Commit Verlauf

Autor SHA1 Nachricht Datum
  AlpinDale c41462cfcd feat: exllamav2 quantization (#305) vor 10 Monaten
  sgsdxzy 94c1543cae fix: typo in marlin kernel path (#295) vor 10 Monaten
  AlpinDale e0c35bb353 feat: bitsandbytes and `--load-in{4,8}bit` support (#294) vor 10 Monaten
  AlpinDale 705821a7fe feat: AQLM quantization support (#293) vor 10 Monaten
  AlpinDale 13d850334e fix: navi support (#283) vor 10 Monaten
  AlpinDale 7d6ba53602 feat: fused top-k kernels for MoE (#273) vor 10 Monaten
  AlpinDale 4360684667 fix: cuda version in wheel vor 11 Monaten
  AlpinDale f99eb2c874 fix: hadamard tensors not included in wheel vor 11 Monaten
  AlpinDale d9b65e6c5f feat: DeepSeek MoE support (#237) vor 11 Monaten
  AlpinDale aebd68c632 feat: backport kernels (#235) vor 11 Monaten
  AlpinDale 5d288aa76c feat: add fast hadamard transformation kernels (#232) vor 11 Monaten
  AlpinDale c3a221eb02 feat: GGUF, QuIP#, and Marlin support (#228) vor 11 Monaten
  AlpinDale 31c95011a6 feat: FP8 E5M2 KV Cache (#226) vor 11 Monaten
  AlpinDale 641bb0f6e9 feat: add custom allreduce kernels (#224) vor 11 Monaten
  AlpinDale c0aac15421 feat: S-LoRA support (#222) vor 11 Monaten
  AlpinDale 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) vor 11 Monaten
  AlpinDale fe70c6e8d5 feat: bump cuda and pytorch (#205) vor 1 Jahr
  AlpinDale 7e72ce0a73 feat: mixtral tensor parallelism (#193) vor 1 Jahr
  AlpinDale 801eda0b7a feat: support GPTQ 2, 3, and 8bit quants (#181) vor 1 Jahr
  AlpinDale 68c2083adb fix includes in wheel vor 1 Jahr
  AlpinDale 62b2c4119d feat: re-write GPTQ and refactor exllama kernels (#152) vor 1 Jahr
  AlpinDale 1334a833a4 feat: AMD ROCm support (#95) vor 1 Jahr
  AlpinDale 2b1ba581f9 feat: re-implement GPTQ (#141) vor 1 Jahr
  AlpinDale 8223f85c1b feat: SqueezeLLM support (#140) vor 1 Jahr
  AlpinDale 1aab8a7d6f feat: speedup compilation times by 3x (#130) vor 1 Jahr
  AlpinDale e7b6a2d5a0 chore: tensor parallel refactors part 2 (#116) vor 1 Jahr
  AlpinDale 887e03669a feat: add exllamav2 for GPTQ (#99) vor 1 Jahr
  AlpinDale 1c988a48b2 fix logging and add py.typed vor 1 Jahr
  AlpinDale 561773dec8 fix: hopefully fixes github actions vor 1 Jahr
  AlpinDale 0495c50a3e GPTQ+exllama support (#21) vor 1 Jahr