Commit Verlauf

Autor SHA1 Nachricht Datum
  AlpinDale c3a221eb02 feat: GGUF, QuIP#, and Marlin support (#228) vor 1 Jahr
  AlpinDale 6305e6f3f2 fix: no repeated IPC registration (#227) vor 1 Jahr
  AlpinDale 0adab894fe feat: grammar support (#206) vor 1 Jahr
  AlpinDale 31c95011a6 feat: FP8 E5M2 KV Cache (#226) vor 1 Jahr
  AlpinDale c0146ed00e chore: slight refactor for async engine finish (#225) vor 1 Jahr
  AlpinDale 339c6aec53 chore: bump ray version vor 1 Jahr
  AlpinDale 641bb0f6e9 feat: add custom allreduce kernels (#224) vor 1 Jahr
  AlpinDale 26a717b49f fix: use head_dim if available vor 1 Jahr
  AlpinDale 5053743c1c feat: speedup AWQ (#223) vor 1 Jahr
  AlpinDale c0aac15421 feat: S-LoRA support (#222) vor 1 Jahr
  AlpinDale 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) vor 1 Jahr
  AlpinDale 3188d5690c fix: logprobs at -inf (#219) vor 1 Jahr
  AlpinDale a39eeb7188 fix: logprobs for dynatemp (#215) vor 1 Jahr
  Stefan Gligorijevic 9e7e108dc8 chore: clamp dynatemp_min (#214) vor 1 Jahr
  AlpinDale 60f072ff6f chore: update klite embed and kcpp version (#212) vor 1 Jahr
  AlpinDale 97f37c1cb2 fix: use tensor parallel for quantized mixtral (#213) vor 1 Jahr
  Stefan Gligorijevic 56446a04bb feat: dynamic temperature (#209) vor 1 Jahr
  AlpinDale 1394eab8ab fix temperature being set to 1 in all cases (#210) vor 1 Jahr
  AlpinDale b3315c9a4c update the readme (#207) vor 1 Jahr
  AlpinDale 9f77f35ff5 bump version to 0.4.6 (#204) vor 1 Jahr
  AlpinDale fe70c6e8d5 feat: bump cuda and pytorch (#205) vor 1 Jahr
  AlpinDale c5802b2bd5 fix: remove windows specific files vor 1 Jahr
  AlpinDale 193287b2ef fix: mixtral unused import vor 1 Jahr
  AlpinDale 53d391e1f2 merge 'dev' into 'main' vor 1 Jahr
  AlpinDale e1f3fd1e02 fix: test units (#201) vor 1 Jahr
  AlpinDale d54791aaa8 feat: reduce sampler overhead by making it less blocking (#198) vor 1 Jahr
  AlpinDale 871c0ce8e4 fix: triton compile error (#200) vor 1 Jahr
  AlpinDale 7e72ce0a73 feat: mixtral tensor parallelism (#193) vor 1 Jahr
  AlpinDale d7f113c3ff readme: add acknowledgements vor 1 Jahr
  AlpinDale 95bdd35ec9 feat: rejection sampler (#197) vor 1 Jahr