Commit History

Автор SHA1 Съобщение Дата
  AlpinDale d8c4193704 feat: Speculative Decoding using a draft model (#432) преди 9 месеца
  AlpinDale 309339ffd3 separate api server args into another file преди 10 месеца
  sgsdxzy 214151b04c fix: max_num_batched_tokens for chunked_prefill (#412) преди 10 месеца
  AlpinDale e0c35bb353 feat: bitsandbytes and `--load-in{4,8}bit` support (#294) преди 11 месеца
  AlpinDale ac82b67f75 feat: naive context shift and various QoL changes (#289) преди 11 месеца
  AlpinDale 72229a94da feat: better marlin kernels (#285) преди 11 месеца
  AlpinDale c3a221eb02 feat: GGUF, QuIP#, and Marlin support (#228) преди 1 година
  AlpinDale 31c95011a6 feat: FP8 E5M2 KV Cache (#226) преди 1 година
  AlpinDale 641bb0f6e9 feat: add custom allreduce kernels (#224) преди 1 година
  AlpinDale e1f3fd1e02 fix: test units (#201) преди 1 година