Commit History

Автор SHA1 Съобщение Дата
  AlpinDale 60ca1e1e5e feat: add ngram prompt lookup decoding for speculative decoding (#438) преди 9 месеца
  AlpinDale d8c4193704 feat: Speculative Decoding using a draft model (#432) преди 9 месеца
  AlpinDale 76f36af704 feat: LM Format Enforcer support (#428) преди 9 месеца
  AlpinDale bd0ddf1cfe feat: EETQ quantization (#408) преди 9 месеца
  AlpinDale 4d33ce60da feat: Triton flash attention backend for ROCm (#407) преди 9 месеца
  AlpinDale 071269e406 feat: FP8 E4M3 KV Cache (#405) преди 9 месеца
  AlpinDale 6f00203041 refactor scheduler for chunked prefill, remove reorder policy for now преди 9 месеца
  AlpinDale 9aaeb5d349 add speculative config and arg for later преди 9 месеца
  AlpinDale a304f76d89 feat: Intel CPU support (#403) преди 9 месеца
  AlpinDale fa083286e3 Speculative Decoding Part 4: Lookahead scheduling (#402) преди 9 месеца
  AlpinDale f845a661dd Chunked Prefill Part 2: data update преди 10 месеца
  AlpinDale eff5eb16c5 ruff преди 10 месеца
  AlpinDale 753f6dc51b add v2 block manager преди 10 месеца
  AlpinDale 7b9c08afae vision model support преди 10 месеца
  AlpinDale b738554558 add reorder scheduler policy преди 10 месеца
  AlpinDale 1ba9ff78cd add scheduler delay factor преди 10 месеца
  AlpinDale 78d66f16d1 Chunked Prefill Part 1 (#384) преди 10 месеца
  AlpinDale feb5840f2a feat: async tokenization (#374) преди 10 месеца
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) преди 10 месеца
  AlpinDale c41462cfcd feat: exllamav2 quantization (#305) преди 10 месеца
  AlpinDale 9810daa699 feat: INT8 KV Cache (#298) преди 11 месеца
  AlpinDale e0c35bb353 feat: bitsandbytes and `--load-in{4,8}bit` support (#294) преди 11 месеца
  AlpinDale 705821a7fe feat: AQLM quantization support (#293) преди 11 месеца
  AlpinDale ac82b67f75 feat: naive context shift and various QoL changes (#289) преди 11 месеца
  AlpinDale 72229a94da feat: better marlin kernels (#285) преди 11 месеца
  AlpinDale 657aec0cbd refactor: OpenAI endpoint (#261) преди 11 месеца
  AlpinDale 4d04ade9ef feat: fine-grained seeds (#279) преди 11 месеца
  AlpinDale ea0f57b233 feat: allow further support for non-cuda devices (#247) преди 1 година
  AlpinDale c3a221eb02 feat: GGUF, QuIP#, and Marlin support (#228) преди 1 година
  AlpinDale 31c95011a6 feat: FP8 E5M2 KV Cache (#226) преди 1 година