История коммитов

Автор SHA1 Сообщение Дата
  AlpinDale bd0ddf1cfe feat: EETQ quantization (#408) 10 месяцев назад
  AlpinDale 4d33ce60da feat: Triton flash attention backend for ROCm (#407) 10 месяцев назад
  AlpinDale 071269e406 feat: FP8 E4M3 KV Cache (#405) 10 месяцев назад
  AlpinDale 6f00203041 refactor scheduler for chunked prefill, remove reorder policy for now 10 месяцев назад
  AlpinDale 9aaeb5d349 add speculative config and arg for later 10 месяцев назад
  AlpinDale a304f76d89 feat: Intel CPU support (#403) 10 месяцев назад
  AlpinDale fa083286e3 Speculative Decoding Part 4: Lookahead scheduling (#402) 10 месяцев назад
  AlpinDale f845a661dd Chunked Prefill Part 2: data update 10 месяцев назад
  AlpinDale eff5eb16c5 ruff 10 месяцев назад
  AlpinDale 753f6dc51b add v2 block manager 10 месяцев назад
  AlpinDale 7b9c08afae vision model support 10 месяцев назад
  AlpinDale b738554558 add reorder scheduler policy 10 месяцев назад
  AlpinDale 1ba9ff78cd add scheduler delay factor 10 месяцев назад
  AlpinDale 78d66f16d1 Chunked Prefill Part 1 (#384) 10 месяцев назад
  AlpinDale feb5840f2a feat: async tokenization (#374) 10 месяцев назад
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) 10 месяцев назад
  AlpinDale c41462cfcd feat: exllamav2 quantization (#305) 11 месяцев назад
  AlpinDale 9810daa699 feat: INT8 KV Cache (#298) 11 месяцев назад
  AlpinDale e0c35bb353 feat: bitsandbytes and `--load-in{4,8}bit` support (#294) 11 месяцев назад
  AlpinDale 705821a7fe feat: AQLM quantization support (#293) 11 месяцев назад
  AlpinDale ac82b67f75 feat: naive context shift and various QoL changes (#289) 11 месяцев назад
  AlpinDale 72229a94da feat: better marlin kernels (#285) 11 месяцев назад
  AlpinDale 657aec0cbd refactor: OpenAI endpoint (#261) 11 месяцев назад
  AlpinDale 4d04ade9ef feat: fine-grained seeds (#279) 11 месяцев назад
  AlpinDale ea0f57b233 feat: allow further support for non-cuda devices (#247) 1 год назад
  AlpinDale c3a221eb02 feat: GGUF, QuIP#, and Marlin support (#228) 1 год назад
  AlpinDale 31c95011a6 feat: FP8 E5M2 KV Cache (#226) 1 год назад
  AlpinDale 641bb0f6e9 feat: add custom allreduce kernels (#224) 1 год назад
  AlpinDale c0aac15421 feat: S-LoRA support (#222) 1 год назад
  AlpinDale 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) 1 год назад