Историја ревизија

Аутор SHA1 Порука Датум
  AlpinDale 93cffaf446 add flash_attn back пре 7 месеци
  AlpinDale f970f3f3fb add base class for VLMs пре 7 месеци
  AlpinDale 9e73559eba make use of batched rotary embedding kernels to support long context lora пре 7 месеци
  AlpinDale 1b86cf6164 navi21 fallback to naive attention пре 7 месеци
  AlpinDale 0dc8492188 relax tiktoken version пре 7 месеци
  AlpinDale 676322dd62 qwen2_moe: mlp_only_layers пре 7 месеци
  AlpinDale 14a2d6f624 fix rope error when loading models with different dtypes пре 7 месеци
  AlpinDale 0c15965621 fix fp8 kv пре 7 месеци
  AlpinDale 2313c97e3d add cutlass w8a8 kernels (#556) пре 7 месеци
  AlpinDale d4edba99f9 add lora dims for Qwen1.5-32B пре 7 месеци
  AlpinDale eaa06fdd14 fix some f-strings пре 7 месеци
  AlpinDale c58589318f remove the graph mode func пре 7 месеци
  AlpinDale 8e11259e90 missing triton autoconfig for rocm flash attn пре 7 месеци
  AlpinDale c66b1b57b1 Marlin 2:4 sparsity (#555) пре 7 месеци
  AlpinDale ad1c6b86a1 gptq_marlin: enable bfloat16 пре 7 месеци
  AlpinDale 2ecfa98da9 re-fix mistral nemo пре 7 месеци
  AlpinDale 9f3d6205ce fix ray gpu executor пре 7 месеци
  AlpinDale 236be273e5 feat: tensor parallel speculative decoding (#554) пре 7 месеци
  AlpinDale 072b30fb42 measure end time within the cuda memory profiler пре 7 месеци
  AlpinDale 7bcff4ac03 implement sharded state dict пре 7 месеци
  AlpinDale 13e5ffd456 fix distributed_executor_backend in args пре 7 месеци
  AlpinDale a94de94c44 refactor: combine the prefill and decode into a single API (#553) пре 7 месеци
  AlpinDale fe431bb840 check for next port if current is unavailable пре 7 месеци
  AlpinDale 033797fd55 refactor throughput benchmark script пре 7 месеци
  AlpinDale c6a501f682 add multiprocessing executor; make ray optional пре 7 месеци
  AlpinDale 342346afda improve hashing function пре 7 месеци
  AlpinDale d7c0dd5b50 fix: do not set the weight to fp8 for fp16 checkpoints пре 7 месеци
  AlpinDale 01190e5049 use flash attention for the decoding phase пре 7 месеци
  AlpinDale e42d0b3455 possibly improve ngram efficiency пре 7 месеци
  AlpinDale 0cea453d36 automatically detect tensorized models пре 7 месеци