Commit History

Автор SHA1 Съобщение Дата
  AlpinDale 4d4e767838 ci: take one of fixing lint issues преди 5 месеца
  AlpinDale 6c2e24de53 fix: support flashinfer for draft model runner преди 5 месеца
  AlpinDale b15e6376f8 bump to torch 2.4.0, add aphrodite_flash_attn (#614) преди 5 месеца
  AlpinDale 705e50f4bd fix: broadcasting logic for multi_modal_kwargs преди 5 месеца
  AlpinDale a4cbcfe59f feat: disable logprob serialization to CPU for spec decode преди 5 месеца
  AlpinDale fa15bad2ea chore: minor AMD fixes преди 5 месеца
  AlpinDale 8ee8483fcf `enable_gpu_advance_step` -> `allo_gpu_advance_step` преди 5 месеца
  AlpinDale dd18c5042c move prepare_inputs to the GPU (#596) преди 5 месеца
  AlpinDale 5289c14b24 feat: Asymmetric Tensor Parallel (#594) преди 5 месеца
  AlpinDale 99680b2d23 feat: soft prompts (#589) преди 5 месеца
  AlpinDale 4f7d212b70 feat: remove vision language config преди 5 месеца
  AlpinDale 5be90c3859 Mamba infrastrucuture support (#586) преди 5 месеца
  AlpinDale ae04f57ec1 feat: Pipeline Parallel support (#581) преди 5 месеца
  AlpinDale cdff8e89f9 feat: introduce `DraftModelRunner` преди 6 месеца