Commit Verlauf

Autor SHA1 Nachricht Datum
  AlpinDale 4d4e767838 ci: take one of fixing lint issues vor 5 Monaten
  AlpinDale 6c2e24de53 fix: support flashinfer for draft model runner vor 5 Monaten
  AlpinDale b15e6376f8 bump to torch 2.4.0, add aphrodite_flash_attn (#614) vor 5 Monaten
  AlpinDale 705e50f4bd fix: broadcasting logic for multi_modal_kwargs vor 5 Monaten
  AlpinDale a4cbcfe59f feat: disable logprob serialization to CPU for spec decode vor 5 Monaten
  AlpinDale fa15bad2ea chore: minor AMD fixes vor 5 Monaten
  AlpinDale 8ee8483fcf `enable_gpu_advance_step` -> `allo_gpu_advance_step` vor 5 Monaten
  AlpinDale dd18c5042c move prepare_inputs to the GPU (#596) vor 5 Monaten
  AlpinDale 5289c14b24 feat: Asymmetric Tensor Parallel (#594) vor 5 Monaten
  AlpinDale 99680b2d23 feat: soft prompts (#589) vor 5 Monaten
  AlpinDale 4f7d212b70 feat: remove vision language config vor 5 Monaten
  AlpinDale 5be90c3859 Mamba infrastrucuture support (#586) vor 5 Monaten
  AlpinDale ae04f57ec1 feat: Pipeline Parallel support (#581) vor 5 Monaten
  AlpinDale cdff8e89f9 feat: introduce `DraftModelRunner` vor 6 Monaten