Historial de Commits

Autor SHA1 Mensaje Fecha
  AlpinDale 4d4e767838 ci: take one of fixing lint issues hace 5 meses
  AlpinDale 6c2e24de53 fix: support flashinfer for draft model runner hace 5 meses
  AlpinDale b15e6376f8 bump to torch 2.4.0, add aphrodite_flash_attn (#614) hace 5 meses
  AlpinDale 705e50f4bd fix: broadcasting logic for multi_modal_kwargs hace 5 meses
  AlpinDale a4cbcfe59f feat: disable logprob serialization to CPU for spec decode hace 5 meses
  AlpinDale fa15bad2ea chore: minor AMD fixes hace 5 meses
  AlpinDale 8ee8483fcf `enable_gpu_advance_step` -> `allo_gpu_advance_step` hace 5 meses
  AlpinDale dd18c5042c move prepare_inputs to the GPU (#596) hace 5 meses
  AlpinDale 5289c14b24 feat: Asymmetric Tensor Parallel (#594) hace 5 meses
  AlpinDale 99680b2d23 feat: soft prompts (#589) hace 5 meses
  AlpinDale 4f7d212b70 feat: remove vision language config hace 5 meses
  AlpinDale 5be90c3859 Mamba infrastrucuture support (#586) hace 5 meses
  AlpinDale ae04f57ec1 feat: Pipeline Parallel support (#581) hace 5 meses
  AlpinDale cdff8e89f9 feat: introduce `DraftModelRunner` hace 6 meses