Histórico de Commits

Autor SHA1 Mensagem Data
  AlpinDale ae04f57ec1 feat: Pipeline Parallel support (#581) há 6 meses atrás
  AlpinDale fad45609b8 chore: remove logical token blocks (turns out they are not needed) há 6 meses atrás
  AlpinDale 237fa59aea feat: support CPU/GPU swapping in BlockManagerV2 há 6 meses atrás
  AlpinDale 9099040472 feat: cross-attention kv caching support há 6 meses atrás
  AlpinDale 8b56dc4347 dict -> torch.Tensor for blocks_to_swap há 6 meses atrás
  AlpinDale 148aca8ff1 cow => dict[int, list] -> list há 6 meses atrás
  AlpinDale 25c2b6feca ignore infeasible swap requests há 6 meses atrás
  AlpinDale 6f6bf568e5 enable prefix caching with v2 block manager for spec decoding há 6 meses atrás
  AlpinDale fca911ee0a vLLM Upstream Sync (#526) há 7 meses atrás
  AlpinDale 9d81716bfd [v0.5.3] Release Candidate (#388) há 9 meses atrás