История коммитов

Автор SHA1 Сообщение Дата
  AlpinDale 236be273e5 feat: tensor parallel speculative decoding (#554) 8 месяцев назад
  AlpinDale 7bcff4ac03 implement sharded state dict 8 месяцев назад
  AlpinDale b984fe4a91 refactor custom allreduce to support multiple tp groups 8 месяцев назад
  AlpinDale be8154a8a0 feat: proper embeddings API with e5-mistral-7b support 8 месяцев назад
  AlpinDale 8ae2cce237 refactor pynccl 8 месяцев назад
  AlpinDale 0e062e66d3 set block size at init 8 месяцев назад
  AlpinDale 8b56dc4347 dict -> torch.Tensor for blocks_to_swap 8 месяцев назад
  AlpinDale 21ce19b3ea blocks_to_copy dict -> torch.Tensor 8 месяцев назад
  AlpinDale ef733aee43 implement ExecuteModelData to reduce executor complexity 8 месяцев назад
  AlpinDale 1879e32510 enable all-reduce for multiple tp groups 8 месяцев назад
  AlpinDale 46159b107a formatting: pt1 8 месяцев назад
  AlpinDale 4c746d8baa chore: init nccl using the gloo backend 8 месяцев назад
  AlpinDale fca911ee0a vLLM Upstream Sync (#526) 8 месяцев назад
  AlpinDale f894f7b176 Revert "reduce dedupe by wrapping in general worker class" 10 месяцев назад
  AlpinDale 9fff6fb507 reduce dedupe by wrapping in general worker class 10 месяцев назад
  AlpinDale 9d81716bfd [v0.5.3] Release Candidate (#388) 10 месяцев назад
  AlpinDale e3252edd07 fix: remove event and stream, add typing (#382) 11 месяцев назад
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) 11 месяцев назад
  AlpinDale e42a78381a feat: switch from pylint to ruff (#322) 1 год назад
  AlpinDale 9810daa699 feat: INT8 KV Cache (#298) 1 год назад
  AlpinDale 4b80b42362 fix: memory leaks due to nccl cuda graphs (#275) 1 год назад
  Thomas Xin 43cf0e98a0 fix: worker initialization on WSL (#260) 1 год назад
  AlpinDale ea0f57b233 feat: allow further support for non-cuda devices (#247) 1 год назад
  AlpinDale 31c95011a6 feat: FP8 E5M2 KV Cache (#226) 1 год назад
  AlpinDale 641bb0f6e9 feat: add custom allreduce kernels (#224) 1 год назад
  AlpinDale c0aac15421 feat: S-LoRA support (#222) 1 год назад
  AlpinDale 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) 1 год назад
  AlpinDale 15a0454172 feat: FP8 KV Cache (#185) 1 год назад
  AlpinDale 7d91e9e0f2 feat: CUDA graphs (#172) 1 год назад
  AlpinDale f5f9bc6a7c fix: memory profiling (#166) 1 год назад