Commit History

Автор SHA1 Съобщение Дата
  AlpinDale 6ac658b0d6 some small performance improvements преди 5 месеца
  AlpinDale b7a2d52e47 fix: allow using mp executor for pipeline parallel преди 5 месеца
  AlpinDale cf381a0c54 OpenAI API Refactor (#591) преди 5 месеца
  AlpinDale ddb28a80a3 fix: bump torch for rocm, unify CUDA_VISIBLE_DEVICES for cuda and rocm преди 5 месеца
  AlpinDale a5fafaa9ce chore: add more tuning for the CPU backend via intel-openmp преди 5 месеца
  AlpinDale 5257ebce8c fix: device >= 0 && device < num_gpus INTERNAL_ASSERT FAILED преди 5 месеца
  AlpinDale cda0e93a10 abstract away the platform for device capability преди 5 месеца
  AlpinDale 7d79c0e726 chore: use nvml query to avoid accidental cuda initialization преди 6 месеца
  AlpinDale 0886c361f4 feat: OpenVINO CPU backend (#576) преди 6 месеца
  AlpinDale 2c321ce1f2 chore: upgrade to rocm 6.1, update docker преди 6 месеца
  AlpinDale 25feb1d592 chore: add support for pinning lora adapters in the lru cache преди 6 месеца
  AlpinDale 6a57861fca feat: initial XPU support via intel_extension_for_pytorch (#571) преди 6 месеца
  AlpinDale a89c9a0e92 fix: device ordinal issues with world_size and stuff преди 6 месеца
  AlpinDale fe21123a1c feat: TPU support (#570) преди 6 месеца
  AlpinDale 156f577f79 feat: switch from `PYBIND11_MODULE` to `TORCH_LIBRARY` (#569) преди 6 месеца
  AlpinDale b029a544ff optimize eager mode host time with numpy преди 6 месеца
  AlpinDale f2b7a42c4e fix: async cancels in merge_async_iterators for python>=3.9 преди 6 месеца
  AlpinDale 7194047318 remove vllm-nccl преди 6 месеца
  AlpinDale 90ceab32ff refactor: consolidate prompt args to LLM engines преди 6 месеца
  AlpinDale 656459fd84 make fp8_e4m3 work on nvidia преди 6 месеца
  AlpinDale 251568470e initial nvidia fp8 e4m3 for kv cache преди 6 месеца
  AlpinDale 4476d2d885 remove cuda version check преди 6 месеца
  AlpinDale 2351a0e2cd feat: FlashInfer backend for decoding phase (#548) преди 6 месеца
  AlpinDale 2656df543b why was this removed? weird преди 6 месеца
  AlpinDale 2e0b115ce1 move func tracing to utils преди 7 месеца
  AlpinDale 46159b107a formatting: pt1 преди 7 месеца
  AlpinDale fca911ee0a vLLM Upstream Sync (#526) преди 7 месеца
  AlpinDale f894f7b176 Revert "reduce dedupe by wrapping in general worker class" преди 8 месеца
  AlpinDale 9fff6fb507 reduce dedupe by wrapping in general worker class преди 8 месеца
  AlpinDale 9d81716bfd [v0.5.3] Release Candidate (#388) преди 9 месеца