コミット履歴

作者 SHA1 メッセージ 日付
  AlpinDale b02e633691 configure endpoint 8 ヶ月 前
  AlpinDale ed759f065d chore: tokenizer_revision -> revision 8 ヶ月 前
  AlpinDale 2e0b115ce1 move func tracing to utils 8 ヶ月 前
  AlpinDale 41338053e7 feat: add shutdown method to engine 8 ヶ月 前
  AlpinDale 199e776722 chore: move ray utils to executor dir 8 ヶ月 前
  AlpinDale e7b1368156 feat: Phi3 support 8 ヶ月 前
  AlpinDale 1225c4dfd6 fix: illegal mem access crash for marlin 8 ヶ月 前
  AlpinDale d1a3c7bc2c chore: simplify try-finally logic in pynccl 8 ヶ月 前
  AlpinDale 440384d776 chore: use nvidia-ml-py instead of pynvml 8 ヶ月 前
  AlpinDale 46159b107a formatting: pt1 8 ヶ月 前
  AlpinDale 4c746d8baa chore: init nccl using the gloo backend 8 ヶ月 前
  AlpinDale bf2dd2bee9 feat: allow multiple sampling params in LLM class 8 ヶ月 前
  Orion a2a24e9b0d feat: list support in message.content (#503) 8 ヶ月 前
  Bruno Renié 9c45fe9a2a openai: fix metrics endpoint (#512) 8 ヶ月 前
  AlpinDale fca911ee0a vLLM Upstream Sync (#526) 8 ヶ月 前
  AlpinDale 8be299e78b fix: lora load check 10 ヶ月 前
  AlpinDale 096d9eb6c5 enhance nvlink detection 10 ヶ月 前
  AlpinDale fb7825df8f squash logprobs 10 ヶ月 前
  AlpinDale 66b7bc4415 sliding window in prefix kernel 10 ヶ月 前
  AlpinDale 42998e423c better quant verification 10 ヶ月 前
  AlpinDale 483c95a2f8 fix ops in gptq and awq 10 ヶ月 前
  AlpinDale 8f9cb7235c chore: allow multiple served model names 10 ヶ月 前
  AlpinDale fc80f57967 fix: correct file name for qwen2 moe 10 ヶ月 前
  AlpinDale f894f7b176 Revert "reduce dedupe by wrapping in general worker class" 10 ヶ月 前
  AlpinDale 082b0b03bc Revert "actually run the workers" 10 ヶ月 前
  AlpinDale 36cf32649d actually run the workers 10 ヶ月 前
  AlpinDale 9fff6fb507 reduce dedupe by wrapping in general worker class 10 ヶ月 前
  AlpinDale b92bddafe9 time.monotonic() -> time.time() 10 ヶ月 前
  AlpinDale 0178b4d976 docker: add AWS Neuron Docker image 10 ヶ月 前
  AlpinDale 949f0445de readme: update installation command 10 ヶ月 前