Commit történet

Szerző SHA1 Üzenet Dátum
  AlpinDale 71a26f0998 chore: use pytorch sdpa backend to do naive attention for rocm 7 hónapja
  AlpinDale e9c0a248dc fix: support check for fp8 cutlass 7 hónapja
  AlpinDale b2cb5a92e9 fix: missing cache_config for dbrx 7 hónapja
  AlpinDale 7c14159702 fix: remove unused include 7 hónapja
  AlpinDale aba03b4756 feat: dynamic per-token activation quantization 7 hónapja
  AlpinDale 3f92035bf1 fix: add `ignored_seq_groups` in `_schedule_chunked_prefill` 7 hónapja
  AlpinDale 17eb1b7eb9 chore: remove ray health check 7 hónapja
  AlpinDale 40bc98b363 chore: use cutlass kernels for fp8 if supported 7 hónapja
  AlpinDale 1d7f5c45b0 feat: add stream_options for chat completions 7 hónapja
  AlpinDale c975bba905 fix: sharded state loader with lora 7 hónapja
  AlpinDale b9a5a0ae79 fix: avoid copying prompt/output tokens if penalties arent used 7 hónapja
  AlpinDale e989ddf2a1 chore: allow using multiple lora modules in llm.generate() 7 hónapja
  AlpinDale 76d6f49bbb fix: modelscope downloads 7 hónapja
  AlpinDale f2e94e2184 chore: minor llava cleanups in preparation for llava-next 7 hónapja
  AlpinDale fde2cda047 chore: update outlines integration from `FSM` to `Guide` 7 hónapja
  AlpinDale c7bddcdef1 chore: skip for logits_scale == 1.0 7 hónapja
  AlpinDale d7ebffe2f0 chore: re-add the graceful engine shutdown 7 hónapja
  AlpinDale ec5b99d075 fix: use named args 7 hónapja
  AlpinDale e0886ee929 feat: add `ProposerWorkerBase` abstract class 7 hónapja
  AlpinDale d00a7517e6 fix: tokenizer delay with using LLM class 7 hónapja
  AlpinDale 39b36efabf fix: mixtral fp8 ckpt loading 7 hónapja
  AlpinDale e32f506e17 chore: gpu arch guard for cutlass w8a8 kernels 7 hónapja
  AlpinDale 814c1ddeba feat: add CustomOp interface for device portability 7 hónapja
  AlpinDale f91f217bf8 fix: do not skip `prompt_logprobs` when `SamplingParams.detokenize=True` 7 hónapja
  AlpinDale 5b5e6dc359 chore: add batch size 1536 and 3072 to moe benchmark 7 hónapja
  AlpinDale a7fb48acdf fix: setuptools version in dockerfile for cpu 7 hónapja
  AlpinDale 05d6e43244 fix: `torch.compile()` with mp executor backend 7 hónapja
  AlpinDale 4bdd2f9892 chore: enhance MoE benchmarking 7 hónapja
  AlpinDale e321d80e4e fix: `prompt_logprobs==0` case 7 hónapja
  AlpinDale 141c602c39 feat: OpenAI `tools` support named functions 7 hónapja