Historie revizí

Autor SHA1 Zpráva Datum
  AlpinDale 71a26f0998 chore: use pytorch sdpa backend to do naive attention for rocm před 7 měsíci
  AlpinDale e9c0a248dc fix: support check for fp8 cutlass před 7 měsíci
  AlpinDale b2cb5a92e9 fix: missing cache_config for dbrx před 7 měsíci
  AlpinDale 7c14159702 fix: remove unused include před 7 měsíci
  AlpinDale aba03b4756 feat: dynamic per-token activation quantization před 7 měsíci
  AlpinDale 3f92035bf1 fix: add `ignored_seq_groups` in `_schedule_chunked_prefill` před 7 měsíci
  AlpinDale 17eb1b7eb9 chore: remove ray health check před 7 měsíci
  AlpinDale 40bc98b363 chore: use cutlass kernels for fp8 if supported před 7 měsíci
  AlpinDale 1d7f5c45b0 feat: add stream_options for chat completions před 7 měsíci
  AlpinDale c975bba905 fix: sharded state loader with lora před 7 měsíci
  AlpinDale b9a5a0ae79 fix: avoid copying prompt/output tokens if penalties arent used před 7 měsíci
  AlpinDale e989ddf2a1 chore: allow using multiple lora modules in llm.generate() před 7 měsíci
  AlpinDale 76d6f49bbb fix: modelscope downloads před 7 měsíci
  AlpinDale f2e94e2184 chore: minor llava cleanups in preparation for llava-next před 7 měsíci
  AlpinDale fde2cda047 chore: update outlines integration from `FSM` to `Guide` před 7 měsíci
  AlpinDale c7bddcdef1 chore: skip for logits_scale == 1.0 před 7 měsíci
  AlpinDale d7ebffe2f0 chore: re-add the graceful engine shutdown před 7 měsíci
  AlpinDale ec5b99d075 fix: use named args před 7 měsíci
  AlpinDale e0886ee929 feat: add `ProposerWorkerBase` abstract class před 7 měsíci
  AlpinDale d00a7517e6 fix: tokenizer delay with using LLM class před 7 měsíci
  AlpinDale 39b36efabf fix: mixtral fp8 ckpt loading před 7 měsíci
  AlpinDale e32f506e17 chore: gpu arch guard for cutlass w8a8 kernels před 7 měsíci
  AlpinDale 814c1ddeba feat: add CustomOp interface for device portability před 7 měsíci
  AlpinDale f91f217bf8 fix: do not skip `prompt_logprobs` when `SamplingParams.detokenize=True` před 7 měsíci
  AlpinDale 5b5e6dc359 chore: add batch size 1536 and 3072 to moe benchmark před 7 měsíci
  AlpinDale a7fb48acdf fix: setuptools version in dockerfile for cpu před 7 měsíci
  AlpinDale 05d6e43244 fix: `torch.compile()` with mp executor backend před 7 měsíci
  AlpinDale 4bdd2f9892 chore: enhance MoE benchmarking před 7 měsíci
  AlpinDale e321d80e4e fix: `prompt_logprobs==0` case před 7 měsíci
  AlpinDale 141c602c39 feat: OpenAI `tools` support named functions před 7 měsíci