Lịch sử commit

Tác giả SHA1 Thông báo Ngày
  AlpinDale 71a26f0998 chore: use pytorch sdpa backend to do naive attention for rocm 7 tháng trước cách đây
  AlpinDale e9c0a248dc fix: support check for fp8 cutlass 7 tháng trước cách đây
  AlpinDale b2cb5a92e9 fix: missing cache_config for dbrx 7 tháng trước cách đây
  AlpinDale 7c14159702 fix: remove unused include 7 tháng trước cách đây
  AlpinDale aba03b4756 feat: dynamic per-token activation quantization 7 tháng trước cách đây
  AlpinDale 3f92035bf1 fix: add `ignored_seq_groups` in `_schedule_chunked_prefill` 7 tháng trước cách đây
  AlpinDale 17eb1b7eb9 chore: remove ray health check 7 tháng trước cách đây
  AlpinDale 40bc98b363 chore: use cutlass kernels for fp8 if supported 7 tháng trước cách đây
  AlpinDale 1d7f5c45b0 feat: add stream_options for chat completions 7 tháng trước cách đây
  AlpinDale c975bba905 fix: sharded state loader with lora 7 tháng trước cách đây
  AlpinDale b9a5a0ae79 fix: avoid copying prompt/output tokens if penalties arent used 7 tháng trước cách đây
  AlpinDale e989ddf2a1 chore: allow using multiple lora modules in llm.generate() 7 tháng trước cách đây
  AlpinDale 76d6f49bbb fix: modelscope downloads 7 tháng trước cách đây
  AlpinDale f2e94e2184 chore: minor llava cleanups in preparation for llava-next 7 tháng trước cách đây
  AlpinDale fde2cda047 chore: update outlines integration from `FSM` to `Guide` 7 tháng trước cách đây
  AlpinDale c7bddcdef1 chore: skip for logits_scale == 1.0 7 tháng trước cách đây
  AlpinDale d7ebffe2f0 chore: re-add the graceful engine shutdown 7 tháng trước cách đây
  AlpinDale ec5b99d075 fix: use named args 7 tháng trước cách đây
  AlpinDale e0886ee929 feat: add `ProposerWorkerBase` abstract class 7 tháng trước cách đây
  AlpinDale d00a7517e6 fix: tokenizer delay with using LLM class 7 tháng trước cách đây
  AlpinDale 39b36efabf fix: mixtral fp8 ckpt loading 7 tháng trước cách đây
  AlpinDale e32f506e17 chore: gpu arch guard for cutlass w8a8 kernels 7 tháng trước cách đây
  AlpinDale 814c1ddeba feat: add CustomOp interface for device portability 7 tháng trước cách đây
  AlpinDale f91f217bf8 fix: do not skip `prompt_logprobs` when `SamplingParams.detokenize=True` 7 tháng trước cách đây
  AlpinDale 5b5e6dc359 chore: add batch size 1536 and 3072 to moe benchmark 7 tháng trước cách đây
  AlpinDale a7fb48acdf fix: setuptools version in dockerfile for cpu 7 tháng trước cách đây
  AlpinDale 05d6e43244 fix: `torch.compile()` with mp executor backend 7 tháng trước cách đây
  AlpinDale 4bdd2f9892 chore: enhance MoE benchmarking 7 tháng trước cách đây
  AlpinDale e321d80e4e fix: `prompt_logprobs==0` case 7 tháng trước cách đây
  AlpinDale 141c602c39 feat: OpenAI `tools` support named functions 7 tháng trước cách đây