AlpinDale
|
71a26f0998
chore: use pytorch sdpa backend to do naive attention for rocm
|
7 tháng trước cách đây |
AlpinDale
|
e9c0a248dc
fix: support check for fp8 cutlass
|
7 tháng trước cách đây |
AlpinDale
|
b2cb5a92e9
fix: missing cache_config for dbrx
|
7 tháng trước cách đây |
AlpinDale
|
7c14159702
fix: remove unused include
|
7 tháng trước cách đây |
AlpinDale
|
aba03b4756
feat: dynamic per-token activation quantization
|
7 tháng trước cách đây |
AlpinDale
|
3f92035bf1
fix: add `ignored_seq_groups` in `_schedule_chunked_prefill`
|
7 tháng trước cách đây |
AlpinDale
|
17eb1b7eb9
chore: remove ray health check
|
7 tháng trước cách đây |
AlpinDale
|
40bc98b363
chore: use cutlass kernels for fp8 if supported
|
7 tháng trước cách đây |
AlpinDale
|
1d7f5c45b0
feat: add stream_options for chat completions
|
7 tháng trước cách đây |
AlpinDale
|
c975bba905
fix: sharded state loader with lora
|
7 tháng trước cách đây |
AlpinDale
|
b9a5a0ae79
fix: avoid copying prompt/output tokens if penalties arent used
|
7 tháng trước cách đây |
AlpinDale
|
e989ddf2a1
chore: allow using multiple lora modules in llm.generate()
|
7 tháng trước cách đây |
AlpinDale
|
76d6f49bbb
fix: modelscope downloads
|
7 tháng trước cách đây |
AlpinDale
|
f2e94e2184
chore: minor llava cleanups in preparation for llava-next
|
7 tháng trước cách đây |
AlpinDale
|
fde2cda047
chore: update outlines integration from `FSM` to `Guide`
|
7 tháng trước cách đây |
AlpinDale
|
c7bddcdef1
chore: skip for logits_scale == 1.0
|
7 tháng trước cách đây |
AlpinDale
|
d7ebffe2f0
chore: re-add the graceful engine shutdown
|
7 tháng trước cách đây |
AlpinDale
|
ec5b99d075
fix: use named args
|
7 tháng trước cách đây |
AlpinDale
|
e0886ee929
feat: add `ProposerWorkerBase` abstract class
|
7 tháng trước cách đây |
AlpinDale
|
d00a7517e6
fix: tokenizer delay with using LLM class
|
7 tháng trước cách đây |
AlpinDale
|
39b36efabf
fix: mixtral fp8 ckpt loading
|
7 tháng trước cách đây |
AlpinDale
|
e32f506e17
chore: gpu arch guard for cutlass w8a8 kernels
|
7 tháng trước cách đây |
AlpinDale
|
814c1ddeba
feat: add CustomOp interface for device portability
|
7 tháng trước cách đây |
AlpinDale
|
f91f217bf8
fix: do not skip `prompt_logprobs` when `SamplingParams.detokenize=True`
|
7 tháng trước cách đây |
AlpinDale
|
5b5e6dc359
chore: add batch size 1536 and 3072 to moe benchmark
|
7 tháng trước cách đây |
AlpinDale
|
a7fb48acdf
fix: setuptools version in dockerfile for cpu
|
7 tháng trước cách đây |
AlpinDale
|
05d6e43244
fix: `torch.compile()` with mp executor backend
|
7 tháng trước cách đây |
AlpinDale
|
4bdd2f9892
chore: enhance MoE benchmarking
|
7 tháng trước cách đây |
AlpinDale
|
e321d80e4e
fix: `prompt_logprobs==0` case
|
7 tháng trước cách đây |
AlpinDale
|
141c602c39
feat: OpenAI `tools` support named functions
|
7 tháng trước cách đây |