.. |
attention
|
6fc1ec6e9a
fix redirects and improve low level debugging
|
7 luni în urmă |
common
|
723c6acb84
re-add ngram speculative decoding
|
7 luni în urmă |
distributed
|
fd1ce09581
allow multiple tp groups
|
7 luni în urmă |
endpoints
|
7e3887f8f8
use random seed if -1
|
7 luni în urmă |
engine
|
29c1b58255
minor logging fixes
|
7 luni în urmă |
executor
|
fd1ce09581
allow multiple tp groups
|
7 luni în urmă |
kv_quant
|
e42a78381a
feat: switch from pylint to ruff (#322)
|
1 an în urmă |
lora
|
e87c32bed3
feat: full tensor parallel for LoRA layers (#545)
|
7 luni în urmă |
modeling
|
0751a2ecf6
fix expert_ids shape in Moe
|
7 luni în urmă |
processing
|
5529304d1f
fix sampling with n>1
|
7 luni în urmă |
quantization
|
c154578c97
gptq_marlin: 8bit GPTQ support
|
7 luni în urmă |
spec_decode
|
723c6acb84
re-add ngram speculative decoding
|
7 luni în urmă |
task_handler
|
aed64884c6
feat: prompt logprobs with chunked prefill (#539)
|
7 luni în urmă |
transformers_utils
|
12c22ddf98
fix modelscope tokenizer download
|
7 luni în urmă |
__init__.py
|
199e776722
chore: move ray utils to executor dir
|
8 luni în urmă |
py.typed
|
1c988a48b2
fix logging and add py.typed
|
1 an în urmă |