.. |
attention
|
156f577f79
feat: switch from `PYBIND11_MODULE` to `TORCH_LIBRARY` (#569)
|
7 luni în urmă |
common
|
156f577f79
feat: switch from `PYBIND11_MODULE` to `TORCH_LIBRARY` (#569)
|
7 luni în urmă |
distributed
|
b2fd915c35
improve p2p access check
|
7 luni în urmă |
endpoints
|
1d7f5c45b0
feat: add stream_options for chat completions
|
7 luni în urmă |
engine
|
d7ebffe2f0
chore: re-add the graceful engine shutdown
|
7 luni în urmă |
executor
|
17eb1b7eb9
chore: remove ray health check
|
7 luni în urmă |
kv_quant
|
e42a78381a
feat: switch from pylint to ruff (#322)
|
1 an în urmă |
lora
|
c975bba905
fix: sharded state loader with lora
|
7 luni în urmă |
modeling
|
156f577f79
feat: switch from `PYBIND11_MODULE` to `TORCH_LIBRARY` (#569)
|
7 luni în urmă |
multimodal
|
f2e94e2184
chore: minor llava cleanups in preparation for llava-next
|
7 luni în urmă |
processing
|
3f92035bf1
fix: add `ignored_seq_groups` in `_schedule_chunked_prefill`
|
7 luni în urmă |
quantization
|
156f577f79
feat: switch from `PYBIND11_MODULE` to `TORCH_LIBRARY` (#569)
|
7 luni în urmă |
spec_decode
|
ec5b99d075
fix: use named args
|
7 luni în urmă |
task_handler
|
6cecbbff6a
fix: reduce memory footprint of cuda graph by adding output buffer
|
7 luni în urmă |
transformers_utils
|
76d6f49bbb
fix: modelscope downloads
|
7 luni în urmă |
__init__.py
|
be8154a8a0
feat: proper embeddings API with e5-mistral-7b support
|
7 luni în urmă |
_custom_ops.py
|
156f577f79
feat: switch from `PYBIND11_MODULE` to `TORCH_LIBRARY` (#569)
|
7 luni în urmă |
py.typed
|
1c988a48b2
fix logging and add py.typed
|
1 an în urmă |