.. |
adapter_commons
|
f1d0b77c92
[0.6.0] Release Candidate (#481)
|
6 tháng trước cách đây |
attention
|
e200775863
feat: enable using fp8 kv and prefix caching with chunked prefill (#668)
|
6 tháng trước cách đây |
common
|
2da6a3ec2b
feat: option to apply temperature scaling last (#670)
|
6 tháng trước cách đây |
distributed
|
31f82da8bd
chore: deduplicate nvlink check to cuda platform (#643)
|
6 tháng trước cách đây |
endpoints
|
2da6a3ec2b
feat: option to apply temperature scaling last (#670)
|
6 tháng trước cách đây |
engine
|
19ad952dd4
chore: better stream termination in async engine (#672)
|
6 tháng trước cách đây |
executor
|
f1d0b77c92
[0.6.0] Release Candidate (#481)
|
6 tháng trước cách đây |
inputs
|
62111fab17
feat: allow serving encoder-decoder models in the API server (#664)
|
6 tháng trước cách đây |
kv_quant
|
e42a78381a
feat: switch from pylint to ruff (#322)
|
1 năm trước cách đây |
lora
|
1394008421
chore: decouple `should_modify_greedy_probs_inplace (#671)
|
6 tháng trước cách đây |
modeling
|
8583aefed7
chore: mamba cache single buffer (#673)
|
6 tháng trước cách đây |
multimodal
|
62111fab17
feat: allow serving encoder-decoder models in the API server (#664)
|
6 tháng trước cách đây |
platforms
|
31f82da8bd
chore: deduplicate nvlink check to cuda platform (#643)
|
6 tháng trước cách đây |
processing
|
ef40c05cd3
fix: minor adjustments to scheduler and block manager (#667)
|
6 tháng trước cách đây |
prompt_adapter
|
f1d0b77c92
[0.6.0] Release Candidate (#481)
|
6 tháng trước cách đây |
quantization
|
3f49a55f82
feat: add INT8 W8A16 quant for TPU (#663)
|
6 tháng trước cách đây |
server
|
ed9a6f97c1
fix: kill api server when pinging dead engine (#660)
|
6 tháng trước cách đây |
spec_decode
|
1394008421
chore: decouple `should_modify_greedy_probs_inplace (#671)
|
6 tháng trước cách đây |
task_handler
|
8583aefed7
chore: mamba cache single buffer (#673)
|
6 tháng trước cách đây |
transformers_utils
|
3648170750
fix: gracefully handle missing chat template (#642)
|
6 tháng trước cách đây |
triton_utils
|
f1d0b77c92
[0.6.0] Release Candidate (#481)
|
6 tháng trước cách đây |
__init__.py
|
f1d0b77c92
[0.6.0] Release Candidate (#481)
|
6 tháng trước cách đây |
_core_ext.py
|
f1d0b77c92
[0.6.0] Release Candidate (#481)
|
6 tháng trước cách đây |
_custom_ops.py
|
a401f8e05d
feat: per-tensor token epilogue kernels (#630)
|
6 tháng trước cách đây |
_ipex_ops.py
|
f1d0b77c92
[0.6.0] Release Candidate (#481)
|
6 tháng trước cách đây |
py.typed
|
1c988a48b2
fix logging and add py.typed
|
1 năm trước cách đây |
scalar_type.py
|
f1d0b77c92
[0.6.0] Release Candidate (#481)
|
6 tháng trước cách đây |
version.py
|
db81a67c54
bump to v0.6.0.post1 (#635)
|
6 tháng trước cách đây |