.. |
block
|
9c9b2dd843
core: improve warmup times for prefix caching in block manager v2 (#920)
|
před 3 týdny |
__init__.py
|
ac1d46a2ec
feat: begin work on the engine
|
před 1 rokem |
block_manager_v1.py
|
f7f3fed265
feat: add async postprocessor (#925)
|
před 2 týdny |
block_manager_v2.py
|
f7f3fed265
feat: add async postprocessor (#925)
|
před 2 týdny |
evictor_v1.py
|
f1d0b77c92
[0.6.0] Release Candidate (#481)
|
před 4 měsíci |
evictor_v2.py
|
3d83e64f8e
feat: add metrics for prefix cache hit rate (#829)
|
před 1 měsícem |
interfaces.py
|
f7f3fed265
feat: add async postprocessor (#925)
|
před 2 týdny |
placeholder_block_space_manager.py
|
abfd4465ca
feat: add support for chunked prefill + prefix caching (#871)
|
před 1 měsícem |
scheduler.py
|
f561a54a43
core: fix async postprocessor in case of preemption (#1000)
|
před 2 týdny |