.. |
block
|
df7ae8ce01
fix spec_decode and block imports
|
před 9 měsíci |
__init__.py
|
ac1d46a2ec
feat: begin work on the engine
|
před 1 rokem |
block_manager_v1.py
|
f52aa64fe6
use the get_len() method instead of manual len calculation
|
před 9 měsíci |
block_manager_v2.py
|
fa083286e3
Speculative Decoding Part 4: Lookahead scheduling (#402)
|
před 9 měsíci |
evictor.py
|
375f24ccca
fix: optimize context shift performance (#380)
|
před 9 měsíci |
interfaces.py
|
fa083286e3
Speculative Decoding Part 4: Lookahead scheduling (#402)
|
před 9 měsíci |
policy.py
|
6f00203041
refactor scheduler for chunked prefill, remove reorder policy for now
|
před 9 měsíci |
scheduler.py
|
fe17712f29
fully working chunked prefill
|
před 9 měsíci |