.. |
block
|
d8c4193704
feat: Speculative Decoding using a draft model (#432)
|
před 8 měsíci |
__init__.py
|
ac1d46a2ec
feat: begin work on the engine
|
před 1 rokem |
block_manager_v1.py
|
f52aa64fe6
use the get_len() method instead of manual len calculation
|
před 9 měsíci |
block_manager_v2.py
|
fa083286e3
Speculative Decoding Part 4: Lookahead scheduling (#402)
|
před 9 měsíci |
evictor.py
|
375f24ccca
fix: optimize context shift performance (#380)
|
před 9 měsíci |
interfaces.py
|
fa083286e3
Speculative Decoding Part 4: Lookahead scheduling (#402)
|
před 9 měsíci |
policy.py
|
6f00203041
refactor scheduler for chunked prefill, remove reorder policy for now
|
před 9 měsíci |
scheduler.py
|
c577c31aaa
feat: tree attention
|
před 8 měsíci |