AlpinDale c577c31aaa feat: tree attention hace 8 meses
..
block d8c4193704 feat: Speculative Decoding using a draft model (#432) hace 8 meses
__init__.py ac1d46a2ec feat: begin work on the engine hace 1 año
block_manager_v1.py f52aa64fe6 use the get_len() method instead of manual len calculation hace 9 meses
block_manager_v2.py fa083286e3 Speculative Decoding Part 4: Lookahead scheduling (#402) hace 9 meses
evictor.py 375f24ccca fix: optimize context shift performance (#380) hace 9 meses
interfaces.py fa083286e3 Speculative Decoding Part 4: Lookahead scheduling (#402) hace 9 meses
policy.py 6f00203041 refactor scheduler for chunked prefill, remove reorder policy for now hace 9 meses
scheduler.py c577c31aaa feat: tree attention hace 8 meses