.. |
backends
|
f7f3fed265
feat: add async postprocessor (#925)
|
1 månad sedan |
ops
|
e200775863
feat: enable using fp8 kv and prefix caching with chunked prefill (#668)
|
4 månader sedan |
__init__.py
|
1405051912
attention: add `AttentionState` abstraction (#863)
|
1 månad sedan |
layer.py
|
bf88c8567e
feat: mamba model support (#674)
|
4 månader sedan |
selector.py
|
22a4cd4595
core: fix spec decode metrics and envs circular import (#889)
|
1 månad sedan |