AlpinDale 1390915778 multi-step: add support for flashinfer attention backend (#1033) před 1 týdnem
..
backends 1390915778 multi-step: add support for flashinfer attention backend (#1033) před 1 týdnem
ops e200775863 feat: enable using fp8 kv and prefix caching with chunked prefill (#668) před 4 měsíci
__init__.py 1405051912 attention: add `AttentionState` abstraction (#863) před 1 měsícem
layer.py bf88c8567e feat: mamba model support (#674) před 4 měsíci
selector.py 4ddc14d653 core: use flashinfer for FP8 KV when available (#944) před 2 týdny