AlpinDale 2d7929d3b7 fix: flashinfer crash with uneven attention group_size 1 tháng trước cách đây
..
backends 2d7929d3b7 fix: flashinfer crash with uneven attention group_size 1 tháng trước cách đây
ops e200775863 feat: enable using fp8 kv and prefix caching with chunked prefill (#668) 4 tháng trước cách đây
__init__.py 1405051912 attention: add `AttentionState` abstraction (#863) 1 tháng trước cách đây
layer.py bf88c8567e feat: mamba model support (#674) 4 tháng trước cách đây
selector.py 5d37ec1016 suppress tpu import warning (#696) 4 tháng trước cách đây