.. |
backends
|
24456206a9
fix: logit softcapping in flash-attn (#688)
|
4 месяцев назад |
ops
|
e200775863
feat: enable using fp8 kv and prefix caching with chunked prefill (#668)
|
4 месяцев назад |
__init__.py
|
a0e446a17d
feat: initial encoder-decoder support with BART model (#633)
|
4 месяцев назад |
layer.py
|
bf88c8567e
feat: mamba model support (#674)
|
4 месяцев назад |
selector.py
|
5d37ec1016
suppress tpu import warning (#696)
|
4 месяцев назад |