AlpinDale 7a313483f1 chore: move update_flash_attn_metadata to attn backend (#731) před 3 měsíci
..
backends 7a313483f1 chore: move update_flash_attn_metadata to attn backend (#731) před 3 měsíci
ops e200775863 feat: enable using fp8 kv and prefix caching with chunked prefill (#668) před 4 měsíci
__init__.py a0e446a17d feat: initial encoder-decoder support with BART model (#633) před 4 měsíci
layer.py bf88c8567e feat: mamba model support (#674) před 4 měsíci
selector.py 5d37ec1016 suppress tpu import warning (#696) před 4 měsíci