AlpinDale ba2c3fc88d feat: add Tencent Hunyuan model support hace 2 meses
..
backends ba2c3fc88d feat: add Tencent Hunyuan model support hace 2 meses
ops e200775863 feat: enable using fp8 kv and prefix caching with chunked prefill (#668) hace 4 meses
__init__.py a0e446a17d feat: initial encoder-decoder support with BART model (#633) hace 5 meses
layer.py bf88c8567e feat: mamba model support (#674) hace 4 meses
selector.py 5d37ec1016 suppress tpu import warning (#696) hace 4 meses