AlpinDale 65cd99ba89 fix KVCache type 8 tháng trước cách đây
..
attention 1270b5567e triton compile error for flash_attn 8 tháng trước cách đây
common 6c43e00e60 add jamba modeling code 8 tháng trước cách đây
distributed b1caee23a6 cache the p2p access check for memory saving 8 tháng trước cách đây
endpoints b1caee23a6 cache the p2p access check for memory saving 8 tháng trước cách đây
engine a1f18f17e6 modify the cache engine and model runner/worker to support mamba states 8 tháng trước cách đây
executor a1f18f17e6 modify the cache engine and model runner/worker to support mamba states 8 tháng trước cách đây
kv_quant e42a78381a feat: switch from pylint to ruff (#322) 10 tháng trước cách đây
lora fe17712f29 fully working chunked prefill 8 tháng trước cách đây
modeling 65cd99ba89 fix KVCache type 8 tháng trước cách đây
processing fe17712f29 fully working chunked prefill 8 tháng trước cách đây
spec_decode 4d33ce60da feat: Triton flash attention backend for ROCm (#407) 8 tháng trước cách đây
task_handler a1f18f17e6 modify the cache engine and model runner/worker to support mamba states 8 tháng trước cách đây
transformers_utils 4fbb052b34 add jamba config file 8 tháng trước cách đây
__init__.py c2aaaefd57 allow out-of-tree model registry 9 tháng trước cách đây
py.typed 1c988a48b2 fix logging and add py.typed 1 năm trước cách đây