AlpinDale c577c31aaa feat: tree attention 8 tháng trước cách đây
..
attention c577c31aaa feat: tree attention 8 tháng trước cách đây
common c577c31aaa feat: tree attention 8 tháng trước cách đây
distributed b1caee23a6 cache the p2p access check for memory saving 8 tháng trước cách đây
endpoints c577c31aaa feat: tree attention 8 tháng trước cách đây
engine c577c31aaa feat: tree attention 8 tháng trước cách đây
executor 60ca1e1e5e feat: add ngram prompt lookup decoding for speculative decoding (#438) 8 tháng trước cách đây
kv_quant e42a78381a feat: switch from pylint to ruff (#322) 10 tháng trước cách đây
lora fe17712f29 fully working chunked prefill 8 tháng trước cách đây
modeling b28011e86e fix: shard exl2 weights more evenly between ranks (#437) 8 tháng trước cách đây
processing c577c31aaa feat: tree attention 8 tháng trước cách đây
spec_decode 60ca1e1e5e feat: add ngram prompt lookup decoding for speculative decoding (#438) 8 tháng trước cách đây
task_handler c577c31aaa feat: tree attention 8 tháng trước cách đây
transformers_utils 58b0616dd3 feat: support sharded ggufs (#420) 8 tháng trước cách đây
__init__.py c2aaaefd57 allow out-of-tree model registry 9 tháng trước cách đây
py.typed 1c988a48b2 fix logging and add py.typed 1 năm trước cách đây