AlpinDale c577c31aaa feat: tree attention před 8 měsíci
..
attention c577c31aaa feat: tree attention před 8 měsíci
common c577c31aaa feat: tree attention před 8 měsíci
distributed b1caee23a6 cache the p2p access check for memory saving před 8 měsíci
endpoints c577c31aaa feat: tree attention před 8 měsíci
engine c577c31aaa feat: tree attention před 8 měsíci
executor 60ca1e1e5e feat: add ngram prompt lookup decoding for speculative decoding (#438) před 8 měsíci
kv_quant e42a78381a feat: switch from pylint to ruff (#322) před 10 měsíci
lora fe17712f29 fully working chunked prefill před 8 měsíci
modeling b28011e86e fix: shard exl2 weights more evenly between ranks (#437) před 8 měsíci
processing c577c31aaa feat: tree attention před 8 měsíci
spec_decode 60ca1e1e5e feat: add ngram prompt lookup decoding for speculative decoding (#438) před 8 měsíci
task_handler c577c31aaa feat: tree attention před 8 měsíci
transformers_utils 58b0616dd3 feat: support sharded ggufs (#420) před 8 měsíci
__init__.py c2aaaefd57 allow out-of-tree model registry před 9 měsíci
py.typed 1c988a48b2 fix logging and add py.typed před 1 rokem