AlpinDale f0aa9b7d31 use a local variable před 10 měsíci
..
quantization f8652c8e99 fix: optimize aqlm dequantization (#325) před 10 měsíci
triton_kernel e42a78381a feat: switch from pylint to ruff (#322) před 10 měsíci
__init__.py 07aa2a492f upstream: add option to specify tokenizer před 1 rokem
activation.py e31c6f0b45 feat: refactor modeling logic and support more models (#274) před 11 měsíci
attention.py 9810daa699 feat: INT8 KV Cache (#298) před 11 měsíci
layernorm.py e31c6f0b45 feat: refactor modeling logic and support more models (#274) před 11 měsíci
linear.py e42a78381a feat: switch from pylint to ruff (#322) před 10 měsíci
rejection.py 95bdd35ec9 feat: rejection sampler (#197) před 1 rokem
rotary_embedding.py e42a78381a feat: switch from pylint to ruff (#322) před 10 měsíci
sampler.py f0aa9b7d31 use a local variable před 10 měsíci
vocab_parallel_embedding.py 968bde81bf fix: tensor parallel with GPTQ and AWQ quants (#307) před 10 měsíci