AlpinDale 89c32b40ec chore: add new imatrix quants (#320) преди 10 месеца
..
aqlm 705821a7fe feat: AQLM quantization support (#293) преди 10 месеца
awq 5053743c1c feat: speedup AWQ (#223) преди 11 месеца
bitsandbytes a98babfb74 fix: bnb on Turing GPUs (#299) преди 10 месеца
exl2 c41462cfcd feat: exllamav2 quantization (#305) преди 10 месеца
fp8_e5m2_kvcache 8e1cd54497 fix: do not include fp8 for rocm (#271) преди 10 месеца
gguf 89c32b40ec chore: add new imatrix quants (#320) преди 10 месеца
gptq 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) преди 11 месеца
int8_kvcache 9810daa699 feat: INT8 KV Cache (#298) преди 10 месеца
marlin 72229a94da feat: better marlin kernels (#285) преди 10 месеца
quip aebd68c632 feat: backport kernels (#235) преди 11 месеца
squeezellm 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) преди 11 месеца