AlpinDale 0307da9e15 refactor: bitsandbytes -> autoquant 7 tháng trước cách đây
..
aqlm 3bdeb3e116 fix: clang formatting for all kernels (#558) 7 tháng trước cách đây
autoquant 0307da9e15 refactor: bitsandbytes -> autoquant 7 tháng trước cách đây
awq 9d81716bfd [v0.5.3] Release Candidate (#388) 10 tháng trước cách đây
compressed_tensors f4ea11b982 feat: initial support for activation quantization 7 tháng trước cách đây
cutlass_w8a8 f2c6791527 feat: update cutlass fp8 configs 7 tháng trước cách đây
exl2 9d81716bfd [v0.5.3] Release Candidate (#388) 10 tháng trước cách đây
fp8 3bdeb3e116 fix: clang formatting for all kernels (#558) 7 tháng trước cách đây
gguf 9d81716bfd [v0.5.3] Release Candidate (#388) 10 tháng trước cách đây
gptq 3bdeb3e116 fix: clang formatting for all kernels (#558) 7 tháng trước cách đây
gptq_marlin 3bdeb3e116 fix: clang formatting for all kernels (#558) 7 tháng trước cách đây
int8_kvcache 9810daa699 feat: INT8 KV Cache (#298) 1 năm trước cách đây
marlin d8667fcb98 improve gptq_marlin_24 prefill performance 7 tháng trước cách đây
quip aebd68c632 feat: backport kernels (#235) 1 năm trước cách đây
squeezellm 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) 1 năm trước cách đây
quant_ops.cpp f4ea11b982 feat: initial support for activation quantization 7 tháng trước cách đây
quant_ops.h f4ea11b982 feat: initial support for activation quantization 7 tháng trước cách đây