AlpinDale 41beab5dc1 add exllamav2 tensor paralell, fused MoE for GPTQ/AWQ | преди 9 месеца | |
---|---|---|
.. | ||
dequantize.cuh | 9f7a0e3ecb feat: AWQ support for Turing GPUs (#53) | преди 1 година |
gemm_kernels.cu | 41beab5dc1 add exllamav2 tensor paralell, fused MoE for GPTQ/AWQ | преди 9 месеца |