AlpinDale 41beab5dc1 add exllamav2 tensor paralell, fused MoE for GPTQ/AWQ 9 månader sedan
..
quant c41462cfcd feat: exllamav2 quantization (#305) 10 månader sedan
compat.cuh c41462cfcd feat: exllamav2 quantization (#305) 10 månader sedan
matrix_view.cuh c41462cfcd feat: exllamav2 quantization (#305) 10 månader sedan
q_gemm_exl2.cu 41beab5dc1 add exllamav2 tensor paralell, fused MoE for GPTQ/AWQ 9 månader sedan
q_gemm_kernel.cuh 41beab5dc1 add exllamav2 tensor paralell, fused MoE for GPTQ/AWQ 9 månader sedan
q_matrix.cu 41beab5dc1 add exllamav2 tensor paralell, fused MoE for GPTQ/AWQ 9 månader sedan
q_matrix.cuh c41462cfcd feat: exllamav2 quantization (#305) 10 månader sedan