AlpinDale 41beab5dc1 add exllamav2 tensor paralell, fused MoE for GPTQ/AWQ hace 9 meses
..
quant c41462cfcd feat: exllamav2 quantization (#305) hace 10 meses
compat.cuh c41462cfcd feat: exllamav2 quantization (#305) hace 10 meses
matrix_view.cuh c41462cfcd feat: exllamav2 quantization (#305) hace 10 meses
q_gemm_exl2.cu 41beab5dc1 add exllamav2 tensor paralell, fused MoE for GPTQ/AWQ hace 9 meses
q_gemm_kernel.cuh 41beab5dc1 add exllamav2 tensor paralell, fused MoE for GPTQ/AWQ hace 9 meses
q_matrix.cu 41beab5dc1 add exllamav2 tensor paralell, fused MoE for GPTQ/AWQ hace 9 meses
q_matrix.cuh c41462cfcd feat: exllamav2 quantization (#305) hace 10 meses