AlpinDale 41beab5dc1 add exllamav2 tensor paralell, fused MoE for GPTQ/AWQ | hace 9 meses | |
---|---|---|
.. | ||
LICENSE | 72229a94da feat: better marlin kernels (#285) | hace 10 meses |
marlin_cuda_kernel.cu | 72229a94da feat: better marlin kernels (#285) | hace 10 meses |
marlin_cuda_kernel_zero.cu | 41beab5dc1 add exllamav2 tensor paralell, fused MoE for GPTQ/AWQ | hace 9 meses |