AlpinDale 41beab5dc1 add exllamav2 tensor paralell, fused MoE for GPTQ/AWQ vor 9 Monaten
..
autogptq_cuda_256.cpp 801eda0b7a feat: support GPTQ 2, 3, and 8bit quants (#181) vor 1 Jahr
autogptq_cuda_64.cpp 801eda0b7a feat: support GPTQ 2, 3, and 8bit quants (#181) vor 1 Jahr
autogptq_cuda_kernel_256.cu 801eda0b7a feat: support GPTQ 2, 3, and 8bit quants (#181) vor 1 Jahr
autogptq_cuda_kernel_64.cu 801eda0b7a feat: support GPTQ 2, 3, and 8bit quants (#181) vor 1 Jahr
compat.cuh 2755a48d51 merge dev branch into main (#153) vor 1 Jahr
matrix_view.cuh 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) vor 1 Jahr
q_gemm.cu 41beab5dc1 add exllamav2 tensor paralell, fused MoE for GPTQ/AWQ vor 9 Monaten
qdq_2.cuh 801eda0b7a feat: support GPTQ 2, 3, and 8bit quants (#181) vor 1 Jahr
qdq_3.cuh 801eda0b7a feat: support GPTQ 2, 3, and 8bit quants (#181) vor 1 Jahr
qdq_4.cuh 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) vor 1 Jahr
qdq_8.cuh 801eda0b7a feat: support GPTQ 2, 3, and 8bit quants (#181) vor 1 Jahr
qdq_util.cuh 2755a48d51 merge dev branch into main (#153) vor 1 Jahr