AlpinDale 3d72f05c7b feat: flattened 1D tensor -> 2D tensor (#85) 1 vuosi sitten
..
attention 4e71bd1d12 feat: add PagedAttention V2 kernels (#76) 1 vuosi sitten
quantization ce5e2332ea fix: launch AWQ kernels on the current CUDAStream (#75) 1 vuosi sitten
activation.cpp 32844c1522 add GELU kernels and remove compile bloat 1 vuosi sitten
activation_kernels.cu 3d72f05c7b feat: flattened 1D tensor -> 2D tensor (#85) 1 vuosi sitten
attention.cpp 4e71bd1d12 feat: add PagedAttention V2 kernels (#76) 1 vuosi sitten
cache.cpp 081545bde6 fix: various CUDA kernel tweaks 1 vuosi sitten
cache_kernels.cu 3d72f05c7b feat: flattened 1D tensor -> 2D tensor (#85) 1 vuosi sitten
cuda_utils.cpp 75c27d3e65 massive overhaul 1 vuosi sitten
cuda_utils_kernels.cu 75c27d3e65 massive overhaul 1 vuosi sitten
dispatch_utils.h 32844c1522 add GELU kernels and remove compile bloat 1 vuosi sitten
layernorm.cpp 081545bde6 fix: various CUDA kernel tweaks 1 vuosi sitten
layernorm_kernels.cu 3d72f05c7b feat: flattened 1D tensor -> 2D tensor (#85) 1 vuosi sitten
pos_encoding.cpp 45f6d9f923 initial refactor commit 1 vuosi sitten
pos_encoding_kernels.cu 3d72f05c7b feat: flattened 1D tensor -> 2D tensor (#85) 1 vuosi sitten
quantization.cpp 0495c50a3e GPTQ+exllama support (#21) 1 vuosi sitten
reduction.cuh 081545bde6 fix: various CUDA kernel tweaks 1 vuosi sitten