AlpinDale d9c1d4f6e5 add awq support преди 1 година
..
attention 45f6d9f923 initial refactor commit преди 1 година
quantization d9c1d4f6e5 add awq support преди 1 година
activation.cpp 32844c1522 add GELU kernels and remove compile bloat преди 1 година
activation_kernels.cu 32844c1522 add GELU kernels and remove compile bloat преди 1 година
attention.cpp 24c78e7306 optimization: multi-query attention kernel преди 1 година
cache.cpp 081545bde6 fix: various CUDA kernel tweaks преди 1 година
cache_kernels.cu 32844c1522 add GELU kernels and remove compile bloat преди 1 година
dispatch_utils.h 32844c1522 add GELU kernels and remove compile bloat преди 1 година
layernorm.cpp 081545bde6 fix: various CUDA kernel tweaks преди 1 година
layernorm_kernels.cu 32844c1522 add GELU kernels and remove compile bloat преди 1 година
pos_encoding.cpp 45f6d9f923 initial refactor commit преди 1 година
pos_encoding_kernels.cu 45f6d9f923 initial refactor commit преди 1 година
quantization.cpp d9c1d4f6e5 add awq support преди 1 година
reduction.cuh 081545bde6 fix: various CUDA kernel tweaks преди 1 година