AlpinDale 1334a833a4 feat: AMD ROCm support (#95) 1 năm trước cách đây
..
attention 1334a833a4 feat: AMD ROCm support (#95) 1 năm trước cách đây
quantization 1334a833a4 feat: AMD ROCm support (#95) 1 năm trước cách đây
activation_kernels.cu 1334a833a4 feat: AMD ROCm support (#95) 1 năm trước cách đây
cache.h 1aab8a7d6f feat: speedup compilation times by 3x (#130) 1 năm trước cách đây
cache_kernels.cu 1334a833a4 feat: AMD ROCm support (#95) 1 năm trước cách đây
cuda_compat.h 1334a833a4 feat: AMD ROCm support (#95) 1 năm trước cách đây
cuda_utils.h 1aab8a7d6f feat: speedup compilation times by 3x (#130) 1 năm trước cách đây
cuda_utils_kernels.cu 1334a833a4 feat: AMD ROCm support (#95) 1 năm trước cách đây
dispatch_utils.h 32844c1522 add GELU kernels and remove compile bloat 1 năm trước cách đây
layernorm_kernels.cu 7612f33afd feat: fused add RMSNorm kernels (#125) 1 năm trước cách đây
ops.h 1334a833a4 feat: AMD ROCm support (#95) 1 năm trước cách đây
pos_encoding_kernels.cu 1334a833a4 feat: AMD ROCm support (#95) 1 năm trước cách đây
pybind.cpp 1334a833a4 feat: AMD ROCm support (#95) 1 năm trước cách đây
reduction.cuh 1334a833a4 feat: AMD ROCm support (#95) 1 năm trước cách đây