AlpinDale 53d391e1f2 merge 'dev' into 'main' 1 ano atrás
..
attention 53d391e1f2 merge 'dev' into 'main' 1 ano atrás
quantization 15a0454172 feat: FP8 KV Cache (#185) 1 ano atrás
activation_kernels.cu b9b295d74e chore: backlogs 1 (#191) 1 ano atrás
cache.h 15a0454172 feat: FP8 KV Cache (#185) 1 ano atrás
cache_kernels.cu 15a0454172 feat: FP8 KV Cache (#185) 1 ano atrás
cuda_compat.h 2755a48d51 merge dev branch into main (#153) 1 ano atrás
cuda_utils.h 2755a48d51 merge dev branch into main (#153) 1 ano atrás
cuda_utils_kernels.cu 2755a48d51 merge dev branch into main (#153) 1 ano atrás
dispatch_utils.h 7e72ce0a73 feat: mixtral tensor parallelism (#193) 1 ano atrás
layernorm_kernels.cu b9b295d74e chore: backlogs 1 (#191) 1 ano atrás
misc_kernels.cu 7e72ce0a73 feat: mixtral tensor parallelism (#193) 1 ano atrás
ops.h 7e72ce0a73 feat: mixtral tensor parallelism (#193) 1 ano atrás
pos_encoding_kernels.cu b9b295d74e chore: backlogs 1 (#191) 1 ano atrás
pybind.cpp 7e72ce0a73 feat: mixtral tensor parallelism (#193) 1 ano atrás
reduction.cuh 2755a48d51 merge dev branch into main (#153) 1 ano atrás