AlpinDale 5e82533d02 upstream: add option to specify tokenizer há 1 ano atrás
..
attention 5e82533d02 upstream: add option to specify tokenizer há 1 ano atrás
activation.cpp 28866137ea feat: add swiglu activation há 1 ano atrás
activation_kernels.cu 28866137ea feat: add swiglu activation há 1 ano atrás
attention.cpp d40a8d6bb0 chore: bind single_query_cached_kv_attention to python há 1 ano atrás
cache.cpp a409431c40 feat: draft for cuda kernels há 1 ano atrás
cache_kernels.cu a409431c40 feat: draft for cuda kernels há 1 ano atrás
layernorm.cpp 0ec53128b6 feat: add layernorm kernels há 1 ano atrás
layernorm_kernels.cu 0ec53128b6 feat: add layernorm kernels há 1 ano atrás
pos_encoding.cpp 67a17a1e93 feat: add rotary embeddings há 1 ano atrás
pos_encoding_kernels.cu 67a17a1e93 feat: add rotary embeddings há 1 ano atrás
reduction.cuh 0ec53128b6 feat: add layernorm kernels há 1 ano atrás