AlpinDale 5e82533d02 upstream: add option to specify tokenizer 1 ano atrás
..
attention 5e82533d02 upstream: add option to specify tokenizer 1 ano atrás
activation.cpp 28866137ea feat: add swiglu activation 1 ano atrás
activation_kernels.cu 28866137ea feat: add swiglu activation 1 ano atrás
attention.cpp d40a8d6bb0 chore: bind single_query_cached_kv_attention to python 1 ano atrás
cache.cpp a409431c40 feat: draft for cuda kernels 1 ano atrás
cache_kernels.cu a409431c40 feat: draft for cuda kernels 1 ano atrás
layernorm.cpp 0ec53128b6 feat: add layernorm kernels 1 ano atrás
layernorm_kernels.cu 0ec53128b6 feat: add layernorm kernels 1 ano atrás
pos_encoding.cpp 67a17a1e93 feat: add rotary embeddings 1 ano atrás
pos_encoding_kernels.cu 67a17a1e93 feat: add rotary embeddings 1 ano atrás
reduction.cuh 0ec53128b6 feat: add layernorm kernels 1 ano atrás