david/flash-attention

mirror de https://github.com/Dao-AILab/flash-attention

Autor	SHA1 Mensagem	Data
Tri Dao	dfe29f5e2b [Gen] Don't use ft_attention, use flash_attn_with_kvcache instead	há 1 ano atrás
Tri Dao	a01d1213d7 [Gen] Add kernel from FasterTransformer for benchmarking	há 1 ano atrás