david/flash-attention

miroir de https://github.com/Dao-AILab/flash-attention

Auteur	SHA1 Message	Date
Tri Dao	dfe29f5e2b [Gen] Don't use ft_attention, use flash_attn_with_kvcache instead	il y a 1 an
Tri Dao	a01d1213d7 [Gen] Add kernel from FasterTransformer for benchmarking	il y a 1 an