david/flash-attention

réplica de https://github.com/Dao-AILab/flash-attention

Autor	SHA1 Mensaxe	Data
Tri Dao	dfe29f5e2b [Gen] Don't use ft_attention, use flash_attn_with_kvcache instead	hai 1 ano
Tri Dao	a01d1213d7 [Gen] Add kernel from FasterTransformer for benchmarking	hai 1 ano