david/flash-attention

mirror of https://github.com/Dao-AILab/flash-attention

Tác giả	SHA1 Thông báo	Ngày
Tri Dao	dfe29f5e2b [Gen] Don't use ft_attention, use flash_attn_with_kvcache instead	1 năm trước cách đây
Tri Dao	a01d1213d7 [Gen] Add kernel from FasterTransformer for benchmarking	1 năm trước cách đây