Commit Verlauf

Autor SHA1 Nachricht Datum
  Tri Dao b4bf9cc1f3 Fix performance regression with causal vor 1 Jahr
  Tri Dao 9e5e8bc91e Change causal mask to be aligned to bottom-right instead of top-left vor 1 Jahr
  Tri Dao 4f285b3547 FlashAttention-2 release vor 1 Jahr
  Tri Dao 4360cfc6a8 [Triton] Fix benchmark_causal.py vor 1 Jahr
  Tri Dao 5d079fdd7a [Triton] Fix benchmark_causal, mention Triton version vor 1 Jahr
  Tri Dao b0c0db81f6 Implement FlashAttention in Triton vor 2 Jahren
  Tri Dao ed553e9238 Add Megatron attention implementation for benchmarking vor 2 Jahren
  Tri Dao 50ca23488d Add Triton implementation for benchmarking vor 2 Jahren