Commit History

Автор SHA1 Съобщение Дата
  Tri Dao 0890032358 Implement backward pass for Sm80 преди 1 месец
  Tri Dao 14894c5717 Make BwdPostprocessKernel work with Sm80 преди 1 месец
  Tri Dao 2c996ca25f Use SeqlenInfo for bwd and epilogue преди 1 месец
  Tri Dao 29cdfedd80 Use Bulk reduce instead of TMA for dQaccum, split across WGs преди 2 месеца
  Tri Dao 82dc825759 Don't use the unsafe convert_type function преди 2 месеца
  Tri Dao 6e8b25e426 Refactor преди 4 месеца
  Ying Zhang db80387343 Add seqused_q in fwd / bwd and seqused_k in bwd. преди 5 месеца
  Cameron Shinn 3cea2fb6ee Add ArchTag to pre/postprocess bwd kernels (#1180) преди 5 месеца
  Tri Dao bafe253042 [FA3] Bwd преди 6 месеца