Histórico de Commits

Autor SHA1 Mensagem Data
  Tri Dao ae3c1fb3e0 Simplify bwd by setting NumdQWarpGroups = NumMmaWarpGroups há 4 semanas atrás
  Tri Dao 2c996ca25f Use SeqlenInfo for bwd and epilogue há 1 mês atrás
  Tri Dao 3b6ac2b954 Use compile time constants in local mask há 1 mês atrás
  Tri Dao bfbaafd043 Fix bwd reading out of out LSE há 1 mês atrás
  Tri Dao 29cdfedd80 Use Bulk reduce instead of TMA for dQaccum, split across WGs há 1 mês atrás
  Tri Dao e8a1edbeb2 Clean up some #include há 1 mês atrás
  Tri Dao 3ed79742fb Add option to shuffle LSE and dPsum in the bwd há 1 mês atrás
  Tri Dao 82dc825759 Don't use the unsafe convert_type function há 1 mês atrás
  Tri Dao df96486c31 Decode: varlen, paged KV, leftpad há 1 mês atrás
  Tri Dao ea7a98f15d Fix backward with softcap há 2 meses atrás
  Tri Dao 6e8b25e426 Refactor há 3 meses atrás
  Ying Zhang 1c9717d699 address comments há 3 meses atrás
  Ying Zhang dff976a84a fixes há 4 meses atrás
  Ying Zhang 7b4e68e04f hopper local attention há 4 meses atrás
  Ying Zhang db80387343 Add seqused_q in fwd / bwd and seqused_k in bwd. há 4 meses atrás
  Tri Dao bafe253042 [FA3] Bwd há 5 meses atrás