Historie revizí

Autor SHA1 Zpráva Datum
  Tri Dao 29cdfedd80 Use Bulk reduce instead of TMA for dQaccum, split across WGs před 1 týdnem
  Tri Dao df96486c31 Decode: varlen, paged KV, leftpad před 1 měsícem
  Tri Dao 6e8b25e426 Refactor před 2 měsíci
  Ying Zhang 1c9717d699 address comments před 2 měsíci
  Ying Zhang be6c1b98c4 small fixes před 2 měsíci
  Ying Zhang dff976a84a fixes před 3 měsíci
  Ying Zhang 7b4e68e04f hopper local attention před 3 měsíci
  Tri Dao 3f6ff1c1c5 Remove struct : cute::aligned_struct to avoid error with gcc 12 před 4 měsíci
  Tri Dao bafe253042 [FA3] Bwd před 4 měsíci
  Tri Dao 7f67966cc7 FA3 initial code release před 5 měsíci