Historie revizí

Autor SHA1 Zpráva Datum
  Tri Dao 20b84d6363 Don't use IntraWGOverlap for hdim 64,512 před 3 dny
  Tri Dao 6752d62aa4 Add dynamic splits před 1 týdnem
  Tri Dao 74dfa43c8d Fix divide by 0 in causal tile_scheduler for large seqlen před 2 týdny
  Tri Dao 7bc3f031a4 Compile for both Sm80 and Sm90 před 1 měsícem
  Tri Dao 7a802796e1 Big refactor and update před 1 měsícem
  Son Nguyen 478ee666cc Make namespace comment consistent (#1305) před 4 měsíci
  jayhshah a5a75274bc FA3 kvcache + split kv + gqa parallelization (#1236) před 4 měsíci
  Ying Zhang dff976a84a fixes před 6 měsíci
  jayhshah 5018ac6ac5 Fp8 kernel with "in-kernel" transpose of V in producer (#1100) před 7 měsíci
  Tri Dao 74b0761ff7 [FA3] BF16 forward před 7 měsíci
  Tri Dao 7f67966cc7 FA3 initial code release před 7 měsíci