Historial de Commits

Autor SHA1 Mensaje Fecha
  Tri Dao d5893f3c74 Merge branch 'main' into changes_for_fp8 hace 4 meses
  Tri Dao 59594f2a67 Bump to v2.6.2 hace 4 meses
  Tri Dao 299563626f Fix test with alibi and cache_leftpad hace 4 meses
  Tri Dao 4488acee8d [CI] Compile with torch 2.4.0.dev20240527 hace 4 meses
  Tri Dao 65f723bb9a Split bwd into more .cu files to speed up compilation hace 4 meses
  Tri Dao 5ca83a9c71 Clean up softcapping bwd a bit hace 4 meses
  Tri Dao 751c762c9c Don't specialize for hdim 224 to speed up compilation hace 4 meses
  Driss Guessous 1c275eb070 Fix ima for split-kv kernel (#1085) hace 4 meses
  janEbert 3c4053b75c Make FA3 externally importable (#1053) hace 4 meses
  rocking d8f104e97a Support AMD ROCm on FlashAttention 2 (#1010) hace 4 meses
  Ying Zhang dfe1a59e4b Add var-seq-len to FA3 fp16 / bf16 fwd (#1072) hace 4 meses
  Cameron Shinn cb516f855b Remove torchlib dependency from cpp files (#1083) hace 4 meses
  Phil Wang 5f1ae4a34b backwards for softcapping (#1033) hace 4 meses
  youkaichao ef3e358a25 remove lambda (#1056) hace 4 meses
  Jorge António 4df62e1440 catch typo (#1058) hace 4 meses
  Ganesh Bikshandi 81b379c54d minor reformatting. hace 4 meses
  Ganesh Bikshandi e0607bb3aa minor formatting. hace 4 meses
  Ganesh Bikshandi df66e974bc fixed odd-seq-len-k. hace 4 meses
  Ganesh Bikshandi 63e9277199 change to correct tile size for headdim=128. hace 4 meses
  Ganesh Bikshandi fe4c5b59df undid clang formatting. hace 4 meses
  Ganesh Bikshandi 4eacd5886d enable all tests except odd-seq-lengths, where it crashes now. hace 4 meses
  Ganesh Bikshandi d5c2d1aa18 removed contiguous check. hace 5 meses
  Ganesh Bikshandi cdc966e81a adding files for fp8 changes. hace 5 meses
  Tri Dao 74b0761ff7 [FA3] BF16 forward hace 5 meses
  Tri Dao 898dd4bbf2 Pass seqused_k to _flash_attn_varlen_forward hace 5 meses
  Tri Dao 7ef24848cf Add FA3 image hace 5 meses
  Tri Dao 7f67966cc7 FA3 initial code release hace 5 meses
  Tri Dao b4a9dd6c9c Temporarily switch to cutlass fork for more shapes hace 5 meses
  Tri Dao 7551202cb2 Bump to v2.6.1 hace 5 meses
  Tri Dao 844912dca0 [CI] Switch from CUDA 12.2 to 12.3 hace 5 meses