Historie revizí

Autor SHA1 Zpráva Datum
  Tri Dao 4ead9bd7cc [FA3] Varlen forward před 4 měsíci
  Tri Dao 74b0761ff7 [FA3] BF16 forward před 5 měsíci
  Tri Dao 898dd4bbf2 Pass seqused_k to _flash_attn_varlen_forward před 5 měsíci
  Tri Dao 7ef24848cf Add FA3 image před 5 měsíci
  Tri Dao 7f67966cc7 FA3 initial code release před 5 měsíci
  Tri Dao b4a9dd6c9c Temporarily switch to cutlass fork for more shapes před 5 měsíci
  Tri Dao 7551202cb2 Bump to v2.6.1 před 5 měsíci
  Tri Dao 844912dca0 [CI] Switch from CUDA 12.2 to 12.3 před 5 měsíci
  Tri Dao 40e534a7f6 Implement cache_leftpad před 5 měsíci
  Tri Dao 116b05f9b0 [CI] Compile with pytorch 2.4.0.dev20240514 před 5 měsíci
  Tri Dao da11d1b853 Bump v2.6.0 před 5 měsíci
  Tri Dao d0787acc16 Relax dropout_fraction test před 5 měsíci
  Tri Dao dca6d89da4 Don't support softcap and dropout at the same time před 5 měsíci
  Tri Dao 81e01efd4b More typo fixes před 5 měsíci
  Tri Dao 72e27c6320 Fix typo with softcapping před 5 měsíci
  Tri Dao 3d41db3e2c Only test backward if there's no softcapping před 5 měsíci
  Tri Dao 908511b2b6 Split into more .cu files to speed up compilation před 5 měsíci
  Tri Dao 1d536d7de5 Minor cleanup of softcapping před 5 měsíci
  Tri Dao beb2bf2a32 Drop support for pytorch 1.12, 1.13, and python 3.7 před 5 měsíci
  Phil Wang f4628b43ec missing commas and backwards return arguments (#1032) před 5 měsíci
  Nicolas Patry 8f873cc6ac Implement softcapping. (#1025) před 5 měsíci
  Jianwei Dong 4e8d60069f Add the return_softmax_lse parameter to the flash_attn_with_kvcache function to allow returning the logsumexp of the attention scores. (#989) před 5 měsíci
  muoshuosha 6df7e0a02e Fix the varlen deterministic test (#1023) před 5 měsíci
  66RING 9486635c92 Fix typos of comments about shape. (#837) před 5 měsíci
  JDKWangGuan 0d810cfb73 Fix KeyError handling for non-existing key in state_dict.pop() (#898) před 5 měsíci
  cao lei 6a2a16e994 fix typo (#974) před 5 měsíci
  Nicolas Patry 5bf201966a Fixing argument checking when using `seqlenq_ngroups_swapped`. (#976) před 5 měsíci
  Liang ab59ec3590 remove swizzle part of `sV.data()` to get a completely non-swizzle `sVtNoSwizzle` (#984) před 5 měsíci
  Grigory Sizov f816dee63c Support unpadded LSE layout (#970) před 5 měsíci
  Tri Dao 320fb59487 Update citation před 6 měsíci