This website works better with JavaScript
Начало
Каталог
Помощ
Регистрация
Вход
david
/
flash-attention
огледало от
https://github.com/Dao-AILab/flash-attention
Наблюдаван
1
Харесван
0
Разклонения
0
Файлове
Задачи
0
Уики
ИН на ревизия:
6807b1ea37
Клонове
Маркери
changes_for_fp8
decode
doc_masking
fa3-fp8-varlen
fa3-kvcache-gqa
ipiszy/local_attn
ipiszy/used_q
main
tdd
varlen
v2.7.2.post1
v2.7.2
v2.7.1.post4
v2.7.1.post3
v2.7.1.post2
v2.7.1.post1
v2.7.1
v2.7.0.post2
v2.7.0.post1
v2.7.0
v2.6.3
v2.6.2
v2.6.1
v2.6.0.post1
v2.6.0
v2.5.9.post1
v2.5.9
v2.5.8
v2.5.7
v2.5.6
v2.5.5
v2.5.4
v2.5.3
v2.5.2
v2.5.1.post1
v2.5.1
v2.5.0
v2.4.3.post1
v2.4.3
v2.4.2
v2.4.1
v2.4.0.post1
v2.4.0
v2.3.6
v2.3.5
v2.3.4
v2.3.3
v2.3.2
v2.3.1.post1
v2.3.1
v2.3.0
v2.2.5
v2.2.4.post1
v2.2.4
v2.2.3.post2
v2.2.3.post1
v2.2.3
v2.2.2
v2.2.1
v2.2.0
v2.1.2.post3
v2.1.2.post2
v2.1.2.post1
v2.1.2
v2.1.1
v2.1.0
v2.0.9
v2.0.8
v2.0.7
v2.0.6.post2
v2.0.6.post1
v2.0.6
v2.0.5
v2.0.4
v2.0.3
v2.0.2
v2.0.1
v2.0.0
v1.0.9
v1.0.8
v1.0.7
v1.0.6
v1.0.5
v1.0.4
v1.0.3.post0
v1.0.3
v1.0.2
v1.0.1
v1.0.0
v0.2.8
v0.2.7
v0.2.6
v0.2.5
v0.2.4
v0.2.3
v0.2.2
v0.2.1
Commit History
Намери
Автор
SHA1
Съобщение
Дата
Tri Dao
2c996ca25f
Use SeqlenInfo for bwd and epilogue
преди 1 седмица
Tri Dao
29cdfedd80
Use Bulk reduce instead of TMA for dQaccum, split across WGs
преди 1 седмица
Tri Dao
82dc825759
Don't use the unsafe convert_type function
преди 2 седмици
Tri Dao
6e8b25e426
Refactor
преди 2 месеца
Ying Zhang
db80387343
Add seqused_q in fwd / bwd and seqused_k in bwd.
преди 3 месеца
Cameron Shinn
3cea2fb6ee
Add ArchTag to pre/postprocess bwd kernels (
#1180
)
преди 3 месеца
Tri Dao
bafe253042
[FA3] Bwd
преди 4 месеца