david/flash-attention: flash-attention from https://github.com/Dao-AILab/flash-attention @ d5893f3c74ae53d0b42632fe5cfeb755d6bb0c7a - Gogs

Inicio Explorar Ayuda

Registro Iniciar sesión

david

/

flash-attention

espejo de https://github.com/Dao-AILab/flash-attention

1

0

Archivos Incidencias 0 Wiki

Árbol: d5893f3c74

Ramas Etiquetas

changes_for_fp8

decode

doc_masking

fa3-fp8-varlen

fa3-kvcache-gqa

ipiszy/local_attn

ipiszy/used_q

main

tdd

varlen

v2.7.2.post1

v2.7.2

v2.7.1.post4

v2.7.1.post3

v2.7.1.post2

v2.7.1.post1

v2.7.1

v2.7.0.post2

v2.7.0.post1

v2.7.0

v2.6.3

v2.6.2

v2.6.1

v2.6.0.post1

v2.6.0

v2.5.9.post1

v2.5.9

v2.5.8

v2.5.7

v2.5.6

v2.5.5

v2.5.4

v2.5.3

v2.5.2

v2.5.1.post1

v2.5.1

v2.5.0

v2.4.3.post1

v2.4.3

v2.4.2

v2.4.1

v2.4.0.post1

v2.4.0

v2.3.6

v2.3.5

v2.3.4

v2.3.3

v2.3.2

v2.3.1.post1

v2.3.1

v2.3.0

v2.2.5

v2.2.4.post1

v2.2.4

v2.2.3.post2

v2.2.3.post1

v2.2.3

v2.2.2

v2.2.1

v2.2.0

v2.1.2.post3

v2.1.2.post2

v2.1.2.post1

v2.1.2

v2.1.1

v2.1.0

v2.0.9

v2.0.8

v2.0.7

v2.0.6.post2

v2.0.6.post1

v2.0.6

v2.0.5

v2.0.4

v2.0.3

v2.0.2

v2.0.1

v2.0.0

v1.0.9

v1.0.8

v1.0.7

v1.0.6

v1.0.5

v1.0.4

v1.0.3.post0

v1.0.3

v1.0.2

v1.0.1

v1.0.0

v0.2.8

v0.2.7

v0.2.6

v0.2.5

v0.2.4

v0.2.3

v0.2.2

v0.2.1

flash-attention

/

assets

/

gpt2_training_efficiency.jpg

gpt2_training_efficiency.jpg 367 KB

Histórico Raw

© 2024 Gogs

Página: 54ms Plantilla: 2ms

español

español English 简体中文繁體中文（香港）繁體中文（臺灣） Deutsch français Nederlands latviešu русский 日本語 português do Brasil polski български italiano suomi Türkçe čeština српски svenska 한국어 galego українська English (United Kingdom) Magyar Slovenčina Indonesian Persian Vietnamese Português Монгол Română

Javascript Licenses Página web