david/flash-attention: flash-attention from https://github.com/Dao-AILab/flash-attention @ varlen

Inicio Explorar Ayuda

Registro Iniciar sesión

david

/

flash-attention

espejo de https://github.com/Dao-AILab/flash-attention

1

0

Fork 0

Archivos Incidencias 0 Wiki

Rama: varlen

Ramas Etiquetas

changes_for_fp8

decode

doc_masking

fa3-fp8-varlen

fa3-kvcache-gqa

ipiszy/local_attn

ipiszy/used_q

main

tdd

varlen

v2.7.2.post1

v2.7.2

v2.7.1.post4

v2.7.1.post3

v2.7.1.post2

v2.7.1.post1

v2.7.1

v2.7.0.post2

v2.7.0.post1

v2.7.0

v2.6.3

v2.6.2

v2.6.1

v2.6.0.post1

v2.6.0

v2.5.9.post1

v2.5.9

v2.5.8

v2.5.7

v2.5.6

v2.5.5

v2.5.4

v2.5.3

v2.5.2

v2.5.1.post1

v2.5.1

v2.5.0

v2.4.3.post1

v2.4.3

v2.4.2

v2.4.1

v2.4.0.post1

v2.4.0

v2.3.6

v2.3.5

v2.3.4

v2.3.3

v2.3.2

v2.3.1.post1

v2.3.1

v2.3.0

v2.2.5

v2.2.4.post1

v2.2.4

v2.2.3.post2

v2.2.3.post1

v2.2.3

v2.2.2

v2.2.1

v2.2.0

v2.1.2.post3

v2.1.2.post2

v2.1.2.post1

v2.1.2

v2.1.1

v2.1.0

v2.0.9

v2.0.8

v2.0.7

v2.0.6.post2

v2.0.6.post1

v2.0.6

v2.0.5

v2.0.4

v2.0.3

v2.0.2

v2.0.1

v2.0.0

v1.0.9

v1.0.8

v1.0.7

v1.0.6

v1.0.5

v1.0.4

v1.0.3.post0

v1.0.3

v1.0.2

v1.0.1

v1.0.0

v0.2.8

v0.2.7

v0.2.6

v0.2.5

v0.2.4

v0.2.3

v0.2.2

v0.2.1

flash-attention

/

assets

/

gpt3_training_efficiency.jpg

gpt3_training_efficiency.jpg 382 KB

Permalink Histórico Raw

Página: 43ms Plantilla: 2ms

español

español English 简体中文繁體中文（香港）繁體中文（臺灣） Deutsch français Nederlands latviešu русский 日本語 português do Brasil polski български italiano suomi Türkçe čeština српски svenska 한국어 galego українська English (United Kingdom) Magyar Slovenčina Indonesian Persian Vietnamese Português Монгол Română

Javascript Licenses Página web

gpt3_training_efficiency.jpg 382 KB Permalink Histórico Raw

gpt3_training_efficiency.jpg 382 KB

Permalink Histórico Raw