david/flash-attention: flash-attention from https://github.com/Dao-AILab/flash-attention @ fa3-fp8-varlen - Gogs

Accueil Explorer Aide

S'inscrire Connexion

david

/

flash-attention

miroir de https://github.com/Dao-AILab/flash-attention

1

0

Fichiers Tickets 0 Wiki

Branche: fa3-fp8-varlen

changes_for_fp8

decode

doc_masking

fa3-fp8-varlen

fa3-kvcache-gqa

ipiszy/local_attn

ipiszy/used_q

main

tdd

varlen

v2.7.2.post1

v2.7.2

v2.7.1.post4

v2.7.1.post3

v2.7.1.post2

v2.7.1.post1

v2.7.1

v2.7.0.post2

v2.7.0.post1

v2.7.0

v2.6.3

v2.6.2

v2.6.1

v2.6.0.post1

v2.6.0

v2.5.9.post1

v2.5.9

v2.5.8

v2.5.7

v2.5.6

v2.5.5

v2.5.4

v2.5.3

v2.5.2

v2.5.1.post1

v2.5.1

v2.5.0

v2.4.3.post1

v2.4.3

v2.4.2

v2.4.1

v2.4.0.post1

v2.4.0

v2.3.6

v2.3.5

v2.3.4

v2.3.3

v2.3.2

v2.3.1.post1

v2.3.1

v2.3.0

v2.2.5

v2.2.4.post1

v2.2.4

v2.2.3.post2

v2.2.3.post1

v2.2.3

v2.2.2

v2.2.1

v2.2.0

v2.1.2.post3

v2.1.2.post2

v2.1.2.post1

v2.1.2

v2.1.1

v2.1.0

v2.0.9

v2.0.8

v2.0.7

v2.0.6.post2

v2.0.6.post1

v2.0.6

v2.0.5

v2.0.4

v2.0.3

v2.0.2

v2.0.1

v2.0.0

v1.0.9

v1.0.8

v1.0.7

v1.0.6

v1.0.5

v1.0.4

v1.0.3.post0

v1.0.3

v1.0.2

v1.0.1

v1.0.0

v0.2.8

v0.2.7

v0.2.6

v0.2.5

v0.2.4

v0.2.3

v0.2.2

v0.2.1

flash-attention

/

training

/

configs

/

trainer

/

ddp.yaml

ddp.yaml 70 B

Lien permanent Historique Raw

123456

defaults:
  - default.yaml

accelerator: gpu
devices: 4
strategy: ddp

© 2024 Gogs

Page: 45ms Modèle: 2ms

français

français English 简体中文繁體中文（香港）繁體中文（臺灣） Deutsch Nederlands latviešu русский 日本語 español português do Brasil polski български italiano suomi Türkçe čeština српски svenska 한국어 galego українська English (United Kingdom) Magyar Slovenčina Indonesian Persian Vietnamese Português Монгол Română

Javascript Licenses Site web