david/flash-attention: flash-attention from https://github.com/Dao-AILab/flash-attention @ fa3-fp8-varlen - Gogs

Halaman utama Jelajahi Bantuan

david

/

flash-attention

cermin dari https://github.com/Dao-AILab/flash-attention

1

0

Berkas Masalah 0 Wiki

Cabang: fa3-fp8-varlen

changes_for_fp8

decode

doc_masking

fa3-fp8-varlen

fa3-kvcache-gqa

ipiszy/local_attn

ipiszy/used_q

main

tdd

varlen

v2.7.2.post1

v2.7.2

v2.7.1.post4

v2.7.1.post3

v2.7.1.post2

v2.7.1.post1

v2.7.1

v2.7.0.post2

v2.7.0.post1

v2.7.0

v2.6.3

v2.6.2

v2.6.1

v2.6.0.post1

v2.6.0

v2.5.9.post1

v2.5.9

v2.5.8

v2.5.7

v2.5.6

v2.5.5

v2.5.4

v2.5.3

v2.5.2

v2.5.1.post1

v2.5.1

v2.5.0

v2.4.3.post1

v2.4.3

v2.4.2

v2.4.1

v2.4.0.post1

v2.4.0

v2.3.6

v2.3.5

v2.3.4

v2.3.3

v2.3.2

v2.3.1.post1

v2.3.1

v2.3.0

v2.2.5

v2.2.4.post1

v2.2.4

v2.2.3.post2

v2.2.3.post1

v2.2.3

v2.2.2

v2.2.1

v2.2.0

v2.1.2.post3

v2.1.2.post2

v2.1.2.post1

v2.1.2

v2.1.1

v2.1.0

v2.0.9

v2.0.8

v2.0.7

v2.0.6.post2

v2.0.6.post1

v2.0.6

v2.0.5

v2.0.4

v2.0.3

v2.0.2

v2.0.1

v2.0.0

v1.0.9

v1.0.8

v1.0.7

v1.0.6

v1.0.5

v1.0.4

v1.0.3.post0

v1.0.3

v1.0.2

v1.0.1

v1.0.0

v0.2.8

v0.2.7

v0.2.6

v0.2.5

v0.2.4

v0.2.3

v0.2.2

v0.2.1

flash-attention

/

training

/

configs

/

trainer

/

ddp.yaml

ddp.yaml 70 B

Permalink Riwayat Mentahan

123456

defaults:
  - default.yaml

accelerator: gpu
devices: 4
strategy: ddp

© 2024 Gogs

Halaman: 47ms Templat: 3ms

Indonesian

Indonesian English 简体中文繁體中文（香港）繁體中文（臺灣） Deutsch français Nederlands latviešu русский 日本語 español português do Brasil polski български italiano suomi Türkçe čeština српски svenska 한국어 galego українська English (United Kingdom) Magyar Slovenčina Persian Vietnamese Português Монгол Română

Javascript Licenses Situs web