Tri Dao
|
a901c7eeda
Make Sm80 forward pass work with persistent scheduler
|
преди 1 месец |
Tri Dao
|
ba2061dfe8
Support cu_seqlens_k_new in flash_attn_with_kvcache
|
преди 1 месец |
Tri Dao
|
6807b1ea37
Longest-processing-time-first scheduler for causal
|
преди 1 месец |
Tri Dao
|
df96486c31
Decode: varlen, paged KV, leftpad
|
преди 2 месеца |
Tri Dao
|
6e8b25e426
Refactor
|
преди 4 месеца |
Ying Zhang
|
dff976a84a
fixes
|
преди 5 месеца |
jayhshah
|
5018ac6ac5
Fp8 kernel with "in-kernel" transpose of V in producer (#1100)
|
преди 6 месеца |
Tri Dao
|
74b0761ff7
[FA3] BF16 forward
|
преди 6 месеца |
Tri Dao
|
7f67966cc7
FA3 initial code release
|
преди 6 месеца |