.. |
composable_kernel @ 8182976c37
|
d8f104e97a
Support AMD ROCm on FlashAttention 2 (#1010)
|
před 4 měsíci |
cutlass @ 756c351b49
|
74b0761ff7
[FA3] BF16 forward
|
před 5 měsíci |
flash_attn
|
65f723bb9a
Split bwd into more .cu files to speed up compilation
|
před 4 měsíci |
flash_attn_ck
|
d8f104e97a
Support AMD ROCm on FlashAttention 2 (#1010)
|
před 4 měsíci |
ft_attention
|
50896ec574
Make nvcc threads configurable via environment variable (#885)
|
před 9 měsíci |
fused_dense_lib
|
50896ec574
Make nvcc threads configurable via environment variable (#885)
|
před 9 měsíci |
fused_softmax
|
50896ec574
Make nvcc threads configurable via environment variable (#885)
|
před 9 měsíci |
layer_norm
|
50896ec574
Make nvcc threads configurable via environment variable (#885)
|
před 9 měsíci |
rotary
|
50896ec574
Make nvcc threads configurable via environment variable (#885)
|
před 9 měsíci |
xentropy
|
50896ec574
Make nvcc threads configurable via environment variable (#885)
|
před 9 měsíci |