.. |
instantiations
|
7bc3f031a4
Compile for both Sm80 and Sm90
|
1 ngày trước cách đây |
__init__.py
|
7f67966cc7
FA3 initial code release
|
6 tháng trước cách đây |
benchmark_attn.py
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
benchmark_flash_attention_fp8.py
|
a5a75274bc
FA3 kvcache + split kv + gqa parallelization (#1236)
|
2 tháng trước cách đây |
benchmark_split_kv.py
|
a5a75274bc
FA3 kvcache + split kv + gqa parallelization (#1236)
|
2 tháng trước cách đây |
combine.h
|
478ee666cc
Make namespace comment consistent (#1305)
|
2 tháng trước cách đây |
copy_sm90_bulk_reduce.hpp
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
epilogue_bwd.hpp
|
7bc3f031a4
Compile for both Sm80 and Sm90
|
1 ngày trước cách đây |
epilogue_fwd.hpp
|
7bc3f031a4
Compile for both Sm80 and Sm90
|
1 ngày trước cách đây |
flash.h
|
7bc3f031a4
Compile for both Sm80 and Sm90
|
1 ngày trước cách đây |
flash_api.cpp
|
7bc3f031a4
Compile for both Sm80 and Sm90
|
1 ngày trước cách đây |
flash_attn_interface.py
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
flash_bwd_kernel_sm80.h
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
flash_bwd_kernel_sm90.h
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
flash_bwd_launch_template.h
|
7bc3f031a4
Compile for both Sm80 and Sm90
|
1 ngày trước cách đây |
flash_bwd_postprocess_kernel.h
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
flash_bwd_preprocess_kernel.h
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
flash_fwd_combine_kernel.h
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
flash_fwd_combine_launch_template.h
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
flash_fwd_combine_sm80.cu
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
flash_fwd_kernel_sm80.h
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
flash_fwd_kernel_sm90.h
|
7bc3f031a4
Compile for both Sm80 and Sm90
|
1 ngày trước cách đây |
flash_fwd_launch_template.h
|
7bc3f031a4
Compile for both Sm80 and Sm90
|
1 ngày trước cách đây |
generate_kernels.py
|
7bc3f031a4
Compile for both Sm80 and Sm90
|
1 ngày trước cách đây |
heuristics.h
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
mainloop_bwd_sm80.hpp
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
mainloop_bwd_sm90_tma_gmma_ws.hpp
|
7bc3f031a4
Compile for both Sm80 and Sm90
|
1 ngày trước cách đây |
mainloop_fwd_sm80.hpp
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
mainloop_fwd_sm90_tma_gmma_ws.hpp
|
7bc3f031a4
Compile for both Sm80 and Sm90
|
1 ngày trước cách đây |
mask.h
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
named_barrier.hpp
|
7bc3f031a4
Compile for both Sm80 and Sm90
|
1 ngày trước cách đây |
pack_gqa.h
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
padding.py
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
paged_kv.h
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
rotary.h
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
seqlen.h
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
setup.py
|
7bc3f031a4
Compile for both Sm80 and Sm90
|
1 ngày trước cách đây |
sm90_pipeline_no_cluster.hpp
|
68bf390920
Update Cutlass to fix mem fence
|
2 ngày trước cách đây |
softmax.h
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
static_switch.h
|
7bc3f031a4
Compile for both Sm80 and Sm90
|
1 ngày trước cách đây |
test_attn_kvcache.py
|
a5a75274bc
FA3 kvcache + split kv + gqa parallelization (#1236)
|
2 tháng trước cách đây |
test_flash_attn.py
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
test_kvcache.py
|
a5a75274bc
FA3 kvcache + split kv + gqa parallelization (#1236)
|
2 tháng trước cách đây |
test_util.py
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
tile_scheduler.hpp
|
7bc3f031a4
Compile for both Sm80 and Sm90
|
1 ngày trước cách đây |
tile_size.h
|
7a802796e1
Big refactor and update
|
2 ngày trước cách đây |
utils.h
|
7bc3f031a4
Compile for both Sm80 and Sm90
|
1 ngày trước cách đây |