.. |
fused_softmax.cpp
|
ed553e9238
Add Megatron attention implementation for benchmarking
|
před 2 roky |
scaled_masked_softmax.h
|
ed553e9238
Add Megatron attention implementation for benchmarking
|
před 2 roky |
scaled_masked_softmax_cuda.cu
|
ed553e9238
Add Megatron attention implementation for benchmarking
|
před 2 roky |
scaled_upper_triang_masked_softmax.h
|
ed553e9238
Add Megatron attention implementation for benchmarking
|
před 2 roky |
scaled_upper_triang_masked_softmax_cuda.cu
|
ed553e9238
Add Megatron attention implementation for benchmarking
|
před 2 roky |
setup.py
|
50896ec574
Make nvcc threads configurable via environment variable (#885)
|
před 9 měsíci |
type_shim.h
|
ed553e9238
Add Megatron attention implementation for benchmarking
|
před 2 roky |