.. |
fused_softmax.cpp
|
ed553e9238
Add Megatron attention implementation for benchmarking
|
2 năm trước cách đây |
scaled_masked_softmax.h
|
ed553e9238
Add Megatron attention implementation for benchmarking
|
2 năm trước cách đây |
scaled_masked_softmax_cuda.cu
|
ed553e9238
Add Megatron attention implementation for benchmarking
|
2 năm trước cách đây |
scaled_upper_triang_masked_softmax.h
|
ed553e9238
Add Megatron attention implementation for benchmarking
|
2 năm trước cách đây |
scaled_upper_triang_masked_softmax_cuda.cu
|
ed553e9238
Add Megatron attention implementation for benchmarking
|
2 năm trước cách đây |
setup.py
|
50896ec574
Make nvcc threads configurable via environment variable (#885)
|
9 tháng trước cách đây |
type_shim.h
|
ed553e9238
Add Megatron attention implementation for benchmarking
|
2 năm trước cách đây |