Tri Dao
|
0e8c46ae08
Run isort and black on test files
|
1 tahun lalu |
Tri Dao
|
88173a1aaf
[FusedDense] Support relu, rename FusedDenseGeluDense -> FusedMLP
|
1 tahun lalu |
Tri Dao
|
93383bd55b
[TP] Implement TensorParallel without sequence parallel
|
1 tahun lalu |
Tri Dao
|
ef1ba918c6
[GPT] Refactor function to shard state_dict for TensorParallel
|
1 tahun lalu |
Tri Dao
|
b4018a5028
Implement Tensor Parallel for GPT model
|
2 tahun lalu |