sclarkson
|
1feb711f46
Fix compilation with clang on ARM64 (#1285)
|
hace 1 mes |
Tri Dao
|
e45a46a5b7
[Rotary] Implement GPT-J style (interleaved) rotary
|
hace 1 año |
Tri Dao
|
1e712ea8b0
Implement TensorParallel for MHA
|
hace 2 años |
Tri Dao
|
ca81f32e04
Implement rotary embedding in CUDA
|
hace 2 años |