Tri Dao
|
ef6d8c75d9
[GPT] Fix loading weights from HF hub
|
1 年間 前 |
Tri Dao
|
f1a73d0740
Run isort and black on python files
|
1 年間 前 |
Xuechen Li
|
0f7853c6a1
enable loading hf llama checkpoints for training (#446)
|
1 年間 前 |
Tri Dao
|
78b7a1dc18
[OPT] Load fp16 weights on CPU before moving to GPU
|
1 年間 前 |
Tri Dao
|
f68d41ec77
[Gen] Add OPT to generation test
|
1 年間 前 |
Tri Dao
|
7c2191542a
[Gen] Make generation work with Tensor Parallel
|
1 年間 前 |
Tri Dao
|
11be742aa3
[Gen] Test generation with rotary embedding
|
1 年間 前 |
Tri Dao
|
c6ecd40a59
Tweak CrossEntropyLoss to take process_group in init
|
1 年間 前 |