Tri Dao
|
0705d2718d
[Llama] Fix some tests, add tests for Llama 2 and CodeLlama
|
1 tahun lalu |
Kevin Hu
|
42832575d4
Fix Llama GQA/MQA (#546)
|
1 tahun lalu |
Tri Dao
|
dfe29f5e2b
[Gen] Don't use ft_attention, use flash_attn_with_kvcache instead
|
1 tahun lalu |
Tri Dao
|
8a733cbd53
[Gen] Fix calling update_graph_cache in tests
|
1 tahun lalu |
Tri Dao
|
913922cac5
[Gen] Refactor decoding function
|
1 tahun lalu |
Tri Dao
|
0e8c46ae08
Run isort and black on test files
|
1 tahun lalu |
Xuechen Li
|
7fcd3e6a04
map custom model state_dict back to huggingface format (#465)
|
1 tahun lalu |
Xuechen Li
|
bb4cded17b
support when num_heads is not divisible by world_size; resolves #459 (#461)
|
1 tahun lalu |
Xuechen Li
|
0f7853c6a1
enable loading hf llama checkpoints for training (#446)
|
1 tahun lalu |
Tri Dao
|
184b992dcb
[GPT] Implement parallel LLaMa
|
1 tahun lalu |
Tri Dao
|
56ccaff126
[GPT] Add LLaMa-13B to test
|
1 tahun lalu |
Tri Dao
|
8e9820a55b
[Rotary] Fix tests when loading state dict with rotary inv_freqs
|
1 tahun lalu |
Tri Dao
|
62e9814466
[Rotary] Make sure frequency calculation is in fp32
|
1 tahun lalu |
Tri Dao
|
a9a4b4e4f2
[LLaMa] Fix last norm layer to use RMSNorm instead of LayerNorm
|
1 tahun lalu |
Tri Dao
|
96d10f6545
Implement LLaMa
|
1 tahun lalu |