Historial de Commits

Autor SHA1 Mensaje Fecha
  Tri Dao 0705d2718d [Llama] Fix some tests, add tests for Llama 2 and CodeLlama hace 1 año
  Kevin Hu 42832575d4 Fix Llama GQA/MQA (#546) hace 1 año
  Tri Dao dfe29f5e2b [Gen] Don't use ft_attention, use flash_attn_with_kvcache instead hace 1 año
  Tri Dao 8a733cbd53 [Gen] Fix calling update_graph_cache in tests hace 1 año
  Tri Dao 913922cac5 [Gen] Refactor decoding function hace 1 año
  Tri Dao 0e8c46ae08 Run isort and black on test files hace 1 año
  Xuechen Li 7fcd3e6a04 map custom model state_dict back to huggingface format (#465) hace 1 año
  Xuechen Li bb4cded17b support when num_heads is not divisible by world_size; resolves #459 (#461) hace 1 año
  Xuechen Li 0f7853c6a1 enable loading hf llama checkpoints for training (#446) hace 1 año
  Tri Dao 184b992dcb [GPT] Implement parallel LLaMa hace 1 año
  Tri Dao 56ccaff126 [GPT] Add LLaMa-13B to test hace 1 año
  Tri Dao 8e9820a55b [Rotary] Fix tests when loading state dict with rotary inv_freqs hace 1 año
  Tri Dao 62e9814466 [Rotary] Make sure frequency calculation is in fp32 hace 1 año
  Tri Dao a9a4b4e4f2 [LLaMa] Fix last norm layer to use RMSNorm instead of LayerNorm hace 1 año
  Tri Dao 96d10f6545 Implement LLaMa hace 1 año