Commit History

Autor SHA1 Mensaxe Data
  Tri Dao d0032700d1 Add tests for Pythia, GPT-JT, and RedPajama models hai 1 ano
  Tri Dao 8a733cbd53 [Gen] Fix calling update_graph_cache in tests hai 1 ano
  Tri Dao 0e8c46ae08 Run isort and black on test files hai 1 ano
  Tri Dao 96d10f6545 Implement LLaMa hai 1 ano
  Tri Dao 393882bc08 [LayerNorm] Implement LN with parallel residual, support dim 8k hai 1 ano
  Tri Dao 993d12448e Implement GPT-NeoX hai 1 ano