Historial de Commits

Autor SHA1 Mensaje Fecha
  Tri Dao dfe29f5e2b [Gen] Don't use ft_attention, use flash_attn_with_kvcache instead hace 1 año
  Tri Dao d0032700d1 Add tests for Pythia, GPT-JT, and RedPajama models hace 1 año
  Tri Dao 8a733cbd53 [Gen] Fix calling update_graph_cache in tests hace 1 año
  Tri Dao 913922cac5 [Gen] Refactor decoding function hace 1 año
  Tri Dao 0e8c46ae08 Run isort and black on test files hace 1 año
  Tri Dao 8e9820a55b [Rotary] Fix tests when loading state dict with rotary inv_freqs hace 1 año
  Tri Dao 425dbcb6c6 [MHA] Implement MQA/GQA hace 1 año
  Tri Dao b3177dfaf6 [GPT] Enable FlashAttention for GPT-J hace 1 año
  Tri Dao 96d10f6545 Implement LLaMa hace 1 año
  Tri Dao 605655bc66 [Gen] Fix FT kernel when using CG hace 1 año
  Tri Dao 393882bc08 [LayerNorm] Implement LN with parallel residual, support dim 8k hace 1 año
  Tri Dao 993d12448e Implement GPT-NeoX hace 1 año
  Tri Dao 4d87e4d875 Implement GPT-J hace 1 año