Histórico de Commits

Autor SHA1 Mensagem Data
  Tri Dao 0705d2718d [Llama] Fix some tests, add tests for Llama 2 and CodeLlama há 1 ano atrás
  Tri Dao dfe29f5e2b [Gen] Don't use ft_attention, use flash_attn_with_kvcache instead há 1 ano atrás
  Tri Dao 913922cac5 [Gen] Refactor decoding function há 1 ano atrás
  Tri Dao 942fcbf046 [Rotary] Implement rotary in Triton há 1 ano atrás
  Tri Dao 0e8c46ae08 Run isort and black on test files há 1 ano atrás
  Tri Dao 4d87e4d875 Implement GPT-J há 1 ano atrás
  Tri Dao 78b7a1dc18 [OPT] Load fp16 weights on CPU before moving to GPU há 1 ano atrás
  Tri Dao 88173a1aaf [FusedDense] Support relu, rename FusedDenseGeluDense -> FusedMLP há 2 anos atrás