Histórico de Commits

Autor SHA1 Mensagem Data
  Tri Dao abbc131173 [LayerNorm] Switch from CUDA to Triton implementation há 11 meses atrás
  Tri Dao 393882bc08 [LayerNorm] Implement LN with parallel residual, support dim 8k há 1 ano atrás
  Tri Dao 6738d9477d [LayerNorm] Implement RMS Norm há 1 ano atrás
  Tri Dao 8c6609ae1a [LayerNorm] Support all dimensions up to 6k (if divisible by 8) há 2 anos atrás
  Tri Dao 0bf5e50038 Release training code há 2 anos atrás
  Tri Dao 43ab0b5205 Mention that some CUDA extensions have only been tested on A100s há 2 anos atrás
  Tri Dao 2e33fc8e36 Add GPT and ViT models há 2 anos atrás
  Tri Dao fa6d1ce44f Add fused_dense and dropout_add_layernorm CUDA extensions há 2 anos atrás