Historie revizí

Autor SHA1 Zpráva Datum
  Tri Dao abbc131173 [LayerNorm] Switch from CUDA to Triton implementation před 11 měsíci
  Tri Dao 393882bc08 [LayerNorm] Implement LN with parallel residual, support dim 8k před 1 rokem
  Tri Dao 6738d9477d [LayerNorm] Implement RMS Norm před 1 rokem
  Tri Dao 8c6609ae1a [LayerNorm] Support all dimensions up to 6k (if divisible by 8) před 2 roky
  Tri Dao 0bf5e50038 Release training code před 2 roky
  Tri Dao 43ab0b5205 Mention that some CUDA extensions have only been tested on A100s před 2 roky
  Tri Dao 2e33fc8e36 Add GPT and ViT models před 2 roky
  Tri Dao fa6d1ce44f Add fused_dense and dropout_add_layernorm CUDA extensions před 2 roky