Tri Dao 88173a1aaf [FusedDense] Support relu, rename FusedDenseGeluDense -> FusedMLP há 1 ano atrás
..
base.yaml 71befc19e1 [Loss] Use flash_attn.losses.cross_entropy.CrossEntropyLoss há 1 ano atrás
gpt2l-flash.yaml 4a6eaa9f27 Update configs, add results há 2 anos atrás
gpt2l-hf.yaml 0bf5e50038 Release training code há 2 anos atrás
gpt2l.yaml 0bf5e50038 Release training code há 2 anos atrás
gpt2m-flash.yaml 4a6eaa9f27 Update configs, add results há 2 anos atrás
gpt2m-hf.yaml 0bf5e50038 Release training code há 2 anos atrás
gpt2m.yaml 0bf5e50038 Release training code há 2 anos atrás
gpt2s-flash.yaml 88173a1aaf [FusedDense] Support relu, rename FusedDenseGeluDense -> FusedMLP há 1 ano atrás
gpt2s-hf.yaml 0bf5e50038 Release training code há 2 anos atrás
gpt2s.yaml 0bf5e50038 Release training code há 2 anos atrás
gpt2xl-flash.yaml 4a6eaa9f27 Update configs, add results há 2 anos atrás
gpt2xl-hf.yaml 4a6eaa9f27 Update configs, add results há 2 anos atrás
gpt2xl.yaml 0bf5e50038 Release training code há 2 anos atrás