Commit History

Автор SHA1 Съобщение Дата
  Tri Dao 71befc19e1 [Loss] Use flash_attn.losses.cross_entropy.CrossEntropyLoss преди 1 година
  Tri Dao dff68c2b22 Add smoothing for CrossEntropyParallel, rename to CrossEntropyLoss преди 2 години
  Tri Dao 0bf5e50038 Release training code преди 2 години