Commit History

Автор SHA1 Съобщение Дата
  Tri Dao 0e8c46ae08 Run isort and black on test files преди 1 година
  Tri Dao 2a2a3c4bfd [LayerNorm] Add test for randomness преди 1 година
  Tri Dao d2f4324f4c [LayerNorm] Make sure memory addresses are aligned to 16 bytes преди 1 година
  Tri Dao 393882bc08 [LayerNorm] Implement LN with parallel residual, support dim 8k преди 1 година
  Tri Dao 6738d9477d [LayerNorm] Implement RMS Norm преди 1 година
  Tri Dao 5db330519a [LayerNorm] Support taking subset of input or subset of output преди 2 години
  Tri Dao ae137ed17a [LayerNorm] Fuse LayerScale преди 2 години
  Tri Dao 8c6609ae1a [LayerNorm] Support all dimensions up to 6k (if divisible by 8) преди 2 години
  Tri Dao fa6d1ce44f Add fused_dense and dropout_add_layernorm CUDA extensions преди 2 години