Commit History

Autor SHA1 Mensaxe Data
  Tri Dao 27f8f890df [FusedDense] Allocate lt_workspace on input device hai 1 ano
  Tri Dao 88173a1aaf [FusedDense] Support relu, rename FusedDenseGeluDense -> FusedMLP hai 1 ano
  Tri Dao 226a1b721d Implement TensorParallel for FusedDense and FusedDenseGeluDense %!s(int64=2) %!d(string=hai) anos
  Tri Dao e68ebbe89a Simplify FusedDense %!s(int64=2) %!d(string=hai) anos
  Tri Dao fa6d1ce44f Add fused_dense and dropout_add_layernorm CUDA extensions %!s(int64=2) %!d(string=hai) anos