Histórico de Commits

Autor SHA1 Mensagem Data
  Tri Dao f907a13187 Tune tile sizes for fwd varlen on Sm80 and Sm86 há 4 semanas atrás
  Tri Dao 76f14c61c9 Tune fwd tile sizes for Sm86 and Sm89 há 4 semanas atrás
  Tri Dao 5171269dab Implement forward pass for Sm80 há 1 mês atrás
  Tri Dao 3f85126149 Use persistent scheduler when paged_kv há 1 mês atrás
  Tri Dao 3e5d77a102 Group instantiations for different hdims together há 1 mês atrás
  Tri Dao 6807b1ea37 Longest-processing-time-first scheduler for causal há 1 mês atrás
  Tri Dao 6293008748 Add option for Mma0_is_RS and Mma1_is_RS in attn fwd há 1 mês atrás
  Tri Dao 2c996ca25f Use SeqlenInfo for bwd and epilogue há 1 mês atrás
  Tri Dao 9c954f7021 Use num_split_heuristics in fwd and fwd_varlen há 2 meses atrás
  Tri Dao f6e165becf Change tile_size and local to avoid wgmma being serialized há 2 meses atrás
  Tri Dao 94657af3e8 Add option for not doing intra-WG overlapping of gemm and softmax há 2 meses atrás
  Tri Dao fc2fd95a18 Renable FP8 kernels há 2 meses atrás
  Tri Dao 586ba914bb Move fwd tile size to a separate file há 2 meses atrás