Histórico de Commits

Autor SHA1 Mensagem Data
  Tri Dao 5acb532214 Switch to cutlass v3.6.0, fix perf regression for hdim 128 causal há 2 semanas atrás
  Tri Dao 65a0f59ef5 Change CP_ASYNC_CACHEGLOBAL to CP_ASYNC_CACHEGLOBAL_ZFILL for compat há 4 semanas atrás
  Tri Dao 8ec230f833 Fix to compile with Cutlass 3.6.0 há 4 semanas atrás
  Tri Dao 6863fde13f Fix bug in paged KV overshooting kBlockN in smem há 1 mês atrás
  Tri Dao 94657af3e8 Add option for not doing intra-WG overlapping of gemm and softmax há 2 meses atrás
  Tri Dao fe412d6b36 Redo rotary when contiguous há 2 meses atrás
  Tri Dao b2d3fe92ff Move rotary to a separate file há 2 meses atrás
  Tri Dao 4d00645c76 Implement appending new KV to KV cache há 2 meses atrás
  Tri Dao d00b88ee05 Move PagedKV to a separate file há 2 meses atrás