Historial de Commits

Autor SHA1 Mensaje Fecha
  Tri Dao 5acb532214 Switch to cutlass v3.6.0, fix perf regression for hdim 128 causal hace 2 semanas
  Tri Dao 65a0f59ef5 Change CP_ASYNC_CACHEGLOBAL to CP_ASYNC_CACHEGLOBAL_ZFILL for compat hace 4 semanas
  Tri Dao 8ec230f833 Fix to compile with Cutlass 3.6.0 hace 4 semanas
  Tri Dao 6863fde13f Fix bug in paged KV overshooting kBlockN in smem hace 1 mes
  Tri Dao 94657af3e8 Add option for not doing intra-WG overlapping of gemm and softmax hace 2 meses
  Tri Dao fe412d6b36 Redo rotary when contiguous hace 2 meses
  Tri Dao b2d3fe92ff Move rotary to a separate file hace 2 meses
  Tri Dao 4d00645c76 Implement appending new KV to KV cache hace 2 meses
  Tri Dao d00b88ee05 Move PagedKV to a separate file hace 2 meses