Commit History

Автор SHA1 Съобщение Дата
  Tri Dao 5acb532214 Switch to cutlass v3.6.0, fix perf regression for hdim 128 causal преди 2 седмици
  Tri Dao 65a0f59ef5 Change CP_ASYNC_CACHEGLOBAL to CP_ASYNC_CACHEGLOBAL_ZFILL for compat преди 4 седмици
  Tri Dao 8ec230f833 Fix to compile with Cutlass 3.6.0 преди 4 седмици
  Tri Dao 6863fde13f Fix bug in paged KV overshooting kBlockN in smem преди 1 месец
  Tri Dao 94657af3e8 Add option for not doing intra-WG overlapping of gemm and softmax преди 2 месеца
  Tri Dao fe412d6b36 Redo rotary when contiguous преди 2 месеца
  Tri Dao b2d3fe92ff Move rotary to a separate file преди 2 месеца
  Tri Dao 4d00645c76 Implement appending new KV to KV cache преди 2 месеца
  Tri Dao d00b88ee05 Move PagedKV to a separate file преди 2 месеца