AlpinDale 1270b5567e triton compile error for flash_attn hace 9 meses
..
backends 083ba7b452 roll back chunked prefill changes to SDPA, isolate cpu worker hace 9 meses
ops 1270b5567e triton compile error for flash_attn hace 9 meses
__init__.py fe17712f29 fully working chunked prefill hace 9 meses
layer.py fe17712f29 fully working chunked prefill hace 9 meses
selector.py 4d33ce60da feat: Triton flash attention backend for ROCm (#407) hace 9 meses