AlpinDale 083ba7b452 roll back chunked prefill changes to SDPA, isolate cpu worker 10 месяцев назад
..
__init__.py 0f1399c135 feat: attention refactor part 2 10 месяцев назад
abstract.py fe17712f29 fully working chunked prefill 10 месяцев назад
flash_attn.py fe17712f29 fully working chunked prefill 10 месяцев назад
rocm_flash_attn.py fe17712f29 fully working chunked prefill 10 месяцев назад
sdpa.py 083ba7b452 roll back chunked prefill changes to SDPA, isolate cpu worker 10 месяцев назад
xformers.py fe17712f29 fully working chunked prefill 10 месяцев назад