AlpinDale 083ba7b452 roll back chunked prefill changes to SDPA, isolate cpu worker 10 mēneši atpakaļ
..
__init__.py 0f1399c135 feat: attention refactor part 2 10 mēneši atpakaļ
abstract.py fe17712f29 fully working chunked prefill 10 mēneši atpakaļ
flash_attn.py fe17712f29 fully working chunked prefill 10 mēneši atpakaļ
rocm_flash_attn.py fe17712f29 fully working chunked prefill 10 mēneši atpakaļ
sdpa.py 083ba7b452 roll back chunked prefill changes to SDPA, isolate cpu worker 10 mēneši atpakaļ
xformers.py fe17712f29 fully working chunked prefill 10 mēneši atpakaļ