.. |
__init__.py
|
0f1399c135
feat: attention refactor part 2
|
пре 10 месеци |
abstract.py
|
fe17712f29
fully working chunked prefill
|
пре 10 месеци |
flash_attn.py
|
fe17712f29
fully working chunked prefill
|
пре 10 месеци |
rocm_flash_attn.py
|
fe17712f29
fully working chunked prefill
|
пре 10 месеци |
sdpa.py
|
083ba7b452
roll back chunked prefill changes to SDPA, isolate cpu worker
|
пре 10 месеци |
xformers.py
|
fe17712f29
fully working chunked prefill
|
пре 10 месеци |