.. |
__init__.py
|
9d81716bfd
[v0.5.3] Release Candidate (#388)
|
пре 10 месеци |
abstract.py
|
a94de94c44
refactor: combine the prefill and decode into a single API (#553)
|
пре 7 месеци |
flash_attn.py
|
93cffaf446
add flash_attn back
|
пре 7 месеци |
flashinfer.py
|
0c15965621
fix fp8 kv
|
пре 7 месеци |
rocm_flash_attn.py
|
1b86cf6164
navi21 fallback to naive attention
|
пре 7 месеци |
torch_sdpa.py
|
0c15965621
fix fp8 kv
|
пре 7 месеци |
xformers.py
|
0c15965621
fix fp8 kv
|
пре 7 месеци |