.. |
__init__.py
|
9d81716bfd
[v0.5.3] Release Candidate (#388)
|
před 9 měsíci |
abstract.py
|
22305c91e9
refactor _prepare_model_input_tensor and attn metadata builder for most backends
|
před 5 měsíci |
blocksparse_attn.py
|
22305c91e9
refactor _prepare_model_input_tensor and attn metadata builder for most backends
|
před 5 měsíci |
flash_attn.py
|
22305c91e9
refactor _prepare_model_input_tensor and attn metadata builder for most backends
|
před 5 měsíci |
flashinfer.py
|
8adc496a2a
fix: use paged attention for bloc swapping/copying in flashinfer
|
před 5 měsíci |
ipex_attn.py
|
22305c91e9
refactor _prepare_model_input_tensor and attn metadata builder for most backends
|
před 5 měsíci |
openvino.py
|
0886c361f4
feat: OpenVINO CPU backend (#576)
|
před 6 měsíci |
pallas.py
|
9d7beaa5b9
chore: separate kv_scale into k_scale and v_scale
|
před 5 měsíci |
rocm_flash_attn.py
|
fa15bad2ea
chore: minor AMD fixes
|
před 5 měsíci |
torch_sdpa.py
|
22305c91e9
refactor _prepare_model_input_tensor and attn metadata builder for most backends
|
před 5 měsíci |
utils.py
|
22305c91e9
refactor _prepare_model_input_tensor and attn metadata builder for most backends
|
před 5 měsíci |
xformers.py
|
22305c91e9
refactor _prepare_model_input_tensor and attn metadata builder for most backends
|
před 5 měsíci |