AlpinDale 7a313483f1 chore: move update_flash_attn_metadata to attn backend (#731) 3 luni în urmă
..
__init__.py 9d81716bfd [v0.5.3] Release Candidate (#388) 8 luni în urmă
abstract.py 7a313483f1 chore: move update_flash_attn_metadata to attn backend (#731) 3 luni în urmă
blocksparse_attn.py f1d0b77c92 [0.6.0] Release Candidate (#481) 4 luni în urmă
flash_attn.py 7a313483f1 chore: move update_flash_attn_metadata to attn backend (#731) 3 luni în urmă
flashinfer.py 60b702a827 chore: register custom torch ops for flash-attn and flashinfer (#724) 3 luni în urmă
ipex_attn.py f1d0b77c92 [0.6.0] Release Candidate (#481) 4 luni în urmă
openvino.py f1d0b77c92 [0.6.0] Release Candidate (#481) 4 luni în urmă
pallas.py f1d0b77c92 [0.6.0] Release Candidate (#481) 4 luni în urmă
placeholder_attn.py bf88c8567e feat: mamba model support (#674) 4 luni în urmă
rocm_flash_attn.py e200775863 feat: enable using fp8 kv and prefix caching with chunked prefill (#668) 4 luni în urmă
torch_sdpa.py f1d0b77c92 [0.6.0] Release Candidate (#481) 4 luni în urmă
utils.py 3bbb3f2086 feat: add numpy implementation of `compute_slot_mapping` (#678) 4 luni în urmă
xformers.py e200775863 feat: enable using fp8 kv and prefix caching with chunked prefill (#668) 4 luni în urmă