AlpinDale 7fffa507ff build: build flash attention kernels inside aphrodite (#1085) 2 săptămâni în urmă
..
__init__.py 9d81716bfd [v0.5.3] Release Candidate (#388) 9 luni în urmă
abstract.py a985143768 core: add cuda graph support for encoder-decoder models (#1051) 1 lună în urmă
blocksparse_attn.py 1405051912 attention: add `AttentionState` abstraction (#863) 2 luni în urmă
flash_attn.py 7fffa507ff build: build flash attention kernels inside aphrodite (#1085) 2 săptămâni în urmă
flashinfer.py a985143768 core: add cuda graph support for encoder-decoder models (#1051) 1 lună în urmă
ipex_attn.py 6951928522 xpu: bump IPEX to 2.3, support GQA (#1042) 1 lună în urmă
openvino.py 1405051912 attention: add `AttentionState` abstraction (#863) 2 luni în urmă
pallas.py 032974a28a tpu: fix TPU type api (#975) 1 lună în urmă
placeholder_attn.py 3bb0f07461 chore: rename `task_handler` to `worker` (#985) 1 lună în urmă
rocm_flash_attn.py d9d287a288 rocm: enable multi-step scheduling for rocm (#1071) 1 lună în urmă
torch_sdpa.py 1405051912 attention: add `AttentionState` abstraction (#863) 2 luni în urmă
utils.py a985143768 core: add cuda graph support for encoder-decoder models (#1051) 1 lună în urmă
xformers.py 1405051912 attention: add `AttentionState` abstraction (#863) 2 luni în urmă