AlpinDale
|
3bb0f07461
chore: rename `task_handler` to `worker` (#985)
|
2 minggu lalu |
AlpinDale
|
0256ed236b
feat: windows support (#790)
|
2 bulan lalu |
AlpinDale
|
f1d0b77c92
[0.6.0] Release Candidate (#481)
|
4 bulan lalu |
AlpinDale
|
9d81716bfd
[v0.5.3] Release Candidate (#388)
|
8 bulan lalu |
AlpinDale
|
f8dfac6372
chore: attention refactor and upstream sync apr01 (#365)
|
9 bulan lalu |
AlpinDale
|
9810daa699
feat: INT8 KV Cache (#298)
|
10 bulan lalu |
AlpinDale
|
8e1cd54497
fix: do not include fp8 for rocm (#271)
|
10 bulan lalu |
AlpinDale
|
31c95011a6
feat: FP8 E5M2 KV Cache (#226)
|
11 bulan lalu |
AlpinDale
|
8fa608aeb7
feat: replace Ray with NCCL for control plane comms (#221)
|
11 bulan lalu |
AlpinDale
|
53d391e1f2
merge 'dev' into 'main'
|
1 tahun lalu |
AlpinDale
|
15a0454172
feat: FP8 KV Cache (#185)
|
1 tahun lalu |
AlpinDale
|
b9b295d74e
chore: backlogs 1 (#191)
|
1 tahun lalu |
AlpinDale
|
f013d714c0
chore: merge dev branch into main (#177)
|
1 tahun lalu |
AlpinDale
|
7d91e9e0f2
feat: CUDA graphs (#172)
|
1 tahun lalu |
AlpinDale
|
02f3ab3501
fix: replace head_mapping with num_kv_heads (#161)
|
1 tahun lalu |
AlpinDale
|
2755a48d51
merge dev branch into main (#153)
|
1 tahun lalu |
AlpinDale
|
1334a833a4
feat: AMD ROCm support (#95)
|
1 tahun lalu |
AlpinDale
|
4e71bd1d12
feat: add PagedAttention V2 kernels (#76)
|
1 tahun lalu |
AlpinDale
|
b7918ad45f
fix: attention kernel attribute (#52)
|
1 tahun lalu |
AlpinDale
|
0495c50a3e
GPTQ+exllama support (#21)
|
1 tahun lalu |
AlpinDale
|
75c27d3e65
massive overhaul
|
1 tahun lalu |
AlpinDale
|
45f6d9f923
initial refactor commit
|
1 tahun lalu |
AlpinDale
|
23389d0108
zero out a variable instead of vector in kernels
|
1 tahun lalu |
AlpinDale
|
ed540c3c87
fix: typo in attention kernel
|
1 tahun lalu |
AlpinDale
|
fffb9f2dac
chore: attention kernel optimizations
|
1 tahun lalu |
AlpinDale
|
24c78e7306
optimization: multi-query attention kernel
|
1 tahun lalu |
AlpinDale
|
081545bde6
fix: various CUDA kernel tweaks
|
1 tahun lalu |
AlpinDale
|
05d0a7e763
feat: adapt the attention kernels
|
1 tahun lalu |