AlpinDale
|
f4ea11b982
feat: initial support for activation quantization
|
7 hónapja |
AlpinDale
|
3bdeb3e116
fix: clang formatting for all kernels (#558)
|
7 hónapja |
AlpinDale
|
2313c97e3d
add cutlass w8a8 kernels (#556)
|
7 hónapja |
AlpinDale
|
c66b1b57b1
Marlin 2:4 sparsity (#555)
|
7 hónapja |
AlpinDale
|
f22b700ee4
feat: marlin kernels for GPTQ (#547)
|
8 hónapja |
AlpinDale
|
36660b55c2
chore: mixtral fp8 w/ static scales (#542)
|
8 hónapja |
AlpinDale
|
a6a627d745
fix aqlm compilation
|
8 hónapja |
AlpinDale
|
fca911ee0a
vLLM Upstream Sync (#526)
|
8 hónapja |
AlpinDale
|
9d81716bfd
[v0.5.3] Release Candidate (#388)
|
10 hónapja |