AlpinDale
|
f4ea11b982
feat: initial support for activation quantization
|
5 luni în urmă |
AlpinDale
|
2313c97e3d
add cutlass w8a8 kernels (#556)
|
5 luni în urmă |
AlpinDale
|
c66b1b57b1
Marlin 2:4 sparsity (#555)
|
5 luni în urmă |
AlpinDale
|
251568470e
initial nvidia fp8 e4m3 for kv cache
|
5 luni în urmă |
AlpinDale
|
e3f2ea4850
make punica kernels work with rocm
|
5 luni în urmă |
AlpinDale
|
f22b700ee4
feat: marlin kernels for GPTQ (#547)
|
5 luni în urmă |
AlpinDale
|
fca911ee0a
vLLM Upstream Sync (#526)
|
6 luni în urmă |
AlpinDale
|
9d81716bfd
[v0.5.3] Release Candidate (#388)
|
8 luni în urmă |
AlpinDale
|
e120404436
Revert "feat: CMake Build System Generator (#332)"
|
9 luni în urmă |
AlpinDale
|
ad6802690f
feat: CMake Build System Generator (#332)
|
9 luni în urmă |