.. |
aqlm
|
fca911ee0a
vLLM Upstream Sync (#526)
|
8 달 전 |
awq
|
9d81716bfd
[v0.5.3] Release Candidate (#388)
|
10 달 전 |
bitsandbytes
|
fca911ee0a
vLLM Upstream Sync (#526)
|
8 달 전 |
exl2
|
9d81716bfd
[v0.5.3] Release Candidate (#388)
|
10 달 전 |
fp8
|
251568470e
initial nvidia fp8 e4m3 for kv cache
|
7 달 전 |
gguf
|
9d81716bfd
[v0.5.3] Release Candidate (#388)
|
10 달 전 |
gptq
|
fca911ee0a
vLLM Upstream Sync (#526)
|
8 달 전 |
gptq_marlin
|
ad1c6b86a1
gptq_marlin: enable bfloat16
|
7 달 전 |
int8_kvcache
|
9810daa699
feat: INT8 KV Cache (#298)
|
1 년 전 |
marlin
|
c66b1b57b1
Marlin 2:4 sparsity (#555)
|
7 달 전 |
quip
|
aebd68c632
feat: backport kernels (#235)
|
1 년 전 |
squeezellm
|
8fa608aeb7
feat: replace Ray with NCCL for control plane comms (#221)
|
1 년 전 |
quant_ops.cpp
|
c66b1b57b1
Marlin 2:4 sparsity (#555)
|
7 달 전 |
quant_ops.h
|
c66b1b57b1
Marlin 2:4 sparsity (#555)
|
7 달 전 |