.. |
aqlm
|
fca911ee0a
vLLM Upstream Sync (#526)
|
před 8 měsíci |
awq
|
9d81716bfd
[v0.5.3] Release Candidate (#388)
|
před 10 měsíci |
bitsandbytes
|
fca911ee0a
vLLM Upstream Sync (#526)
|
před 8 měsíci |
exl2
|
9d81716bfd
[v0.5.3] Release Candidate (#388)
|
před 10 měsíci |
fp8
|
251568470e
initial nvidia fp8 e4m3 for kv cache
|
před 7 měsíci |
gguf
|
9d81716bfd
[v0.5.3] Release Candidate (#388)
|
před 10 měsíci |
gptq
|
fca911ee0a
vLLM Upstream Sync (#526)
|
před 8 měsíci |
gptq_marlin
|
ad1c6b86a1
gptq_marlin: enable bfloat16
|
před 7 měsíci |
int8_kvcache
|
9810daa699
feat: INT8 KV Cache (#298)
|
před 1 rokem |
marlin
|
1225c4dfd6
fix: illegal mem access crash for marlin
|
před 8 měsíci |
quip
|
aebd68c632
feat: backport kernels (#235)
|
před 1 rokem |
squeezellm
|
8fa608aeb7
feat: replace Ray with NCCL for control plane comms (#221)
|
před 1 rokem |
quant_ops.cpp
|
f22b700ee4
feat: marlin kernels for GPTQ (#547)
|
před 8 měsíci |
quant_ops.h
|
c154578c97
gptq_marlin: 8bit GPTQ support
|
před 8 měsíci |