.. |
attention.py
|
e1f3fd1e02
fix: test units (#201)
|
před 1 rokem |
backend_request_func.py
|
e42a78381a
feat: switch from pylint to ruff (#322)
|
před 1 rokem |
latency.py
|
e1f3fd1e02
fix: test units (#201)
|
před 1 rokem |
launch_tgi.sh
|
4d04ade9ef
feat: fine-grained seeds (#279)
|
před 1 rokem |
moe_config.py
|
6d2f00d728
benchmark script for fp8 MoE
|
před 7 měsíci |
serving.py
|
e42a78381a
feat: switch from pylint to ruff (#322)
|
před 1 rokem |
throughput.py
|
f22b700ee4
feat: marlin kernels for GPTQ (#547)
|
před 7 měsíci |