.. |
attention.py
|
e1f3fd1e02
fix: test units (#201)
|
před 1 rokem |
backend_request_func.py
|
e42a78381a
feat: switch from pylint to ruff (#322)
|
před 10 měsíci |
latency.py
|
e1f3fd1e02
fix: test units (#201)
|
před 1 rokem |
launch_tgi.sh
|
4d04ade9ef
feat: fine-grained seeds (#279)
|
před 10 měsíci |
moe_config.py
|
f8dfac6372
chore: attention refactor and upstream sync apr01 (#365)
|
před 9 měsíci |
serving.py
|
e42a78381a
feat: switch from pylint to ruff (#322)
|
před 10 měsíci |
throughput.py
|
e0c35bb353
feat: bitsandbytes and `--load-in{4,8}bit` support (#294)
|
před 10 měsíci |