AlpinDale d8c4193704 feat: Speculative Decoding using a draft model (#432) před 9 měsíci
..
attention.py e1f3fd1e02 fix: test units (#201) před 1 rokem
backend_request_func.py e42a78381a feat: switch from pylint to ruff (#322) před 10 měsíci
latency.py e1f3fd1e02 fix: test units (#201) před 1 rokem
launch_tgi.sh 4d04ade9ef feat: fine-grained seeds (#279) před 11 měsíci
moe_config.py f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) před 10 měsíci
serving.py e42a78381a feat: switch from pylint to ruff (#322) před 10 měsíci
throughput.py d8c4193704 feat: Speculative Decoding using a draft model (#432) před 9 měsíci