AlpinDale abbb730607 feat: support draft model on different tensor parallel size před 7 měsíci
..
cutlass_benchmarks 765adcfba1 chore: add w8a8 benchmark scripts před 7 měsíci
attention.py 156f577f79 feat: switch from `PYBIND11_MODULE` to `TORCH_LIBRARY` (#569) před 7 měsíci
backend_request_func.py 89ee54dcff update dockerfile and enhance serving benchmark před 7 měsíci
benchmark_moe.py 5b5e6dc359 chore: add batch size 1536 and 3072 to moe benchmark před 7 měsíci
hashing.py c6a501f682 add multiprocessing executor; make ray optional před 8 měsíci
latency.py e1f3fd1e02 fix: test units (#201) před 1 rokem
launch_tgi.sh 4d04ade9ef feat: fine-grained seeds (#279) před 1 rokem
serving.py 89ee54dcff update dockerfile and enhance serving benchmark před 7 měsíci
sonnet.txt 89ee54dcff update dockerfile and enhance serving benchmark před 7 měsíci
throughput.py abbb730607 feat: support draft model on different tensor parallel size před 7 měsíci