AlpinDale f22b700ee4 feat: marlin kernels for GPTQ (#547) há 8 meses atrás
..
attention.py e1f3fd1e02 fix: test units (#201) há 1 ano atrás
backend_request_func.py e42a78381a feat: switch from pylint to ruff (#322) há 1 ano atrás
latency.py e1f3fd1e02 fix: test units (#201) há 1 ano atrás
launch_tgi.sh 4d04ade9ef feat: fine-grained seeds (#279) há 1 ano atrás
moe_config.py f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) há 1 ano atrás
serving.py e42a78381a feat: switch from pylint to ruff (#322) há 1 ano atrás
throughput.py f22b700ee4 feat: marlin kernels for GPTQ (#547) há 8 meses atrás