AlpinDale e0c35bb353 feat: bitsandbytes and `--load-in{4,8}bit` support (#294) | hace 10 meses | |
---|---|---|
.. | ||
attention.py | hace 1 año | |
backend_request_func.py | hace 11 meses | |
latency.py | hace 1 año | |
launch_tgi.sh | hace 11 meses | |
serving.py | hace 11 meses | |
throughput.py | hace 10 meses |