AlpinDale e0c35bb353 feat: bitsandbytes and `--load-in{4,8}bit` support (#294) | vor 10 Monaten | |
---|---|---|
.. | ||
attention.py | vor 1 Jahr | |
backend_request_func.py | vor 11 Monaten | |
latency.py | vor 1 Jahr | |
launch_tgi.sh | vor 11 Monaten | |
serving.py | vor 11 Monaten | |
throughput.py | vor 10 Monaten |