AlpinDale e0c35bb353 feat: bitsandbytes and `--load-in{4,8}bit` support (#294) | 10 luni în urmă | |
---|---|---|
.. | ||
attention.py | 1 an în urmă | |
backend_request_func.py | 11 luni în urmă | |
latency.py | 1 an în urmă | |
launch_tgi.sh | 11 luni în urmă | |
serving.py | 11 luni în urmă | |
throughput.py | 10 luni în urmă |