AlpinDale 22422d962b feat: add cuda sampling kernels for top_k and top_p | 2 tháng trước cách đây | |
---|---|---|
.. | ||
latency.py | f1d0b77c92 [0.6.0] Release Candidate (#481) | 5 tháng trước cách đây |
serving.py | f1d0b77c92 [0.6.0] Release Candidate (#481) | 5 tháng trước cách đây |
throughput.py | 22422d962b feat: add cuda sampling kernels for top_k and top_p | 2 tháng trước cách đây |