Autor | SHA1 Mensagem | Data |
---|---|---|
|
22422d962b feat: add cuda sampling kernels for top_k and top_p | há 2 meses atrás |
|
ee5964465d chore: max_num_seqs in throughput benchmark (#770) | há 4 meses atrás |
|
73177656ed feat: quant_llm support (#755) | há 4 meses atrás |
|
f1d0b77c92 [0.6.0] Release Candidate (#481) | há 5 meses atrás |