AlpinDale
|
f7f3fed265
feat: add async postprocessor (#925)
|
1 lună în urmă |
AlpinDale
|
132aa2abe4
spec decode: add support for EAGLE (#899)
|
1 lună în urmă |
AlpinDale
|
48a8693aed
feat: multi-step scheduling (#831)
|
2 luni în urmă |
AlpinDale
|
bfc8988116
feat: add cuda sampling kernels for top_k and top_p (#828)
|
2 luni în urmă |
Pyroserenus
|
ee5964465d
chore: max_num_seqs in throughput benchmark (#770)
|
3 luni în urmă |
AlpinDale
|
73177656ed
feat: quant_llm support (#755)
|
4 luni în urmă |
AlpinDale
|
f1d0b77c92
[0.6.0] Release Candidate (#481)
|
5 luni în urmă |