Autor | SHA1 Mensaje | Fecha |
---|---|---|
|
145e554a4d neuron: add 8bit quantization for Neuron (#994) | hace 2 meses |
|
0dfa6b60ec core: support logprobs with multi-step scheduling (#963) | hace 2 meses |
|
ba6d798784 neuron: support for context length and token bucketing (#960) | hace 2 meses |
|
0e558e9b2f fix: loading chameleon model with TP>1 (#695) | hace 6 meses |
|
f1d0b77c92 [0.6.0] Release Candidate (#481) | hace 6 meses |