AlpinDale
|
e42d0b3455
possibly improve ngram efficiency
|
před 5 měsíci |
AlpinDale
|
197a6d2c16
auto disable speculative decoding by the running queue size
|
před 5 měsíci |
AlpinDale
|
ef733aee43
implement ExecuteModelData to reduce executor complexity
|
před 5 měsíci |
AlpinDale
|
79901b76de
logprobs for target model (spec decoding)
|
před 5 měsíci |
AlpinDale
|
9d81716bfd
[v0.5.3] Release Candidate (#388)
|
před 8 měsíci |