AlpinDale
|
a4cbcfe59f
feat: disable logprob serialization to CPU for spec decode
|
5 månader sedan |
AlpinDale
|
af43576da0
feat: add MLPSpeculator speculative decoding support (#572)
|
5 månader sedan |
AlpinDale
|
4d1e613804
chore: minor simplifications
|
5 månader sedan |
AlpinDale
|
5b0c11d190
support pipeline parallel pynccl groups
|
6 månader sedan |
AlpinDale
|
be8154a8a0
feat: proper embeddings API with e5-mistral-7b support
|
6 månader sedan |
AlpinDale
|
79901b76de
logprobs for target model (spec decoding)
|
6 månader sedan |
AlpinDale
|
9d81716bfd
[v0.5.3] Release Candidate (#388)
|
8 månader sedan |
AlpinDale
|
f8dfac6372
chore: attention refactor and upstream sync apr01 (#365)
|
10 månader sedan |