Historial de Commits

Autor SHA1 Mensaje Fecha
  AlpinDale a4cbcfe59f feat: disable logprob serialization to CPU for spec decode hace 5 meses
  AlpinDale af43576da0 feat: add MLPSpeculator speculative decoding support (#572) hace 5 meses
  AlpinDale 4d1e613804 chore: minor simplifications hace 5 meses
  AlpinDale 5b0c11d190 support pipeline parallel pynccl groups hace 6 meses
  AlpinDale be8154a8a0 feat: proper embeddings API with e5-mistral-7b support hace 6 meses
  AlpinDale 79901b76de logprobs for target model (spec decoding) hace 6 meses
  AlpinDale 9d81716bfd [v0.5.3] Release Candidate (#388) hace 8 meses
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) hace 10 meses