Commit Verlauf

Autor SHA1 Nachricht Datum
  AlpinDale db73f03cdc fix: use ParallelLMHead for MLPSpeculator vor 5 Monaten
  AlpinDale 0f4a9ee77b quantized lm_head (#582) vor 5 Monaten
  AlpinDale de7e6919c0 feat: support tied weights and input scale for MLPSpeculator vor 6 Monaten
  AlpinDale 51cfadeb29 fix: `MLPSpeculator` handling of `num_speculative_tokens` vor 6 Monaten
  AlpinDale af43576da0 feat: add MLPSpeculator speculative decoding support (#572) vor 6 Monaten