Commit Verlauf

Autor SHA1 Nachricht Datum
  AlpinDale d8c4193704 feat: Speculative Decoding using a draft model (#432) vor 9 Monaten
  AlpinDale 8d26cf3876 simplify model_executor logic vor 9 Monaten
  AlpinDale 2d2b43fe00 fix type hint vor 9 Monaten
  AlpinDale 4d33ce60da feat: Triton flash attention backend for ROCm (#407) vor 9 Monaten
  AlpinDale 9aaeb5d349 add speculative config and arg for later vor 9 Monaten
  AlpinDale 7b9c08afae vision model support vor 10 Monaten
  AlpinDale 0f6d56b07f feat: model executor refactor (#367) vor 10 Monaten
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) vor 10 Monaten