Commit Verlauf

Autor SHA1 Nachricht Datum
  AlpinDale 86bf2cc4f3 core: rename `PromptInputs,inputs` -> `PromptType,prompt` (#1080) vor 1 Tag
  AlpinDale 1264e0b5d8 api: add mistral function calling format to all models loaded with "mistral" format (#1053) vor 1 Woche
  AlpinDale a985143768 core: add cuda graph support for encoder-decoder models (#1051) vor 1 Woche
  AlpinDale 055c8905a3 api: add sampling/engine option to return only deltas or final output (#1035) vor 2 Wochen
  AlpinDale f644e10449 vlm: enable multimodal inputs for the LLM class (#992) vor 2 Wochen
  AlpinDale f7f3fed265 feat: add async postprocessor (#925) vor 3 Wochen
  AlpinDale f797294b29 fix: `add_generation_template` -> `add_generation_prompt` in llm (#877) vor 4 Wochen
  AlpinDale e5b1afe625 feat: add chat method for LLM class (#822) vor 1 Monat
  AlpinDale 62111fab17 feat: allow serving encoder-decoder models in the API server (#664) vor 4 Monaten
  AlpinDale a0e446a17d feat: initial encoder-decoder support with BART model (#633) vor 4 Monaten
  AlpinDale f1d0b77c92 [0.6.0] Release Candidate (#481) vor 4 Monaten
  AlpinDale 9d81716bfd [v0.5.3] Release Candidate (#388) vor 8 Monaten
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) vor 9 Monaten
  AlpinDale e42a78381a feat: switch from pylint to ruff (#322) vor 10 Monaten
  AlpinDale ac82b67f75 feat: naive context shift and various QoL changes (#289) vor 10 Monaten
  AlpinDale c3a221eb02 feat: GGUF, QuIP#, and Marlin support (#228) vor 11 Monaten
  AlpinDale 641bb0f6e9 feat: add custom allreduce kernels (#224) vor 11 Monaten
  AlpinDale c0aac15421 feat: S-LoRA support (#222) vor 11 Monaten
  AlpinDale 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) vor 11 Monaten
  AlpinDale f013d714c0 chore: merge dev branch into main (#177) vor 1 Jahr
  AlpinDale 2755a48d51 merge dev branch into main (#153) vor 1 Jahr
  AlpinDale 8834ecf9de chore: clean up refactor endpoints (#98) vor 1 Jahr
  AlpinDale c70abc7522 fix the LLM class for quantization vor 1 Jahr
  AlpinDale 6b9561ef07 adapt TGI incremental detokenization vor 1 Jahr
  AlpinDale 388d7545dd fix: circular import vor 1 Jahr
  AlpinDale c761d38c69 fix: sort outputs and avoid unwanted list copy vor 1 Jahr
  AlpinDale 56077f0f29 upstream: trust remote code vor 1 Jahr
  AlpinDale 724852dc31 chore: refactoring cont. vor 1 Jahr
  AlpinDale 5169163403 chore: add tokenizer mode for slow/fast tokenizers vor 1 Jahr
  AlpinDale 07aa2a492f upstream: add option to specify tokenizer vor 1 Jahr