Commit History

Автор SHA1 Съобщение Дата
  AlpinDale 86bf2cc4f3 core: rename `PromptInputs,inputs` -> `PromptType,prompt` (#1080) преди 2 седмици
  AlpinDale 1264e0b5d8 api: add mistral function calling format to all models loaded with "mistral" format (#1053) преди 4 седмици
  AlpinDale a985143768 core: add cuda graph support for encoder-decoder models (#1051) преди 4 седмици
  AlpinDale 055c8905a3 api: add sampling/engine option to return only deltas or final output (#1035) преди 4 седмици
  AlpinDale f644e10449 vlm: enable multimodal inputs for the LLM class (#992) преди 1 месец
  AlpinDale f7f3fed265 feat: add async postprocessor (#925) преди 1 месец
  AlpinDale f797294b29 fix: `add_generation_template` -> `add_generation_prompt` in llm (#877) преди 1 месец
  AlpinDale e5b1afe625 feat: add chat method for LLM class (#822) преди 2 месеца
  AlpinDale 62111fab17 feat: allow serving encoder-decoder models in the API server (#664) преди 4 месеца
  AlpinDale a0e446a17d feat: initial encoder-decoder support with BART model (#633) преди 4 месеца
  AlpinDale f1d0b77c92 [0.6.0] Release Candidate (#481) преди 4 месеца
  AlpinDale 9d81716bfd [v0.5.3] Release Candidate (#388) преди 8 месеца
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) преди 9 месеца
  AlpinDale e42a78381a feat: switch from pylint to ruff (#322) преди 10 месеца
  AlpinDale ac82b67f75 feat: naive context shift and various QoL changes (#289) преди 10 месеца
  AlpinDale c3a221eb02 feat: GGUF, QuIP#, and Marlin support (#228) преди 1 година
  AlpinDale 641bb0f6e9 feat: add custom allreduce kernels (#224) преди 1 година
  AlpinDale c0aac15421 feat: S-LoRA support (#222) преди 1 година
  AlpinDale 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) преди 1 година
  AlpinDale f013d714c0 chore: merge dev branch into main (#177) преди 1 година
  AlpinDale 2755a48d51 merge dev branch into main (#153) преди 1 година
  AlpinDale 8834ecf9de chore: clean up refactor endpoints (#98) преди 1 година
  AlpinDale c70abc7522 fix the LLM class for quantization преди 1 година
  AlpinDale 6b9561ef07 adapt TGI incremental detokenization преди 1 година
  AlpinDale 388d7545dd fix: circular import преди 1 година
  AlpinDale c761d38c69 fix: sort outputs and avoid unwanted list copy преди 1 година
  AlpinDale 56077f0f29 upstream: trust remote code преди 1 година
  AlpinDale 724852dc31 chore: refactoring cont. преди 1 година
  AlpinDale 5169163403 chore: add tokenizer mode for slow/fast tokenizers преди 1 година
  AlpinDale 07aa2a492f upstream: add option to specify tokenizer преди 1 година