Histórico de Commits

Autor SHA1 Mensagem Data
  AlpinDale 86bf2cc4f3 core: rename `PromptInputs,inputs` -> `PromptType,prompt` (#1080) há 2 semanas atrás
  AlpinDale 1264e0b5d8 api: add mistral function calling format to all models loaded with "mistral" format (#1053) há 4 semanas atrás
  AlpinDale a985143768 core: add cuda graph support for encoder-decoder models (#1051) há 4 semanas atrás
  AlpinDale 055c8905a3 api: add sampling/engine option to return only deltas or final output (#1035) há 4 semanas atrás
  AlpinDale f644e10449 vlm: enable multimodal inputs for the LLM class (#992) há 1 mês atrás
  AlpinDale f7f3fed265 feat: add async postprocessor (#925) há 1 mês atrás
  AlpinDale f797294b29 fix: `add_generation_template` -> `add_generation_prompt` in llm (#877) há 1 mês atrás
  AlpinDale e5b1afe625 feat: add chat method for LLM class (#822) há 2 meses atrás
  AlpinDale 62111fab17 feat: allow serving encoder-decoder models in the API server (#664) há 4 meses atrás
  AlpinDale a0e446a17d feat: initial encoder-decoder support with BART model (#633) há 4 meses atrás
  AlpinDale f1d0b77c92 [0.6.0] Release Candidate (#481) há 4 meses atrás
  AlpinDale 9d81716bfd [v0.5.3] Release Candidate (#388) há 8 meses atrás
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) há 9 meses atrás
  AlpinDale e42a78381a feat: switch from pylint to ruff (#322) há 10 meses atrás
  AlpinDale ac82b67f75 feat: naive context shift and various QoL changes (#289) há 10 meses atrás
  AlpinDale c3a221eb02 feat: GGUF, QuIP#, and Marlin support (#228) há 1 ano atrás
  AlpinDale 641bb0f6e9 feat: add custom allreduce kernels (#224) há 1 ano atrás
  AlpinDale c0aac15421 feat: S-LoRA support (#222) há 1 ano atrás
  AlpinDale 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) há 1 ano atrás
  AlpinDale f013d714c0 chore: merge dev branch into main (#177) há 1 ano atrás
  AlpinDale 2755a48d51 merge dev branch into main (#153) há 1 ano atrás
  AlpinDale 8834ecf9de chore: clean up refactor endpoints (#98) há 1 ano atrás
  AlpinDale c70abc7522 fix the LLM class for quantization há 1 ano atrás
  AlpinDale 6b9561ef07 adapt TGI incremental detokenization há 1 ano atrás
  AlpinDale 388d7545dd fix: circular import há 1 ano atrás
  AlpinDale c761d38c69 fix: sort outputs and avoid unwanted list copy há 1 ano atrás
  AlpinDale 56077f0f29 upstream: trust remote code há 1 ano atrás
  AlpinDale 724852dc31 chore: refactoring cont. há 1 ano atrás
  AlpinDale 5169163403 chore: add tokenizer mode for slow/fast tokenizers há 1 ano atrás
  AlpinDale 07aa2a492f upstream: add option to specify tokenizer há 1 ano atrás