Historie revizí

Autor SHA1 Zpráva Datum
  AlpinDale 577586309d chore: multi-step args and sequence modifications (#713) před 4 měsíci
  AlpinDale ef40c05cd3 fix: minor adjustments to scheduler and block manager (#667) před 4 měsíci
  AlpinDale 7df7b8ca53 optimization: reduce end-to-end overhead from python obj allocation (#666) před 4 měsíci
  AlpinDale 62111fab17 feat: allow serving encoder-decoder models in the API server (#664) před 4 měsíci
  AlpinDale a0e446a17d feat: initial encoder-decoder support with BART model (#633) před 4 měsíci
  AlpinDale f1d0b77c92 [0.6.0] Release Candidate (#481) před 4 měsíci
  AlpinDale 9d81716bfd [v0.5.3] Release Candidate (#388) před 8 měsíci
  AlpinDale 9181fa0396 feat: Triton kernels for sampling (#383) před 9 měsíci
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) před 9 měsíci
  AlpinDale e42a78381a feat: switch from pylint to ruff (#322) před 10 měsíci
  AlpinDale 9810daa699 feat: INT8 KV Cache (#298) před 10 měsíci
  AlpinDale ac82b67f75 feat: naive context shift and various QoL changes (#289) před 10 měsíci
  AlpinDale 657aec0cbd refactor: OpenAI endpoint (#261) před 10 měsíci
  AlpinDale 4d04ade9ef feat: fine-grained seeds (#279) před 10 měsíci
  AlpinDale d2db4143fa feat: add grafana for metrics (#240) před 11 měsíci
  AlpinDale c0aac15421 feat: S-LoRA support (#222) před 11 měsíci
  AlpinDale 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) před 11 měsíci
  AlpinDale f013d714c0 chore: merge dev branch into main (#177) před 1 rokem
  AlpinDale 2755a48d51 merge dev branch into main (#153) před 1 rokem
  50h100a fa0ae5a2c9 feat: new mirostatv2 implementation (#96) před 1 rokem
  AlpinDale efc6f7fbec chore: reformats (#90) před 1 rokem
  AlpinDale e6be0118c9 feat: prompt logprobs and batched samplers (#77) před 1 rokem
  AlpinDale 75c27d3e65 massive overhaul před 1 rokem
  AlpinDale 6dfca14e1f compute logprobs with log_softmax instead of log před 1 rokem
  AlpinDale 6b9561ef07 adapt TGI incremental detokenization před 1 rokem
  AlpinDale 45f6d9f923 initial refactor commit před 1 rokem
  AlpinDale f4bb602b74 chore: remove redundant import and minor refactor před 1 rokem
  AlpinDale c761d38c69 fix: sort outputs and avoid unwanted list copy před 1 rokem
  AlpinDale 7a27bd5f2f fix: do not allow prompt to exceed max input len před 1 rokem
  AlpinDale fefbf029c9 revert previous commit před 1 rokem