Commit History

Автор SHA1 Съобщение Дата
  AlpinDale c18bf116da fix stop strings not being excluded from outputs преди 9 месеца
  AlpinDale fe17712f29 fully working chunked prefill преди 9 месеца
  AlpinDale 082d4e6972 feat: add chunked prefill scheduler (#406) преди 9 месеца
  AlpinDale f845a661dd Chunked Prefill Part 2: data update преди 9 месеца
  AlpinDale 3f5ce50c19 add stop_reason преди 9 месеца
  AlpinDale 7b9c08afae vision model support преди 9 месеца
  AlpinDale 777b6f6d51 add logprob ranks преди 9 месеца
  AlpinDale 0f1399c135 feat: attention refactor part 2 преди 9 месеца
  AlpinDale 9181fa0396 feat: Triton kernels for sampling (#383) преди 9 месеца
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) преди 9 месеца
  AlpinDale e42a78381a feat: switch from pylint to ruff (#322) преди 10 месеца
  AlpinDale 9810daa699 feat: INT8 KV Cache (#298) преди 10 месеца
  AlpinDale ac82b67f75 feat: naive context shift and various QoL changes (#289) преди 10 месеца
  AlpinDale 657aec0cbd refactor: OpenAI endpoint (#261) преди 10 месеца
  AlpinDale 4d04ade9ef feat: fine-grained seeds (#279) преди 10 месеца
  AlpinDale d2db4143fa feat: add grafana for metrics (#240) преди 11 месеца
  AlpinDale c0aac15421 feat: S-LoRA support (#222) преди 11 месеца
  AlpinDale 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) преди 11 месеца
  AlpinDale f013d714c0 chore: merge dev branch into main (#177) преди 1 година
  AlpinDale 2755a48d51 merge dev branch into main (#153) преди 1 година
  50h100a fa0ae5a2c9 feat: new mirostatv2 implementation (#96) преди 1 година
  AlpinDale efc6f7fbec chore: reformats (#90) преди 1 година
  AlpinDale e6be0118c9 feat: prompt logprobs and batched samplers (#77) преди 1 година
  AlpinDale 75c27d3e65 massive overhaul преди 1 година
  AlpinDale 6dfca14e1f compute logprobs with log_softmax instead of log преди 1 година
  AlpinDale 6b9561ef07 adapt TGI incremental detokenization преди 1 година
  AlpinDale 45f6d9f923 initial refactor commit преди 1 година
  AlpinDale f4bb602b74 chore: remove redundant import and minor refactor преди 1 година
  AlpinDale c761d38c69 fix: sort outputs and avoid unwanted list copy преди 1 година
  AlpinDale 7a27bd5f2f fix: do not allow prompt to exceed max input len преди 1 година