Commit History

Автор SHA1 Съобщение Дата
  sgsdxzy a3b1602391 fix: rope scaling for cohere and qwen (#436) преди 9 месеца
  AlpinDale d8c4193704 feat: Speculative Decoding using a draft model (#432) преди 9 месеца
  AlpinDale 76f36af704 feat: LM Format Enforcer support (#428) преди 9 месеца
  AlpinDale c18bf116da fix stop strings not being excluded from outputs преди 9 месеца
  AlpinDale fe17712f29 fully working chunked prefill преди 9 месеца
  AlpinDale 4d33ce60da feat: Triton flash attention backend for ROCm (#407) преди 9 месеца
  AlpinDale 082d4e6972 feat: add chunked prefill scheduler (#406) преди 9 месеца
  AlpinDale 7528e0ce3e make detokenization optional преди 9 месеца
  AlpinDale 071269e406 feat: FP8 E4M3 KV Cache (#405) преди 9 месеца
  AlpinDale 6f00203041 refactor scheduler for chunked prefill, remove reorder policy for now преди 9 месеца
  AlpinDale 9aaeb5d349 add speculative config and arg for later преди 9 месеца
  AlpinDale a304f76d89 feat: Intel CPU support (#403) преди 9 месеца
  AlpinDale f845a661dd Chunked Prefill Part 2: data update преди 10 месеца
  AlpinDale 753f6dc51b add v2 block manager преди 10 месеца
  AlpinDale 3f5ce50c19 add stop_reason преди 10 месеца
  AlpinDale 7b9c08afae vision model support преди 10 месеца
  AlpinDale 0c4ead5e9f min_tokens преди 10 месеца
  AlpinDale d1786645a3 fix formatting преди 10 месеца
  AlpinDale eed70dff76 improve detokenization performance; improve logprobs преди 10 месеца
  AlpinDale 2319b411ce refactor: neuron support преди 10 месеца
  AlpinDale c9cb00c2a1 add warning for mismatch in vocab size преди 10 месеца
  AlpinDale feb5840f2a feat: async tokenization (#374) преди 10 месеца
  AlpinDale 0f6d56b07f feat: model executor refactor (#367) преди 10 месеца
  AlpinDale b361096463 fix: tokenizer when using ray (#366) преди 10 месеца
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) преди 10 месеца
  AlpinDale e42a78381a feat: switch from pylint to ruff (#322) преди 10 месеца
  AlpinDale c2d77b1822 chore: logging refactor (#302) преди 10 месеца
  AlpinDale 9810daa699 feat: INT8 KV Cache (#298) преди 11 месеца
  AlpinDale 2d3d44b3e9 chore: add health check for ray workers (#290) преди 11 месеца
  AlpinDale ac82b67f75 feat: naive context shift and various QoL changes (#289) преди 11 месеца