Commit History

Автор SHA1 Съобщение Дата
  AlpinDale c18bf116da fix stop strings not being excluded from outputs преди 10 месеца
  AlpinDale fe17712f29 fully working chunked prefill преди 10 месеца
  AlpinDale 4d33ce60da feat: Triton flash attention backend for ROCm (#407) преди 10 месеца
  AlpinDale 082d4e6972 feat: add chunked prefill scheduler (#406) преди 10 месеца
  AlpinDale 7528e0ce3e make detokenization optional преди 10 месеца
  AlpinDale 071269e406 feat: FP8 E4M3 KV Cache (#405) преди 10 месеца
  AlpinDale 6f00203041 refactor scheduler for chunked prefill, remove reorder policy for now преди 10 месеца
  AlpinDale 9aaeb5d349 add speculative config and arg for later преди 10 месеца
  AlpinDale a304f76d89 feat: Intel CPU support (#403) преди 10 месеца
  AlpinDale f845a661dd Chunked Prefill Part 2: data update преди 10 месеца
  AlpinDale 753f6dc51b add v2 block manager преди 10 месеца
  AlpinDale 3f5ce50c19 add stop_reason преди 10 месеца
  AlpinDale 7b9c08afae vision model support преди 10 месеца
  AlpinDale 0c4ead5e9f min_tokens преди 10 месеца
  AlpinDale d1786645a3 fix formatting преди 10 месеца
  AlpinDale eed70dff76 improve detokenization performance; improve logprobs преди 10 месеца
  AlpinDale 2319b411ce refactor: neuron support преди 10 месеца
  AlpinDale c9cb00c2a1 add warning for mismatch in vocab size преди 10 месеца
  AlpinDale feb5840f2a feat: async tokenization (#374) преди 10 месеца
  AlpinDale 0f6d56b07f feat: model executor refactor (#367) преди 10 месеца
  AlpinDale b361096463 fix: tokenizer when using ray (#366) преди 10 месеца
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) преди 10 месеца
  AlpinDale e42a78381a feat: switch from pylint to ruff (#322) преди 11 месеца
  AlpinDale c2d77b1822 chore: logging refactor (#302) преди 11 месеца
  AlpinDale 9810daa699 feat: INT8 KV Cache (#298) преди 11 месеца
  AlpinDale 2d3d44b3e9 chore: add health check for ray workers (#290) преди 11 месеца
  AlpinDale ac82b67f75 feat: naive context shift and various QoL changes (#289) преди 11 месеца
  AlpinDale 657aec0cbd refactor: OpenAI endpoint (#261) преди 11 месеца
  AlpinDale 4b80b42362 fix: memory leaks due to nccl cuda graphs (#275) преди 11 месеца
  AlpinDale 2c08aa5af4 chore: remove eos token from output (#272) преди 11 месеца