AlpinDale 0bf916eabd Revert "feat: add support for chunked prefill + prefix caching (#871)" 3 тижнів тому
..
__init__.py 04b53d2db5 chore: add initializer files 1 рік тому
cache_engine.py bf88c8567e feat: mamba model support (#674) 4 місяців тому
cpu_model_runner.py 22a4cd4595 core: fix spec decode metrics and envs circular import (#889) 3 тижнів тому
cpu_worker.py 22a4cd4595 core: fix spec decode metrics and envs circular import (#889) 3 тижнів тому
embedding_model_runner.py 89a2c6dee1 chore: refactor `MultiModalConfig` initialization and profiling (#745) 3 місяців тому
enc_dec_model_runner.py 22a4cd4595 core: fix spec decode metrics and envs circular import (#889) 3 тижнів тому
model_runner.py 0bf916eabd Revert "feat: add support for chunked prefill + prefix caching (#871)" 3 тижнів тому
model_runner_base.py 22a4cd4595 core: fix spec decode metrics and envs circular import (#889) 3 тижнів тому
multi_step_model_runner.py 48a8693aed feat: multi-step scheduling (#831) 1 місяць тому
multi_step_worker.py 132aa2abe4 spec decode: add support for EAGLE (#899) 3 тижнів тому
neuron_model_runner.py 22a4cd4595 core: fix spec decode metrics and envs circular import (#889) 3 тижнів тому
neuron_worker.py 008e646c7e chore: add support for up to 2048 block size (#715) 3 місяців тому
openvino_model_runner.py 22a4cd4595 core: fix spec decode metrics and envs circular import (#889) 3 тижнів тому
openvino_worker.py bf88c8567e feat: mamba model support (#674) 4 місяців тому
tpu_model_runner.py 81c5f196eb chore: various TPU fixes and optimizations (#746) 3 місяців тому
tpu_worker.py 22a4cd4595 core: fix spec decode metrics and envs circular import (#889) 3 тижнів тому
utils.py 89a2c6dee1 chore: refactor `MultiModalConfig` initialization and profiling (#745) 3 місяців тому
worker.py 132aa2abe4 spec decode: add support for EAGLE (#899) 3 тижнів тому
worker_base.py 132aa2abe4 spec decode: add support for EAGLE (#899) 3 тижнів тому
xpu_model_runner.py 89a2c6dee1 chore: refactor `MultiModalConfig` initialization and profiling (#745) 3 місяців тому
xpu_worker.py 9094a8a2a3 xpu: refactor XPU worker & executor (#861) 1 місяць тому