50h100a ed87b5dd32 remove special-case values for prompt sequences преди 5 месеца
..
adapter_commons f1d0b77c92 [0.6.0] Release Candidate (#481) преди 6 месеца
attention 7a313483f1 chore: move update_flash_attn_metadata to attn backend (#731) преди 5 месеца
common 73177656ed feat: quant_llm support (#755) преди 5 месеца
distributed ef3a0f4cb1 fix: `custom_ar` check (#737) преди 5 месеца
endpoints ad181e3fef feat: bring back dynatemp (#754) преди 5 месеца
engine 73177656ed feat: quant_llm support (#755) преди 5 месеца
executor 89a2c6dee1 chore: refactor `MultiModalConfig` initialization and profiling (#745) преди 5 месеца
inputs 89a2c6dee1 chore: refactor `MultiModalConfig` initialization and profiling (#745) преди 5 месеца
kv_quant e42a78381a feat: switch from pylint to ruff (#322) преди 1 година
lora d9d85eeb6e chore: register lora functions as torch ops (#732) преди 5 месеца
modeling ed87b5dd32 remove special-case values for prompt sequences преди 5 месеца
multimodal 89a2c6dee1 chore: refactor `MultiModalConfig` initialization and profiling (#745) преди 5 месеца
platforms 81c28d2a7f fix: use nvml to get consistent device names (#739) преди 5 месеца
plugins f76f2a5af0 feat: add aphrodite plugin system (#705) преди 6 месеца
processing 577586309d chore: multi-step args and sequence modifications (#713) преди 6 месеца
prompt_adapter f1d0b77c92 [0.6.0] Release Candidate (#481) преди 6 месеца
quantization 73177656ed feat: quant_llm support (#755) преди 5 месеца
server ed9a6f97c1 fix: kill api server when pinging dead engine (#660) преди 6 месеца
spec_decode 89a2c6dee1 chore: refactor `MultiModalConfig` initialization and profiling (#745) преди 5 месеца
task_handler 81c5f196eb chore: various TPU fixes and optimizations (#746) преди 5 месеца
transformers_utils 4648f16c84 chore: fix return statement in Detokenizer class (#727) преди 6 месеца
triton_utils f1d0b77c92 [0.6.0] Release Candidate (#481) преди 6 месеца
__init__.py f1d0b77c92 [0.6.0] Release Candidate (#481) преди 6 месеца
_core_ext.py 9296d4b25d feat: dynamo support for ScalarType (#733) преди 5 месеца
_custom_ops.py 73177656ed feat: quant_llm support (#755) преди 5 месеца
_ipex_ops.py f1d0b77c92 [0.6.0] Release Candidate (#481) преди 6 месеца
py.typed 1c988a48b2 fix logging and add py.typed преди 1 година
scalar_type.py f1d0b77c92 [0.6.0] Release Candidate (#481) преди 6 месеца
version.py 0e0bd02b52 ci: bump version to 0.6.2 (#758) преди 5 месеца