AlpinDale 145e554a4d neuron: add 8bit quantization for Neuron (#994) 2 тижнів тому
..
arctic_inference.py f1d0b77c92 [0.6.0] Release Candidate (#481) 4 місяців тому
cached_prefix_inference.py f1d0b77c92 [0.6.0] Release Candidate (#481) 4 місяців тому
embedding_inference.py f1d0b77c92 [0.6.0] Release Candidate (#481) 4 місяців тому
encoder_decoder_inference.py 62111fab17 feat: allow serving encoder-decoder models in the API server (#664) 4 місяців тому
gguf_inference.py f1d0b77c92 [0.6.0] Release Candidate (#481) 4 місяців тому
lora_aphrodite_engine.py 673621a3d2 xpu: refactor the model runner for tensor parallelism (#910) 3 тижнів тому
lora_async_aphrodite.py 673621a3d2 xpu: refactor the model runner for tensor parallelism (#910) 3 тижнів тому
mlpspeculator_inference.py f1d0b77c92 [0.6.0] Release Candidate (#481) 4 місяців тому
neuron_inference.py ba6d798784 neuron: support for context length and token bucketing (#960) 2 тижнів тому
neuron_int8_quantization.py 145e554a4d neuron: add 8bit quantization for Neuron (#994) 2 тижнів тому
offline_inference.py f1d0b77c92 [0.6.0] Release Candidate (#481) 4 місяців тому
ray_distributed_inference.py f1d0b77c92 [0.6.0] Release Candidate (#481) 4 місяців тому
soft_prompt_inference.py f1d0b77c92 [0.6.0] Release Candidate (#481) 4 місяців тому
tpu_inference.py 436d8fa0f1 core: do not compile for profiling (#931) 2 тижнів тому