AlpinDale a985143768 core: add cuda graph support for encoder-decoder models (#1051) hace 1 mes
..
output_processor 09dab16f82 core: improve async postproc + multi-step performance (#983) hace 1 mes
__init__.py 04b53d2db5 chore: add initializer files hace 1 año
aphrodite_engine.py 638c08d9dc fix: clean shutdown issues (#1047) hace 1 mes
args_tools.py a985143768 core: add cuda graph support for encoder-decoder models (#1051) hace 1 mes
async_aphrodite.py 638c08d9dc fix: clean shutdown issues (#1047) hace 1 mes
async_timeout.py f1d0b77c92 [0.6.0] Release Candidate (#481) hace 4 meses
metrics.py 3d83e64f8e feat: add metrics for prefix cache hit rate (#829) hace 2 meses
metrics_types.py 3d83e64f8e feat: add metrics for prefix cache hit rate (#829) hace 2 meses
protocol.py 0dfa6b60ec core: support logprobs with multi-step scheduling (#963) hace 1 mes