.. |
multiprocessing
|
12b0059b47
api: enable MQAphroditeEngine for embedding models (#1065)
|
před 3 týdny |
output_processor
|
09dab16f82
core: improve async postproc + multi-step performance (#983)
|
před 1 měsícem |
__init__.py
|
04b53d2db5
chore: add initializer files
|
před 1 rokem |
aphrodite_engine.py
|
9a7d5514c4
feat: introduce MQAphroditeEngine (#1056)
|
před 3 týdny |
args_tools.py
|
a985143768
core: add cuda graph support for encoder-decoder models (#1051)
|
před 4 týdny |
async_aphrodite.py
|
9a7d5514c4
feat: introduce MQAphroditeEngine (#1056)
|
před 3 týdny |
async_timeout.py
|
f1d0b77c92
[0.6.0] Release Candidate (#481)
|
před 4 měsíci |
metrics.py
|
3d83e64f8e
feat: add metrics for prefix cache hit rate (#829)
|
před 2 měsíci |
metrics_types.py
|
3d83e64f8e
feat: add metrics for prefix cache hit rate (#829)
|
před 2 měsíci |
protocol.py
|
9a7d5514c4
feat: introduce MQAphroditeEngine (#1056)
|
před 3 týdny |