.. |
output_processor
|
c577c31aaa
feat: tree attention
|
преди 9 месеца |
__init__.py
|
04b53d2db5
chore: add initializer files
|
преди 1 година |
aphrodite_engine.py
|
a3b1602391
fix: rope scaling for cohere and qwen (#436)
|
преди 9 месеца |
args_tools.py
|
60ca1e1e5e
feat: add ngram prompt lookup decoding for speculative decoding (#438)
|
преди 9 месеца |
async_aphrodite.py
|
f216601f18
fix: logging in the API server
|
преди 9 месеца |
metrics.py
|
d8c4193704
feat: Speculative Decoding using a draft model (#432)
|
преди 9 месеца |
ray_tools.py
|
8c9cabf4c8
fix: display error in ray before deadlock (#378)
|
преди 9 месеца |