AlpinDale c577c31aaa feat: tree attention hace 9 meses
..
output_processor c577c31aaa feat: tree attention hace 9 meses
__init__.py 04b53d2db5 chore: add initializer files hace 1 año
aphrodite_engine.py a3b1602391 fix: rope scaling for cohere and qwen (#436) hace 9 meses
args_tools.py 60ca1e1e5e feat: add ngram prompt lookup decoding for speculative decoding (#438) hace 9 meses
async_aphrodite.py f216601f18 fix: logging in the API server hace 9 meses
metrics.py d8c4193704 feat: Speculative Decoding using a draft model (#432) hace 9 meses
ray_tools.py 8c9cabf4c8 fix: display error in ray before deadlock (#378) hace 10 meses