AlpinDale c577c31aaa feat: tree attention před 9 měsíci
..
__init__.py 04b53d2db5 chore: add initializer files před 1 rokem
cache_engine.py 4d33ce60da feat: Triton flash attention backend for ROCm (#407) před 9 měsíci
cpu_model_runner.py 6e0761ba5d make init_distributed_environment compatible with init_process_group před 9 měsíci
cpu_worker.py d8c4193704 feat: Speculative Decoding using a draft model (#432) před 9 měsíci
model_runner.py c577c31aaa feat: tree attention před 9 měsíci
neuron_model_runner.py 0f1399c135 feat: attention refactor part 2 před 9 měsíci
neuron_worker.py d8c4193704 feat: Speculative Decoding using a draft model (#432) před 9 měsíci
worker.py d8c4193704 feat: Speculative Decoding using a draft model (#432) před 9 měsíci
worker_base.py d8c4193704 feat: Speculative Decoding using a draft model (#432) před 9 měsíci