.. |
__init__.py
|
f8dfac6372
chore: attention refactor and upstream sync apr01 (#365)
|
před 9 měsíci |
cpu_executor.py
|
ef733aee43
implement ExecuteModelData to reduce executor complexity
|
před 6 měsíci |
distributed_gpu_executor.py
|
de62ceb18c
refactor: eliminate parallel worker per-step task scheduling overhead
|
před 5 měsíci |
executor_base.py
|
de62ceb18c
refactor: eliminate parallel worker per-step task scheduling overhead
|
před 5 měsíci |
gpu_executor.py
|
236be273e5
feat: tensor parallel speculative decoding (#554)
|
před 6 měsíci |
multiproc_gpu_executor.py
|
5b0c11d190
support pipeline parallel pynccl groups
|
před 5 měsíci |
multiproc_worker_utils.py
|
eaa06fdd14
fix some f-strings
|
před 6 měsíci |
neuron_executor.py
|
ef733aee43
implement ExecuteModelData to reduce executor complexity
|
před 6 měsíci |
ray_gpu_executor.py
|
de62ceb18c
refactor: eliminate parallel worker per-step task scheduling overhead
|
před 5 měsíci |
ray_utils.py
|
c6a501f682
add multiprocessing executor; make ray optional
|
před 6 měsíci |