AlpinDale 801eda0b7a feat: support GPTQ 2, 3, and 8bit quants (#181) před 1 rokem
..
layers 801eda0b7a feat: support GPTQ 2, 3, and 8bit quants (#181) před 1 rokem
megatron e7b6a2d5a0 chore: tensor parallel refactors part 2 (#116) před 1 rokem
models b9b295d74e chore: backlogs 1 (#191) před 1 rokem
__init__.py 653da510d1 chore: rewrite InputMetadata (#143) před 1 rokem
hf_downloader.py 725be3e0de feat: mixtral HF with expert parallelism (#167) před 1 rokem
loader.py 730357c7d5 chore: implement lazy module loader for models (#165) před 1 rokem
metadata.py 7d91e9e0f2 feat: CUDA graphs (#172) před 1 rokem
sampling_metadata.py 2aab3da9bd chore: fix Python 3.8+ compatibility (#170) před 1 rokem
utils.py e7b6a2d5a0 chore: tensor parallel refactors part 2 (#116) před 1 rokem