AlpinDale 801eda0b7a feat: support GPTQ 2, 3, and 8bit quants (#181) hace 1 año
..
layers 801eda0b7a feat: support GPTQ 2, 3, and 8bit quants (#181) hace 1 año
megatron e7b6a2d5a0 chore: tensor parallel refactors part 2 (#116) hace 1 año
models b9b295d74e chore: backlogs 1 (#191) hace 1 año
__init__.py 653da510d1 chore: rewrite InputMetadata (#143) hace 1 año
hf_downloader.py 725be3e0de feat: mixtral HF with expert parallelism (#167) hace 1 año
loader.py 730357c7d5 chore: implement lazy module loader for models (#165) hace 1 año
metadata.py 7d91e9e0f2 feat: CUDA graphs (#172) hace 1 año
sampling_metadata.py 2aab3da9bd chore: fix Python 3.8+ compatibility (#170) hace 1 año
utils.py e7b6a2d5a0 chore: tensor parallel refactors part 2 (#116) hace 1 año