AlpinDale 1c46fa31ad feat: add quadratic sampling (#233) hai 11 meses
..
__init__.py 07aa2a492f upstream: add option to specify tokenizer hai 1 ano
block.py 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) hai 1 ano
config.py c3a221eb02 feat: GGUF, QuIP#, and Marlin support (#228) hai 1 ano
grammar.py 0adab894fe feat: grammar support (#206) hai 1 ano
logger.py 8834ecf9de chore: clean up refactor endpoints (#98) hai 1 ano
logits_processor.py 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) hai 1 ano
outputs.py c0aac15421 feat: S-LoRA support (#222) hai 1 ano
prefix.py c0aac15421 feat: S-LoRA support (#222) hai 1 ano
sampling_params.py 1c46fa31ad feat: add quadratic sampling (#233) hai 11 meses
sequence.py c0aac15421 feat: S-LoRA support (#222) hai 1 ano
test_utils.py 641bb0f6e9 feat: add custom allreduce kernels (#224) hai 1 ano
utils.py 31c95011a6 feat: FP8 E5M2 KV Cache (#226) hai 1 ano