AlpinDale ba371fbbbd feat: AWQ marlin kernels (#603) преди 5 месеца
..
fused_moe 9be43994fe feat: fbgemm quantization support (#601) преди 5 месеца
mamba 2dfa4e47e6 chore: set seed for dummy weights init преди 5 месеца
ops fca911ee0a vLLM Upstream Sync (#526) преди 7 месеца
__init__.py 07aa2a492f upstream: add option to specify tokenizer преди 1 година
activation.py c0c336aaa3 refactor: registry for processing model inputs; quick_gelu; clip model support преди 6 месеца
layernorm.py 5761ef8c35 feat: gemma-2 support преди 5 месеца
linear.py ba371fbbbd feat: AWQ marlin kernels (#603) преди 5 месеца
logits_processor.py 5761ef8c35 feat: gemma-2 support преди 5 месеца
pooler.py be8154a8a0 feat: proper embeddings API with e5-mistral-7b support преди 6 месеца
rejection_sampler.py 2c653a2268 fix: make speculative decoding work with per-request seed преди 5 месеца
rotary_embedding.py 5761ef8c35 feat: gemma-2 support преди 5 месеца
sampler.py dd18c5042c move prepare_inputs to the GPU (#596) преди 5 месеца
spec_decode_base_sampler.py 2c653a2268 fix: make speculative decoding work with per-request seed преди 5 месеца
typical_acceptance_sampler.py 2c653a2268 fix: make speculative decoding work with per-request seed преди 5 месеца
vocab_parallel_embedding.py 9be43994fe feat: fbgemm quantization support (#601) преди 5 месеца