.. |
fused_moe
|
4abbbdad78
chore: make triton fully optional
|
před 4 měsíci |
mamba
|
2dfa4e47e6
chore: set seed for dummy weights init
|
před 4 měsíci |
ops
|
4abbbdad78
chore: make triton fully optional
|
před 4 měsíci |
__init__.py
|
07aa2a492f
upstream: add option to specify tokenizer
|
před 1 rokem |
activation.py
|
6b1fdd07bd
chore: add isort and refactor formatting script and utils
|
před 4 měsíci |
layernorm.py
|
5761ef8c35
feat: gemma-2 support
|
před 4 měsíci |
linear.py
|
0e6c400b13
feat: re-add GGUF (#600)
|
před 4 měsíci |
logits_processor.py
|
4d4e767838
ci: take one of fixing lint issues
|
před 4 měsíci |
pooler.py
|
be8154a8a0
feat: proper embeddings API with e5-mistral-7b support
|
před 5 měsíci |
rejection_sampler.py
|
d8a51d05a7
fix: seeded gens with pipeline parallel
|
před 4 měsíci |
rotary_embedding.py
|
18b45266bb
feat: add nemotron HF support (#606)
|
před 4 měsíci |
sampler.py
|
4abbbdad78
chore: make triton fully optional
|
před 4 měsíci |
spec_decode_base_sampler.py
|
d8a51d05a7
fix: seeded gens with pipeline parallel
|
před 4 měsíci |
typical_acceptance_sampler.py
|
4d4e767838
ci: take one of fixing lint issues
|
před 4 měsíci |
vocab_parallel_embedding.py
|
0e6c400b13
feat: re-add GGUF (#600)
|
před 4 měsíci |