.. |
quantized_linear
|
887e03669a
feat: add exllamav2 for GPTQ (#99)
|
hace 1 año |
__init__.py
|
07aa2a492f
upstream: add option to specify tokenizer
|
hace 1 año |
activation.py
|
74604eb252
fix: pylint complaints (#91)
|
hace 1 año |
attention.py
|
f384f3ae60
fix: force v2 for ctxlen larger than 8192 (#100)
|
hace 1 año |
layernorm.py
|
74604eb252
fix: pylint complaints (#91)
|
hace 1 año |
rotary_embedding.py
|
efc6f7fbec
chore: reformats (#90)
|
hace 1 año |
sampler.py
|
ae7d8df224
fix lint issues (again)
|
hace 1 año |
sampler_mirostat.py
|
ae7d8df224
fix lint issues (again)
|
hace 1 año |