.. |
layers
|
89c7f0469f
fix: calculate the key/value outputs with kvhead
|
1 рік тому |
megatron
|
386be46787
fix: megatron-lm url
|
1 рік тому |
models
|
6dfca19dda
fix: gpt-j loading
|
1 рік тому |
__init__.py
|
5e25fe5e64
feat: add model loader
|
1 рік тому |
hf_downloader.py
|
35ec43f478
fix: remove aria2 for now
|
1 рік тому |
loader.py
|
06e71fc492
feat: add GPT-NeoX support for testing purposes
|
1 рік тому |
metadata.py
|
34295abec4
chore: use xformers attention bias and add docs
|
1 рік тому |
utils.py
|
b48fe85378
chore: utilities for modeling
|
1 рік тому |