JDKWangGuan 0d810cfb73 Fix KeyError handling for non-existing key in state_dict.pop() (#898) пре 6 месеци
..
__init__.py ece539abd6 Add __init__.py files to subdirectories for installation пре 2 година
baichuan.py 3f7d5786ba Pass alibi slopes to flash_attn_with_kvcache during generation пре 1 година
bert.py abbc131173 [LayerNorm] Switch from CUDA to Triton implementation пре 1 година
bigcode.py 07005806ff Add BigCode converters (#532) пре 1 година
btlm.py 7ffba9a501 Implement BTLM model пре 1 година
falcon.py f1a73d0740 Run isort and black on python files пре 1 година
gpt.py 0d810cfb73 Fix KeyError handling for non-existing key in state_dict.pop() (#898) пре 6 месеци
gpt_neox.py 0a146185d6 [Gen] Remove minor dead code пре 1 година
gptj.py f1a73d0740 Run isort and black on python files пре 1 година
llama.py 187c2a0635 Fix E1136 (#563) пре 1 година
opt.py f1a73d0740 Run isort and black on python files пре 1 година
vit.py abbc131173 [LayerNorm] Switch from CUDA to Triton implementation пре 1 година