Историја ревизија

Аутор SHA1 Порука Датум
  Tri Dao ef6d8c75d9 [GPT] Fix loading weights from HF hub пре 1 година
  Tri Dao f1a73d0740 Run isort and black on python files пре 1 година
  Xuechen Li 0f7853c6a1 enable loading hf llama checkpoints for training (#446) пре 1 година
  Tri Dao 78b7a1dc18 [OPT] Load fp16 weights on CPU before moving to GPU пре 1 година
  Tri Dao f68d41ec77 [Gen] Add OPT to generation test пре 1 година
  Tri Dao 7c2191542a [Gen] Make generation work with Tensor Parallel пре 1 година
  Tri Dao 11be742aa3 [Gen] Test generation with rotary embedding пре 1 година
  Tri Dao c6ecd40a59 Tweak CrossEntropyLoss to take process_group in init пре 1 година