Историја ревизија

Аутор SHA1 Порука Датум
  Tri Dao e0fbaa7016 [Gen] Simplify decode_speculative пре 1 година
  Tri Dao e6a8026489 [Gen] Rename max_sequence_len->max_seqlen, sequence_len_offset->seqlen_offset пре 1 година
  Tri Dao dfe29f5e2b [Gen] Don't use ft_attention, use flash_attn_with_kvcache instead пре 1 година
  Tri Dao ccbb14f38e Implement rotary embedding in flash_attn_with_kvcache пре 1 година
  Tri Dao a86442f0f3 [Gen] Use flash_attn_with_kvcache in generation пре 1 година
  Tri Dao fd20f16a4e Support cache_seqlens being integer пре 1 година
  Tri Dao 913922cac5 [Gen] Refactor decoding function пре 1 година
  dan_the_3rd 011ec323d6 Support MQA + MP for decoding (#490) пре 1 година
  Tri Dao 9f42cb6e7a [Gen] Clone logits before returning when cg=True пре 1 година
  Tri Dao f8aea6ead0 [GPT] Generalize last_token_only arg to num_last_tokens пре 1 година
  Tri Dao 371e20658c [GPT] Test generation when passing in multiple tokens пре 1 година
  Tri Dao c000c3a2c0 [GPT] Move more tests to test_gpt.py пре 1 година
  Tri Dao 9b713872ea [GPT] Move GPT and OPT generation tests to test_{gpt,opt}.py пре 1 година
  Tri Dao 0e8c46ae08 Run isort and black on test files пре 1 година
  Tri Dao 4d87e4d875 Implement GPT-J пре 1 година
  Tri Dao 88173a1aaf [FusedDense] Support relu, rename FusedDenseGeluDense -> FusedMLP пре 2 година
  Tri Dao ff34123bd4 Reorder LN in Block, support OPT пре 2 година
  Tri Dao 63670fd84a Implement generation for GPT пре 2 година
  Tri Dao 9d797d8848 Support loading GPT2 weights from Huggingface пре 2 година