コミット履歴

作者 SHA1 メッセージ 日付
  sgsdxzy a3b1602391 fix: rope scaling for cohere and qwen (#436) 9 ヶ月 前
  sgsdxzy f3b546e33a feat: upport twe lm_head for quantized weights (#409) 9 ヶ月 前
  AlpinDale 50c2434267 move megatron to a top-level directory 10 ヶ月 前
  sgsdxzy 638547ec98 fix: Improve cohere model. (#404) 10 ヶ月 前
  AlpinDale fa083286e3 Speculative Decoding Part 4: Lookahead scheduling (#402) 10 ヶ月 前
  sgsdxzy 47370d2ad5 Fix cohere for command-r+ (#394) 10 ヶ月 前
  AlpinDale 0f1399c135 feat: attention refactor part 2 10 ヶ月 前
  AlpinDale d1786645a3 fix formatting 10 ヶ月 前
  AlpinDale ace9bcd53f fix gptq for cohere 10 ヶ月 前
  AlpinDale 688d56993a add logit scale for command-r 10 ヶ月 前
  AlpinDale 06d88bb8fd logitproc for cohere 10 ヶ月 前
  AlpinDale 582e9efc12 support command-r+ model 10 ヶ月 前
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) 10 ヶ月 前
  AlpinDale da223153c6 feat&fix: cohere support and missing GPU blocks (#333) 11 ヶ月 前