コミット履歴

作者 SHA1 メッセージ 日付
  AlpinDale e26a4ac698 chore: avoid loading the unused layers and init the VLM up to the required feature space 5 ヶ月 前
  AlpinDale c11a8bdaad fix: calculate max number of multi-modal tokens automatically 5 ヶ月 前
  AlpinDale 4599c98f99 feat: dynamic image size support for VLMs 5 ヶ月 前
  AlpinDale 3a0fdf7b9b chore: remove `image_input_type` from VLM config 5 ヶ月 前
  AlpinDale c0c336aaa3 refactor: registry for processing model inputs; quick_gelu; clip model support 5 ヶ月 前