Commit History

Автор SHA1 Съобщение Дата
  AlpinDale c1c37c755d bump version to 0.6.0 преди 4 месеца
  AlpinDale 75122b20ef chore: refactor wheel build script преди 4 месеца
  AlpinDale 638784c3c9 docs: fix typos преди 4 месеца
  AlpinDale cc7a636ffd ci: add action for deploying docs преди 4 месеца
  AlpinDale 57968a5053 docs: finalize User & Developer Documentation for Release Candidate (#618) преди 4 месеца
  AlpinDale 208cd5405f fix: cpu offloading with gptq преди 4 месеца
  AlpinDale 28946766fb fix: allow loading GGUF model without .gguf extension преди 4 месеца
  AlpinDale 2b85ffb1a5 chore: minor cleanups преди 4 месеца
  AlpinDale 2424207fac ci: remove isort преди 4 месеца
  AlpinDale c4933b1a6d ci: remove yapf from the formatting script преди 4 месеца
  AlpinDale 616de67ff5 ci: remove yapf преди 4 месеца
  AlpinDale f18eeaf59a ci: codespell fixes преди 4 месеца
  AlpinDale 4d4e767838 ci: take one of fixing lint issues преди 4 месеца
  AlpinDale 6b1f96586b ci: remove clang-format преди 4 месеца
  AlpinDale dc00aa7b17 ci: a few more ignores преди 4 месеца
  AlpinDale e63be8e46c minor CI fixes преди 4 месеца
  AlpinDale 0e6c400b13 feat: re-add GGUF (#600) преди 4 месеца
  AlpinDale 6c1eab6a6c feat: non-blocking transfer in prepare_input преди 4 месеца
  AlpinDale 2a349ca3e1 fix: specify device when loading lora and embedding tensors преди 4 месеца
  AlpinDale 9d98f29b3a chore: update cutlass to 3.5.1 преди 4 месеца
  AlpinDale bd210a6cf6 fix: use args.trust_remote_code преди 4 месеца
  AlpinDale e8008f24ed fix: use ipv4 localhost form for zmq bind преди 4 месеца
  AlpinDale 6c2e24de53 fix: support flashinfer for draft model runner преди 4 месеца
  AlpinDale edffcecc67 chore: add proper logging for spec decoding verification преди 4 месеца
  AlpinDale c3ee71a437 feat: port SiglipVisionModel from transformers преди 4 месеца
  AlpinDale 040e5af52b refactor: factor out code for running uvicorn again преди 4 месеца
  AlpinDale 9a50e3b4eb refactor: minicpmv and port Idefix2VisionTransformer преди 4 месеца
  AlpinDale 29f0478f90 chore: simplify output processing with shortcut for non-parallel sampling and non-beam search usecase (#616) преди 4 месеца
  AlpinDale b6c97e4d16 feat: add guided decoding to LLM преди 4 месеца
  AlpinDale 212b9d8a03 refactor: add has_prefix_cache_hit flag to FlashAttentionMetadataBuilder преди 4 месеца