Historial de Commits

Autor SHA1 Mensaje Fecha
  AlpinDale c1c37c755d bump version to 0.6.0 hace 4 meses
  AlpinDale 75122b20ef chore: refactor wheel build script hace 4 meses
  AlpinDale 638784c3c9 docs: fix typos hace 4 meses
  AlpinDale cc7a636ffd ci: add action for deploying docs hace 4 meses
  AlpinDale 57968a5053 docs: finalize User & Developer Documentation for Release Candidate (#618) hace 4 meses
  AlpinDale 208cd5405f fix: cpu offloading with gptq hace 4 meses
  AlpinDale 28946766fb fix: allow loading GGUF model without .gguf extension hace 4 meses
  AlpinDale 2b85ffb1a5 chore: minor cleanups hace 4 meses
  AlpinDale 2424207fac ci: remove isort hace 4 meses
  AlpinDale c4933b1a6d ci: remove yapf from the formatting script hace 4 meses
  AlpinDale 616de67ff5 ci: remove yapf hace 4 meses
  AlpinDale f18eeaf59a ci: codespell fixes hace 4 meses
  AlpinDale 4d4e767838 ci: take one of fixing lint issues hace 4 meses
  AlpinDale 6b1f96586b ci: remove clang-format hace 4 meses
  AlpinDale dc00aa7b17 ci: a few more ignores hace 4 meses
  AlpinDale e63be8e46c minor CI fixes hace 4 meses
  AlpinDale 0e6c400b13 feat: re-add GGUF (#600) hace 4 meses
  AlpinDale 6c1eab6a6c feat: non-blocking transfer in prepare_input hace 4 meses
  AlpinDale 2a349ca3e1 fix: specify device when loading lora and embedding tensors hace 4 meses
  AlpinDale 9d98f29b3a chore: update cutlass to 3.5.1 hace 4 meses
  AlpinDale bd210a6cf6 fix: use args.trust_remote_code hace 4 meses
  AlpinDale e8008f24ed fix: use ipv4 localhost form for zmq bind hace 4 meses
  AlpinDale 6c2e24de53 fix: support flashinfer for draft model runner hace 4 meses
  AlpinDale edffcecc67 chore: add proper logging for spec decoding verification hace 4 meses
  AlpinDale c3ee71a437 feat: port SiglipVisionModel from transformers hace 4 meses
  AlpinDale 040e5af52b refactor: factor out code for running uvicorn again hace 4 meses
  AlpinDale 9a50e3b4eb refactor: minicpmv and port Idefix2VisionTransformer hace 4 meses
  AlpinDale 29f0478f90 chore: simplify output processing with shortcut for non-parallel sampling and non-beam search usecase (#616) hace 4 meses
  AlpinDale b6c97e4d16 feat: add guided decoding to LLM hace 4 meses
  AlpinDale 212b9d8a03 refactor: add has_prefix_cache_hit flag to FlashAttentionMetadataBuilder hace 4 meses