Историја ревизија

Аутор SHA1 Порука Датум
  AlpinDale 05e45aeb53 fix: dtype mismatch for paligemma пре 6 месеци
  AlpinDale 500f3b654f fix: support bias term in compressed-tensors quant пре 6 месеци
  AlpinDale d2f38f6f81 chore: remove separate bias add пре 6 месеци
  AlpinDale ddb28a80a3 fix: bump torch for rocm, unify CUDA_VISIBLE_DEVICES for cuda and rocm пре 6 месеци
  AlpinDale a2d476183f fix: remove scipy and re-implement CSR matrix пре 6 месеци
  AlpinDale 5ac65d2d49 chore: bump optimum-intel пре 6 месеци
  AlpinDale cc6399792f fix: keep consistent with how pytorch finds libcudart.so пре 6 месеци
  AlpinDale 63becc67c0 fix: prompt logprob detokenization пре 6 месеци
  AlpinDale 0ab35652d3 fix: llava 1.6 feature size calculation пре 6 месеци
  AlpinDale 058e629f8e chore: refactor marlin python utils пре 6 месеци
  AlpinDale c0c2b1ac20 fix: get_and_reset only when scheduler outputs are not empty пре 6 месеци
  AlpinDale b9268be8e8 fix: engine timeout due to request abort пре 6 месеци
  AlpinDale 8a44866e00 restrict outlines to < 0.1 пре 6 месеци
  AlpinDale 4501ae5f15 fix: neuron executor for adapters пре 6 месеци
  AlpinDale 16dff9babc chore: enable bonus token in spec decoding for KV cache based models пре 6 месеци
  AlpinDale 4150b1ea3a fix: adapter methods for OpenVINO executor пре 6 месеци
  AlpinDale db73f03cdc fix: use ParallelLMHead for MLPSpeculator пре 6 месеци
  AlpinDale 9622c59f8f chore: support 2D input shape in MoE layer пре 6 месеци
  AlpinDale 4628caeae6 fix: missed these adapter methods for TPU executor пре 6 месеци
  AlpinDale dba22e4f83 fix: add zeromq fallback for broadcasting large objects (e.g. vlm images) пре 6 месеци
  AlpinDale d9f4c36edd feat: Medusa speculative decoding support (#590) пре 6 месеци
  AlpinDale 6abf4e3883 fix: needs_scalar_to_array logic check in linear layer пре 6 месеци
  AlpinDale a3b56353fa fix: another one missed пре 6 месеци
  AlpinDale 4e4cd55d30 fix: incorrect LoRA import пре 6 месеци
  AlpinDale 99680b2d23 feat: soft prompts (#589) пре 6 месеци
  AlpinDale 1cb06835a0 fix: TPU multimodal kwargs and outlines installation in TPU docker пре 6 месеци
  AlpinDale 1562e073c6 fix: ray worker rank assigment пре 6 месеци
  AlpinDale 1a40bf438b fix: incorrect gpu capability when used mixed gpus пре 6 месеци
  AlpinDale 3798ecc309 chore: add flashinfer to default dockerfile пре 6 месеци
  AlpinDale ebba0d9226 fix: mamba cache cuda graph padding пре 6 месеци