Geçmişin Kaydedilmesi

Yazar SHA1 Mesaj Tarih
  AlpinDale a985143768 core: add cuda graph support for encoder-decoder models (#1051) 1 hafta önce
  AlpinDale 271879a4a5 fix: disable chunked prefill and prefix caching for multimodal models (#1037) 1 hafta önce
  AlpinDale ddaefd8d38 chore: remove engine_use_ray (#1024) 1 hafta önce
  AlpinDale fe01e2ded8 chore: move `device` keys to a constant (#1020) 2 hafta önce
  AlpinDale 9a42869055 chore: keep chunked prefill enabled with prefix caching (#1007) 2 hafta önce
  AlpinDale 145e554a4d neuron: add 8bit quantization for Neuron (#994) 2 hafta önce
  AlpinDale 510ae5b949 core: fix chunked prefill not being enabled by default for long contexts (#974) 2 hafta önce
  AlpinDale b3f6eeb1d2 vlm: increase the default `max_num_batched_tokens` for multimodal models (#973) 2 hafta önce
  AlpinDale 8d9f1fd4e6 feat: add single user mode (#927) 2 hafta önce
  AlpinDale f7f3fed265 feat: add async postprocessor (#925) 2 hafta önce
  AlpinDale 0c6d90dade neuron: add support for tensor parallelism (#923) 3 hafta önce
  AlpinDale 22a4cd4595 core: fix spec decode metrics and envs circular import (#889) 3 hafta önce
  AlpinDale 901900854e chore: consolidate environment variables within one file (#882) 4 hafta önce
  AlpinDale 48a8693aed feat: multi-step scheduling (#831) 1 ay önce
  AlpinDale 2f61644f6e SPMD optimizations (#824) 1 ay önce
  AlpinDale f088ea81c7 fix: --max-seq-len-to-capture arg (#818) 1 ay önce
  AlpinDale 0256ed236b feat: windows support (#790) 2 ay önce
  AlpinDale dcb794a340 fix: revert incorrect commit 2 ay önce
  AlpinDale 76367b5ae7 wip 2 ay önce
  AlpinDale 7222b84582 feat: ministral support (#776) 2 ay önce
  AlpinDale 73177656ed feat: quant_llm support (#755) 3 ay önce
  AlpinDale 89a2c6dee1 chore: refactor `MultiModalConfig` initialization and profiling (#745) 3 ay önce
  AlpinDale 28b6397188 chore: quant config for speculative draft models (#719) 3 ay önce
  AlpinDale 008e646c7e chore: add support for up to 2048 block size (#715) 3 ay önce
  AlpinDale 577586309d chore: multi-step args and sequence modifications (#713) 3 ay önce
  AlpinDale 0b8b407b6d feat: support profiling with multiple multi-modal inputs per prompt (#712) 3 ay önce
  AlpinDale d5033e12fd feat: implement mistral tokenizer mode (#711) 3 ay önce
  AlpinDale 4fe371b7fa fix: allow passing float for GiB arguments (#690) 4 ay önce
  AlpinDale bf88c8567e feat: mamba model support (#674) 4 ay önce
  AlpinDale a0e446a17d feat: initial encoder-decoder support with BART model (#633) 4 ay önce