Historie revizí

Autor SHA1 Zpráva Datum
  AlpinDale 92cee435e2 rocm: add more quants, fix _scaled_mm call (#1062) před 1 týdnem
  AlpinDale b3f9ab3b72 quant: add tensor parallel support for bitsandbytes (#1052) před 1 týdnem
  AlpinDale a985143768 core: add cuda graph support for encoder-decoder models (#1051) před 1 týdnem
  AlpinDale 4b1b658855 tpu: implement multi-step scheduling (#1046) před 1 týdnem
  AlpinDale ddaefd8d38 chore: remove engine_use_ray (#1024) před 1 týdnem
  AlpinDale f2b6dc3872 cpu: add support for W8A8 quantization via compressed-tensor (#1017) před 2 týdny
  AlpinDale 411ac4f405 vlm: add support for Qwen2-VL model (#1015) před 2 týdny
  AlpinDale dcb36de9c4 quants: add support for NVIDIA's ModelOpt checkpoints (#1013) před 2 týdny
  AlpinDale 30d02d0747 chore: remove peft as a requirement (#1006) před 2 týdny
  AlpinDale 145e554a4d neuron: add 8bit quantization for Neuron (#994) před 2 týdny
  AlpinDale b3f6eeb1d2 vlm: increase the default `max_num_batched_tokens` for multimodal models (#973) před 2 týdny
  AlpinDale 5bec8fbb1b tpu: add support for async postprocessing (#968) před 2 týdny
  AlpinDale a8bdd488b9 distributed: support pipeline parallelism for internvl and internlm2 (#965) před 2 týdny
  AlpinDale fcfcfc65e1 quants: add triton kernels for AWQ (#946) před 2 týdny
  AlpinDale 8d9f1fd4e6 feat: add single user mode (#927) před 2 týdny
  AlpinDale f7f3fed265 feat: add async postprocessor (#925) před 2 týdny
  AlpinDale 132aa2abe4 spec decode: add support for EAGLE (#899) před 3 týdny
  AlpinDale 908ff753a1 fix: phi_3.5_v loading (#896) před 3 týdny
  AlpinDale 22a4cd4595 core: fix spec decode metrics and envs circular import (#889) před 3 týdny
  AlpinDale 901900854e chore: consolidate environment variables within one file (#882) před 4 týdny
  AlpinDale 9288a98084 spec decoding: set the draft model ctxlen to target model (#874) před 1 měsícem
  AlpinDale 483c9e6e59 fix: disable awq_marlin override for awq models (#843) před 1 měsícem
  AlpinDale 2f61644f6e SPMD optimizations (#824) před 1 měsícem
  AlpinDale 0a369f9171 feat: support chunked prefill with LoRA (#823) před 1 měsícem
  AlpinDale c6c91edab7 ci: update & overhaul test units (#769) před 1 měsícem
  AlpinDale 0256ed236b feat: windows support (#790) před 2 měsíci
  AlpinDale 7222b84582 feat: ministral support (#776) před 2 měsíci
  AlpinDale 73177656ed feat: quant_llm support (#755) před 3 měsíci
  AlpinDale 89a2c6dee1 chore: refactor `MultiModalConfig` initialization and profiling (#745) před 3 měsíci
  AlpinDale d34e083c48 feat: add experts_int8 support (#730) před 3 měsíci