Historie revizí

Autor SHA1 Zpráva Datum
  AlpinDale 9866af1626 chore: optimize scheduler and remove policy před 4 měsíci
  AlpinDale 1d8616e4f7 fix: massively improve throughput with high number of prompts před 4 měsíci
  AlpinDale d8a51d05a7 fix: seeded gens with pipeline parallel před 5 měsíci
  AlpinDale e76bbe72eb chore: handle aborted requests for jamba před 5 měsíci
  AlpinDale 99680b2d23 feat: soft prompts (#589) před 5 měsíci
  AlpinDale 5be90c3859 Mamba infrastrucuture support (#586) před 5 měsíci
  AlpinDale ae04f57ec1 feat: Pipeline Parallel support (#581) před 5 měsíci
  AlpinDale 29ddfae8de fix: typo in scheduler před 5 měsíci
  AlpinDale 28e45a6209 fix: attempting to remove a lora that has already been removed před 5 měsíci
  AlpinDale 3f92035bf1 fix: add `ignored_seq_groups` in `_schedule_chunked_prefill` před 5 měsíci
  AlpinDale 237fa59aea feat: support CPU/GPU swapping in BlockManagerV2 před 5 měsíci
  AlpinDale 5b0c11d190 support pipeline parallel pynccl groups před 6 měsíci
  AlpinDale b7667151e5 fix scheduler being off by one for lora support před 6 měsíci
  AlpinDale 9e73559eba make use of batched rotary embedding kernels to support long context lora před 6 měsíci
  AlpinDale eaa06fdd14 fix some f-strings před 6 měsíci
  AlpinDale 342346afda improve hashing function před 6 měsíci
  AlpinDale fd0a5c0ea4 raise a warning during preemption and swapping před 6 měsíci
  AlpinDale be8154a8a0 feat: proper embeddings API with e5-mistral-7b support před 6 měsíci
  AlpinDale 8b56dc4347 dict -> torch.Tensor for blocks_to_swap před 6 měsíci
  AlpinDale 148aca8ff1 cow => dict[int, list] -> list před 6 měsíci
  AlpinDale 21ce19b3ea blocks_to_copy dict -> torch.Tensor před 6 měsíci
  AlpinDale ef733aee43 implement ExecuteModelData to reduce executor complexity před 6 měsíci
  AlpinDale 25c2b6feca ignore infeasible swap requests před 6 měsíci
  AlpinDale 5529304d1f fix sampling with n>1 před 6 měsíci
  AlpinDale aed64884c6 feat: prompt logprobs with chunked prefill (#539) před 6 měsíci
  AlpinDale fca911ee0a vLLM Upstream Sync (#526) před 6 měsíci
  AlpinDale 9d81716bfd [v0.5.3] Release Candidate (#388) před 8 měsíci
  AlpinDale 78d66f16d1 Chunked Prefill Part 1 (#384) před 9 měsíci
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) před 9 měsíci
  AlpinDale e42a78381a feat: switch from pylint to ruff (#322) před 10 měsíci