Historial de Commits

Autor SHA1 Mensaje Fecha
  AlpinDale 2050b42f3f fix: remove unused code in sampler hace 4 meses
  AlpinDale 705e50f4bd fix: broadcasting logic for multi_modal_kwargs hace 4 meses
  AlpinDale d8a51d05a7 fix: seeded gens with pipeline parallel hace 4 meses
  AlpinDale 4abbbdad78 chore: make triton fully optional hace 4 meses
  AlpinDale ff84ebbb04 chore: use array to speedup padding hace 4 meses
  AlpinDale dd18c5042c move prepare_inputs to the GPU (#596) hace 4 meses
  AlpinDale ebf8a53618 feat: optimize throughput to 1.4x by using numpy for token padding hace 4 meses
  AlpinDale 63b735bc2a chore: optimize v2 block manager to match the performance of v1 hace 4 meses
  AlpinDale d1f91d0f70 fix: greedy sampling being not greedy in concurrent situations where penalties are used hace 5 meses
  AlpinDale b9a5a0ae79 fix: avoid copying prompt/output tokens if penalties arent used hace 5 meses
  AlpinDale e321d80e4e fix: `prompt_logprobs==0` case hace 5 meses
  AlpinDale 35ae01d7ba refactor: attention metadata term hace 5 meses
  AlpinDale 9ce319b03c fix: sampler indexing issues in distributed environments (#546) hace 5 meses
  AlpinDale aed64884c6 feat: prompt logprobs with chunked prefill (#539) hace 5 meses
  AlpinDale fca911ee0a vLLM Upstream Sync (#526) hace 6 meses
  AlpinDale 9d81716bfd [v0.5.3] Release Candidate (#388) hace 8 meses
  50h100a 0634b8a3a6 fix memory pinning conditional hace 9 meses
  50h100a d3dd170a7d merge main hace 9 meses
  50h100a dc09dc2b4d Merge branch 'main' into pr_samplers hace 9 meses
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) hace 9 meses
  50h100a 7ed57e318d Overhauled SamplingTensors construction. hace 9 meses
  AlpinDale 9fa99215f8 feat: add cubic sampling (#280) hace 10 meses
  AlpinDale 657aec0cbd refactor: OpenAI endpoint (#261) hace 10 meses
  AlpinDale 4d04ade9ef feat: fine-grained seeds (#279) hace 10 meses
  AlpinDale 1c46fa31ad feat: add quadratic sampling (#233) hace 11 meses
  AlpinDale 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) hace 11 meses
  AlpinDale a39eeb7188 fix: logprobs for dynatemp (#215) hace 11 meses
  Stefan Gligorijevic 56446a04bb feat: dynamic temperature (#209) hace 11 meses
  AlpinDale 1394eab8ab fix temperature being set to 1 in all cases (#210) hace 11 meses
  AlpinDale d54791aaa8 feat: reduce sampler overhead by making it less blocking (#198) hace 1 año