Histórico de Commits

Autor SHA1 Mensagem Data
  AlpinDale d8c4193704 feat: Speculative Decoding using a draft model (#432) há 9 meses atrás
  50h100a f67b5be198 chore: port sampler+metadata changes from main to dev (#427) há 9 meses atrás
  AlpinDale fa083286e3 Speculative Decoding Part 4: Lookahead scheduling (#402) há 10 meses atrás
  AlpinDale 3abc641d68 directly use in forward pass há 10 meses atrás
  AlpinDale c3c374396b logprobs fixes há 10 meses atrás
  AlpinDale 2efee6bcc6 optimize logprob ranks há 10 meses atrás
  AlpinDale 777b6f6d51 add logprob ranks há 10 meses atrás
  AlpinDale 0c4ead5e9f min_tokens há 10 meses atrás
  AlpinDale d1786645a3 fix formatting há 10 meses atrás
  AlpinDale f01c668259 clean up sampler há 10 meses atrás
  AlpinDale 78d66f16d1 Chunked Prefill Part 1 (#384) há 10 meses atrás
  AlpinDale 9181fa0396 feat: Triton kernels for sampling (#383) há 10 meses atrás
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) há 10 meses atrás
  50h100a d5dbd29db4 hoist sampler internals into a single function. há 10 meses atrás
  AlpinDale da223153c6 feat&fix: cohere support and missing GPU blocks (#333) há 11 meses atrás
  AlpinDale e42a78381a feat: switch from pylint to ruff (#322) há 11 meses atrás
  AlpinDale 9fa99215f8 feat: add cubic sampling (#280) há 11 meses atrás
  AlpinDale 657aec0cbd refactor: OpenAI endpoint (#261) há 11 meses atrás
  AlpinDale 4d04ade9ef feat: fine-grained seeds (#279) há 11 meses atrás
  anon998 35b9033782 fix: crash in quadratic sampling when batch > 1 (#253) há 1 ano atrás
  50h100a f619c96c79 fix: zero token output due to temperature bias (#243) há 1 ano atrás
  50h100a 53a9c60442 fix: logit processor declarations and application (#242) há 1 ano atrás
  AlpinDale e73a92ad2f fix: remove the mask for quadratic sampling (#236) há 1 ano atrás
  AlpinDale 1c46fa31ad feat: add quadratic sampling (#233) há 1 ano atrás
  AlpinDale c3a221eb02 feat: GGUF, QuIP#, and Marlin support (#228) há 1 ano atrás
  AlpinDale c0aac15421 feat: S-LoRA support (#222) há 1 ano atrás
  AlpinDale 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) há 1 ano atrás
  Stefan Gligorijevic 9e7e108dc8 chore: clamp dynatemp_min (#214) há 1 ano atrás
  Stefan Gligorijevic 56446a04bb feat: dynamic temperature (#209) há 1 ano atrás
  AlpinDale d54791aaa8 feat: reduce sampler overhead by making it less blocking (#198) há 1 ano atrás