Histórico de Commits

Autor SHA1 Mensagem Data
  AlpinDale 2242aabaf4 fix: outlines import errors há 1 mês atrás
  AlpinDale d2971a6831 ci: bump version to 0.6.4 (#845) há 1 mês atrás
  AlpinDale 538471f76e chore: bump mistral_common to 1.5.0 (#844) há 1 mês atrás
  AlpinDale 483c9e6e59 fix: disable awq_marlin override for awq models (#843) há 1 mês atrás
  AlpinDale dfa34d1b24 feat: add sampler_priorty (#837) há 1 mês atrás
  AlpinDale 93bc863591 feat: Machete Kernels for Hopper GPUs (#842) há 1 mês atrás
  AlpinDale 563e8f7ac8 fix: latency and serving benchmarks (#841) há 1 mês atrás
  AlpinDale 7c7ec12f36 chore: refactor executor classes for easier inheritance (#840) há 1 mês atrás
  AlpinDale 16b587c104 fix: hidden states handling in batch expansion for spec decoding (#839) há 1 mês atrás
  AlpinDale 60f7b828d5 feat: add skew sampling (#834) há 1 mês atrás
  AlpinDale ba9d8f631a feat: add no_repeat_ngram sampler (#832) há 2 meses atrás
  Selali 4c4a365f77 feat: Add DRY (Don't Repeat Yourself) sampling (#827) há 2 meses atrás
  AlpinDale 48a8693aed feat: multi-step scheduling (#831) há 2 meses atrás
  AlpinDale 2242cb25dc fix: unbound tokenizer error há 2 meses atrás
  AlpinDale 3d83e64f8e feat: add metrics for prefix cache hit rate (#829) há 2 meses atrás
  AlpinDale 22425b689d fix: XPU build há 2 meses atrás
  AlpinDale bfc8988116 feat: add cuda sampling kernels for top_k and top_p (#828) há 2 meses atrás
  AlpinDale 22427602eb feat: add top-nsigma sampling method há 2 meses atrás
  AlpinDale 22429e4a10 fix: sampler test with new transformers version há 2 meses atrás
  AlpinDale 2f61644f6e SPMD optimizations (#824) há 2 meses atrás
  AlpinDale 32a37e8107 tests: partially fix tensorizer and logprobs tests há 2 meses atrás
  AlpinDale 7f1c9af5e2 fix: fp8 quant test há 2 meses atrás
  AlpinDale 173ac23399 fix: experts int8 quant test há 2 meses atrás
  AlpinDale 68f050129d fix: lora worker manager test import há 2 meses atrás
  AlpinDale 3661de812d fix: lora layer test há 2 meses atrás
  AlpinDale 0a369f9171 feat: support chunked prefill with LoRA (#823) há 2 meses atrás
  AlpinDale e5b1afe625 feat: add chat method for LLM class (#822) há 2 meses atrás
  AlpinDale 262cbc63b7 fix: vision api test template path há 2 meses atrás
  AlpinDale b0113a1eaa fix: tokenization api test (#821) há 2 meses atrás
  AlpinDale c6c91edab7 ci: update & overhaul test units (#769) há 2 meses atrás