Commit History

Upphovsman SHA1 Meddelande Datum
  AlpinDale b01eec7c35 stop workflows on dev 11 månader sedan
  AlpinDale f01c668259 clean up sampler 11 månader sedan
  AlpinDale fa6af97a5a add new logits processor 11 månader sedan
  AlpinDale 78d66f16d1 Chunked Prefill Part 1 (#384) 11 månader sedan
  AlpinDale 9181fa0396 feat: Triton kernels for sampling (#383) 11 månader sedan
  AlpinDale e3252edd07 fix: remove event and stream, add typing (#382) 11 månader sedan
  AlpinDale 375f24ccca fix: optimize context shift performance (#380) 11 månader sedan
  AlpinDale 33b3786175 fix: cache neuron checks (#379) 11 månader sedan
  AlpinDale 8c9cabf4c8 fix: display error in ray before deadlock (#378) 11 månader sedan
  AlpinDale f587953f46 fix: yapf 11 månader sedan
  AlpinDale 4b99ac15b7 fix: do not deepcopy metadata 11 månader sedan
  AlpinDale 17b034613d chore: make metadata a dataclass (#377) 11 månader sedan
  AlpinDale 9534fcfb7b fix: build error 11 månader sedan
  AlpinDale 0b35176089 feat: add context-free grammars (#376) 11 månader sedan
  AlpinDale feb5840f2a feat: async tokenization (#374) 11 månader sedan
  IggoOnCode 2aec297c55 feat: add embeddings endpoint to openai rest-api server. (#363) 11 månader sedan
  AlpinDale 29c241c115 fix: explicitly disallow installation on non-linux platforms (#373) 11 månader sedan
  AlpinDale 439a826712 fix: broadcast group 11 månader sedan
  AlpinDale 935027bdcc feat: dynamic shared memory allocation for moe align block size (#372) 11 månader sedan
  AlpinDale 97a2b26c97 fix: assertion error when use_sliding_window is present 11 månader sedan
  AlpinDale e702f587cf feat: add batched RoPE kernels (#371) 11 månader sedan
  AlpinDale 3d6695cfbb feat: add approximate gelu activation kernels (#370) 11 månader sedan
  AlpinDale 5fa15b4435 fix: double free with sliding window (#369) 11 månader sedan
  AlpinDale 72cd8494aa feat: mistral neuron support (#368) 11 månader sedan
  AlpinDale 0f6d56b07f feat: model executor refactor (#367) 11 månader sedan
  AlpinDale b361096463 fix: tokenizer when using ray (#366) 11 månader sedan
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) 11 månader sedan
  50h100a a39920bc99 Merge pull request #355 from 50h100a/pr_seedfix 11 månader sedan
  50h100a 051c60736e Merge pull request #356 from 50h100a/pr_samplerinternals 11 månader sedan
  50h100a d5dbd29db4 hoist sampler internals into a single function. 11 månader sedan