Historie revizí

Autor SHA1 Zpráva Datum
  AlpinDale 4e71bd1d12 feat: add PagedAttention V2 kernels (#76) před 1 rokem
  50h100a d0eadd4dbd Added `min_tokens` and reimplemented `ignore_eos` using a new logit processor (#70) před 1 rokem
  AlpinDale 04a27c6aeb fix: revert mirostat v2 (#79) před 1 rokem
  AlpinDale 9c353a0e02 fix: unnecessary import před 1 rokem
  AlpinDale ce5e2332ea fix: launch AWQ kernels on the current CUDAStream (#75) před 1 rokem
  AlpinDale 561773dec8 fix: hopefully fixes github actions před 1 rokem
  AlpinDale 2c1d6a8cf2 fix: fast tokenizer latency reduction před 1 rokem
  AlpinDale 28db67fd78 fix: mistral support před 1 rokem
  AlpinDale d8f04f29a9 readme: update sampling params před 1 rokem
  Stefan Gligorijevic 5acc27adeb chore: fix parameter validation on ooba endpoint před 1 rokem
  Stefan Gligorijevic 93daff0384 chore: delete leftover debug prints před 1 rokem
  Stefan Gligorijevic 5dbd262033 feat: Mirostat v2 (#69) před 1 rokem
  AlpinDale f393dc2af1 fix: broken GPTQ layer před 1 rokem
  AlpinDale 3bf6197afb fix: prompt processing delay introduced by #66 (#71) před 1 rokem
  AlpinDale 9df91fe863 bump version to 0.3.6 před 1 rokem
  AlpinDale 2b42a1ada2 bump the version to 0.3.5 před 1 rokem
  AlpinDale c55c8f7bd8 update readme před 1 rokem
  AlpinDale 380206038e fix: change the timing of logit sorting (#66) před 1 rokem
  AlpinDale bdad759503 feat: YaRN context window extension support (#67) před 1 rokem
  AlpinDale f04588203e feat: mistral AWQ support and file blacklisting před 1 rokem
  AlpinDale 7572e1dd59 overflow in AWQ GEMM kernel před 1 rokem
  AlpinDale c1fa7e8567 chore: fix datatype check (#65) před 1 rokem
  AlpinDale a6a4220fa6 feat: refactor megatron and quants (#57) před 1 rokem
  AlpinDale 9a9e59b871 update readme with new instructions před 1 rokem
  g4rg 16bf6b61a3 fix: requests stalling in KAI non-streaming endpoint (#46) před 1 rokem
  LitreallyNone b526a7b3bc Update requirements.txt (#58) před 1 rokem
  AlpinDale 2e70a6d5ed chore: allow the user to specify install method (#56) před 1 rokem
  official-elinas 46e472062a chore: make NVCC work for different versions (#55) před 1 rokem
  AlpinDale 6682ede3de fix: clean up API servers před 1 rokem
  henk717 0b2b62fe96 Micromamba Runtime (#54) před 1 rokem