Commit történet

Szerző SHA1 Üzenet Dátum
  AlpinDale efc6f7fbec chore: reformats (#90) 1 éve
  AlpinDale 3d72f05c7b feat: flattened 1D tensor -> 2D tensor (#85) 1 éve
  AlpinDale 0dcc924088 readme: add benchmarks 1 éve
  AlpinDale eafcd75a69 fix tests and tweak throughput benchmark 1 éve
  AlpinDale 2460d17e54 fix positional encoding tests 1 éve
  AlpinDale b047197513 tests: increase tolerance for layernorm 1 éve
  AlpinDale 9b317aa26a feat: finish up tests and workflows (#87) 1 éve
  AlpinDale f73f2dd3c2 feat: add mistral support for GPTQ (#86) 1 éve
  AlpinDale e6be0118c9 feat: prompt logprobs and batched samplers (#77) 1 éve
  city-unit 12e296b556 fix: update Dockerfile (#82) 1 éve
  city-unit 27af10fd0b chore: make entrypoint executable (#83) 1 éve
  AlpinDale 977e8d3507 update readme with new sampling params 1 éve
  AlpinDale ab1ac578ba bump version to 0.3.7-dev 1 éve
  Stefan Gligorijevic 34c1c8c83a feat: Enable banning tokens (#80) 1 éve
  AlpinDale 4e71bd1d12 feat: add PagedAttention V2 kernels (#76) 1 éve
  50h100a d0eadd4dbd Added `min_tokens` and reimplemented `ignore_eos` using a new logit processor (#70) 1 éve
  AlpinDale 04a27c6aeb fix: revert mirostat v2 (#79) 1 éve
  AlpinDale 9c353a0e02 fix: unnecessary import 1 éve
  AlpinDale ce5e2332ea fix: launch AWQ kernels on the current CUDAStream (#75) 1 éve
  AlpinDale 561773dec8 fix: hopefully fixes github actions 1 éve
  AlpinDale 2c1d6a8cf2 fix: fast tokenizer latency reduction 1 éve
  AlpinDale 28db67fd78 fix: mistral support 1 éve
  AlpinDale d8f04f29a9 readme: update sampling params 1 éve
  Stefan Gligorijevic 5acc27adeb chore: fix parameter validation on ooba endpoint 1 éve
  Stefan Gligorijevic 93daff0384 chore: delete leftover debug prints 1 éve
  Stefan Gligorijevic 5dbd262033 feat: Mirostat v2 (#69) 1 éve
  AlpinDale f393dc2af1 fix: broken GPTQ layer 1 éve
  AlpinDale 3bf6197afb fix: prompt processing delay introduced by #66 (#71) 1 éve
  AlpinDale 9df91fe863 bump version to 0.3.6 1 éve
  AlpinDale 2b42a1ada2 bump the version to 0.3.5 1 éve