Commit History

Автор SHA1 Съобщение Дата
  AlpinDale efc6f7fbec chore: reformats (#90) преди 1 година
  AlpinDale 3d72f05c7b feat: flattened 1D tensor -> 2D tensor (#85) преди 1 година
  AlpinDale 0dcc924088 readme: add benchmarks преди 1 година
  AlpinDale eafcd75a69 fix tests and tweak throughput benchmark преди 1 година
  AlpinDale 2460d17e54 fix positional encoding tests преди 1 година
  AlpinDale b047197513 tests: increase tolerance for layernorm преди 1 година
  AlpinDale 9b317aa26a feat: finish up tests and workflows (#87) преди 1 година
  AlpinDale f73f2dd3c2 feat: add mistral support for GPTQ (#86) преди 1 година
  AlpinDale e6be0118c9 feat: prompt logprobs and batched samplers (#77) преди 1 година
  city-unit 12e296b556 fix: update Dockerfile (#82) преди 1 година
  city-unit 27af10fd0b chore: make entrypoint executable (#83) преди 1 година
  AlpinDale 977e8d3507 update readme with new sampling params преди 1 година
  AlpinDale ab1ac578ba bump version to 0.3.7-dev преди 1 година
  Stefan Gligorijevic 34c1c8c83a feat: Enable banning tokens (#80) преди 1 година
  AlpinDale 4e71bd1d12 feat: add PagedAttention V2 kernels (#76) преди 1 година
  50h100a d0eadd4dbd Added `min_tokens` and reimplemented `ignore_eos` using a new logit processor (#70) преди 1 година
  AlpinDale 04a27c6aeb fix: revert mirostat v2 (#79) преди 1 година
  AlpinDale 9c353a0e02 fix: unnecessary import преди 1 година
  AlpinDale ce5e2332ea fix: launch AWQ kernels on the current CUDAStream (#75) преди 1 година
  AlpinDale 561773dec8 fix: hopefully fixes github actions преди 1 година
  AlpinDale 2c1d6a8cf2 fix: fast tokenizer latency reduction преди 1 година
  AlpinDale 28db67fd78 fix: mistral support преди 1 година
  AlpinDale d8f04f29a9 readme: update sampling params преди 1 година
  Stefan Gligorijevic 5acc27adeb chore: fix parameter validation on ooba endpoint преди 1 година
  Stefan Gligorijevic 93daff0384 chore: delete leftover debug prints преди 1 година
  Stefan Gligorijevic 5dbd262033 feat: Mirostat v2 (#69) преди 1 година
  AlpinDale f393dc2af1 fix: broken GPTQ layer преди 1 година
  AlpinDale 3bf6197afb fix: prompt processing delay introduced by #66 (#71) преди 1 година
  AlpinDale 9df91fe863 bump version to 0.3.6 преди 1 година
  AlpinDale 2b42a1ada2 bump the version to 0.3.5 преди 1 година