Historie revizí

Autor SHA1 Zpráva Datum
  AlpinDale efc6f7fbec chore: reformats (#90) před 1 rokem
  AlpinDale 3d72f05c7b feat: flattened 1D tensor -> 2D tensor (#85) před 1 rokem
  AlpinDale 0dcc924088 readme: add benchmarks před 1 rokem
  AlpinDale eafcd75a69 fix tests and tweak throughput benchmark před 1 rokem
  AlpinDale 2460d17e54 fix positional encoding tests před 1 rokem
  AlpinDale b047197513 tests: increase tolerance for layernorm před 1 rokem
  AlpinDale 9b317aa26a feat: finish up tests and workflows (#87) před 1 rokem
  AlpinDale f73f2dd3c2 feat: add mistral support for GPTQ (#86) před 1 rokem
  AlpinDale e6be0118c9 feat: prompt logprobs and batched samplers (#77) před 1 rokem
  city-unit 12e296b556 fix: update Dockerfile (#82) před 1 rokem
  city-unit 27af10fd0b chore: make entrypoint executable (#83) před 1 rokem
  AlpinDale 977e8d3507 update readme with new sampling params před 1 rokem
  AlpinDale ab1ac578ba bump version to 0.3.7-dev před 1 rokem
  Stefan Gligorijevic 34c1c8c83a feat: Enable banning tokens (#80) před 1 rokem
  AlpinDale 4e71bd1d12 feat: add PagedAttention V2 kernels (#76) před 1 rokem
  50h100a d0eadd4dbd Added `min_tokens` and reimplemented `ignore_eos` using a new logit processor (#70) před 1 rokem
  AlpinDale 04a27c6aeb fix: revert mirostat v2 (#79) před 1 rokem
  AlpinDale 9c353a0e02 fix: unnecessary import před 1 rokem
  AlpinDale ce5e2332ea fix: launch AWQ kernels on the current CUDAStream (#75) před 1 rokem
  AlpinDale 561773dec8 fix: hopefully fixes github actions před 1 rokem
  AlpinDale 2c1d6a8cf2 fix: fast tokenizer latency reduction před 1 rokem
  AlpinDale 28db67fd78 fix: mistral support před 1 rokem
  AlpinDale d8f04f29a9 readme: update sampling params před 1 rokem
  Stefan Gligorijevic 5acc27adeb chore: fix parameter validation on ooba endpoint před 1 rokem
  Stefan Gligorijevic 93daff0384 chore: delete leftover debug prints před 1 rokem
  Stefan Gligorijevic 5dbd262033 feat: Mirostat v2 (#69) před 1 rokem
  AlpinDale f393dc2af1 fix: broken GPTQ layer před 1 rokem
  AlpinDale 3bf6197afb fix: prompt processing delay introduced by #66 (#71) před 1 rokem
  AlpinDale 9df91fe863 bump version to 0.3.6 před 1 rokem
  AlpinDale 2b42a1ada2 bump the version to 0.3.5 před 1 rokem