AlpinDale
|
efc6f7fbec
chore: reformats (#90)
|
1 yıl önce |
AlpinDale
|
3d72f05c7b
feat: flattened 1D tensor -> 2D tensor (#85)
|
1 yıl önce |
AlpinDale
|
0dcc924088
readme: add benchmarks
|
1 yıl önce |
AlpinDale
|
eafcd75a69
fix tests and tweak throughput benchmark
|
1 yıl önce |
AlpinDale
|
2460d17e54
fix positional encoding tests
|
1 yıl önce |
AlpinDale
|
b047197513
tests: increase tolerance for layernorm
|
1 yıl önce |
AlpinDale
|
9b317aa26a
feat: finish up tests and workflows (#87)
|
1 yıl önce |
AlpinDale
|
f73f2dd3c2
feat: add mistral support for GPTQ (#86)
|
1 yıl önce |
AlpinDale
|
e6be0118c9
feat: prompt logprobs and batched samplers (#77)
|
1 yıl önce |
city-unit
|
12e296b556
fix: update Dockerfile (#82)
|
1 yıl önce |
city-unit
|
27af10fd0b
chore: make entrypoint executable (#83)
|
1 yıl önce |
AlpinDale
|
977e8d3507
update readme with new sampling params
|
1 yıl önce |
AlpinDale
|
ab1ac578ba
bump version to 0.3.7-dev
|
1 yıl önce |
Stefan Gligorijevic
|
34c1c8c83a
feat: Enable banning tokens (#80)
|
1 yıl önce |
AlpinDale
|
4e71bd1d12
feat: add PagedAttention V2 kernels (#76)
|
1 yıl önce |
50h100a
|
d0eadd4dbd
Added `min_tokens` and reimplemented `ignore_eos` using a new logit processor (#70)
|
1 yıl önce |
AlpinDale
|
04a27c6aeb
fix: revert mirostat v2 (#79)
|
1 yıl önce |
AlpinDale
|
9c353a0e02
fix: unnecessary import
|
1 yıl önce |
AlpinDale
|
ce5e2332ea
fix: launch AWQ kernels on the current CUDAStream (#75)
|
1 yıl önce |
AlpinDale
|
561773dec8
fix: hopefully fixes github actions
|
1 yıl önce |
AlpinDale
|
2c1d6a8cf2
fix: fast tokenizer latency reduction
|
1 yıl önce |
AlpinDale
|
28db67fd78
fix: mistral support
|
1 yıl önce |
AlpinDale
|
d8f04f29a9
readme: update sampling params
|
1 yıl önce |
Stefan Gligorijevic
|
5acc27adeb
chore: fix parameter validation on ooba endpoint
|
1 yıl önce |
Stefan Gligorijevic
|
93daff0384
chore: delete leftover debug prints
|
1 yıl önce |
Stefan Gligorijevic
|
5dbd262033
feat: Mirostat v2 (#69)
|
1 yıl önce |
AlpinDale
|
f393dc2af1
fix: broken GPTQ layer
|
1 yıl önce |
AlpinDale
|
3bf6197afb
fix: prompt processing delay introduced by #66 (#71)
|
1 yıl önce |
AlpinDale
|
9df91fe863
bump version to 0.3.6
|
1 yıl önce |
AlpinDale
|
2b42a1ada2
bump the version to 0.3.5
|
1 yıl önce |