AlpinDale
|
22422543ce
feat: add no_repeat_ngram sampler
|
1 місяць тому |
Selali
|
4c4a365f77
feat: Add DRY (Don't Repeat Yourself) sampling (#827)
|
1 місяць тому |
AlpinDale
|
48a8693aed
feat: multi-step scheduling (#831)
|
1 місяць тому |
AlpinDale
|
2242cb25dc
fix: unbound tokenizer error
|
1 місяць тому |
AlpinDale
|
3d83e64f8e
feat: add metrics for prefix cache hit rate (#829)
|
1 місяць тому |
AlpinDale
|
22425b689d
fix: XPU build
|
1 місяць тому |
AlpinDale
|
bfc8988116
feat: add cuda sampling kernels for top_k and top_p (#828)
|
1 місяць тому |
AlpinDale
|
22427602eb
feat: add top-nsigma sampling method
|
1 місяць тому |
AlpinDale
|
22429e4a10
fix: sampler test with new transformers version
|
1 місяць тому |
AlpinDale
|
2f61644f6e
SPMD optimizations (#824)
|
1 місяць тому |
AlpinDale
|
32a37e8107
tests: partially fix tensorizer and logprobs tests
|
1 місяць тому |
AlpinDale
|
7f1c9af5e2
fix: fp8 quant test
|
1 місяць тому |
AlpinDale
|
173ac23399
fix: experts int8 quant test
|
1 місяць тому |
AlpinDale
|
68f050129d
fix: lora worker manager test import
|
1 місяць тому |
AlpinDale
|
3661de812d
fix: lora layer test
|
1 місяць тому |
AlpinDale
|
0a369f9171
feat: support chunked prefill with LoRA (#823)
|
1 місяць тому |
AlpinDale
|
e5b1afe625
feat: add chat method for LLM class (#822)
|
1 місяць тому |
AlpinDale
|
262cbc63b7
fix: vision api test template path
|
1 місяць тому |
AlpinDale
|
b0113a1eaa
fix: tokenization api test (#821)
|
1 місяць тому |
AlpinDale
|
c6c91edab7
ci: update & overhaul test units (#769)
|
1 місяць тому |
AlpinDale
|
f088ea81c7
fix: --max-seq-len-to-capture arg (#818)
|
1 місяць тому |
50h100a
|
a5346b2ea5
Merge pull request #814 from PygmalionAI/50h100a-temp-fix
|
1 місяць тому |
50h100a
|
273c61d406
guard against nan temperature from dynatemp (or anywhere else).
|
1 місяць тому |
50h100a
|
a22e887319
why we don't use the github website editor to make changes
|
1 місяць тому |
50h100a
|
54a8320638
logit shenanigans to prevent even worse shenanigans
|
1 місяць тому |
50h100a
|
b6a897d2a1
fix temperature, and address those pernicious dynatemp NaNs
|
1 місяць тому |
50h100a
|
a61d00fad7
Merge pull request #813 from PygmalionAI/50h100a-patch-1
|
1 місяць тому |
50h100a
|
83040c6389
Mask dynatemp using min/max, rather than exp
|
1 місяць тому |
AlpinDale
|
2fa112f86b
feat: update to serviceinfo v0.2 (#808)
|
2 місяців тому |
AlpinDale
|
72fbfa1b5b
feat: add serviceinfo endpoint (#807)
|
2 місяців тому |