AlpinDale
|
46159b107a
formatting: pt1
|
6 kuukautta sitten |
AlpinDale
|
bf2dd2bee9
feat: allow multiple sampling params in LLM class
|
6 kuukautta sitten |
AlpinDale
|
9d81716bfd
[v0.5.3] Release Candidate (#388)
|
8 kuukautta sitten |
AlpinDale
|
f8dfac6372
chore: attention refactor and upstream sync apr01 (#365)
|
9 kuukautta sitten |
AlpinDale
|
e42a78381a
feat: switch from pylint to ruff (#322)
|
10 kuukautta sitten |
AlpinDale
|
ac82b67f75
feat: naive context shift and various QoL changes (#289)
|
10 kuukautta sitten |
AlpinDale
|
c3a221eb02
feat: GGUF, QuIP#, and Marlin support (#228)
|
11 kuukautta sitten |
AlpinDale
|
641bb0f6e9
feat: add custom allreduce kernels (#224)
|
11 kuukautta sitten |
AlpinDale
|
c0aac15421
feat: S-LoRA support (#222)
|
11 kuukautta sitten |
AlpinDale
|
8fa608aeb7
feat: replace Ray with NCCL for control plane comms (#221)
|
11 kuukautta sitten |
AlpinDale
|
f013d714c0
chore: merge dev branch into main (#177)
|
1 vuosi sitten |
AlpinDale
|
2755a48d51
merge dev branch into main (#153)
|
1 vuosi sitten |
AlpinDale
|
8834ecf9de
chore: clean up refactor endpoints (#98)
|
1 vuosi sitten |
AlpinDale
|
c70abc7522
fix the LLM class for quantization
|
1 vuosi sitten |
AlpinDale
|
6b9561ef07
adapt TGI incremental detokenization
|
1 vuosi sitten |
AlpinDale
|
388d7545dd
fix: circular import
|
1 vuosi sitten |
AlpinDale
|
c761d38c69
fix: sort outputs and avoid unwanted list copy
|
1 vuosi sitten |
AlpinDale
|
56077f0f29
upstream: trust remote code
|
1 vuosi sitten |
AlpinDale
|
724852dc31
chore: refactoring cont.
|
1 vuosi sitten |
AlpinDale
|
5169163403
chore: add tokenizer mode for slow/fast tokenizers
|
1 vuosi sitten |
AlpinDale
|
07aa2a492f
upstream: add option to specify tokenizer
|
1 vuosi sitten |
AlpinDale
|
20a8235114
upstream: add
|
1 vuosi sitten |
AlpinDale
|
e52de7de70
feat: add API endpoint with FastAPI
|
1 vuosi sitten |