.. |
__init__.py
|
07aa2a492f
upstream: add option to specify tokenizer
|
před 1 rokem |
api_server.py
|
fe431bb840
check for next port if current is unavailable
|
před 6 měsíci |
args.py
|
8f9cb7235c
chore: allow multiple served model names
|
před 8 měsíci |
protocol.py
|
be8154a8a0
feat: proper embeddings API with e5-mistral-7b support
|
před 6 měsíci |
samplers.json
|
ac82b67f75
feat: naive context shift and various QoL changes (#289)
|
před 11 měsíci |
serving_chat.py
|
e8b7f53321
allow prompt token IDs in the logits processor api
|
před 6 měsíci |
serving_completions.py
|
be8154a8a0
feat: proper embeddings API with e5-mistral-7b support
|
před 6 měsíci |
serving_embedding.py
|
54a4cef647
add bias and tie word embedding support for llama
|
před 6 měsíci |
serving_engine.py
|
696f2cd59c
add phi3_small support with blocksparse attention
|
před 6 měsíci |