.. |
__init__.py
|
07aa2a492f
upstream: add option to specify tokenizer
|
пре 1 година |
block.py
|
ac82b67f75
feat: naive context shift and various QoL changes (#289)
|
пре 10 месеци |
config.py
|
ac79d115b3
add guards for prefix caching, fp8, chunked, etc
|
пре 5 месеци |
grammar.py
|
0527131e93
fix: grammar logits processor (#268)
|
пре 10 месеци |
logger.py
|
46159b107a
formatting: pt1
|
пре 6 месеци |
logits_processor.py
|
9d81716bfd
[v0.5.3] Release Candidate (#388)
|
пре 8 месеци |
outputs.py
|
be8154a8a0
feat: proper embeddings API with e5-mistral-7b support
|
пре 5 месеци |
pooling_params.py
|
be8154a8a0
feat: proper embeddings API with e5-mistral-7b support
|
пре 5 месеци |
sampling_params.py
|
e8b7f53321
allow prompt token IDs in the logits processor api
|
пре 5 месеци |
sequence.py
|
a94de94c44
refactor: combine the prefill and decode into a single API (#553)
|
пре 5 месеци |
test_utils.py
|
9d81716bfd
[v0.5.3] Release Candidate (#388)
|
пре 8 месеци |
utils.py
|
656459fd84
make fp8_e4m3 work on nvidia
|
пре 5 месеци |