.. |
async_aphrodite
|
055c8905a3
api: add sampling/engine option to return only deltas or final output (#1035)
|
před 1 měsícem |
basic_correctness
|
7b6501bd05
tests: refactor model tests (#1078)
|
před 4 týdny |
benchmarks
|
86bf2cc4f3
core: rename `PromptInputs,inputs` -> `PromptType,prompt` (#1080)
|
před 3 týdny |
compile
|
239a8cae25
torch.compile: register all-reduce operations as custom ops (#1050)
|
před 1 měsícem |
core
|
be0b0c13ca
tests: update scheduler tests (#1113)
|
před 1 týdnem |
distributed
|
c90abcc603
VLM: add pipeline parallelism support for Qwen2-VL (#1103)
|
před 1 týdnem |
encoder_decoder
|
a985143768
core: add cuda graph support for encoder-decoder models (#1051)
|
před 1 měsícem |
endpoints
|
5b03d67abb
Core: add output streaming support to multi-step + async (#1112)
|
před 1 týdnem |
engine
|
cc5e185795
VLM: support passing multimodal processor kwargs (#1102)
|
před 1 týdnem |
kernels
|
7b6501bd05
tests: refactor model tests (#1078)
|
před 4 týdny |
lora
|
69cf654901
LoRA: add assertions for SGMV kernels to avoid incorrect results (#1104)
|
před 1 týdnem |
metrics
|
c6c91edab7
ci: update & overhaul test units (#769)
|
před 2 měsíci |
modeling
|
c6c91edab7
ci: update & overhaul test units (#769)
|
před 2 měsíci |
models
|
80be38ca6f
chore: expose phi3_v num_crops as an mm_processor_kwargs (#1117)
|
před 4 dny |
mq_aphrodite_engine
|
86bf2cc4f3
core: rename `PromptInputs,inputs` -> `PromptType,prompt` (#1080)
|
před 3 týdny |
multi_step
|
58aff3771d
core: support prompt logprobs in multi-step (#1060)
|
před 1 měsícem |
multimodal
|
cc5e185795
VLM: support passing multimodal processor kwargs (#1102)
|
před 1 týdnem |
plugins
|
c6c91edab7
ci: update & overhaul test units (#769)
|
před 2 měsíci |
prefix_caching
|
6212072245
api: support LoRA lineage and base model metadata management (#1072)
|
před 1 měsícem |
prompt_adapter
|
c6c91edab7
ci: update & overhaul test units (#769)
|
před 2 měsíci |
prompts
|
e1f3fd1e02
fix: test units (#201)
|
před 1 rokem |
quantization
|
6bdff60aab
quant: support pre-quanted bitsandbytes checkpoints (#961)
|
před 1 měsícem |
samplers
|
eb1ffacf74
Spec Decoding: fix typical acceptance sampler with correct recovered tok IDs (#1106)
|
před 1 týdnem |
spec_decode
|
1fac86c325
core: factor out common code in SequenceData (#1083)
|
před 3 týdny |
tensorizer_loader
|
673621a3d2
xpu: refactor the model runner for tensor parallelism (#910)
|
před 1 měsícem |
tokenization
|
c6c91edab7
ci: update & overhaul test units (#769)
|
před 2 měsíci |
tool_use
|
0191c5efd1
tools: fix tool calls to more strictly follow OpenAI format (#1003)
|
před 1 měsícem |
tpu
|
ea59784f59
tpu: remove torch._dynamo.reset() (#952)
|
před 1 měsícem |
weight_loading
|
c6c91edab7
ci: update & overhaul test units (#769)
|
před 2 měsíci |
worker
|
1fac86c325
core: factor out common code in SequenceData (#1083)
|
před 3 týdny |
__init__.py
|
2755a48d51
merge dev branch into main (#153)
|
před 1 rokem |
conftest.py
|
7b6501bd05
tests: refactor model tests (#1078)
|
před 4 týdny |
test_cache_block_hashing.py
|
c6c91edab7
ci: update & overhaul test units (#769)
|
před 2 měsíci |
test_config.py
|
c6c91edab7
ci: update & overhaul test units (#769)
|
před 2 měsíci |
test_embedded_commit.py
|
c6c91edab7
ci: update & overhaul test units (#769)
|
před 2 měsíci |
test_inputs.py
|
c6c91edab7
ci: update & overhaul test units (#769)
|
před 2 měsíci |
test_logits_processor.py
|
1fac86c325
core: factor out common code in SequenceData (#1083)
|
před 3 týdny |
test_regression.py
|
c6c91edab7
ci: update & overhaul test units (#769)
|
před 2 měsíci |
test_sampling_params.py
|
c6c91edab7
ci: update & overhaul test units (#769)
|
před 2 měsíci |
test_scalartype.py
|
c6c91edab7
ci: update & overhaul test units (#769)
|
před 2 měsíci |
test_sequence.py
|
1fac86c325
core: factor out common code in SequenceData (#1083)
|
před 3 týdny |
test_sharded_state_loader.py
|
c6c91edab7
ci: update & overhaul test units (#769)
|
před 2 měsíci |
test_utils.py
|
c6c91edab7
ci: update & overhaul test units (#769)
|
před 2 měsíci |
utils.py
|
5b03d67abb
Core: add output streaming support to multi-step + async (#1112)
|
před 1 týdnem |