AlpinDale 3f712cd287 feat: add progress bar for loading individual weight modules (#640) před 6 měsíci
..
adapter_commons f1d0b77c92 [0.6.0] Release Candidate (#481) před 6 měsíci
attention 300f889554 chore: update flashinfer to v0.1.3 (#685) před 6 měsíci
common 3f712cd287 feat: add progress bar for loading individual weight modules (#640) před 6 měsíci
distributed 31f82da8bd chore: deduplicate nvlink check to cuda platform (#643) před 6 měsíci
endpoints 81fa31bcaf feat: embeddings support for batched OAI endpoint (#676) před 6 měsíci
engine bf88c8567e feat: mamba model support (#674) před 6 měsíci
executor f1d0b77c92 [0.6.0] Release Candidate (#481) před 6 měsíci
inputs 62111fab17 feat: allow serving encoder-decoder models in the API server (#664) před 6 měsíci
kv_quant e42a78381a feat: switch from pylint to ruff (#322) před 1 rokem
lora 1394008421 chore: decouple `should_modify_greedy_probs_inplace (#671) před 6 měsíci
modeling 3f712cd287 feat: add progress bar for loading individual weight modules (#640) před 6 měsíci
multimodal 2573b36f6a feat: allow image embeddings for VLM input (#686) před 6 měsíci
platforms 31f82da8bd chore: deduplicate nvlink check to cuda platform (#643) před 6 měsíci
processing 79d603954e fix: chunked prefill with v2 block manager (#679) před 6 měsíci
prompt_adapter f1d0b77c92 [0.6.0] Release Candidate (#481) před 6 měsíci
quantization 3f49a55f82 feat: add INT8 W8A16 quant for TPU (#663) před 6 měsíci
server ed9a6f97c1 fix: kill api server when pinging dead engine (#660) před 6 měsíci
spec_decode 1394008421 chore: decouple `should_modify_greedy_probs_inplace (#671) před 6 měsíci
task_handler b03fa02397 refactor: base worker input refactor for multi-step (#683) před 6 měsíci
transformers_utils 3648170750 fix: gracefully handle missing chat template (#642) před 6 měsíci
triton_utils f1d0b77c92 [0.6.0] Release Candidate (#481) před 6 měsíci
__init__.py f1d0b77c92 [0.6.0] Release Candidate (#481) před 6 měsíci
_core_ext.py f1d0b77c92 [0.6.0] Release Candidate (#481) před 6 měsíci
_custom_ops.py a401f8e05d feat: per-tensor token epilogue kernels (#630) před 6 měsíci
_ipex_ops.py f1d0b77c92 [0.6.0] Release Candidate (#481) před 6 měsíci
py.typed 1c988a48b2 fix logging and add py.typed před 1 rokem
scalar_type.py f1d0b77c92 [0.6.0] Release Candidate (#481) před 6 měsíci
version.py db81a67c54 bump to v0.6.0.post1 (#635) před 6 měsíci