AlpinDale c20073824a cleanup 7 месяцев назад
..
attention 66b7bc4415 sliding window in prefix kernel 7 месяцев назад
common 42998e423c better quant verification 7 месяцев назад
distributed 096d9eb6c5 enhance nvlink detection 7 месяцев назад
endpoints fb7825df8f squash logprobs 7 месяцев назад
engine 42998e423c better quant verification 7 месяцев назад
executor f894f7b176 Revert "reduce dedupe by wrapping in general worker class" 7 месяцев назад
kv_quant e42a78381a feat: switch from pylint to ruff (#322) 10 месяцев назад
lora 8be299e78b fix: lora load check 7 месяцев назад
modeling 85a865cc00 feat: fp8 quant 7 месяцев назад
processing 9d81716bfd [v0.5.3] Release Candidate (#388) 8 месяцев назад
quantization c20073824a cleanup 7 месяцев назад
spec_decode 9d81716bfd [v0.5.3] Release Candidate (#388) 8 месяцев назад
task_handler f894f7b176 Revert "reduce dedupe by wrapping in general worker class" 7 месяцев назад
transformers_utils 9d81716bfd [v0.5.3] Release Candidate (#388) 8 месяцев назад
__init__.py 9d81716bfd [v0.5.3] Release Candidate (#388) 8 месяцев назад
py.typed 1c988a48b2 fix logging and add py.typed 1 год назад