AlpinDale 92cee435e2 rocm: add more quants, fix _scaled_mm call (#1062) пре 1 недеља
..
compressed_tensors 92cee435e2 rocm: add more quants, fix _scaled_mm call (#1062) пре 1 недеља
gguf_utils 8a71788372 Add OLMoE (#772) пре 2 месеци
kernels f7f3fed265 feat: add async postprocessor (#925) пре 2 недеља
utils 92cee435e2 rocm: add more quants, fix _scaled_mm call (#1062) пре 1 недеља
__init__.py dcb36de9c4 quants: add support for NVIDIA's ModelOpt checkpoints (#1013) пре 1 недеља
aqlm.py ccbda97416 fix: types in AQLM and GGUF for dynamo support (#736) пре 3 месеци
autoquant.py f1d0b77c92 [0.6.0] Release Candidate (#481) пре 4 месеци
awq.py edec2e9a9e feat: migrate awq and awq_marlin to AphroditeParameter (#702) пре 3 месеци
awq_marlin.py 93bc863591 feat: Machete Kernels for Hopper GPUs (#842) пре 1 месец
awq_triton.py cbde3c66a5 quants: improve awq_triton throughput (#998) пре 2 недеља
base_config.py f1d0b77c92 [0.6.0] Release Candidate (#481) пре 4 месеци
bitsandbytes.py 6bdff60aab quant: support pre-quanted bitsandbytes checkpoints (#961) пре 2 недеља
deepspeedfp.py f1d0b77c92 [0.6.0] Release Candidate (#481) пре 4 месеци
eetq.py f1d0b77c92 [0.6.0] Release Candidate (#481) пре 4 месеци
exl2.py f1d0b77c92 [0.6.0] Release Candidate (#481) пре 4 месеци
experts_int8.py 201db10f02 models: add support for Phi3 MoE пре 2 недеља
fbgemm_fp8.py 92cee435e2 rocm: add more quants, fix _scaled_mm call (#1062) пре 1 недеља
fp6.py 73177656ed feat: quant_llm support (#755) пре 3 месеци
fp8.py 201db10f02 models: add support for Phi3 MoE пре 2 недеља
gguf.py 0dfa6b60ec core: support logprobs with multi-step scheduling (#963) пре 2 недеља
gptq.py 83af2524f3 quants: add GPTQ and FBGEMM to AphroditeParameters (#987) пре 2 недеља
gptq_marlin.py 94a13ad036 fix: gptq_marlin exception on older GPUs (#996) пре 2 недеља
gptq_marlin_24.py 5d9021969c quants: update `qqq` and `gptq_marlin_24` to use AphroditeParameters (#921) пре 3 недеља
hadamard.safetensors 9d81716bfd [v0.5.3] Release Candidate (#388) пре 8 месеци
hqq_marlin.py f98e7b2f8c feat: add HQQ quantization support (#795) пре 2 месеци
kv_cache.py f1d0b77c92 [0.6.0] Release Candidate (#481) пре 4 месеци
marlin.py 799667737b quantization: update marlin to use `AphroditeParameters` (#913) пре 3 недеља
modelopt.py dcb36de9c4 quants: add support for NVIDIA's ModelOpt checkpoints (#1013) пре 1 недеља
neuron_quant.py 145e554a4d neuron: add 8bit quantization for Neuron (#994) пре 2 недеља
qqq.py 8976805f90 kernel: asymmetric AQ AZP quantization kernels (#1048) пре 1 недеља
quip.py f1d0b77c92 [0.6.0] Release Candidate (#481) пре 4 месеци
quip_utils.py 8a71788372 Add OLMoE (#772) пре 2 месеци
schema.py 9d81716bfd [v0.5.3] Release Candidate (#388) пре 8 месеци
squeezellm.py f1d0b77c92 [0.6.0] Release Candidate (#481) пре 4 месеци
tpu_int8.py f4b62bf803 quant: update tpu_int8 to use AphroditeParameters (#959) пре 2 недеља