Historie revizí

Autor SHA1 Zpráva Datum
  sgsdxzy 214151b04c fix: max_num_batched_tokens for chunked_prefill (#412) před 9 měsíci
  sgsdxzy fcfb72af24 Support arbitrary model in GGUF. (#381) před 9 měsíci
  AlpinDale 50c2434267 move megatron to a top-level directory před 9 měsíci
  AlpinDale 7528e0ce3e make detokenization optional před 9 měsíci
  AlpinDale 23a1114e4f enable hf_transfer if installed před 9 měsíci
  AlpinDale 071269e406 feat: FP8 E4M3 KV Cache (#405) před 9 měsíci
  AlpinDale 41beab5dc1 add exllamav2 tensor paralell, fused MoE for GPTQ/AWQ před 10 měsíci
  AlpinDale 609710b940 LockFile -> SoftLockFile před 10 měsíci
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) před 10 měsíci
  AlpinDale e42a78381a feat: switch from pylint to ruff (#322) před 10 měsíci
  AlpinDale 89c32b40ec chore: add new imatrix quants (#320) před 10 měsíci
  AlpinDale c41462cfcd feat: exllamav2 quantization (#305) před 11 měsíci
  AlpinDale c2d77b1822 chore: logging refactor (#302) před 11 měsíci
  AlpinDale 842912d022 feat: on-the-fly gguf conversion (#250) před 1 rokem
  AlpinDale 8b6790d504 fix: gguf config not recognized před 1 rokem
  AlpinDale 4faf78ba29 fix: grab correct quant config from revisions (#246) před 1 rokem
  AlpinDale c3a221eb02 feat: GGUF, QuIP#, and Marlin support (#228) před 1 rokem
  AlpinDale 8fa608aeb7 feat: replace Ray with NCCL for control plane comms (#221) před 1 rokem
  AlpinDale f013d714c0 chore: merge dev branch into main (#177) před 1 rokem
  AlpinDale 2755a48d51 merge dev branch into main (#153) před 1 rokem
  AlpinDale 887e03669a feat: add exllamav2 for GPTQ (#99) před 1 rokem
  AlpinDale 74604eb252 fix: pylint complaints (#91) před 1 rokem
  AlpinDale efc6f7fbec chore: reformats (#90) před 1 rokem
  AlpinDale f04588203e feat: mistral AWQ support and file blacklisting před 1 rokem
  AlpinDale 0495c50a3e GPTQ+exllama support (#21) před 1 rokem
  AlpinDale 779148bfc3 fix missing import in llama modeling před 1 rokem
  AlpinDale 303c782c79 fix initialization code před 1 rokem
  AlpinDale d9c1d4f6e5 add awq support před 1 rokem
  AlpinDale 39beed0b87 Revert "Refactor AWQ support." před 1 rokem
  AlpinDale d09e27f5d4 Refactor AWQ support. před 1 rokem