Историја ревизија

Аутор SHA1 Порука Датум
  AlpinDale 61aed092a5 rocm: add support for FP8 KV cache in the custom paged attention kkernels (#1066) пре 6 дана
  AlpinDale 9bdf8d5bfa mamba: enable continuous batching for mamba kernels (#1055) пре 1 недеља
  AlpinDale 239a8cae25 torch.compile: register all-reduce operations as custom ops (#1050) пре 1 недеља
  AlpinDale 8976805f90 kernel: asymmetric AQ AZP quantization kernels (#1048) пре 1 недеља
  AlpinDale 4a7cb8f232 rocm: add custom paged attention kernels for ROCm (#1043) пре 1 недеља
  AlpinDale 1390915778 multi-step: add support for flashinfer attention backend (#1033) пре 1 недеља
  AlpinDale a113309876 kernel: add meta functions for ops to prevent graph breaks (#1019) пре 1 недеља
  AlpinDale fcfcfc65e1 quants: add triton kernels for AWQ (#946) пре 2 недеља
  AlpinDale 9f3e7c86e2 feat: add fused Marlin MoE kernel (#934) пре 2 недеља
  AlpinDale 93bc863591 feat: Machete Kernels for Hopper GPUs (#842) пре 1 месец
  AlpinDale bfc8988116 feat: add cuda sampling kernels for top_k and top_p (#828) пре 1 месец
  AlpinDale f98e7b2f8c feat: add HQQ quantization support (#795) пре 2 месеци
  AlpinDale 73177656ed feat: quant_llm support (#755) пре 3 месеци
  AlpinDale ccbda97416 fix: types in AQLM and GGUF for dynamo support (#736) пре 3 месеци
  AlpinDale b0f262eec1 feat: FP8 quantization support for AMD ROCm (#729) пре 3 месеци
  AlpinDale 5d37ec1016 suppress tpu import warning (#696) пре 3 месеци
  AlpinDale a401f8e05d feat: per-tensor token epilogue kernels (#630) пре 4 месеци
  AlpinDale f1d0b77c92 [0.6.0] Release Candidate (#481) пре 4 месеци