Historie revizí

Autor SHA1 Zpráva Datum
  AlpinDale 1efd0f89b7 feat: support FP8 for DeepSeekV2 MoE před 6 měsíci
  AlpinDale cdc0e498a9 fix: illegal memory access in FP8 MoE kernel před 6 měsíci
  AlpinDale 3e7d5f7d14 chore: reloading fused_moe config on the last chunk před 6 měsíci
  AlpinDale 3b2666314d fix: add chunking mechanism to fused_moe před 6 měsíci
  AlpinDale 336eb4dbf8 fix: raise error in moe kernel if it receives more than 65k tokens před 6 měsíci
  AlpinDale bbde979ecd DeepSeek-V2 (#579) před 6 měsíci
  AlpinDale 156f577f79 feat: switch from `PYBIND11_MODULE` to `TORCH_LIBRARY` (#569) před 6 měsíci
  AlpinDale 4bdd2f9892 chore: enhance MoE benchmarking před 6 měsíci
  AlpinDale 00acf371f9 rocm: fused topk softmax před 6 měsíci
  AlpinDale 1e35cef979 feat: add arctic snowflake model (#551) před 6 měsíci
  AlpinDale 0751a2ecf6 fix expert_ids shape in Moe před 7 měsíci
  AlpinDale db9beeb79c fix typo před 7 měsíci
  AlpinDale b565928d3f fix: compute_dtype in MoE kernel před 7 měsíci
  AlpinDale 36660b55c2 chore: mixtral fp8 w/ static scales (#542) před 7 měsíci
  AlpinDale fca911ee0a vLLM Upstream Sync (#526) před 7 měsíci
  AlpinDale 9d81716bfd [v0.5.3] Release Candidate (#388) před 9 měsíci
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) před 10 měsíci