AlpinDale ba371fbbbd feat: AWQ marlin kernels (#603) | преди 4 месеца | |
---|---|---|
.. | ||
amd | 251568470e initial nvidia fp8 e4m3 for kv cache | преди 5 месеца |
nvidia | 3bdeb3e116 fix: clang formatting for all kernels (#558) | преди 5 месеца |
common.cu | c8f5424d72 add scale_ub inputs to fp8 dynamic per-token quant | преди 4 месеца |
fp8_marlin.cu | ba371fbbbd feat: AWQ marlin kernels (#603) | преди 4 месеца |