.. |
amd
|
251568470e
initial nvidia fp8 e4m3 for kv cache
|
6 tháng trước cách đây |
nvidia
|
3bdeb3e116
fix: clang formatting for all kernels (#558)
|
6 tháng trước cách đây |
common.cu
|
c8f5424d72
add scale_ub inputs to fp8 dynamic per-token quant
|
5 tháng trước cách đây |
fp8_marlin.cu
|
ba371fbbbd
feat: AWQ marlin kernels (#603)
|
5 tháng trước cách đây |