AlpinDale
|
a20e2ce155
fix: pass cutlass_fp8_supported correctly for fbgemm_fp8
|
преди 5 месеца |
AlpinDale
|
598afb63dd
chore: add ignored layers for fp8 quant
|
преди 5 месеца |
AlpinDale
|
32acf54c63
fix: fbgemm_fp8 when modules_to_not_convert=None
|
преди 5 месеца |
AlpinDale
|
408ca43d2e
feat: support fbgemm_fp8 quant on ampere
|
преди 5 месеца |
AlpinDale
|
9be43994fe
feat: fbgemm quantization support (#601)
|
преди 5 месеца |