1
0

cuda_compat.h 860 B

123456789101112131415161718192021222324252627
  1. #pragma once
  2. #ifndef USE_ROCM
  3. #define APHRODITE_LDG(arg) __ldg(arg)
  4. #else
  5. #define APHRODITE_LDG(arg) *(arg)
  6. #endif
  7. #ifndef USE_ROCM
  8. #define APHRODITE_SHFL_XOR_SYNC(var, lane_mask) __shfl_xor_sync(uint32_t(-1), var, lane_mask)
  9. #else
  10. #define APHRODITE_SHFL_XOR_SYNC(var, lane_mask) __shfl_xor(var, lane_mask)
  11. #endif
  12. #ifndef USE_ROCM
  13. #define APHRODITE_SHFL_SYNC(var, src_lane) __shfl_sync(uint32_t(-1), var, src_lane)
  14. #else
  15. #define APHRODITE_SHFL_SYNC(var, src_lane) __shfl(var, src_lane)
  16. #endif
  17. #ifndef USE_ROCM
  18. #define APHRODITE_DevFuncAttribute_SET_MaxDynamicSharedMemorySize(FUNC, VAL) \
  19. cudaFuncSetAttribute(FUNC, cudaFuncAttributeMaxDynamicSharedMemorySize, VAL)
  20. #else
  21. #define APHRODITE_DevFuncAttribute_SET_MaxDynamicSharedMemorySize(FUNC, VAL) \
  22. hipFuncSetAttribute(FUNC, hipFuncAttributeMaxDynamicSharedMemorySize, VAL)
  23. #endif