1
0

cuda_compat.h 997 B

12345678910111213141516171819202122232425262728293031323334353637
  1. #pragma once
  2. #ifdef USE_ROCM
  3. #include <hip/hip_runtime.h>
  4. #endif
  5. #ifndef USE_ROCM
  6. #define WARP_SIZE 32
  7. #else
  8. #define WARP_SIZE warpSize
  9. #endif
  10. #ifndef USE_ROCM
  11. #define APHRODITE_LDG(arg) __ldg(arg)
  12. #else
  13. #define APHRODITE_LDG(arg) *(arg)
  14. #endif
  15. #ifndef USE_ROCM
  16. #define APHRODITE_SHFL_XOR_SYNC(var, lane_mask) __shfl_xor_sync(uint32_t(-1), var, lane_mask)
  17. #else
  18. #define APHRODITE_SHFL_XOR_SYNC(var, lane_mask) __shfl_xor(var, lane_mask)
  19. #endif
  20. #ifndef USE_ROCM
  21. #define APHRODITE_SHFL_SYNC(var, src_lane) __shfl_sync(uint32_t(-1), var, src_lane)
  22. #else
  23. #define APHRODITE_SHFL_SYNC(var, src_lane) __shfl(var, src_lane)
  24. #endif
  25. #ifndef USE_ROCM
  26. #define APHRODITE_DevFuncAttribute_SET_MaxDynamicSharedMemorySize(FUNC, VAL) \
  27. cudaFuncSetAttribute(FUNC, cudaFuncAttributeMaxDynamicSharedMemorySize, VAL)
  28. #else
  29. #define APHRODITE_DevFuncAttribute_SET_MaxDynamicSharedMemorySize(FUNC, VAL) \
  30. hipFuncSetAttribute(FUNC, hipFuncAttributeMaxDynamicSharedMemorySize, VAL)
  31. #endif