advance_step.cuh 397 B

12345678910111213141516171819
  1. #pragma once
  2. #include <torch/all.h>
  3. #include <ATen/cuda/CUDAContext.h>
  4. #include <c10/cuda/CUDAGuard.h>
  5. #include <cuda.h>
  6. #include <cuda_fp16.h>
  7. #include <cuda_runtime.h>
  8. #include <iostream>
  9. namespace prepare_inputs {
  10. static constexpr int max_threads = 256;
  11. static constexpr bool logging = false;
  12. constexpr int div_ceil(int a, int b) { return (a + b - 1) / b; }
  13. } // namespace prepare_inputs