modify the macro of cuda stream and event

MingMingShangTian · MingMingShangTian · commit c369bafe06c6 · 2021-04-26T04:15:46.000Z
diff --git a/paddle/fluid/platform/event.h b/paddle/fluid/platform/event.h
@@ -117,8 +117,8 @@ class MemEvent {
   std::string annotation_;
 };
 
-#if defined(PADDLE_WITH_CUDA) || defined(PADDLE_WITH_HIP)
 class CudaEvent {
+#if defined(PADDLE_WITH_CUDA) || defined(PADDLE_WITH_HIP)
  public:
   CudaEvent() { cudaEventCreateWithFlags(&event_, flags_); }
 
@@ -151,17 +151,23 @@ class CudaEvent {
  private:
   unsigned int flags_ = cudaEventDefault;
   gpuEvent_t event_;
+#endif
 };
 
 static unsigned int get_cuda_flags(bool enable_timing, bool blocking,
                                    bool interprocess) {
+#if defined(PADDLE_WITH_CUDA) || defined(PADDLE_WITH_HIP)
   unsigned int flags =
       (blocking ? cudaEventBlockingSync : cudaEventDefault) |
       (enable_timing ? cudaEventDefault : cudaEventDisableTiming) |
       (interprocess ? cudaEventInterprocess : cudaEventDefault);
   return flags;
-}
+#else
+  PADDLE_THROW(platform::errors::Unavailable(
+      "Paddle is not compiled with CUDA. Cannot get the cuda event flags."));
+  return 0;
 #endif
+}
 
 }  // namespace platform
 }  // namespace paddle
diff --git a/paddle/fluid/platform/stream/cuda_stream.cc b/paddle/fluid/platform/stream/cuda_stream.cc
@@ -96,8 +96,8 @@ void CUDAStream::Wait() const {
   PADDLE_ENFORCE_CUDA_SUCCESS(e_sync);
 }
 
-#if defined(PADDLE_WITH_CUDA) || defined(PADDLE_WITH_HIP)
 CUDAStream* get_current_stream(int deviceId) {
+#if defined(PADDLE_WITH_CUDA) || defined(PADDLE_WITH_HIP)
   if (deviceId == -1) {
     deviceId = platform::GetCurrentDeviceId();
   }
@@ -111,8 +111,12 @@ CUDAStream* get_current_stream(int deviceId) {
                     ->Stream()
                     .get();
   return stream;
-}
+#else
+  PADDLE_THROW(platform::errors::Unavailable(
+      "Paddle is not compiled with CUDA. Cannot visit cuda current stream."));
+  return nullptr;
 #endif
+}
 
 }  // namespace stream
 }  // namespace platform
diff --git a/paddle/fluid/platform/stream/cuda_stream.h b/paddle/fluid/platform/stream/cuda_stream.h
@@ -33,8 +33,9 @@ enum class Priority : uint8_t {
   kHigh = 0x1,
   kNormal = 0x2,
 };
-
+#endif
 class CUDAStream final {
+#if defined(PADDLE_WITH_CUDA) || defined(PADDLE_WITH_HIP)
  public:
   CUDAStream() = default;
   explicit CUDAStream(const Place& place,
@@ -119,12 +120,11 @@ class CUDAStream final {
 #endif
   Priority priority_{Priority::kNormal};
   std::unique_ptr<StreamCallbackManager<gpuStream_t>> callback_manager_;
-
+#endif
   DISABLE_COPY_AND_ASSIGN(CUDAStream);
 };
 
 CUDAStream* get_current_stream(int deviceId);
-#endif
 
 }  // namespace stream
 }  // namespace platform
diff --git a/paddle/fluid/pybind/imperative.cc b/paddle/fluid/pybind/imperative.cc
@@ -610,13 +610,19 @@ void BindImperative(py::module *m_ptr) {
         [](const std::shared_ptr<imperative::Tracer> &tracer) {
           imperative::SetCurrentTracer(tracer);
         });
-#if defined(PADDLE_WITH_CUDA) && !defined(PADDLE_WITH_HIP)
   m.def("_get_current_stream",
         [](int deviceId) {
+#if defined(PADDLE_WITH_CUDA) || defined(PADDLE_WITH_HIP)
           return paddle::platform::stream::get_current_stream(deviceId);
+#else
+          PADDLE_THROW(platform::errors::Unavailable(
+              "Paddle is not compiled with CUDA. Cannot visit cuda current "
+              "stream."));
+#endif
         },
         py::return_value_policy::reference);
   m.def("_device_synchronize", [](int device_id) {
+#if defined(PADDLE_WITH_CUDA) || defined(PADDLE_WITH_HIP)
     if (device_id == -1) {
       device_id = paddle::platform::GetCurrentDeviceId();
     }
@@ -625,8 +631,11 @@ void BindImperative(py::module *m_ptr) {
     paddle::platform::SetDeviceId(device_id);
     PADDLE_ENFORCE_CUDA_SUCCESS(cudaDeviceSynchronize());
     paddle::platform::SetDeviceId(curr_device_id);
-  });
+#else
+    PADDLE_THROW(platform::errors::Unavailable(
+        "Paddle is not compiled with CUDA. Cannot visit device synchronize."));
 #endif
+  });
 
   py::class_<imperative::VarBase, std::shared_ptr<imperative::VarBase>>(
       m, "VarBase", R"DOC()DOC")
@@ -1692,24 +1701,28 @@ void BindImperative(py::module *m_ptr) {
           return imperative::PyLayerApply(place, cls, args, kwargs);
         });
 
-#if defined(PADDLE_WITH_CUDA) && !defined(PADDLE_WITH_HIP)
   py::class_<paddle::platform::stream::CUDAStream>(m, "CUDAStream")
-      .def("__init__",
-           [](paddle::platform::stream::CUDAStream &self,
-              platform::CUDAPlace &device, int priority) {
-             if (priority != 1 && priority != 2) {
-               PADDLE_THROW(platform::errors::InvalidArgument(
-                   "Priority should be 1(high) or 2(normal) "));
-             }
-             auto prio = paddle::platform::stream::Priority(priority);
+      .def("__init__", [](paddle::platform::stream::CUDAStream &self,
+                          platform::CUDAPlace &device, int priority) {
+#if defined(PADDLE_WITH_CUDA) || defined(PADDLE_WITH_HIP)
+        if (priority != 1 && priority != 2) {
+          PADDLE_THROW(platform::errors::InvalidArgument(
+              "Priority should be 1(high) or 2(normal) "));
+        }
+        auto prio = paddle::platform::stream::Priority(priority);
 
-             new (&self) paddle::platform::stream::CUDAStream(device, prio);
-           })
-      .def("wait_event",
-           [](paddle::platform::stream::CUDAStream &self,
-              paddle::platform::CudaEvent &event) {
-             self.WaitEvent(event.GetRawCudaEvent());
-           })
+        new (&self) paddle::platform::stream::CUDAStream(device, prio);
+#else
+            PADDLE_THROW(platform::errors::Unavailable(
+        "Class CUDAStream can only be initialized on the GPU platform."));
+#endif
+      });
+#if defined(PADDLE_WITH_CUDA) || defined(PADDLE_WITH_HIP)
+  m.def("wait_event",
+        [](paddle::platform::stream::CUDAStream &self,
+           paddle::platform::CudaEvent &event) {
+          self.WaitEvent(event.GetRawCudaEvent());
+        })
       .def("wait_stream",
            [](paddle::platform::stream::CUDAStream &self,
               paddle::platform::stream::CUDAStream &stream) {
@@ -1736,23 +1749,34 @@ void BindImperative(py::module *m_ptr) {
         return event;
 
       });
+#endif
 
   py::class_<paddle::platform::CudaEvent>(m, "CUDAEvent")
       .def("__init__",
-           [](paddle::platform::CudaEvent &self, bool enable_timing = false,
-              bool blocking = false, bool interprocess = false) {
+           [](paddle::platform::CudaEvent &self, bool enable_timing,
+              bool blocking, bool interprocess) {
+#if defined(PADDLE_WITH_CUDA) || defined(PADDLE_WITH_HIP)
              unsigned int flags = platform::get_cuda_flags(
                  enable_timing, blocking, interprocess);
              new (&self) paddle::platform::CudaEvent(flags);
-           })
-      .def("record",
-           [](paddle::platform::CudaEvent &self,
-              paddle::platform::stream::CUDAStream *stream) {
-             if (stream == nullptr) {
-               stream = paddle::platform::stream::get_current_stream(-1);
-             }
-             self.Record(*stream);
-           })
+#else
+             PADDLE_THROW(platform::errors::Unavailable(
+                 "Class CUDAEvent can only be initialized on the GPU "
+                 "platform."));
+
+#endif
+           },
+           py::arg("enable_timing") = false, py::arg("blocking") = false,
+           py::arg("interprocess") = false);
+#if defined(PADDLE_WITH_CUDA) || defined(PADDLE_WITH_HIP)
+  m.def("record",
+        [](paddle::platform::CudaEvent &self,
+           paddle::platform::stream::CUDAStream *stream) {
+          if (stream == nullptr) {
+            stream = paddle::platform::stream::get_current_stream(-1);
+          }
+          self.Record(*stream);
+        })
       .def("query",
            [](paddle::platform::CudaEvent &self) { return self.Query(); })
       .def("synchronize",