StepMesh-fork/fserver/csrc/kernel.hpp at 2b7f86c64b8c3380b7624acccee8d2ca79013676 · niehao100/StepMesh-fork · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
#include <torch/extension.h>
#include <cuda.h>
#include <cuda_runtime.h>

#include <ATen/cuda/CUDAContext.h>
#include <cuda_runtime.h>


torch::Tensor map_pinned_tensor(torch::Tensor tensor, int64_t device_index);
void write_flag(torch::Tensor flag, torch::Tensor seq);
void wait_flag(torch::Tensor flag, torch::Tensor seq);
void seq_add_one(torch::Tensor seq);

void pybind_kernel(py::module &m){
  // StepMesh utils
  m.def("map_pinned_tensor", &map_pinned_tensor, py::arg("tensor"), py::arg("device_index"));
  m.def("write_flag", &write_flag, py::arg("flag"), py::arg("seq"));
  m.def("wait_flag", &wait_flag, py::arg("flag"), py::arg("seq"));
  m.def("seq_add_one", &seq_add_one, py::arg("seq"));
}