您好,想问下您有尝试过用C++ 部署吗,在导出pt 时,有一个关键的函数selective_scan_cuda_core.fwd(), 是通过C++ 和cuda写的,无法被torch.jit.script 和torch.onnx 正确导出,使用torch.jit.trace, 貌似也直接忽略了这个函数,导致最终推理出来的效果很差,想咨询下您这边有尝试部署过吗
您好,想问下您有尝试过用C++ 部署吗,在导出pt 时,有一个关键的函数selective_scan_cuda_core.fwd(), 是通过C++ 和cuda写的,无法被torch.jit.script 和torch.onnx 正确导出,使用torch.jit.trace, 貌似也直接忽略了这个函数,导致最终推理出来的效果很差,想咨询下您这边有尝试部署过吗