Supplementary documentation

Le-soleile · Le-soleile · commit 3f7d25688cbe · 2026-03-09T20:54:43.000+08:00
diff --git a/CMakeLists.txt b/CMakeLists.txt
@@ -22,6 +22,37 @@ include(external)
 
 find_package(Threads REQUIRED)
 
+# ---------------------------------------------------------------------------
+# CUDA Toolkit (optional) — needed for HAS_CUDA tests
+# ---------------------------------------------------------------------------
+# Prefer auto-detection; if it fails, fall back to CUDA_TOOLKIT_ROOT cache var.
+set(CUDA_TOOLKIT_ROOT
+    ""
+    CACHE PATH "Path to CUDA toolkit root (e.g. /home/aistudio/cuda-11.8). \
+Leave empty to let CMake auto-detect.")
+
+if(CUDA_TOOLKIT_ROOT)
+  set(CUDAToolkit_ROOT "${CUDA_TOOLKIT_ROOT}")
+endif()
+
+find_package(CUDAToolkit QUIET)
+
+if(CUDAToolkit_FOUND)
+  message(STATUS "CUDA Toolkit ${CUDAToolkit_VERSION} found: \
+${CUDAToolkit_INCLUDE_DIRS}")
+  include_directories(${CUDAToolkit_INCLUDE_DIRS})
+else()
+  # Last-resort: accept a bare include path supplied by the user
+  if(CUDA_TOOLKIT_ROOT AND EXISTS "${CUDA_TOOLKIT_ROOT}/include/cuda.h")
+    message(STATUS "CUDA headers found via CUDA_TOOLKIT_ROOT: \
+${CUDA_TOOLKIT_ROOT}/include")
+    include_directories("${CUDA_TOOLKIT_ROOT}/include")
+  else()
+    message(STATUS "CUDA Toolkit not found — CUDA tests will be skipped. \
+Set -DCUDA_TOOLKIT_ROOT=/home/aistudio/cuda-11.8 to enable them.")
+  endif()
+endif()
+
 set(EXE_TARGET_NAME "all_api_tests")
 if(CMAKE_COMPILER_IS_GNUCXX)
   set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -Wall -ansi -Wno-deprecated")
diff --git a/doc/mismatch_api_record.md b/doc/mismatch_api_record.md
@@ -241,6 +241,19 @@ libtorch 在同路径头文件中完整定义了上述类，供 CUDA kernel 使
 ## 差异点列表
 
 1. **`at::empty()` 不支持含 `requires_grad` 的 `TensorOptions`**：Paddle 在通过 `at::empty({...}, opts)` 创建 tensor 时，若 `opts` 含有 `requires_grad(true)` 会抛出异常。PyTorch 完整支持。当前测试已绕过：将含 `requires_grad` 的 `opts` 与用于创建 tensor 的 `opts_for_dtype` 分离，单独测试 `requires_grad()` 的读取，但实际上 Paddle 无法通过 `TensorOptions` 在 tensor 创建时传递梯度需求。
+2. **`device_index()` 对 CPU 设备的返回值不同**：Torch 对 CPU 设备返回 `-1`（无显式 index）；Paddle 会将 CPU 规范化为 `cpu:0`，因此返回 `0`。
+
+---
+
+## 详细记录
+
+- 测试用例：DeviceIndex
+- 字段：`c10::TensorOptions().device(c10::Device(c10::kCPU)).device_index()`
+- 差异：
+    - Paddle 输出：`0`
+    - Torch 输出：`-1`
+- 原因：Torch 将 CPU 设备视为无显式 index；Paddle 会将 CPU 设备规范化为 `cpu:0`。
+- 处理：已在测试文件中注释掉该字段输出，并添加 `DIFF` 标注说明。
 
 ---
 
@@ -253,3 +266,50 @@ libtorch 在同路径头文件中完整定义了上述类，供 CUDA kernel 使
 1. **`resize_()` 不支持**：Paddle 调用 `tensor.resize_({...})` 会抛出异常，PyTorch 完整支持原地调整 tensor 形状。当前测试用 try-catch 捕获异常并输出 `"1 "` 表示异常发生，无法对比实际 resize 结果。
 
 ---
+
+# TensorFactoryTest
+
+## 差异点列表
+
+1. **ScalarType::Bool 枚举值不同**：Paddle 的 DataType::BOOL = 10，Torch 的 ScalarType::Bool = 11。
+
+---
+
+## 详细记录
+
+- 测试用例：TensorFromBoolArrayRef
+- 字段：scalar_type（write_tensor_info_to_file 输出的 static_cast<int>(t.scalar_type())）
+- 差异：
+    - Paddle 输出：10
+    - Torch 输出：11
+- 原因：Paddle 与 Torch 框架的 ScalarType::Bool 枚举值不同（Paddle=10，Torch=11），属于设计差异。
+- 处理：已在测试文件中注释掉该字段输出，并添加 DIFF 标注说明。
+
+---
+
+# CUDADataTypeTest
+
+## 差异点列表
+
+1. **`ScalarTypeToCudaDataType(Bool)` 支持范围不同**：Paddle compat 不支持 `Bool` 转 `cudaDataType`，会抛出异常；Torch 侧接口支持范围更完整。当前测试已跳过 `Bool`。
+2. **`empty_cuda` 结果依赖运行时/构建环境**：Torch CUDA 版通常可成功创建 CUDA Tensor；Paddle compat 在未编译 CUDA 或运行时不可用时会抛异常并进入不可用分支。该差异属于环境差异，不属于接口语义差异。
+
+---
+
+## 详细记录
+
+- 测试用例：GetCudaDataType
+- 字段：`Bool` 类型的 `ScalarTypeToCudaDataType` 转换
+- 差异：
+    - Paddle：抛出 `Cannot convert ScalarType Bool to cudaDataType`
+    - Torch：可返回对应的 `cudaDataType`
+- 原因：Paddle compat 的 `ATen/cuda/CUDADataType.h` 未实现 `Bool` 分支。
+- 处理：已在测试文件中跳过 `Bool` 的输出，并添加 `DIFF` 注释说明。
+
+- 测试用例：EmptyCUDA / EmptyCudaDifferentDtype
+- 字段：结果字符串（`cuda_empty` / `cuda_empty_int` / `cuda_not_available`）
+- 差异：
+    - Paddle 输出：`cuda_not_available`
+    - Torch 输出：`cuda_empty`、`cuda_empty_int`
+- 原因：该结果依赖 Paddle 是否为 GPU 版以及当前 CUDA 运行时是否可用，属于运行时/构建环境差异，而非接口行为差异。
+- 处理：已在测试文件中保留调用、注释掉结果字符串输出，并添加 `DIFF` 注释说明。
diff --git a/test/CUDADataTypeTest.cpp b/test/CUDADataTypeTest.cpp
@@ -34,16 +34,34 @@ TEST_F(CUDADataTypeTest, GetCudaDataType) {
 #if !defined(HAS_CUDA)
   GTEST_SKIP() << "CUDA not available";
 #else
-  // Test getCudaDataType for various ScalarTypes
-  file << std::to_string(at::getCudaDataType(c10::ScalarType::Float)) << " ";
-  file << std::to_string(at::getCudaDataType(c10::ScalarType::Double)) << " ";
-  file << std::to_string(at::getCudaDataType(c10::ScalarType::Int)) << " ";
-  file << std::to_string(at::getCudaDataType(c10::ScalarType::Long)) << " ";
-  file << std::to_string(at::getCudaDataType(c10::ScalarType::Half)) << " ";
-  file << std::to_string(at::getCudaDataType(c10::ScalarType::Bool)) << " ";
-  file << std::to_string(at::getCudaDataType(c10::ScalarType::Byte)) << " ";
-  file << std::to_string(at::getCudaDataType(c10::ScalarType::Char)) << " ";
-  file << std::to_string(at::getCudaDataType(c10::ScalarType::Short)) << " ";
+  // Both libtorch and Paddle compat headers expose ScalarTypeToCudaDataType
+  // under at::cuda. The old at::getCudaDataType(...) symbol is unavailable.
+  file << std::to_string(
+              at::cuda::ScalarTypeToCudaDataType(c10::ScalarType::Float))
+       << " ";
+  file << std::to_string(
+              at::cuda::ScalarTypeToCudaDataType(c10::ScalarType::Double))
+       << " ";
+  file << std::to_string(
+              at::cuda::ScalarTypeToCudaDataType(c10::ScalarType::Int))
+       << " ";
+  file << std::to_string(
+              at::cuda::ScalarTypeToCudaDataType(c10::ScalarType::Long))
+       << " ";
+  file << std::to_string(
+              at::cuda::ScalarTypeToCudaDataType(c10::ScalarType::Half))
+       << " ";
+  // DIFF: Paddle compat 的 ScalarTypeToCudaDataType 不支持 Bool，
+  // 会抛出 "Cannot convert ScalarType Bool to cudaDataType"，因此跳过。
+  file << std::to_string(
+              at::cuda::ScalarTypeToCudaDataType(c10::ScalarType::Byte))
+       << " ";
+  file << std::to_string(
+              at::cuda::ScalarTypeToCudaDataType(c10::ScalarType::Char))
+       << " ";
+  file << std::to_string(
+              at::cuda::ScalarTypeToCudaDataType(c10::ScalarType::Short))
+       << " ";
   file.saveFile();
 #endif
 }
@@ -57,7 +75,9 @@ TEST_F(CUDADataTypeTest, GetCudaDataTypeBFloat16) {
 #if !defined(HAS_CUDA)
   GTEST_SKIP() << "CUDA not available";
 #else
-  file << std::to_string(at::getCudaDataType(c10::ScalarType::BFloat16)) << " ";
+  file << std::to_string(
+              at::cuda::ScalarTypeToCudaDataType(c10::ScalarType::BFloat16))
+       << " ";
   file.saveFile();
 #endif
 }
@@ -71,15 +91,22 @@ TEST_F(CUDADataTypeTest, GetCudaDataTypeComplex) {
 #if !defined(HAS_CUDA)
   GTEST_SKIP() << "CUDA not available";
 #else
-  file << std::to_string(at::getCudaDataType(c10::ScalarType::ComplexFloat))
+  file << std::to_string(
+              at::cuda::ScalarTypeToCudaDataType(c10::ScalarType::ComplexFloat))
        << " ";
-  file << std::to_string(at::getCudaDataType(c10::ScalarType::ComplexDouble))
+  file << std::to_string(at::cuda::ScalarTypeToCudaDataType(
+              c10::ScalarType::ComplexDouble))
        << " ";
   file.saveFile();
 #endif
 }
 
 // empty_cuda
+// DIFF: 该测试在 Torch CUDA 版下可成功创建 Tensor，输出 "cuda_empty"；
+// 但在 Paddle 兼容层中，如果 Paddle 未编译 CUDA
+// 或当前运行时不可用，会进入异常分支， 输出
+// "cuda_not_available"。这是运行时/构建环境差异，不属于接口语义差异。
+// 为避免比较结果受环境影响，保留调用，仅注释掉相关输出。
 TEST_F(CUDADataTypeTest, EmptyCUDA) {
   auto file_name = g_custom_param.get();
   FileManerger file(file_name);
@@ -88,18 +115,27 @@ TEST_F(CUDADataTypeTest, EmptyCUDA) {
 #if !defined(HAS_CUDA)
   GTEST_SKIP() << "CUDA not available";
 #else
-  // empty_cuda with IntArrayRef size
+  // Both libtorch and Paddle compat headers expose empty_cuda under at::detail.
   try {
-    at::Tensor t = at::cuda::empty_cuda({2, 3, 4}, c10::ScalarType::Float, 0);
-    file << "cuda_empty ";
+    at::Tensor t = at::detail::empty_cuda({2, 3, 4},
+                                          c10::ScalarType::Float,
+                                          at::Device(at::kCUDA, 0),
+                                          std::nullopt);
+    // DIFF: Torch 侧会输出 "cuda_empty"，Paddle 侧可能因未编译
+    // CUDA/运行时不可用而不一致，故注释掉。 file << "cuda_empty ";
   } catch (...) {
-    file << "cuda_not_available ";
+    // DIFF: Paddle 侧常落入该分支输出 "cuda_not_available"，与 Torch
+    // 侧环境相关差异，故注释掉。 file << "cuda_not_available ";
   }
   file.saveFile();
 #endif
 }
 
 // empty_cuda with different dtypes
+// DIFF: 与 EmptyCUDA 相同，该测试结果依赖 Paddle 是否为 GPU 版以及当前 CUDA
+// 运行时是否可用。 Torch CUDA 版通常输出 "cuda_empty_int"，而 Paddle 侧可能输出
+// "cuda_not_available"。
+// 为避免环境差异导致比对失败，仅保留调用，不记录结果字符串。
 TEST_F(CUDADataTypeTest, EmptyCudaDifferentDtype) {
   auto file_name = g_custom_param.get();
   FileManerger file(file_name);
@@ -109,10 +145,13 @@ TEST_F(CUDADataTypeTest, EmptyCudaDifferentDtype) {
   GTEST_SKIP() << "CUDA not available";
 #else
   try {
-    at::Tensor t = at::cuda::empty_cuda({2, 3}, c10::ScalarType::Int, 0);
-    file << "cuda_empty_int ";
+    at::Tensor t = at::detail::empty_cuda(
+        {2, 3}, c10::ScalarType::Int, at::Device(at::kCUDA, 0), std::nullopt);
+    // DIFF: Torch 侧会输出 "cuda_empty_int"，Paddle
+    // 侧可能因环境差异不一致，故注释掉。 file << "cuda_empty_int ";
   } catch (...) {
-    file << "cuda_not_available ";
+    // DIFF: Paddle 侧常输出 "cuda_not_available"，与 Torch
+    // 侧环境相关差异，故注释掉。 file << "cuda_not_available ";
   }
   file.saveFile();
 #endif
diff --git a/test/OptionalArrayRefTest.cpp b/test/OptionalArrayRefTest.cpp
@@ -202,6 +202,11 @@ TEST_F(OptionalArrayRefTest, SwapMethod) {
 }
 
 // emplace 方法
+// DIFF: emplace(initializer_list) 所构造的临时 initializer_list
+// 在语句结束后被销毁， OptionalArrayRef 内部 ArrayRef
+// 持有悬空指针，遍历元素时输出随机内存内容， 导致 Paddle 与 Torch
+// 结果不一致（element[0]/[2]/[3] 均为随机值）。 仅保留 has_value 和 size
+// 的输出（两者一致），注释掉元素遍历。
 TEST_F(OptionalArrayRefTest, EmplaceMethod) {
   c10::OptionalArrayRef<int64_t> arr;
   auto file_name = g_custom_param.get();
@@ -210,9 +215,11 @@ TEST_F(OptionalArrayRefTest, EmplaceMethod) {
   arr.emplace(std::initializer_list<int64_t>{1, 2, 3, 4});
   file << std::to_string(arr.has_value() ? 1 : 0) << " ";
   file << std::to_string(arr->size()) << " ";
-  for (const auto& v : *arr) {
-    file << std::to_string(v) << " ";
-  }
+  // DIFF: 以下元素遍历输出悬空引用（initializer_list 临时对象已销毁），
+  // 结果为随机内存值，Paddle 与 Torch 间不可复现，故注释掉。
+  // for (const auto& v : *arr) {
+  //   file << std::to_string(v) << " ";
+  // }
   file.saveFile();
 }
 
@@ -331,16 +338,22 @@ TEST_F(OptionalArrayRefTest, EmptyArray) {
 }
 
 // from vector (more reliable than initializer_list)
+// DIFF: std::vector<int64_t>{1, 2, 3, 4, 5} 是临时对象，传入 OptionalArrayRef
+// 后即被销毁， 内部 ArrayRef 持有悬空指针，遍历元素时输出随机内存内容， 导致
+// Paddle 与 Torch 结果不一致（element[0]-[3] 均为随机值，element[4]
+// 偶然相同）。 仅保留 has_value 和 size 的输出（两者一致），注释掉元素遍历。
 TEST_F(OptionalArrayRefTest, InPlaceConstruction) {
   c10::OptionalArrayRef<int64_t> arr(std::vector<int64_t>{1, 2, 3, 4, 5});
   auto file_name = g_custom_param.get();
   FileManerger file(file_name);
   file.openAppend();
   file << std::to_string(arr.has_value() ? 1 : 0) << " ";
   file << std::to_string(arr->size()) << " ";
-  for (const auto& v : *arr) {
-    file << std::to_string(v) << " ";
-  }
+  // DIFF: 以下元素遍历输出悬空引用（临时 vector 已销毁），
+  // 结果为随机内存值，Paddle 与 Torch 间不可复现，故注释掉。
+  // for (const auto& v : *arr) {
+  //   file << std::to_string(v) << " ";
+  // }
   file.saveFile();
 }
 
diff --git a/test/TensorOptionsTest.cpp b/test/TensorOptionsTest.cpp
@@ -131,12 +131,17 @@ TEST_F(TensorOptionsTest, HasAndOptMethods) {
 }
 
 // device_index
+// DIFF: 对于 `c10::TensorOptions().device(c10::Device(c10::kCPU))`，
+// Torch 的 `device_index()` 返回 -1（CPU 无显式 index），
+// Paddle 返回 0（CPU 被规范化为 cpu:0）。该差异属于设备表示设计差异。
+// 为避免结果比对失败，保留构造逻辑，注释掉 `device_index()` 输出。
 TEST_F(TensorOptionsTest, DeviceIndex) {
   auto opts = c10::TensorOptions().device(c10::Device(c10::kCPU));
   auto file_name = g_custom_param.get();
   FileManerger file(file_name);
   file.openAppend();
-  file << std::to_string(opts.device_index()) << " ";
+  // DIFF: Paddle=0, Torch=-1，两框架行为不一致，故注释掉。
+  // file << std::to_string(opts.device_index()) << " ";
   file.saveFile();
 }
 
diff --git a/test/ops/TensorFactoryTest.cpp b/test/ops/TensorFactoryTest.cpp
@@ -103,6 +103,9 @@ TEST_F(TensorFactoryTest, TensorFromLongArrayRef) {
 }
 
 // at::tensor(ArrayRef<bool>)
+// DIFF: write_tensor_info_to_file 中 static_cast<int>(t.scalar_type()) 对 Bool
+// 类型在两框架间枚举值不同（Paddle=10, Torch=11），故此处不使用辅助函数，
+// 手动写出 dim/numel/sizes，并注释掉 scalar_type 输出。
 TEST_F(TensorFactoryTest, TensorFromBoolArrayRef) {
   bool data[] = {true, false, true, true, false};
   at::Tensor t = at::zeros({5}, at::kBool);
@@ -112,7 +115,14 @@ TEST_F(TensorFactoryTest, TensorFromBoolArrayRef) {
   auto file_name = g_custom_param.get();
   FileManerger file(file_name);
   file.openAppend();
-  write_tensor_info_to_file(&file, t);
+  // 手动写 dim / numel / sizes（与 write_tensor_info_to_file 一致）
+  file << std::to_string(t.dim()) << " ";
+  file << std::to_string(t.numel()) << " ";
+  for (int64_t i = 0; i < t.dim(); ++i) {
+    file << std::to_string(t.sizes()[i]) << " ";
+  }
+  // DIFF: scalar_type 枚举值 Paddle=10 vs Torch=11，两框架不一致，故注释掉。
+  // file << std::to_string(static_cast<int>(t.scalar_type())) << " ";
   bool* ptr = t.data_ptr<bool>();
   for (int64_t i = 0; i < t.numel(); ++i) {
     file << std::to_string(static_cast<int>(ptr[i])) << " ";
diff --git a/test/result_cmp.sh b/test/result_cmp.sh
@@ -8,6 +8,14 @@ PADDLE_PATH=${BUILD_PATH}/paddle/
 TORCH_PATH=${BUILD_PATH}/torch/
 RESULT_FILE_PATH="/tmp/paddle_cpp_api_test/"
 
+# 保存原始终端输出，并在退出时稳定打印日志路径
+LOG_FILE="${RESULT_FILE_PATH}result_cmp_$(date +%Y%m%d_%H%M%S).log"
+mkdir -p "${RESULT_FILE_PATH}"
+exec 3>&1 4>&2
+trap 'status=$?; printf "\nDone. Full output saved to: %s\n" "$LOG_FILE" | tee -a "$LOG_FILE" >&3; exit $status' EXIT
+exec > >(tee -a "$LOG_FILE") 2>&1
+echo "Log file: $LOG_FILE"
+
 # 记录PADDLE_PATH下所有可执行文件到列表
 echo "Collecting and executing Paddle executables..."
 PADDLE_EXECUTABLES=()
diff --git a/test/unmatch_TorchCudaTest.cpp b/test/unmatch_TorchCudaTest.cpp