Add CloverLeaf benchmark

mehmetyusufoglu · mehmetyusufoglu · commit efb0563e73bb · 2024-07-17T21:33:05.000+02:00
diff --git a/benchmarks/CMakeLists.txt b/benchmarks/CMakeLists.txt
@@ -1,18 +1,19 @@
 #
-# Copyright 2023 Benjamin Worpitz, Jan Stephan, Mehmet Yusufoglu
-# SPDX-License-Identifier: ISC
+#Copyright 2023 Benjamin Worpitz, Jan Stephan, Mehmet Yusufoglu
+#SPDX - License - Identifier : ISC
 #
 
 ################################################################################
-# Required CMake version.
+#Required CMake version.
 ################################################################################
 
 cmake_minimum_required(VERSION 3.22)
 
 project("alpakaBenchmarks" LANGUAGES CXX)
 
 ################################################################################
-# Add subdirectories.
+#Add subdirectories.
 ################################################################################
 
 add_subdirectory("babelstream/")
+add_subdirectory("cloverleaf/")
diff --git a/benchmarks/cloverleaf/CMakeLists.txt b/benchmarks/cloverleaf/CMakeLists.txt
@@ -0,0 +1,53 @@
+#
+# Copyright 2023 Erik Zenker, Benjamin Worpitz, Jan Stephan, Bernhard Manfred Gruber
+# SPDX-License-Identifier: ISC
+#
+
+cmake_minimum_required(VERSION 3.22)
+set_property(GLOBAL PROPERTY USE_FOLDERS ON)
+
+project(cloverleaf LANGUAGES CXX)
+
+if(NOT TARGET alpaka::alpaka)
+    option(alpaka_USE_SOURCE_TREE "Use alpaka's source tree instead of an alpaka installation" OFF)
+    if(alpaka_USE_SOURCE_TREE)
+        # Don't build the benchmarks recursively
+        set(alpaka_BUILD_BENCHMARKS OFF)
+        add_subdirectory("${CMAKE_CURRENT_LIST_DIR}/../.." "${CMAKE_BINARY_DIR}/alpaka")
+    else()
+        find_package(alpaka REQUIRED)
+    endif()
+endif()
+
+
+set(_TARGET_NAME "cloverleaf")
+append_recursive_files_add_to_src_group("src/" "src/" "cpp" _FILES_SOURCE)
+
+alpaka_add_executable(
+    ${_TARGET_NAME}
+    ${_FILES_SOURCE})
+
+target_sources(cloverleaf
+  PRIVATE
+    src/cloverLeafKernels.hpp
+)
+
+target_include_directories(
+ ${_TARGET_NAME}
+ PRIVATE "src")
+
+target_link_libraries(
+    ${_TARGET_NAME}
+    PRIVATE common)
+
+#Run as a ctest
+if(alpaka_CI)
+    # Only run for release builds since this is a benchmark
+    if(CMAKE_BUILD_TYPE STREQUAL "Release")
+       set_target_properties(${_TARGET_NAME} PROPERTIES FOLDER benchmarks/cloverleaf)
+       add_test(NAME ${_TARGET_NAME} COMMAND ${_TARGET_NAME} --benchmark-samples 1 -r xml)
+    endif()
+else()
+    # For a normal benchmark test, number of samples should be equal to the default value.
+    add_test(NAME ${_TARGET_NAME} COMMAND ${_TARGET_NAME})
+endif()
diff --git a/benchmarks/cloverleaf/src/cloverLeafKernels.hpp b/benchmarks/cloverleaf/src/cloverLeafKernels.hpp
@@ -0,0 +1,232 @@
+#pragma once
+
+#include <alpaka/alpaka.hpp>
+
+#include <experimental/mdspan>
+
+using Data = float;
+using Dim3 = alpaka::DimInt<3>;
+using Idx = std::uint32_t;
+
+const Idx nx = 512; // Number of cells in x direction
+const Idx ny = 512; // Number of cells in y direction
+const Idx nz = 512; // Number of cells in z direction
+
+// Kernel to initialize the simulation variables
+struct InitializerKernel
+{
+    template<typename TAcc, typename MdSpan>
+    ALPAKA_FN_ACC auto operator()(
+        TAcc const& acc,
+        MdSpan density,
+        MdSpan energy,
+        MdSpan pressure,
+        MdSpan velocityX,
+        MdSpan velocityY,
+        MdSpan velocityZ) const -> void
+    {
+        // Get thread index, the center of filter-matrix is positioned to the item on this index.
+        auto const i = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[0];
+        auto const j = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[1];
+        auto const k = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[2];
+
+        if(i < nx && j < ny && k < nz)
+        {
+            density(i, j, k) = 1.0f; // Initial density
+            energy(i, j, k) = 1.0f; // Initial energy
+            pressure(i, j, k) = 1.0f; // Initial pressure
+            velocityX(i, j, k) = 0.0f; // Initial velocity in x direction
+            velocityY(i, j, k) = 0.0f; // Initial velocity in y direction
+            velocityZ(i, j, k) = 0.0f; // Initial velocity in z direction
+        }
+    }
+};
+
+// Kernel to compute the equation of state (EOS) and additional calculations
+struct EOSKernel
+{
+    template<typename TAcc, typename MdSpan>
+    ALPAKA_FN_ACC auto operator()(
+        TAcc const& acc,
+        MdSpan density,
+        MdSpan energy,
+        MdSpan pressure,
+        MdSpan velocityX,
+        MdSpan velocityY,
+        MdSpan velocityZ,
+        float gamma) const -> void
+    {
+        auto const i = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[0];
+        auto const j = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[1];
+        auto const k = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[2];
+
+        if(i < nx && j < ny && k < nz)
+        {
+            // Compute pressure using ideal gas law: P = (gamma - 1) * density * energy
+            pressure(i, j, k) = (gamma - 1.0f) * density(i, j, k) * energy(i, j, k);
+
+            // Additional calculations to update velocities (this is a simplified example)
+            velocityX(i, j, k) += pressure(i, j, k) * 0.1f;
+            velocityY(i, j, k) += pressure(i, j, k) * 0.1f;
+            velocityZ(i, j, k) += pressure(i, j, k) * 0.1f;
+        }
+    }
+};
+
+// Kernel for Flux calculations
+struct FluxKernel
+{
+    template<typename TAcc, typename MdSpan>
+    ALPAKA_FN_ACC auto operator()(
+        TAcc const& acc,
+        MdSpan density,
+        MdSpan energy,
+        MdSpan pressure,
+        MdSpan velocityX,
+        MdSpan velocityY,
+        MdSpan velocityZ,
+        MdSpan fluxDensity,
+        MdSpan fluxEnergy,
+        MdSpan fluxVelocityX,
+        MdSpan fluxVelocityY,
+        MdSpan fluxVelocityZ) const -> void
+    {
+        auto const i = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[0];
+        auto const j = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[1];
+        auto const k = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[2];
+
+        if(i < nx && j < ny && k < nz)
+        {
+            // Compute fluxes (this is a simplified example)
+            fluxDensity(i, j, k) = density(i, j, k) * velocityX(i, j, k);
+            fluxEnergy(i, j, k) = energy(i, j, k) * velocityX(i, j, k);
+            fluxVelocityX(i, j, k) = velocityX(i, j, k) * velocityX(i, j, k) + pressure(i, j, k);
+            fluxVelocityY(i, j, k) = velocityY(i, j, k) * velocityX(i, j, k);
+            fluxVelocityZ(i, j, k) = velocityZ(i, j, k) * velocityX(i, j, k);
+        }
+    }
+};
+
+// Kernel for the advection step
+struct AdvectionKernel
+{
+    template<typename TAcc, typename MdSpan>
+    ALPAKA_FN_ACC auto operator()(
+        TAcc const& acc,
+        MdSpan density,
+        MdSpan velocityX,
+        MdSpan velocityY,
+        MdSpan velocityZ) const -> void
+    {
+        auto const i = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[0];
+        auto const j = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[1];
+        auto const k = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[2];
+
+        if(i < nx && j < ny && k < nz)
+        {
+            // Simple advection calculation (this is a simplified example)
+            density(i, j, k) += (velocityX(i, j, k) + velocityY(i, j, k) + velocityZ(i, j, k)) * 0.01f;
+        }
+    }
+};
+
+struct LagrangianKernel
+{
+    template<typename TAcc, typename MdSpan>
+    ALPAKA_FN_ACC auto operator()(
+        TAcc const& acc,
+        MdSpan density,
+        MdSpan energy,
+        MdSpan velocityX,
+        MdSpan velocityY,
+        MdSpan velocityZ,
+        MdSpan fluxDensity,
+        MdSpan fluxEnergy,
+        MdSpan fluxVelocityX,
+        MdSpan fluxVelocityY,
+        MdSpan fluxVelocityZ) const -> void
+    {
+        auto const i = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[0];
+        auto const j = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[1];
+        auto const k = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[2];
+
+        if(i < nx && j < ny && k < nz)
+        {
+            // Update the cell-centered variables based on flux calculations
+            density(i, j, k) -= fluxDensity(i, j, k) * 0.1f;
+            energy(i, j, k) -= fluxEnergy(i, j, k) * 0.1f;
+            velocityX(i, j, k) -= fluxVelocityX(i, j, k) * 0.1f;
+            velocityY(i, j, k) -= fluxVelocityY(i, j, k) * 0.1f;
+            velocityZ(i, j, k) -= fluxVelocityZ(i, j, k) * 0.1f;
+        }
+    }
+};
+
+struct ViscosityKernel
+{
+    template<typename TAcc, typename MdSpan>
+    ALPAKA_FN_ACC auto operator()(
+        TAcc const& acc,
+        MdSpan density,
+        MdSpan velocityX,
+        MdSpan velocityY,
+        MdSpan velocityZ,
+        MdSpan pressure,
+        MdSpan viscosity) const -> void
+    {
+        auto const i = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[0];
+        auto const j = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[1];
+        auto const k = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[2];
+
+        if(i < nx && j < ny && k < nz)
+        {
+            // Calculate artificial viscosity (this is a simplified example)
+            float gradVx = (velocityX(i + 1, j, k) - velocityX(i - 1, j, k)) * 0.5f;
+            float gradVy = (velocityY(i, j + 1, k) - velocityY(i, j - 1, k)) * 0.5f;
+            float gradVz = (velocityZ(i, j, k + 1) - velocityZ(i, j, k - 1)) * 0.5f;
+
+            viscosity(i, j, k) = density(i, j, k) * (gradVx * gradVx + gradVy * gradVy + gradVz * gradVz) * 0.01f;
+
+            // Apply viscosity to pressure
+            pressure(i, j, k) += viscosity(i, j, k);
+        }
+    }
+};
+
+struct MaxVelocityKernel
+{
+    template<typename TAcc, typename MdSpan>
+    ALPAKA_FN_ACC auto operator()(
+        TAcc const& acc,
+        MdSpan velocityX,
+        MdSpan velocityY,
+        MdSpan velocityZ,
+        float* maxVelocity) const -> void
+    {
+        auto const i = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[0];
+        auto const j = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[1];
+        auto const k = alpaka::getIdx<alpaka::Grid, alpaka::Threads>(acc)[2];
+
+        if(i < nx && j < ny && k < nz)
+        {
+            float vx = velocityX(i, j, k);
+            float vy = velocityY(i, j, k);
+            float vz = velocityZ(i, j, k);
+            float v = alpaka::math::sqrt(acc, (vx * vx + vy * vy + vz * vz));
+
+            // Atomic operation to find the maximum velocity
+            alpaka::atomicMax(acc, maxVelocity, v);
+        }
+    }
+};
+
+[[maybe_unused]] static float calculateTimeStep(float dx, float dy, float dz, float maxVelocity, float cMax)
+{
+    // Compute the smallest grid spacing
+    float minDx = std::min({dx, dy, dz});
+
+    // Calculate the time step based on the CFL condition
+    float dt = cMax * minDx / maxVelocity;
+
+    return dt;
+}
diff --git a/benchmarks/cloverleaf/src/cloverLeafMainTest.cpp b/benchmarks/cloverleaf/src/cloverLeafMainTest.cpp