Expand constant expressions on named computations with all constant like ops.

Google-ML-Automation · copybara-github · commit 958320c436a1 · 2025-09-10T08:26:08.000-07:00
PiperOrigin-RevId: 804851791
diff --git a/shardy/dialect/sdy/transforms/import/constant_or_scalar_splitter.cc b/shardy/dialect/sdy/transforms/import/constant_or_scalar_splitter.cc
@@ -16,6 +16,7 @@ limitations under the License.
 #include <cassert>
 #include <utility>
 
+#include "llvm/ADT/DenseSet.h"
 #include "llvm/ADT/STLExtras.h"
 #include "mlir/Dialect/Func/IR/FuncOps.h"
 #include "mlir/IR/Builders.h"
@@ -66,28 +67,41 @@ void eraseShardingGroupUsers(Operation* op) {
 
 // A constant preserving op is an op that is considered a constant expression if
 // it is pure and all its results can be considered as constant expressions
-// given all its operands are constant expressions.
-bool isConstantPreserving(Operation* op) {
+// given all its operands are constant expressions, for which it holds if the
+// given op is either:
+// - A broadcast, reshape or slice op.
+// - An elementwise op.
+// - A named computation all operations are constant preserving.
+// Assumes the op is not constant or iota.
+bool isConstantPreserving(
+    Operation* op,
+    const llvm::SmallDenseSet<StringRef>& nonConstantNamedComputationOps) {
   if (isa<stablehlo::BroadcastInDimOp, stablehlo::ReshapeOp,
           stablehlo::SliceOp>(op)) {
     return isPure(op);
   }
   if (isElementwise(op)) {
     return isPure(op);
   }
+  if (auto namedComputationOp = dyn_cast<NamedComputationOp>(op)) {
+    return !nonConstantNamedComputationOps.contains(
+               namedComputationOp.getName()) &&
+           isPure(op);
+  }
   return false;
 }
 
 // Returns true if the given op is either:
 // - A constant or iota op.
-// - A constant preserving op. (see isConstantPreserving)
-// - All operands are constants, that is, exist in `constantOps`.
-bool isConstantExpression(Operation* op,
-                          const llvm::SetVector<Operation*>& constantOps) {
+// - A constant preserving op. (see isConstantPreserving) and all operands are
+// constants, that is, exist in `constantOps`.
+bool isConstantExpression(
+    Operation* op, const llvm::SetVector<Operation*>& constantOps,
+    const llvm::SmallDenseSet<StringRef>& nonConstantNamedComputationOps) {
   if (isa<ConstantOp, stablehlo::IotaOp>(op)) {
     return true;
   }
-  return isConstantPreserving(op) &&
+  return isConstantPreserving(op, nonConstantNamedComputationOps) &&
          llvm::all_of(op->getOperands(), [&](Value operand) {
            return operand.getDefiningOp() &&
                   constantOps.contains(operand.getDefiningOp());
@@ -156,14 +170,27 @@ void cloneSubComputationOnOperands(
 }
 
 void processOp(Operation* op, llvm::SetVector<Operation*>& constantOps,
-               llvm::SetVector<Operation*>& scalarExpansionOps) {
+               llvm::SetVector<Operation*>& scalarExpansionOps,
+               llvm::SmallDenseSet<StringRef>& nonConstantNamedComputationOps) {
   if (isa<ShardingGroupOp>(op)) {
     return;
   }
-  if (isConstantExpression(op, constantOps)) {
+  if (isConstantExpression(op, constantOps, nonConstantNamedComputationOps)) {
     constantOps.insert(op);
     return;
   }
+  // NOTE: There are cases that op is an constant expression but may not pass
+  // the following check such as constant and iota ops. That is fine because if
+  // the op is a constant expression it is a stronger condition than being just
+  // constant preserving and it does not make the parent named computation
+  // non-const, and at this point, it is guaranteed that the op is not constant
+  // expression.
+  if (!isConstantPreserving(op, nonConstantNamedComputationOps) &&
+      !op->hasTrait<OpTrait::IsTerminator>()) {
+    if (auto namedCompuationOp = op->getParentOfType<NamedComputationOp>()) {
+      nonConstantNamedComputationOps.insert(namedCompuationOp.getName());
+    }
+  }
   if (isScalarExpansion(op)) {
     scalarExpansionOps.insert(op);
     return;
@@ -213,22 +240,45 @@ struct ConstantOrScalarSplitterPass
     }
 
     // Then we split constant sub-computations for each non-constant user.
-    llvm::SetVector<Operation*> constantOps, scalarExpansionOps;
-    funcOp.walk(
-        [&](Operation* op) { processOp(op, constantOps, scalarExpansionOps); });
+    llvm::SmallVector<llvm::SetVector<Operation*>> constantOps;
+    llvm::SetVector<Operation*> scalarExpansionOps;
+    llvm::SmallDenseSet<StringRef> nonConstantNamedComputationOps;
+    constantOps.push_back(llvm::SetVector<Operation*>());
+    funcOp.walk<WalkOrder::PreOrder>([&](Operation* op) {
+      if (isa<NamedComputationOp>(op)) {
+        constantOps.push_back(llvm::SetVector<Operation*>());
+        return;
+      }
+      processOp(op, constantOps.back(), scalarExpansionOps,
+                nonConstantNamedComputationOps);
+      if (op->hasTrait<OpTrait::IsTerminator>() &&
+          isa<NamedComputationOp>(op->getParentOp())) {
+        for (Operation* op : llvm::reverse(constantOps.back())) {
+          if (hasOnlyUsersOfType<ShardingGroupOp>(op)) {
+            eraseShardingGroupUsers(op);
+            op->erase();
+          }
+        }
+        constantOps.pop_back();
+        processOp(op->getParentOp(), constantOps.back(), scalarExpansionOps,
+                  nonConstantNamedComputationOps);
+        return;
+      }
+    });
 
     // Since for every op in `constantOps` that has a use that isn't in
     // `constantOps`, we replaced the use with a clone of the entire
     // sub-computation, we can now erase all ops in `constantOps` as long as we
     // iterate in reverse order. Note that we did not clone scalars so we keep
     // the original.
     for (Operation* op : llvm::concat<Operation* const>(
-             scalarExpansionOps, llvm::reverse(constantOps))) {
+             scalarExpansionOps, llvm::reverse(constantOps.back()))) {
       if (hasOnlyUsersOfType<ShardingGroupOp>(op)) {
         eraseShardingGroupUsers(op);
         op->erase();
       }
     }
+    constantOps.pop_back();
   }
 
  private:
diff --git a/shardy/dialect/sdy/transforms/import/test/constant_or_scalar_splitter.mlir b/shardy/dialect/sdy/transforms/import/test/constant_or_scalar_splitter.mlir
@@ -119,15 +119,19 @@ func.func @constant_to_named_computation_with_only_constant_ops(%arg0: tensor<8x
 
 // CHECK-LABEL: func @constant_multiple_users_within_named_computation_with_no_arguments_and_with_only_constant_ops
 func.func @constant_multiple_users_within_named_computation_with_no_arguments_and_with_only_constant_ops() -> (tensor<8x16xf32>, tensor<8x16xf32>) {
-  // CHECK-NEXT: %[[NC:.*]] = sdy.named_computation<"foo">()
-  // CHECK-NEXT:   %[[CONST:.*]] = sdy.constant dense<1.000000e+00>
-  // CHECK-NEXT:   %[[NEGATE:.*]] = stablehlo.negate %[[CONST]]
-  // CHECK-NEXT:   sdy.return %[[NEGATE]]
+  // CHECK-NEXT: %[[NC0:.*]] = sdy.named_computation<"foo">()
+  // CHECK-NEXT:   %[[CONST0:.*]] = sdy.constant dense<1.000000e+00>
+  // CHECK-NEXT:   %[[NEGATE0:.*]] = stablehlo.negate %[[CONST0]]
+  // CHECK-NEXT:   sdy.return %[[NEGATE0]]
   // CHECK-NEXT: } : () -> tensor<8x16xf32>
-  // CHECK-NEXT: %[[ABS_0:.*]] = stablehlo.abs %[[NC]]
-  // CHECK-NEXT: %[[ABS_1:.*]] = stablehlo.abs %[[NC]]
+  // CHECK-NEXT: %[[NC1:.*]] = sdy.named_computation<"foo">()
+  // CHECK-NEXT:   %[[CONST1:.*]] = sdy.constant dense<1.000000e+00>
+  // CHECK-NEXT:   %[[NEGATE1:.*]] = stablehlo.negate %[[CONST1]]
+  // CHECK-NEXT:   sdy.return %[[NEGATE1]]
+  // CHECK-NEXT: } : () -> tensor<8x16xf32>
+  // CHECK-NEXT: %[[ABS_0:.*]] = stablehlo.abs %[[NC0]]
+  // CHECK-NEXT: %[[ABS_1:.*]] = stablehlo.abs %[[NC1]]
   // CHECK-NEXT: return %[[ABS_0]], %[[ABS_1]]
-  // TODO(enver): The named computation should be splitted.
   %0 = sdy.named_computation<"foo">() () {
     %1 = stablehlo.constant dense<1.000000e+00> : tensor<8x16xf32>
     %2 = stablehlo.negate %1 : tensor<8x16xf32>
@@ -140,16 +144,21 @@ func.func @constant_multiple_users_within_named_computation_with_no_arguments_an
 
 // CHECK-LABEL: func @constant_to_named_computation_with_one_argument_and_with_only_constant_ops
 func.func @constant_to_named_computation_with_one_argument_and_with_only_constant_ops() -> (tensor<8x16xf32>, tensor<8x16xf32>) {
-  // CHECK-NEXT: %[[CONST:.*]] = sdy.constant dense<1.000000e+00>
-  // CHECK-NEXT: %[[NC:.*]] = sdy.named_computation<"foo">(%[[CONST]]) (%arg0: tensor<8x16xf32>) {
-  // CHECK-NEXT:   %[[NEGATE:.*]] = stablehlo.negate %arg0
-  // CHECK-NEXT:   %[[ADD:.*]] = stablehlo.add %arg0, %[[NEGATE]]
-  // CHECK-NEXT:   sdy.return %[[ADD]]
+  // CHECK-NEXT: %[[CONST0:.*]] = sdy.constant dense<1.000000e+00>
+  // CHECK-NEXT: %[[CONST1:.*]] = sdy.constant dense<1.000000e+00>
+  // CHECK-NEXT: %[[NC0:.*]] = sdy.named_computation<"foo">(%[[CONST0]]) (%arg0: tensor<8x16xf32>) {
+  // CHECK-NEXT:   %[[NEGATE0:.*]] = stablehlo.negate %arg0
+  // CHECK-NEXT:   %[[ADD0:.*]] = stablehlo.add %arg0, %[[NEGATE0]]
+  // CHECK-NEXT:   sdy.return %[[ADD0]]
   // CHECK-NEXT: } : (tensor<8x16xf32>) -> tensor<8x16xf32>
-  // CHECK-NEXT: %[[ABS_0:.*]] = stablehlo.abs %[[NC]]
-  // CHECK-NEXT: %[[ABS_1:.*]] = stablehlo.abs %[[NC]]
+  // CHECK-NEXT: %[[NC1:.*]] = sdy.named_computation<"foo">(%[[CONST1]]) (%arg0: tensor<8x16xf32>) {
+  // CHECK-NEXT:   %[[NEGATE1:.*]] = stablehlo.negate %arg0
+  // CHECK-NEXT:   %[[ADD1:.*]] = stablehlo.add %arg0, %[[NEGATE1]]
+  // CHECK-NEXT:   sdy.return %[[ADD1]]
+  // CHECK-NEXT: } : (tensor<8x16xf32>) -> tensor<8x16xf32>
+  // CHECK-NEXT: %[[ABS_0:.*]] = stablehlo.abs %[[NC0]]
+  // CHECK-NEXT: %[[ABS_1:.*]] = stablehlo.abs %[[NC1]]
   // CHECK-NEXT: return %[[ABS_0]], %[[ABS_1]]
-  // TODO(enver): The named computation should be splitted.
   %0 = stablehlo.constant dense<1.000000e+00> : tensor<8x16xf32>
   %1 = sdy.named_computation<"foo">(%0) (%arg0: tensor<8x16xf32>) {
     %2 = stablehlo.negate %arg0 : tensor<8x16xf32>
@@ -165,15 +174,20 @@ func.func @constant_to_named_computation_with_one_argument_and_with_only_constan
 func.func @constant_multiple_users_one_to_named_computation_with_one_argument_and_with_only_constant_ops() -> (tensor<8x16xf32>, tensor<8x16xf32>, tensor<8x16xf32>) {
   // CHECK-NEXT: %[[CONST_0:.*]] = sdy.constant dense<1.000000e+00>
   // CHECK-NEXT: %[[CONST_1:.*]] = sdy.constant dense<1.000000e+00>
-  // CHECK-NEXT: %[[NC:.*]] = sdy.named_computation<"foo">(%[[CONST_0]]) (%arg0: tensor<8x16xf32>) {
-  // CHECK-NEXT:   %[[NEGATE:.*]] = stablehlo.negate %arg0
-  // CHECK-NEXT:   %[[ADD:.*]] = stablehlo.add %arg0, %[[NEGATE]]
-  // CHECK-NEXT:   sdy.return %[[ADD]]
+  // CHECK-NEXT: %[[CONST_2:.*]] = sdy.constant dense<1.000000e+00>
+  // CHECK-NEXT: %[[NC0:.*]] = sdy.named_computation<"foo">(%[[CONST_1]]) (%arg0: tensor<8x16xf32>) {
+  // CHECK-NEXT:   %[[NEGATE0:.*]] = stablehlo.negate %arg0
+  // CHECK-NEXT:   %[[ADD0:.*]] = stablehlo.add %arg0, %[[NEGATE0]]
+  // CHECK-NEXT:   sdy.return %[[ADD0]]
   // CHECK-NEXT: } : (tensor<8x16xf32>) -> tensor<8x16xf32>
-  // CHECK-NEXT: %[[ABS_0:.*]] = stablehlo.abs %[[NC]]
-  // CHECK-NEXT: %[[ABS_1:.*]] = stablehlo.abs %[[NC]]
-  // CHECK-NEXT: return %[[CONST_1]], %[[ABS_0]], %[[ABS_1]]
-  // TODO(enver): The named computation should be splitted.
+  // CHECK-NEXT: %[[NC1:.*]] = sdy.named_computation<"foo">(%[[CONST_2]]) (%arg0: tensor<8x16xf32>) {
+  // CHECK-NEXT:   %[[NEGATE1:.*]] = stablehlo.negate %arg0
+  // CHECK-NEXT:   %[[ADD1:.*]] = stablehlo.add %arg0, %[[NEGATE1]]
+  // CHECK-NEXT:   sdy.return %[[ADD1]]
+  // CHECK-NEXT: } : (tensor<8x16xf32>) -> tensor<8x16xf32>
+  // CHECK-NEXT: %[[ABS_0:.*]] = stablehlo.abs %[[NC0]]
+  // CHECK-NEXT: %[[ABS_1:.*]] = stablehlo.abs %[[NC1]]
+  // CHECK-NEXT: return %[[CONST_0]], %[[ABS_0]], %[[ABS_1]]
   %0 = stablehlo.constant dense<1.000000e+00> : tensor<8x16xf32>
   %1 = sdy.named_computation<"foo">(%0) (%arg0: tensor<8x16xf32>) {
     %2 = stablehlo.negate %arg0 : tensor<8x16xf32>
@@ -687,17 +701,25 @@ func.func @constant_both_to_named_computation_and_inside_named_computation_and_n
 func.func @constant_both_to_named_computation_and_inside_named_computation_and_named_computation_is_constant() -> (tensor<8x16xf32>, tensor<8x16xf32>, tensor<8x16xf32>) {
   // CHECK-NEXT: %[[CONST0:.*]] = sdy.constant dense<1.000000e+00> : tensor<8x16xf32>
   // CHECK-NEXT: %[[CONST1:.*]] = sdy.constant dense<1.000000e+00> : tensor<8x16xf32>
-  // CHECK-NEXT: %[[NC:.*]] = sdy.named_computation<"foo">(%[[CONST0]]) (%arg0: tensor<8x16xf32>) {
-  // CHECK-NEXT:   %[[CONST2:.*]] = sdy.constant dense<1.000000e+00> : tensor<8x16xf32>
+  // CHECK-NEXT: %[[CONST2:.*]] = sdy.constant dense<1.000000e+00> : tensor<8x16xf32>
+  // CHECK-NEXT: %[[NC0:.*]] = sdy.named_computation<"foo">(%[[CONST1]]) (%arg0: tensor<8x16xf32>) {
   // CHECK-NEXT:   %[[CONST3:.*]] = sdy.constant dense<1.000000e+00> : tensor<8x16xf32>
-  // CHECK-NEXT:   %[[ADD0:.*]] = stablehlo.add %arg0, %[[CONST2]] : tensor<8x16xf32>
-  // CHECK-NEXT:   %[[ADD1:.*]] = stablehlo.add %arg0, %[[CONST3]] : tensor<8x16xf32>
-  // CHECK-NEXT:   %[[MULTIPLY:.*]] = stablehlo.multiply %[[ADD0]], %[[ADD1]] : tensor<8x16xf32>
-  // CHECK-NEXT:   sdy.return %[[MULTIPLY]] : tensor<8x16xf32>
+  // CHECK-NEXT:   %[[CONST4:.*]] = sdy.constant dense<1.000000e+00> : tensor<8x16xf32>
+  // CHECK-NEXT:   %[[ADD0:.*]] = stablehlo.add %arg0, %[[CONST3]] : tensor<8x16xf32>
+  // CHECK-NEXT:   %[[ADD1:.*]] = stablehlo.add %arg0, %[[CONST4]] : tensor<8x16xf32>
+  // CHECK-NEXT:   %[[MULTIPLY0:.*]] = stablehlo.multiply %[[ADD0]], %[[ADD1]] : tensor<8x16xf32>
+  // CHECK-NEXT:   sdy.return %[[MULTIPLY0]] : tensor<8x16xf32>
   // CHECK-NEXT: } : (tensor<8x16xf32>) -> tensor<8x16xf32>
-  // CHECK-NEXT: %[[NEGATE:.*]] = stablehlo.negate %[[NC]] : tensor<8x16xf32>
-  // CHECK-NEXT: return %[[CONST1]], %[[NC]], %[[NEGATE]] : tensor<8x16xf32>, tensor<8x16xf32>, tensor<8x16xf32>
-  // TODO(enver): The named computation should be splitted as well.
+  // CHECK-NEXT: %[[NC1:.*]] = sdy.named_computation<"foo">(%[[CONST2]]) (%arg0: tensor<8x16xf32>) {
+  // CHECK-NEXT:   %[[CONST5:.*]] = sdy.constant dense<1.000000e+00> : tensor<8x16xf32>
+  // CHECK-NEXT:   %[[CONST6:.*]] = sdy.constant dense<1.000000e+00> : tensor<8x16xf32>
+  // CHECK-NEXT:   %[[ADD2:.*]] = stablehlo.add %arg0, %[[CONST5]] : tensor<8x16xf32>
+  // CHECK-NEXT:   %[[ADD3:.*]] = stablehlo.add %arg0, %[[CONST6]] : tensor<8x16xf32>
+  // CHECK-NEXT:   %[[MULTIPLY1:.*]] = stablehlo.multiply %[[ADD2]], %[[ADD3]] : tensor<8x16xf32>
+  // CHECK-NEXT:   sdy.return %[[MULTIPLY1]] : tensor<8x16xf32>
+  // CHECK-NEXT: } : (tensor<8x16xf32>) -> tensor<8x16xf32>
+  // CHECK-NEXT: %[[NEGATE:.*]] = stablehlo.negate %[[NC1]] : tensor<8x16xf32>
+  // CHECK-NEXT: return %[[CONST0]], %[[NC0]], %[[NEGATE]] : tensor<8x16xf32>, tensor<8x16xf32>, tensor<8x16xf32>
   %0 = stablehlo.constant dense<1.000000e+00> : tensor<8x16xf32>
   %1 = sdy.named_computation<"foo">(%0) (%arg0: tensor<8x16xf32>) {
     %2 = stablehlo.constant dense<1.000000e+00> : tensor<8x16xf32>