Sink func data flow edges for funcs and calls.

ekayaaslan · copybara-github · commit 7cd90987dab5 · 2026-04-25T02:12:29.000-07:00
Drop enableNativeNonFlatSupport flag for sinking.

It does not impact prod as the prod does not contain func data flow edges yet. It is behind flag enableNativeNonFlatSupport.

PiperOrigin-RevId: 902646126
diff --git a/shardy/dialect/sdy/transforms/export/export_pipeline.cc b/shardy/dialect/sdy/transforms/export/export_pipeline.cc
@@ -76,11 +76,10 @@ void addExportPipeline(OpPassManager& pm, int& dumpIndex,
     pm.addPass(createRemoveShardingGroupsPass());
     pm.addNestedPass<func::FuncOp>(createShardingConstraintToReshardPass());
   }
-  pm.addNestedPass<
-      func::FuncOp>(createSinkDataFlowEdgesPass(SinkDataFlowEdgesPassOptions{
-      /*sinkDebugShardingOrigins=*/options.dumpShardingOrigins,
-      /*sinkDebugPropagationEdgeSharding=*/options.dumpPropagationEdges,
-      /*sinkEnableNativeNonFlatSupport=*/options.enableNativeNonFlatSupport}));
+  pm.addNestedPass<func::FuncOp>(
+      createSinkDataFlowEdgesPass(SinkDataFlowEdgesPassOptions{
+          /*sinkDebugShardingOrigins=*/options.dumpShardingOrigins,
+          /*sinkDebugPropagationEdgeSharding=*/options.dumpPropagationEdges}));
   if (options.updateNonDivisibleInputOutputShardings) {
     pm.addPass(createUpdateNonDivisibleInputOutputShardingsPass());
     pm.addPass(createRemoveSubAxesInInputOutputShardingsPass());
diff --git a/shardy/dialect/sdy/transforms/export/passes.h b/shardy/dialect/sdy/transforms/export/passes.h
@@ -86,13 +86,6 @@ struct ExportOptions : public PassPipelineOptions<ExportOptions> {
       *this, "update-non-divisible-input-output-shardings",
       llvm::cl::desc("Update axes with non-divisible input/output shardings."),
       llvm::cl::init(true)};
-
-  Option<bool> enableNativeNonFlatSupport{
-      *this, "enable-native-non-flat-support",
-      llvm::cl::desc("Whether to propagate shardings directly on a non-flat "
-                     "graph without flattening it. The default is false, "
-                     "meaning it will flatten the graph and then propagate."),
-      llvm::cl::init(false)};
 };
 
 // Adds a sequence of export passes needed as a post-processing step for SDY
diff --git a/shardy/dialect/sdy/transforms/export/passes.td b/shardy/dialect/sdy/transforms/export/passes.td
@@ -40,11 +40,6 @@ def SinkDataFlowEdgesPass : Pass<"sdy-sink-data-flow-edges", "func::FuncOp"> {
            "Whether to sink the debug propagation edge sharding info. See "
            "`debug-propagation-edge-sharding` option in propagation for more "
            "info.">,
-    Option<"enableNativeNonFlatSupport", "enable-native-non-flat-support", "bool",
-           /*default=*/"false",
-           "Whether to propagate shardings directly on a non-flat graph without "
-           "flattening it. The default is false, meaning it will flatten the "
-           "graph and then propagate.">
   ];
 }
 
diff --git a/shardy/dialect/sdy/transforms/export/sink_data_flow_edges.cc b/shardy/dialect/sdy/transforms/export/sink_data_flow_edges.cc
@@ -64,21 +64,23 @@ struct SinkDataFlowEdgesPass
       if (isa<DataFlowEdgeOp>(op)) {
         DataFlowEdgeOp dataFlowEdgeOp = cast<DataFlowEdgeOp>(op);
         Value input = dataFlowEdgeOp.getInput();
-        // TODO(enver): Drop enableNativeNonFlatSupport check and assume func
-        // arguments do not have data flow edges in the first place.
-        if (enableNativeNonFlatSupport) {
-          if (func::FuncOp funcOp =
-                  dyn_cast<func::FuncOp>(getOwningOp(input))) {
-            if (TensorShardingAttr sharding = dataFlowEdgeOp.getShardingAttr();
-                sharding) {
-              funcOp.setArgAttr(cast<BlockArgument>(input).getArgNumber(),
-                                kShardingAttr, sharding);
-            }
-          }
-        }
         rewriter.replaceOp(dataFlowEdgeOp, input);
         return WalkResult::skip();
       }
+      if (isa<FuncDataFlowEdgeOp>(op)) {
+        FuncDataFlowEdgeOp funcEdgeOp = cast<FuncDataFlowEdgeOp>(op);
+        Value operand = funcEdgeOp.getOperand();
+        Value result = funcEdgeOp.getResult();
+        TensorShardingAttr operandSharding = getSharding(operand);
+        if (TensorShardingAttr sharding = getSharding(result)) {
+          setSharding(operand, sharding);
+        } else if (operandSharding) {
+          setSharding(operand,
+                      TensorShardingAttr::getFullyOpenLike(operandSharding));
+        }
+        rewriter.replaceOp(funcEdgeOp, operand);
+        return WalkResult::skip();
+      }
       auto shardableDataFlowOp = dyn_cast<ShardableDataFlowOpInterface>(op);
       if (!shardableDataFlowOp) {
         return WalkResult::advance();
diff --git a/shardy/dialect/sdy/transforms/export/test/sink_data_flow_edges.mlir b/shardy/dialect/sdy/transforms/export/test/sink_data_flow_edges.mlir
@@ -1,4 +1,4 @@
-// RUN: sdy_opt %s -sdy-sink-data-flow-edges | FileCheck %s
+// RUN: sdy_opt %s -split-input-file -sdy-sink-data-flow-edges | FileCheck %s
 
 sdy.mesh @mesh = <["a"=2, "b"=2, "c"=2]>
 sdy.mesh @other_mesh = <["c"=4]>
@@ -249,3 +249,202 @@ func.func @manual_computation_origin_debug_info(%arg0: tensor<32x32x32xf32>) ->
   %2 = sdy.data_flow_edge %1 sharding=<@mesh, [{"a", ?}, {"b", ?}, {?}]> {sdy.origin_sharding = {a = "mc_0_input: 0", b = "mc_0_output: 0"}} : tensor<32x32x32xf32>
   return %2 : tensor<32x32x32xf32>
 }
+
+// -----
+
+// CHECK-LABEL: func private @bar(%arg0: tensor<8xf32>)
+func.func private @bar(%arg0: tensor<8xf32>) -> tensor<8xf32> {
+  // CHECK-NEXT: %[[NEGATE:.*]] = stablehlo.negate %arg0
+  // CHECK-NEXT: return %[[NEGATE]]
+  %0 = sdy.func_data_flow_edge %arg0 : tensor<8xf32>
+  %1 = stablehlo.negate %0: tensor<8xf32>
+  return %1 : tensor<8xf32>
+}
+
+// CHECK-LABEL: func @simple_call_graph_on_func_with_single_argument(%arg0: tensor<8xf32>)
+func.func @simple_call_graph_on_func_with_single_argument(%arg0: tensor<8xf32>) -> tensor<8xf32> {
+  // CHECK-NEXT: %[[ABS0:.*]] = stablehlo.abs %arg0
+  // CHECK-NEXT: %[[CALL:.*]] = call @bar(%[[ABS0]])
+  // CHECK-NEXT: %[[ABS1:.*]] = stablehlo.abs %[[CALL]]
+  // CHECK-NEXT: return %[[ABS1]]
+  %0 = stablehlo.abs %arg0 : tensor<8xf32>
+  %1 = call @bar(%0) : (tensor<8xf32>) -> (tensor<8xf32>)
+  %2 = sdy.func_data_flow_edge %1 : tensor<8xf32>
+  %3 = stablehlo.abs %2 : tensor<8xf32>
+  return %3 : tensor<8xf32>
+}
+
+// -----
+
+// CHECK-LABEL: @bar(%arg0: tensor<8xf32>)
+func.func private @bar(%arg0: tensor<8xf32>) -> tensor<8xf32> {
+  // CHECK-NEXT: %[[NEGATE:.*]] = stablehlo.negate %arg0
+  // CHECK-NEXT: return %[[NEGATE]]
+  %0 = sdy.func_data_flow_edge %arg0 : tensor<8xf32>
+  %1 = stablehlo.negate %0: tensor<8xf32>
+  return %1 : tensor<8xf32>
+}
+
+// CHECK-LABEL: @multiple_calls_on_same_func(%arg0: tensor<8xf32>)
+func.func @multiple_calls_on_same_func(%arg0: tensor<8xf32>) -> tensor<8xf32> {
+  // CHECK-NEXT: %[[ABS0:.*]] = stablehlo.abs %arg0
+  // CHECK-NEXT: %[[CALL0:.*]] = call @bar(%[[ABS0]])
+  // CHECK-NEXT: %[[ABS1:.*]] = stablehlo.abs %[[CALL0]]
+  // CHECK-NEXT: %[[CALL1:.*]] = call @bar(%[[ABS1]])
+  // CHECK-NEXT: %[[ABS2:.*]] = stablehlo.abs %[[CALL1]]
+  // CHECK-NEXT: return %[[ABS2]]
+  %0 = stablehlo.abs %arg0 : tensor<8xf32>
+  %1 = call @bar(%0) : (tensor<8xf32>) -> (tensor<8xf32>)
+  %2 = sdy.func_data_flow_edge %1 : tensor<8xf32>
+  %3 = stablehlo.abs %2 : tensor<8xf32>
+  %4 = call @bar(%3) : (tensor<8xf32>) -> (tensor<8xf32>)
+  %5 = sdy.func_data_flow_edge %4 : tensor<8xf32>
+  %6 = stablehlo.abs %5 : tensor<8xf32>
+  return %6 : tensor<8xf32>
+}
+
+// -----
+
+// CHECK-LABEL: @bar(%arg0: tensor<8xf32>, %arg1: tensor<8xf32>)
+func.func private @bar(%arg0: tensor<8xf32>, %arg1: tensor<8xf32>) -> tensor<8xf32> {
+  // CHECK-NEXT: %[[ADD:.*]] = stablehlo.add %arg0, %arg1
+  // CHECK-NEXT: return %[[ADD]]
+  %0 = sdy.func_data_flow_edge %arg0 : tensor<8xf32>
+  %1 = sdy.func_data_flow_edge %arg1 : tensor<8xf32>
+  %2 = stablehlo.add %0, %1: tensor<8xf32>
+  return %2 : tensor<8xf32>
+}
+
+// CHECK-LABEL: @simple_call_graph_on_func_with_multiple_argument(%arg0: tensor<8xf32>)
+func.func @simple_call_graph_on_func_with_multiple_argument(%arg0: tensor<8xf32>) -> tensor<8xf32> {
+  // CHECK-NEXT: %[[ABS0:.*]] = stablehlo.abs %arg0
+  // CHECK-NEXT: %[[ABS1:.*]] = stablehlo.abs %arg0
+  // CHECK-NEXT: %[[CALL:.*]] = call @bar(%[[ABS0]], %[[ABS1]])
+  // CHECK-NEXT: %[[ABS2:.*]] = stablehlo.abs %[[CALL]]
+  // CHECK-NEXT: return %[[ABS2]]
+  %0 = stablehlo.abs %arg0 : tensor<8xf32>
+  %1 = stablehlo.abs %arg0 : tensor<8xf32>
+  %2 = call @bar(%0, %1) : (tensor<8xf32>, tensor<8xf32>) -> (tensor<8xf32>)
+  %3 = sdy.func_data_flow_edge %2 : tensor<8xf32>
+  %4 = stablehlo.abs %3 : tensor<8xf32>
+  return %4 : tensor<8xf32>
+}
+
+// -----
+
+// CHECK-LABEL: @bar(%arg0: tensor<8xf32>, %arg1: tensor<8xf32>)
+func.func private @bar(%arg0: tensor<8xf32>, %arg1: tensor<8xf32>) -> tensor<8xf32> {
+  // CHECK-NEXT: %[[ADD:.*]] = stablehlo.add %arg0, %arg1
+  // CHECK-NEXT: return %[[ADD]]
+  %0 = sdy.func_data_flow_edge %arg0 : tensor<8xf32>
+  %1 = sdy.func_data_flow_edge %arg1 : tensor<8xf32>
+  %2 = stablehlo.add %0, %1: tensor<8xf32>
+  return %2 : tensor<8xf32>
+}
+
+// CHECK-LABEL: @simple_call_graph_on_func_with_multiple_argument_same_operand(%arg0: tensor<8xf32>)
+func.func @simple_call_graph_on_func_with_multiple_argument_same_operand(%arg0: tensor<8xf32>) -> tensor<8xf32> {
+  // CHECK-NEXT: %[[ABS0:.*]] = stablehlo.abs %arg0
+  // CHECK-NEXT: %[[CALL:.*]] = call @bar(%[[ABS0]], %[[ABS0]])
+  // CHECK-NEXT: %[[ABS1:.*]] = stablehlo.abs %[[CALL]]
+  // CHECK-NEXT: return %[[ABS1]]
+  %0 = stablehlo.abs %arg0 : tensor<8xf32>
+  %1 = call @bar(%0, %0) : (tensor<8xf32>, tensor<8xf32>) -> (tensor<8xf32>)
+  %2 = sdy.func_data_flow_edge %1 : tensor<8xf32>
+  %3 = stablehlo.abs %2 : tensor<8xf32>
+  return %3 : tensor<8xf32>
+}
+
+// -----
+
+sdy.mesh @mesh = <["a"=2]>
+
+// CHECK-LABEL: func private @bar(%arg0: tensor<8xf32> {sdy.sharding = #sdy.sharding<@mesh, [{"a"}]>})
+func.func private @bar(%arg0: tensor<8xf32>) -> tensor<8xf32> {
+  // CHECK-NEXT: %[[NEGATE:.*]] = stablehlo.negate %arg0
+  // CHECK-NEXT: return %[[NEGATE]]
+  %0 = sdy.func_data_flow_edge %arg0 {sdy.sharding = #sdy.sharding_per_value<[<@mesh, [{"a"}]>]>} : tensor<8xf32>
+  %1 = stablehlo.negate %0: tensor<8xf32>
+  return %1 : tensor<8xf32>
+}
+
+// CHECK-LABEL: func @simple_call_graph_on_func_with_sharded_argument(%arg0: tensor<8xf32>)
+func.func @simple_call_graph_on_func_with_sharded_argument(%arg0: tensor<8xf32>) -> tensor<8xf32> {
+  // CHECK-NEXT: %[[ABS0:.*]] = stablehlo.abs %arg0
+  // CHECK-NEXT: %[[CALL:.*]] = call @bar(%[[ABS0]]) {sdy.sharding = #sdy.sharding_per_value<[<@mesh, [{"a"}]>]>}
+  // CHECK-NEXT: %[[ABS1:.*]] = stablehlo.abs %[[CALL]]
+  // CHECK-NEXT: %[[ABS2:.*]] = stablehlo.abs %[[CALL]]
+  // CHECK-NEXT: return %[[ABS1]]
+  %0 = stablehlo.abs %arg0 : tensor<8xf32>
+  %1 = call @bar(%0) : (tensor<8xf32>) -> (tensor<8xf32>)
+  %2 = sdy.func_data_flow_edge %1 {sdy.sharding = #sdy.sharding_per_value<[<@mesh, [{"a"}]>]>} : tensor<8xf32>
+  %3 = stablehlo.abs %2 : tensor<8xf32>
+  %4 = stablehlo.abs %2 : tensor<8xf32>
+  return %3 : tensor<8xf32>
+}
+
+// -----
+
+sdy.mesh @mesh = <["a"=2]>
+
+// CHECK-LABEL: func private @bar(%arg0: tensor<8xf32> {sdy.sharding = #sdy.sharding<@mesh, [{"a"}]>})
+func.func private @bar(%arg0: tensor<8xf32>) -> tensor<8xf32> {
+  // CHECK-NEXT: %[[NEGATE:.*]] = stablehlo.negate %arg0
+  // CHECK-NEXT: return %[[NEGATE]]
+  %0 = sdy.func_data_flow_edge %arg0 {sdy.sharding = #sdy.sharding_per_value<[<@mesh, [{"a"}]>]>} : tensor<8xf32>
+  %1 = stablehlo.negate %0: tensor<8xf32>
+  return %1 : tensor<8xf32>
+}
+
+// CHECK-LABEL: func @func_data_flow_edge_has_sharding_call_does_not(%arg0: tensor<8xf32>)
+func.func @func_data_flow_edge_has_sharding_call_does_not(%arg0: tensor<8xf32>) -> tensor<8xf32> {
+  // CHECK-NEXT: %[[ABS0:.*]] = stablehlo.abs %arg0
+  // CHECK-NEXT: %[[CALL:.*]] = call @bar(%[[ABS0]]) {sdy.sharding = #sdy.sharding_per_value<[<@mesh, [{?}]>]>}
+  // CHECK-NEXT: %[[ABS1:.*]] = stablehlo.abs %[[CALL]]
+  // CHECK-NEXT: %[[ABS2:.*]] = stablehlo.abs %[[CALL]]
+  // CHECK-NEXT: return %[[ABS1]]
+  %0 = stablehlo.abs %arg0 : tensor<8xf32>
+  %1 = call @bar(%0) {sdy.sharding = #sdy.sharding_per_value<[<@mesh, [{"a"}]>]>} : (tensor<8xf32>) -> (tensor<8xf32>)
+  %2 = sdy.func_data_flow_edge %1 : tensor<8xf32>
+  %3 = stablehlo.abs %2 : tensor<8xf32>
+  %4 = stablehlo.abs %2 : tensor<8xf32>
+  return %3 : tensor<8xf32>
+}
+
+// -----
+
+sdy.mesh @mesh = <["a"=2]>
+
+// CHECK-LABEL: func private @bar(%arg0: tensor<8xf32> {sdy.sharding = #sdy.sharding<@mesh, [{"a"}]>})
+func.func private @bar(%arg0: tensor<8xf32>) -> tensor<8xf32> {
+  // CHECK-NEXT: %[[NEGATE:.*]] = stablehlo.negate %arg0
+  // CHECK-NEXT: return %[[NEGATE]]
+  %0 = sdy.func_data_flow_edge %arg0 {sdy.sharding = #sdy.sharding_per_value<[<@mesh, [{"a"}]>]>} : tensor<8xf32>
+  %1 = stablehlo.negate %0: tensor<8xf32>
+  return %1 : tensor<8xf32>
+}
+
+// CHECK-LABEL: func private @foo(%arg0: tensor<8xf32> {sdy.sharding = #sdy.sharding<@mesh, [{"a"}]>})
+func.func private @foo(%arg0: tensor<8xf32>) -> tensor<8xf32> {
+  // CHECK-NEXT: %[[CALL:.*]] = call @bar(%arg0) {sdy.sharding = #sdy.sharding_per_value<[<@mesh, [{?}]>]>}
+  // CHECK-NEXT: %[[ABS:.*]] = stablehlo.abs %[[CALL]]
+  // CHECK-NEXT: return %[[ABS]]
+  %0 = sdy.func_data_flow_edge %arg0 {sdy.sharding = #sdy.sharding_per_value<[<@mesh, [{"a"}]>]>} : tensor<8xf32>
+  %1 = call @bar(%0) {sdy.sharding = #sdy.sharding_per_value<[<@mesh, [{"a"}]>]>} : (tensor<8xf32>) -> (tensor<8xf32>)
+  %2 = sdy.func_data_flow_edge %1 : tensor<8xf32>
+  %3 = stablehlo.abs %2 : tensor<8xf32>
+  return %3 : tensor<8xf32>
+}
+
+// CHECK-LABEL: func @main_calls_foo_calls_bar(%arg0: tensor<8xf32>)
+func.func @main_calls_foo_calls_bar(%arg0: tensor<8xf32>) -> tensor<8xf32> {
+  // CHECK-NEXT: %[[ABS0:.*]] = stablehlo.abs %arg0
+  // CHECK-NEXT: %[[CALL:.*]] = call @foo(%[[ABS0]]) {sdy.sharding = #sdy.sharding_per_value<[<@mesh, [{"a"}]>]>}
+  // CHECK-NEXT: %[[ABS1:.*]] = stablehlo.abs %[[CALL]]
+  // CHECK-NEXT: return %[[ABS1]]
+  %0 = stablehlo.abs %arg0 : tensor<8xf32>
+  %1 = call @foo(%0) : (tensor<8xf32>) -> (tensor<8xf32>)
+  %2 = sdy.func_data_flow_edge %1 {sdy.sharding = #sdy.sharding_per_value<[<@mesh, [{"a"}]>]>} : tensor<8xf32>
+  %3 = stablehlo.abs %2 : tensor<8xf32>
+  return %3 : tensor<8xf32>
+}
diff --git a/shardy/dialect/sdy/transforms/export/test/sink_data_flow_edges_enable_native_non_flat_support.mlir b/shardy/dialect/sdy/transforms/export/test/sink_data_flow_edges_enable_native_non_flat_support.mlir
diff --git a/shardy/dialect/sdy/transforms/propagation/propagation_pipeline.cc b/shardy/dialect/sdy/transforms/propagation/propagation_pipeline.cc
@@ -46,7 +46,6 @@ void populateExportOptions(ExportOptions& options,
   options.avoidReshardsOnCalls = propOptions.avoidReshardsOnNamedComputations;
   options.updateNonDivisibleInputOutputShardings =
       propOptions.updateNonDivisibleInputOutputShardings;
-  options.enableNativeNonFlatSupport = propOptions.enableNativeNonFlatSupport;
 }
 
 }  // namespace

Original file line number	Diff line number	Diff line change
`@@ -46,7 +46,6 @@ void populateExportOptions(ExportOptions& options,`
`46`	`46`	`options.avoidReshardsOnCalls = propOptions.avoidReshardsOnNamedComputations;`
`47`	`47`	`options.updateNonDivisibleInputOutputShardings =`
`48`	`48`	`propOptions.updateNonDivisibleInputOutputShardings;`
`49`		`- options.enableNativeNonFlatSupport = propOptions.enableNativeNonFlatSupport;`
`50`	`49`	`}`
`51`	`50`
`52`	`51`	`} // namespace`