facebookincubator
diff --git a/‎axiom/optimizer/Optimization.cpp‎
Lines changed: 495 additions & 0 deletions b/‎axiom/optimizer/Optimization.cpp‎
Lines changed: 495 additions & 0 deletions
diff --git a/‎axiom/optimizer/Optimization.h‎
Lines changed: 10 additions & 0 deletions b/‎axiom/optimizer/Optimization.h‎
Lines changed: 10 additions & 0 deletions
diff --git a/‎axiom/optimizer/OptimizerOptions.h‎
Lines changed: 7 additions & 0 deletions b/‎axiom/optimizer/OptimizerOptions.h‎
Lines changed: 7 additions & 0 deletions
diff --git a/‎axiom/optimizer/RelationOp.cpp‎
Lines changed: 37 additions & 12 deletions b/‎axiom/optimizer/RelationOp.cpp‎
Lines changed: 37 additions & 12 deletions
diff --git a/‎axiom/optimizer/RelationOp.h‎
Lines changed: 6 additions & 1 deletion b/‎axiom/optimizer/RelationOp.h‎
Lines changed: 6 additions & 1 deletion
diff --git a/‎axiom/optimizer/Schema.cpp‎
Lines changed: 24 additions & 10 deletions b/‎axiom/optimizer/Schema.cpp‎
Lines changed: 24 additions & 10 deletions
diff --git a/‎axiom/optimizer/Schema.h‎
Lines changed: 7 additions & 3 deletions b/‎axiom/optimizer/Schema.h‎
Lines changed: 7 additions & 3 deletions
diff --git a/‎axiom/optimizer/ToVelox.cpp‎
Lines changed: 27 additions & 0 deletions b/‎axiom/optimizer/ToVelox.cpp‎
Lines changed: 27 additions & 0 deletions
diff --git a/‎axiom/optimizer/ToVelox.h‎
Lines changed: 7 additions & 0 deletions b/‎axiom/optimizer/ToVelox.h‎
Lines changed: 7 additions & 0 deletions
diff --git a/‎axiom/optimizer/tests/CMakeLists.txt‎
Lines changed: 1 addition & 0 deletions b/‎axiom/optimizer/tests/CMakeLists.txt‎
Lines changed: 1 addition & 0 deletions
@@ -313,6 +313,16 @@ class Optimization {
       PlanState& state,
       std::vector<NextJoin>& toTry);
 
+  // Adds 'candidate' on top of 'plan' as a merge join. Checks if the left
+  // input (plan) is partitioned and ordered, and if join keys match the
+  // ordering. Prepares the right side with appropriate partitioning and
+  // ordering, adding shuffle and sort operators as needed.
+  void joinByMerge(
+      const RelationOpPtr& plan,
+      const JoinCandidate& candidate,
+      PlanState& state,
+      std::vector<NextJoin>& toTry);
+
   void crossJoin(
       const RelationOpPtr& plan,
       const JoinCandidate& candidate,
 
@@ -75,6 +75,13 @@ struct OptimizerOptions {
   /// partial + final or not.
   bool alwaysPlanPartialAggregation = false;
 
+  /// For testing: control merge join behavior.
+  /// - std::nullopt (default): normal cost-based selection among all join types
+  /// - true: prefer merge joins - return immediately if joinByMerge produces a
+  ///   candidate
+  /// - false: disable merge joins - skip calling joinByMerge
+  std::optional<bool> testingUseMergeJoin{std::nullopt};
+
   bool isMapAsStruct(std::string_view table, std::string_view column) const {
     if (allMapsAsStruct) {
       return true;
 
@@ -403,14 +403,16 @@ Join::Join(
     float fanout,
     float innerFanout,
     ColumnVector columns,
-    PlanState& state)
+    PlanState& state,
+    ExprVector discreteJoinFilterExprs)
     : RelationOp{RelType::kJoin, std::move(lhs), std::move(columns)},
       method{method},
       joinType{joinType},
       right{std::move(rhs)},
       leftKeys{std::move(lhsKeys)},
       rightKeys{std::move(rhsKeys)},
-      filter{std::move(filterExprs)} {
+      filter{std::move(filterExprs)},
+      discreteJoinFilter{std::move(discreteJoinFilterExprs)} {
   cost_.inputCardinality = inputCardinality();
 
   // Determine optionality for each side
@@ -471,18 +473,24 @@ Join::Join(
     }
   }
 
-  const float buildSize = right->resultCardinality();
-  const auto numKeys = leftKeys.size();
-  const auto probeCost = Costs::hashTableCost(buildSize) +
-      // Multiply by min(fanout, 1) because most misses will not compare and if
-      // fanout > 1, there is still only one compare.
-      (Costs::kKeyCompareCost * numKeys * std::min<float>(1, cost_.fanout)) +
-      numKeys * Costs::kHashColumnCost;
+  // Compute join cost based on method
+  if (method == JoinMethod::kMerge) {
+    setMergeJoinCost();
+  } else {
+    // Hash join costing
+    const float buildSize = right->resultCardinality();
+    const auto numKeys = leftKeys.size();
+    const auto probeCost = Costs::hashTableCost(buildSize) +
+        // Multiply by min(fanout, 1) because most misses will not compare and
+        // if fanout > 1, there is still only one compare.
+        (Costs::kKeyCompareCost * numKeys * std::min<float>(1, cost_.fanout)) +
+        numKeys * Costs::kHashColumnCost;
 
-  const auto rowBytes = byteSize(right->columns());
-  const auto rowCost = Costs::hashRowCost(buildSize, rowBytes);
+    const auto rowBytes = byteSize(right->columns());
+    const auto rowCost = Costs::hashRowCost(buildSize, rowBytes);
 
-  cost_.unitCost = probeCost + cost_.fanout * rowCost;
+    cost_.unitCost = probeCost + cost_.fanout * rowCost;
+  }
 
   // Add constraints for non-key columns from the optional side of an outer join
   if (leftOptional || rightOptional) {
@@ -532,6 +540,23 @@ Join::Join(
   }
 }
 
+void Join::setMergeJoinCost() {
+  const auto numKeys = leftKeys.size();
+
+  // Get right side columns for byte size calculation
+  const auto rightSideColumns = right->columns();
+  const auto rightSideBytes = byteSize(rightSideColumns);
+  const auto numRightSideColumns = rightSideColumns.size();
+
+  // Merge join cost formula:
+  // 3 * key compare cost * number of keys * min(1, fanout) +
+  // byteSize(rightSideColumns) +
+  // kHashExtractColumnCost * numRightSideColumns
+  cost_.unitCost =
+      3 * Costs::kKeyCompareCost * numKeys * std::min<float>(1, cost_.fanout) +
+      rightSideBytes + Costs::kHashExtractColumnCost * numRightSideColumns;
+}
+
 namespace {
 std::pair<std::string, std::string> joinKeysString(
     const ExprVector& left,
 
@@ -491,7 +491,8 @@ struct Join : public RelationOp {
       float fanout,
       float innerFanout, // The fanout if this were an inner join
       ColumnVector columns,
-      PlanState& state);
+      PlanState& state,
+      ExprVector discreteJoinFilter = {});
 
   static Join* makeCrossJoin(
       RelationOpPtr input,
@@ -505,6 +506,7 @@ struct Join : public RelationOp {
   const ExprVector leftKeys;
   const ExprVector rightKeys;
   const ExprVector filter;
+  const ExprVector discreteJoinFilter;
 
   const QGString& historyKey() const override;
 
@@ -513,6 +515,9 @@ struct Join : public RelationOp {
   void accept(
       const RelationOpVisitor& visitor,
       RelationOpVisitorContext& context) const override;
+
+ private:
+  void setMergeJoinCost();
 };
 
 using JoinCP = const Join*;
 
@@ -101,10 +101,15 @@ std::string Value::toString() const {
 ColumnGroupCP SchemaTable::addIndex(
     const connector::TableLayout& layout,
     Distribution distribution,
-    ColumnVector columns) {
+    ColumnVector columns,
+    ColumnVector lookupColumns) {
   return columnGroups.emplace_back(
       make<ColumnGroup>(
-          *this, layout, std::move(distribution), std::move(columns)));
+          *this,
+          layout,
+          std::move(distribution),
+          std::move(columns),
+          std::move(lookupColumns)));
 }
 
 ColumnCP SchemaTable::findColumn(Name name) const {
@@ -187,7 +192,15 @@ SchemaTableCP Schema::findTable(
 
     ColumnVector columns;
     appendColumns(layout->columns(), columns);
-    schemaTable->addIndex(*layout, std::move(distribution), std::move(columns));
+
+    ColumnVector lookupColumns;
+    appendColumns(layout->lookupKeys(), lookupColumns);
+
+    schemaTable->addIndex(
+        *layout,
+        std::move(distribution),
+        std::move(columns),
+        std::move(lookupColumns));
   }
   table = {std::move(connectorTable), schemaTable};
   return schemaTable;
@@ -281,26 +294,27 @@ IndexInfo SchemaTable::indexInfo(
 
   const auto& distribution = index->distribution;
 
-  const auto numSorting = distribution.orderTypes.size();
+  const auto numLookupKeys = index->lookupColumns.size();
   const auto numUnique = distribution.numKeysUnique;
 
   PlanObjectSet covered;
-  for (auto i = 0; i < numSorting || i < numUnique; ++i) {
-    auto orderKey = distribution.orderKeys[i];
-    auto part = findColumnByName(columnsSpan, orderKey->as<Column>()->name());
+  for (auto i = 0; i < numLookupKeys || i < numUnique; ++i) {
+    ExprCP lookupKey =
+        i < numLookupKeys ? index->lookupColumns[i] : distribution.orderKeys[i];
+    auto part = findColumnByName(columnsSpan, lookupKey->as<Column>()->name());
     if (!part) {
       break;
     }
 
     covered.add(part);
-    if (i < numSorting) {
+    if (i < numLookupKeys) {
       info.scanCardinality =
-          combine(info.scanCardinality, i, orderKey->value().cardinality);
+          combine(info.scanCardinality, i, lookupKey->value().cardinality);
       info.lookupKeys.push_back(part);
       info.joinCardinality = info.scanCardinality;
     } else {
       info.joinCardinality =
-          combine(info.joinCardinality, i, orderKey->value().cardinality);
+          combine(info.joinCardinality, i, lookupKey->value().cardinality);
     }
     if (i == numUnique - 1) {
       info.unique = true;
 
@@ -231,16 +231,19 @@ struct ColumnGroup {
       const SchemaTable& table,
       const connector::TableLayout& layout,
       Distribution distribution,
-      ColumnVector columns)
+      ColumnVector columns,
+      ColumnVector lookupColumns)
       : table{&table},
         layout{&layout},
         distribution{std::move(distribution)},
-        columns{std::move(columns)} {}
+        columns{std::move(columns)},
+        lookupColumns{std::move(lookupColumns)} {}
 
   SchemaTableCP table;
   const connector::TableLayout* layout;
   const Distribution distribution;
   const ColumnVector columns;
+  const ColumnVector lookupColumns;
 
   /// Returns cost of next lookup when the hit is within 'range' rows
   /// of the previous hit. If lookups are not batched or not ordered,
@@ -302,7 +305,8 @@ struct SchemaTable {
   ColumnGroupCP addIndex(
       const connector::TableLayout& layout,
       Distribution distribution,
-      ColumnVector columns);
+      ColumnVector columns,
+      ColumnVector lookupColumns);
 
   ColumnCP findColumn(Name name) const;
 
 
@@ -1112,6 +1112,10 @@ velox::core::PlanNodePtr ToVelox::makeJoin(
         nextId(), toAnd(join.filter), joinNode);
   }
 
+  if (join.method == JoinMethod::kMerge) {
+    return makeMergeJoin(join, fragment, stages, left, right);
+  }
+
   auto leftKeys = toFieldRefs(join.leftKeys);
   auto rightKeys = toFieldRefs(join.rightKeys);
 
@@ -1130,6 +1134,29 @@ velox::core::PlanNodePtr ToVelox::makeJoin(
   return joinNode;
 }
 
+velox::core::PlanNodePtr ToVelox::makeMergeJoin(
+    const Join& join,
+    runner::ExecutableFragment& fragment,
+    std::vector<runner::ExecutableFragment>& stages,
+    velox::core::PlanNodePtr left,
+    velox::core::PlanNodePtr right) {
+  auto leftKeys = toFieldRefs(join.leftKeys);
+  auto rightKeys = toFieldRefs(join.rightKeys);
+
+  auto joinNode = std::make_shared<velox::core::MergeJoinNode>(
+      nextId(),
+      join.joinType,
+      leftKeys,
+      rightKeys,
+      toAnd(join.filter),
+      left,
+      right,
+      makeOutputType(join.columns()));
+
+  makePredictionAndHistory(joinNode->id(), &join);
+  return joinNode;
+}
+
 velox::core::PlanNodePtr ToVelox::makeUnnest(
     const Unnest& op,
     runner::ExecutableFragment& fragment,
 
@@ -179,6 +179,13 @@ class ToVelox {
       runner::ExecutableFragment& fragment,
       std::vector<runner::ExecutableFragment>& stages);
 
+  velox::core::PlanNodePtr makeMergeJoin(
+      const Join& join,
+      runner::ExecutableFragment& fragment,
+      std::vector<runner::ExecutableFragment>& stages,
+      velox::core::PlanNodePtr left,
+      velox::core::PlanNodePtr right);
+
   velox::core::PlanNodePtr makeRepartition(
       const Repartition& repartition,
       runner::ExecutableFragment& fragment,
 
@@ -120,6 +120,7 @@ add_executable(
   HiveLimitQueriesTest.cpp
   HiveQueriesTest.cpp
   JoinTest.cpp
+  OrderedOpsTest.cpp
   ParquetTpchTest.cpp
   PrecomputeProjectionTest.cpp
   PlanTest.cpp