JingsongLi
diff --git a/‎paimon-core/src/main/java/org/apache/paimon/operation/AbstractFileStoreScan.java‎
Lines changed: 6 additions & 0 deletions b/‎paimon-core/src/main/java/org/apache/paimon/operation/AbstractFileStoreScan.java‎
Lines changed: 6 additions & 0 deletions
diff --git a/‎paimon-core/src/main/java/org/apache/paimon/operation/FileStoreScan.java‎
Lines changed: 2 additions & 0 deletions b/‎paimon-core/src/main/java/org/apache/paimon/operation/FileStoreScan.java‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎paimon-core/src/main/java/org/apache/paimon/table/source/DataSplit.java‎
Lines changed: 0 additions & 18 deletions b/‎paimon-core/src/main/java/org/apache/paimon/table/source/DataSplit.java‎
Lines changed: 0 additions & 18 deletions
diff --git a/‎paimon-core/src/main/java/org/apache/paimon/table/source/DataTableBatchScan.java‎
Lines changed: 66 additions & 30 deletions b/‎paimon-core/src/main/java/org/apache/paimon/table/source/DataTableBatchScan.java‎
Lines changed: 66 additions & 30 deletions
diff --git a/‎…/org/apache/paimon/stats/StatsUtils.java‎ ‎…e/paimon/table/source/PushDownUtils.java‎paimon-core/src/main/java/org/apache/paimon/stats/StatsUtils.java renamed to paimon-core/src/main/java/org/apache/paimon/table/source/PushDownUtils.java
Lines changed: 28 additions & 3 deletions b/‎…/org/apache/paimon/stats/StatsUtils.java‎ ‎…e/paimon/table/source/PushDownUtils.java‎paimon-core/src/main/java/org/apache/paimon/stats/StatsUtils.java renamed to paimon-core/src/main/java/org/apache/paimon/table/source/PushDownUtils.java
Lines changed: 28 additions & 3 deletions
@@ -224,6 +224,12 @@ public FileStoreScan dropStats() {
         return this;
     }
 
+    @Override
+    public FileStoreScan keepStats() {
+        this.dropStats = false;
+        return this;
+    }
+
     @Nullable
     @Override
     public Integer parallelism() {
 
@@ -85,6 +85,8 @@ public interface FileStoreScan {
 
     FileStoreScan dropStats();
 
+    FileStoreScan keepStats();
+
     @Nullable
     Integer parallelism();
 
 
@@ -46,16 +46,13 @@
 import java.io.ObjectInputStream;
 import java.io.ObjectOutputStream;
 import java.util.ArrayList;
-import java.util.HashSet;
 import java.util.List;
 import java.util.Objects;
 import java.util.Optional;
 import java.util.OptionalLong;
-import java.util.Set;
 import java.util.stream.Collectors;
 
 import static org.apache.paimon.io.DataFilePathFactory.INDEX_PATH_SUFFIX;
-import static org.apache.paimon.utils.ListUtils.isNullOrEmpty;
 import static org.apache.paimon.utils.Preconditions.checkArgument;
 import static org.apache.paimon.utils.Preconditions.checkState;
 
@@ -158,21 +155,6 @@ public long mergedRowCount() {
         return partialMergedRowCount();
     }
 
-    public boolean statsAvailable(Set<String> columns) {
-        if (isNullOrEmpty(columns)) {
-            return false;
-        }
-
-        return dataFiles.stream()
-                .map(DataFileMeta::valueStatsCols)
-                .allMatch(
-                        valueStatsCols ->
-                                // It means there are all column statistics when valueStatsCols ==
-                                // null
-                                valueStatsCols == null
-                                        || new HashSet<>(valueStatsCols).containsAll(columns));
-    }
-
     public Object minValue(int fieldIndex, DataField dataField, SimpleStatsEvolutions evolutions) {
         Object minValue = null;
         for (DataFileMeta dataFile : dataFiles) {
 
@@ -21,16 +21,21 @@
 import org.apache.paimon.CoreOptions;
 import org.apache.paimon.manifest.PartitionEntry;
 import org.apache.paimon.predicate.Predicate;
+import org.apache.paimon.predicate.SortValue;
 import org.apache.paimon.predicate.TopN;
 import org.apache.paimon.schema.SchemaManager;
 import org.apache.paimon.schema.TableSchema;
 import org.apache.paimon.table.BucketMode;
 import org.apache.paimon.table.source.snapshot.SnapshotReader;
 import org.apache.paimon.table.source.snapshot.StartingScanner;
 import org.apache.paimon.table.source.snapshot.StartingScanner.ScannedResult;
+import org.apache.paimon.types.DataType;
 
 import java.util.ArrayList;
 import java.util.List;
+import java.util.Optional;
+
+import static org.apache.paimon.table.source.PushDownUtils.minmaxAvailable;
 
 /** {@link TableScan} implementation for batch planning. */
 public class DataTableBatchScan extends AbstractDataTableScan {
@@ -93,10 +98,15 @@ public TableScan.Plan plan() {
 
         if (hasNext) {
             hasNext = false;
-            StartingScanner.Result result = startingScanner.scan(snapshotReader);
-            result = applyPushDownLimit(result);
-            result = applyPushDownTopN(result);
-            return DataFilePlan.fromResult(result);
+            Optional<StartingScanner.Result> pushed = applyPushDownLimit();
+            if (pushed.isPresent()) {
+                return DataFilePlan.fromResult(pushed.get());
+            }
+            pushed = applyPushDownTopN();
+            if (pushed.isPresent()) {
+                return DataFilePlan.fromResult(pushed.get());
+            }
+            return DataFilePlan.fromResult(startingScanner.scan(snapshotReader));
         } else {
             throw new EndOfScanException();
         }
@@ -110,51 +120,77 @@ public List<PartitionEntry> listPartitionEntries() {
         return startingScanner.scanPartitions(snapshotReader);
     }
 
-    private StartingScanner.Result applyPushDownLimit(StartingScanner.Result result) {
-        if (pushDownLimit != null && result instanceof ScannedResult) {
-            long scannedRowCount = 0;
-            SnapshotReader.Plan plan = ((ScannedResult) result).plan();
-            List<DataSplit> splits = plan.dataSplits();
-            if (splits.isEmpty()) {
-                return result;
-            }
+    private Optional<StartingScanner.Result> applyPushDownLimit() {
+        if (pushDownLimit == null) {
+            return Optional.empty();
+        }
+
+        StartingScanner.Result result = startingScanner.scan(snapshotReader);
+        if (!(result instanceof ScannedResult)) {
+            return Optional.of(result);
+        }
+
+        long scannedRowCount = 0;
+        SnapshotReader.Plan plan = ((ScannedResult) result).plan();
+        List<DataSplit> splits = plan.dataSplits();
+        if (splits.isEmpty()) {
+            return Optional.of(result);
+        }
 
-            List<Split> limitedSplits = new ArrayList<>();
-            for (DataSplit dataSplit : splits) {
-                if (dataSplit.rawConvertible()) {
-                    long partialMergedRowCount = dataSplit.partialMergedRowCount();
-                    limitedSplits.add(dataSplit);
-                    scannedRowCount += partialMergedRowCount;
-                    if (scannedRowCount >= pushDownLimit) {
-                        SnapshotReader.Plan newPlan =
-                                new PlanImpl(plan.watermark(), plan.snapshotId(), limitedSplits);
-                        return new ScannedResult(newPlan);
-                    }
+        List<Split> limitedSplits = new ArrayList<>();
+        for (DataSplit dataSplit : splits) {
+            if (dataSplit.rawConvertible()) {
+                long partialMergedRowCount = dataSplit.partialMergedRowCount();
+                limitedSplits.add(dataSplit);
+                scannedRowCount += partialMergedRowCount;
+                if (scannedRowCount >= pushDownLimit) {
+                    SnapshotReader.Plan newPlan =
+                            new PlanImpl(plan.watermark(), plan.snapshotId(), limitedSplits);
+                    return Optional.of(new ScannedResult(newPlan));
                 }
             }
         }
-        return result;
+        return Optional.of(result);
     }
 
-    private StartingScanner.Result applyPushDownTopN(StartingScanner.Result result) {
+    private Optional<StartingScanner.Result> applyPushDownTopN() {
         if (topN == null
                 || pushDownLimit != null
-                || !(result instanceof ScannedResult)
                 || !schema.primaryKeys().isEmpty()
                 || options().deletionVectorsEnabled()) {
-            return result;
+            return Optional.empty();
+        }
+
+        List<SortValue> orders = topN.orders();
+        if (orders.size() != 1) {
+            return Optional.empty();
+        }
+
+        if (topN.limit() > 100) {
+            return Optional.empty();
+        }
+
+        SortValue order = orders.get(0);
+        DataType type = order.field().type();
+        if (!minmaxAvailable(type)) {
+            return Optional.empty();
+        }
+
+        StartingScanner.Result result = startingScanner.scan(snapshotReader.keepStats());
+        if (!(result instanceof ScannedResult)) {
+            return Optional.of(result);
         }
 
         SnapshotReader.Plan plan = ((ScannedResult) result).plan();
         List<DataSplit> splits = plan.dataSplits();
         if (splits.isEmpty()) {
-            return result;
+            return Optional.of(result);
         }
 
         TopNDataSplitEvaluator evaluator = new TopNDataSplitEvaluator(schema, schemaManager);
-        List<Split> topNSplits = new ArrayList<>(evaluator.evaluate(topN, splits));
+        List<Split> topNSplits = new ArrayList<>(evaluator.evaluate(order, topN.limit(), splits));
         SnapshotReader.Plan newPlan = new PlanImpl(plan.watermark(), plan.snapshotId(), topNSplits);
-        return new ScannedResult(newPlan);
+        return Optional.of(new ScannedResult(newPlan));
     }
 
     @Override
 
@@ -16,8 +16,9 @@
  * limitations under the License.
  */
 
-package org.apache.paimon.stats;
+package org.apache.paimon.table.source;
 
+import org.apache.paimon.io.DataFileMeta;
 import org.apache.paimon.types.BigIntType;
 import org.apache.paimon.types.BooleanType;
 import org.apache.paimon.types.DataType;
@@ -28,8 +29,13 @@
 import org.apache.paimon.types.SmallIntType;
 import org.apache.paimon.types.TinyIntType;
 
-/** Utils for Stats. */
-public class StatsUtils {
+import java.util.HashSet;
+import java.util.Set;
+
+import static org.apache.paimon.utils.ListUtils.isNullOrEmpty;
+
+/** Utils for pushing downs. */
+public class PushDownUtils {
 
     public static boolean minmaxAvailable(DataType type) {
         // not push down complex type
@@ -48,4 +54,23 @@ public static boolean minmaxAvailable(DataType type) {
                 || type instanceof DoubleType
                 || type instanceof DateType;
     }
+
+    public static boolean minmaxAvailable(DataSplit split, Set<String> columns) {
+        if (isNullOrEmpty(columns)) {
+            return false;
+        }
+
+        if (!split.rawConvertible()) {
+            return false;
+        }
+
+        return split.dataFiles().stream()
+                .map(DataFileMeta::valueStatsCols)
+                .allMatch(
+                        valueStatsCols ->
+                                // It means there are all column statistics when valueStatsCols ==
+                                // null
+                                valueStatsCols == null
+                                        || new HashSet<>(valueStatsCols).containsAll(columns));
+    }
 }