trinodb · Max-Cheng · Apr 8, 2026 · Apr 9, 2026 · ebyhr · Apr 9, 2026
diff --git a/plugin/trino-delta-lake/src/main/java/io/trino/plugin/deltalake/DeltaLakeMetadata.java b/plugin/trino-delta-lake/src/main/java/io/trino/plugin/deltalake/DeltaLakeMetadata.java
@@ -2943,13 +2943,12 @@ public Map<String, Long> finishTableExecute(ConnectorSession session, ConnectorT
         DeltaLakeTableExecuteHandle executeHandle = (DeltaLakeTableExecuteHandle) tableExecuteHandle;
         switch (executeHandle.procedureId()) {
             case OPTIMIZE:
-                finishOptimize(session, executeHandle, fragments, splitSourceInfo);
-                return ImmutableMap.of();
+                return finishOptimize(session, executeHandle, fragments, splitSourceInfo).toMap();
         }
         throw new IllegalArgumentException("Unknown procedure '" + executeHandle.procedureId() + "'");
     }
 
-    private void finishOptimize(ConnectorSession session, DeltaLakeTableExecuteHandle executeHandle, Collection<Slice> fragments, List<Object> splitSourceInfo)
+    private OptimizeResult finishOptimize(ConnectorSession session, DeltaLakeTableExecuteHandle executeHandle, Collection<Slice> fragments, List<Object> splitSourceInfo)
     {
         DeltaTableOptimizeHandle optimizeHandle = (DeltaTableOptimizeHandle) executeHandle.procedureHandle();
         String tableLocation = executeHandle.tableLocation();
@@ -2959,6 +2958,12 @@ private void finishOptimize(ConnectorSession session, DeltaLakeTableExecuteHandl
                 .map(DeltaLakeScannedDataFile.class::cast)
                 .collect(toImmutableSet());
 
+        // delete vector
+        Set<String> filesToDelete = scannedDataFiles.stream()
+                .map(scannedDataFile -> scannedDataFile.deletionVector().map(DeletionVectorEntry::uniqueId))
+                .flatMap(Optional::stream)
+                .collect(Collectors.toSet());
+
         // files to be added
         List<DataFileInfo> dataFileInfos = fragments.stream()
                 .map(Slice::getInput)
@@ -3002,6 +3007,19 @@ private void finishOptimize(ConnectorSession session, DeltaLakeTableExecuteHandl
             }
             throw new TrinoException(DELTA_LAKE_BAD_WRITE, "Failed to write Delta Lake transaction log entry", e);
         }
+        return new OptimizeResult(scannedDataFiles.size(), filesToDelete.size(), dataFileInfos.size());
+    }
+
+    private record OptimizeResult(long rewrittenDataFiles, long removedDeleteFiles, long addedDataFiles)
+    {
+        Map<String, Long> toMap()
+        {
+            return ImmutableMap.<String, Long>builder()
+                    .put("rewritten_data_files_count", rewrittenDataFiles)
+                    .put("removed_delete_files_count", removedDeleteFiles)
+                    .put("added_data_files_count", addedDataFiles)
+                    .buildOrThrow();
+        }
     }
 
     private long commitOptimizeOperation(

diff --git a/...in/trino-delta-lake/src/main/java/io/trino/plugin/deltalake/DeltaLakeScannedDataFile.java b/...in/trino-delta-lake/src/main/java/io/trino/plugin/deltalake/DeltaLakeScannedDataFile.java
@@ -14,17 +14,19 @@
 package io.trino.plugin.deltalake;
 
 import com.google.common.collect.ImmutableMap;
+import io.trino.plugin.deltalake.transactionlog.DeletionVectorEntry;
 
 import java.util.Map;
 import java.util.Optional;
 
 import static java.util.Objects.requireNonNull;
 
-public record DeltaLakeScannedDataFile(String path, Map<String, Optional<String>> partitionKeys)
+public record DeltaLakeScannedDataFile(String path, Map<String, Optional<String>> partitionKeys, Optional<DeletionVectorEntry> deletionVector)
 {
     public DeltaLakeScannedDataFile
     {
         requireNonNull(path, "path is null");
         partitionKeys = ImmutableMap.copyOf(requireNonNull(partitionKeys, "partitionKeys is null"));
+        requireNonNull(deletionVector, "deletionVector is null");
     }
 }
diff --git a/plugin/trino-delta-lake/src/main/java/io/trino/plugin/deltalake/DeltaLakeSplitSource.java b/plugin/trino-delta-lake/src/main/java/io/trino/plugin/deltalake/DeltaLakeSplitSource.java
@@ -146,7 +146,13 @@ public CompletableFuture<ConnectorSplitBatch> getNextBatch(int maxSize)
                                     split.getStatisticsPredicate().overlaps(dynamicFilterPredicate))
                             .collect(toImmutableList());
                     if (recordScannedFiles) {
-                        filteredSplits.forEach(split -> scannedFilePaths.add(new DeltaLakeScannedDataFile(((DeltaLakeSplit) split).getPath(), ((DeltaLakeSplit) split).getPartitionKeys())));
+                        filteredSplits.forEach(split -> {
+                            DeltaLakeSplit deltaLakeSplit = (DeltaLakeSplit) split;
+                            scannedFilePaths.add(new DeltaLakeScannedDataFile(
+                                    deltaLakeSplit.getPath(),
+                                    deltaLakeSplit.getPartitionKeys(),
+                                    deltaLakeSplit.getDeletionVector()));
+                        });
                     }
                     return new ConnectorSplitBatch(filteredSplits, noMoreSplits);
                 },

diff --git a/...o-delta-lake/src/test/java/io/trino/plugin/deltalake/BaseDeltaLakeConnectorSmokeTest.java b/...o-delta-lake/src/test/java/io/trino/plugin/deltalake/BaseDeltaLakeConnectorSmokeTest.java
@@ -385,17 +385,14 @@ public void testOptimizeRewritesTable()
         String tableLocation = getLocationForTable(bucketName, tableName);
         assertUpdate("CREATE TABLE " + tableName + " (key integer, value varchar) WITH (location = '" + tableLocation + "')");
         try {
-            // DistributedQueryRunner sets node-scheduler.include-coordinator by default, so include coordinator
-            int workerCount = getQueryRunner().getNodeCount();
-
             assertUpdate("INSERT INTO " + tableName + " VALUES (1, 'one')", 1);
 
             for (int i = 0; i < 3; i++) {
                 Set<String> initialFiles = getActiveFiles(tableName);
-                computeActual("ALTER TABLE " + tableName + " EXECUTE OPTIMIZE");
+                computeActual(withSingleWriterPerTask(getSession()), "ALTER TABLE " + tableName + " EXECUTE OPTIMIZE");
                 Set<String> filesAfterOptimize = getActiveFiles(tableName);
                 assertThat(filesAfterOptimize)
-                        .hasSizeBetween(1, workerCount)
+                        .hasSize(1)
                         .containsExactlyElementsOf(initialFiles);
             }
 
@@ -444,18 +441,15 @@ public void testOptimizeRewritesPartitionedTable()
         String tableLocation = getLocationForTable(bucketName, tableName);
         assertUpdate("CREATE TABLE " + tableName + " (key integer, value varchar) WITH (location = '" + tableLocation + "', partitioned_by = ARRAY['key'])");
         try {
-            // DistributedQueryRunner sets node-scheduler.include-coordinator by default, so include coordinator
-            int workerCount = getQueryRunner().getNodeCount();
-
             assertUpdate("INSERT INTO " + tableName + " VALUES (1, 'one')", 1);
             assertUpdate("INSERT INTO " + tableName + " VALUES (2, 'two')", 1);
 
             for (int i = 0; i < 3; i++) {
                 Set<String> initialFiles = getActiveFiles(tableName);
-                computeActual("ALTER TABLE " + tableName + " EXECUTE OPTIMIZE");
+                computeActual(withSingleWriterPerTask(getSession()), "ALTER TABLE " + tableName + " EXECUTE OPTIMIZE");
                 Set<String> filesAfterOptimize = getActiveFiles(tableName);
                 assertThat(filesAfterOptimize)
-                        .hasSizeBetween(1, workerCount)
+                        .hasSize(2)
                         .containsExactlyInAnyOrderElementsOf(initialFiles);
             }
             assertQuery("SELECT * FROM " + tableName, "VALUES(1, 'one'), (2, 'two')");
@@ -1949,12 +1943,12 @@ public void testOptimize()
                     // Verify we have sufficiently many test rows with respect to worker count.
                     .hasSizeGreaterThan(workerCount);
 
-            computeActual("ALTER TABLE " + tableName + " EXECUTE OPTIMIZE");
+            computeActual(withSingleWriterPerTask(getSession()), "ALTER TABLE " + tableName + " EXECUTE OPTIMIZE");
             assertThat(query("SELECT sum(key), listagg(value, ' ') WITHIN GROUP (ORDER BY key) FROM " + tableName))
                     .matches("VALUES (BIGINT '65', VARCHAR 'eleven zwölf trzynaście quatorze пʼятнадцять')");
             Set<String> updatedFiles = getActiveFiles(tableName);
             assertThat(updatedFiles)
-                    .hasSizeBetween(1, workerCount)
+                    .hasSize(1)
                     .doesNotContainAnyElementsOf(initialFiles);
             // No files should be removed (this is VACUUM's job)
             assertThat(getAllDataFilesFromTableDirectory(tableName)).isEqualTo(union(initialFiles, updatedFiles));
@@ -2005,21 +1999,74 @@ public void testOptimizeWithPartitionedTable()
             Set<String> initialFiles = getActiveFiles(tableName);
             assertThat(initialFiles).hasSize(9);
 
-            computeActual("ALTER TABLE " + tableName + " EXECUTE OPTIMIZE");
+            assertUpdate(withSingleWriterPerTask(getSession()), "ALTER TABLE " + tableName + " EXECUTE OPTIMIZE",
+                    "VALUES ('rewritten_data_files_count', 3), ('removed_delete_files_count', 0), ('added_data_files_count', 1)");
 
             assertThat(query("SELECT sum(key), listagg(value, ' ') WITHIN GROUP (ORDER BY value) FROM " + tableName))
                     .matches("VALUES (BIGINT '508', VARCHAR 'ONE Three four one one one tHrEe three two')");
 
             Set<String> updatedFiles = getActiveFiles(tableName);
             assertThat(updatedFiles)
-                    .hasSizeBetween(7, initialFiles.size());
+                    .hasSize(7);
             assertThat(getAllDataFilesFromTableDirectory(tableName)).isEqualTo(union(initialFiles, updatedFiles));
         }
         finally {
             assertUpdate("DROP TABLE " + tableName);
         }
     }
 
+    @Test
+    public void testOptimizeWithDeletionVectors()
+    {
+        String tableName = "test_optimize_partitioned_table_" + randomNameSuffix();
+        String tableLocation = getLocationForTable(bucketName, tableName);
+        assertQuerySucceeds(withSingleWriterPerTask(getSession()), "CREATE TABLE " + tableName + " WITH (deletion_vectors_enabled = true, location = '" + tableLocation + "') AS SELECT * FROM tpch.tiny.nation");
+        try {
+            assertQuerySucceeds(withSingleWriterPerTask(getSession()), "INSERT INTO " + tableName + " SELECT * FROM tpch.tiny.nation");
+            assertQuerySucceeds(withSingleWriterPerTask(getSession()), "INSERT INTO " + tableName + " SELECT * FROM tpch.tiny.nation");
+            assertQuerySucceeds(withSingleWriterPerTask(getSession()), "INSERT INTO " + tableName + " SELECT * FROM tpch.tiny.nation");
+            assertQuerySucceeds(withSingleWriterPerTask(getSession()), "INSERT INTO " + tableName + " SELECT * FROM tpch.tiny.nation");
+            assertQuerySucceeds(withSingleWriterPerTask(getSession()), "INSERT INTO " + tableName + " SELECT * FROM tpch.tiny.nation");
+            Set<String> initFile = getActiveFiles(tableName);
+            assertThat(initFile).hasSize(6);
+            assertQuerySucceeds("DELETE FROM " + tableName + " WHERE nationkey < 5");
+            assertUpdate(withSingleWriterPerTask(getSession()),"ALTER TABLE " + tableName + " EXECUTE optimize",
+                    "VALUES ('rewritten_data_files_count', 6), ('removed_delete_files_count', 6), ('added_data_files_count', 1)");
+            assertThat(getActiveFiles(tableName)).hasSize(1);
+        }
+        finally {
+            assertUpdate("DROP TABLE " + tableName);
+        }
+    }
+
+    @Test
+    public void testOptimizeWithPartitionedTableAndDeleteVector()
+    {
+        String tableName = "test_optimize_partitioned_table_" + randomNameSuffix();
+        String tableLocation = getLocationForTable(bucketName, tableName);
+        assertQuerySucceeds(withSingleWriterPerTask(getSession()), "CREATE TABLE " + tableName + " WITH (deletion_vectors_enabled = true, partitioned_by = ARRAY['regionkey'], location = '" + tableLocation + "') AS SELECT nationkey, regionkey FROM tpch.tiny.nation");
+        try {
+            assertQuerySucceeds(withSingleWriterPerTask(getSession()), "INSERT INTO " + tableName + " SELECT nationkey, regionkey FROM tpch.tiny.nation");
+            assertQuerySucceeds(withSingleWriterPerTask(getSession()), "INSERT INTO " + tableName + " SELECT nationkey, regionkey FROM tpch.tiny.nation");
+            assertQuerySucceeds(withSingleWriterPerTask(getSession()), "INSERT INTO " + tableName + " SELECT nationkey, regionkey FROM tpch.tiny.nation");
+            assertQuerySucceeds(withSingleWriterPerTask(getSession()), "INSERT INTO " + tableName + " SELECT nationkey, regionkey FROM tpch.tiny.nation");
+            assertQuerySucceeds(withSingleWriterPerTask(getSession()), "INSERT INTO " + tableName + " SELECT nationkey, regionkey FROM tpch.tiny.nation");
+
+            Set<String> initialFiles = getActiveFiles(tableName);
+            assertThat(initialFiles).hasSize(30);
+            assertQuerySucceeds("DELETE FROM " + tableName + " WHERE nationkey < 5");
+
+            assertUpdate(withSingleWriterPerTask(getSession()), "ALTER TABLE " + tableName + " EXECUTE OPTIMIZE",
+                    "VALUES ('rewritten_data_files_count', 30), ('removed_delete_files_count', 18), ('added_data_files_count', 5)");
+            Set<String> updatedFiles = getActiveFiles(tableName);
+            assertThat(updatedFiles)
+                    .hasSize(5);
+        }
+        finally {
+            assertUpdate("DROP TABLE " + tableName);
+        }
+    }
+
     @Test
     public void testOptimizeWithEnforcedRepartitioning()
     {
@@ -2046,7 +2093,7 @@ public void testOptimizeWithEnforcedRepartitioning()
             Set<String> initialFiles = getActiveFiles(tableName, currentSession);
             assertThat(initialFiles).hasSize(10);
 
-            computeActual(currentSession, "ALTER TABLE " + tableName + " EXECUTE OPTIMIZE");
+            computeActual(withSingleWriterPerTask(currentSession), "ALTER TABLE " + tableName + " EXECUTE OPTIMIZE");
 
             assertThat(query(currentSession, "SELECT sum(key), listagg(value, ' ') WITHIN GROUP (ORDER BY value) FROM " + tableName))
                     .matches("VALUES (BIGINT '55', VARCHAR 'one one one one one one one three two two')");
@@ -2060,6 +2107,13 @@ public void testOptimizeWithEnforcedRepartitioning()
         }
     }
 
+    private Session withSingleWriterPerTask(Session session)
+    {
+        return Session.builder(session)
+                .setSystemProperty("task_min_writer_count", "1")
+                .build();
+    }
+
     private void fillWithInserts(String tableName, String values, int toCreate)
     {
         for (int i = 0; i < toCreate; i++) {
@@ -2144,7 +2198,7 @@ public void testOptimizeUsingForcedPartitioning()
         Set<String> initialFiles = getActiveFiles(tableName);
         assertThat(initialFiles).hasSize(10);
 
-        computeActual("ALTER TABLE " + tableName + " EXECUTE OPTIMIZE");
+        computeActual(withSingleWriterPerTask(getSession()), "ALTER TABLE " + tableName + " EXECUTE OPTIMIZE");
 
         assertThat(query("SELECT " +
                 "sum(value1), " +