valkey-io
diff --git a/‎.github/benchmark_configs/fts-benchmarks-arm.json‎
Lines changed: 57 additions & 149 deletions b/‎.github/benchmark_configs/fts-benchmarks-arm.json‎
Lines changed: 57 additions & 149 deletions
diff --git a/‎docs/topics/search-configurables.md‎
Lines changed: 1 addition & 0 deletions b/‎docs/topics/search-configurables.md‎
Lines changed: 1 addition & 0 deletions
@@ -477,6 +477,11 @@
         "type": "vector",
         "doc_count": 100,
         "dimensions": 256
+      },
+      "composed_tag_queries.csv": {
+        "type": "tag_only",
+        "doc_count": 100,
+        "tags": ["electronics", "books", "clothing", "food", "sports"]
       }
     },
     "test_groups": [
@@ -1052,6 +1057,21 @@
               "": "",
               "NOCONTENT": "_nocontent"
             }
+          },
+          {
+            "id": "e",
+            "type": "read",
+            "cluster_execution": "parallel",
+            "description": "NUMERIC + TAG composed (entries fetcher optimization test)",
+            "dataset": "datasets/composed_tag_queries.csv",
+            "clients": 1000,
+            "duration": 200,
+            "warmup": 60,
+            "command": "FT.SEARCH rd0 \"@price:[100 500] @category:{__field:category__}\"",
+            "options": {
+              "": "",
+              "NOCONTENT": "_nocontent"
+            }
           }
         ]
       },
@@ -1152,54 +1172,6 @@
               }
             }
           },
-          {
-            "id": "b",
-            "type": "write",
-            "cluster_execution": "single",
-            "description": "1K docs × 100K tokens cyclic-8193 - position byte size increase",
-            "setup_commands": [
-              "FT.CREATE rd0 ON HASH PREFIX 1 rd0- STOPWORDS 0 SCHEMA field1 TEXT NOSTEM"
-            ],
-            "flush_before": true,
-            "dataset": "datasets/posting_cyclic8193_1k_100k.csv",
-            "duration": 200,
-            "keyspacelen": 1000,
-            "clients": 100,
-            "sequential": true,
-            "command": "HSET rd0-{tag}:__rand_int__ field1 \"__field:field1__\"",
-            "profiling": {
-              "delays": {
-                "write": {
-                  "delay": 5,
-                  "duration": 10
-                }
-              }
-            }
-          },
-          {
-            "id": "c",
-            "type": "write",
-            "cluster_execution": "single",
-            "description": "10K docs × 50 fields × 1K tokens - field mask byte size increase",
-            "setup_commands": [
-              "FT.CREATE rd0 ON HASH PREFIX 1 rd0- SCHEMA field1 TEXT field2 TEXT field3 TEXT field4 TEXT field5 TEXT field6 TEXT field7 TEXT field8 TEXT field9 TEXT field10 TEXT field11 TEXT field12 TEXT field13 TEXT field14 TEXT field15 TEXT field16 TEXT field17 TEXT field18 TEXT field19 TEXT field20 TEXT field21 TEXT field22 TEXT field23 TEXT field24 TEXT field25 TEXT field26 TEXT field27 TEXT field28 TEXT field29 TEXT field30 TEXT field31 TEXT field32 TEXT field33 TEXT field34 TEXT field35 TEXT field36 TEXT field37 TEXT field38 TEXT field39 TEXT field40 TEXT field41 TEXT field42 TEXT field43 TEXT field44 TEXT field45 TEXT field46 TEXT field47 TEXT field48 TEXT field49 TEXT field50 TEXT"
-            ],
-            "flush_before": true,
-            "dataset": "datasets/wiki_10k_50field_1ktok.csv",
-            "duration": 200,
-            "keyspacelen": 10000,
-            "clients": 1000,
-            "sequential": true,
-            "command": "HSET rd0-{tag}:__rand_int__ field1 \"__field:field1__\" field2 \"__field:field2__\" field3 \"__field:field3__\" field4 \"__field:field4__\" field5 \"__field:field5__\" field6 \"__field:field6__\" field7 \"__field:field7__\" field8 \"__field:field8__\" field9 \"__field:field9__\" field10 \"__field:field10__\" field11 \"__field:field11__\" field12 \"__field:field12__\" field13 \"__field:field13__\" field14 \"__field:field14__\" field15 \"__field:field15__\" field16 \"__field:field16__\" field17 \"__field:field17__\" field18 \"__field:field18__\" field19 \"__field:field19__\" field20 \"__field:field20__\" field21 \"__field:field21__\" field22 \"__field:field22__\" field23 \"__field:field23__\" field24 \"__field:field24__\" field25 \"__field:field25__\" field26 \"__field:field26__\" field27 \"__field:field27__\" field28 \"__field:field28__\" field29 \"__field:field29__\" field30 \"__field:field30__\" field31 \"__field:field31__\" field32 \"__field:field32__\" field33 \"__field:field33__\" field34 \"__field:field34__\" field35 \"__field:field35__\" field36 \"__field:field36__\" field37 \"__field:field37__\" field38 \"__field:field38__\" field39 \"__field:field39__\" field40 \"__field:field40__\" field41 \"__field:field41__\" field42 \"__field:field42__\" field43 \"__field:field43__\" field44 \"__field:field44__\" field45 \"__field:field45__\" field46 \"__field:field46__\" field47 \"__field:field47__\" field48 \"__field:field48__\" field49 \"__field:field49__\" field50 \"__field:field50__\"",
-            "profiling": {
-              "delays": {
-                "write": {
-                  "delay": 5,
-                  "duration": 10
-                }
-              }
-            }
-          },
           {
             "id": "d",
             "type": "write",
@@ -1224,30 +1196,6 @@
                 }
               }
             }
-          },
-          {
-            "id": "e",
-            "type": "write",
-            "cluster_execution": "single",
-            "description": "100K docs × 20 fields × 10 tokens from set of 10 - small pos map (<128 bytes)",
-            "setup_commands": [
-              "FT.CREATE rd0 ON HASH PREFIX 1 rd0- STOPWORDS 0 SCHEMA field1 TEXT NOSTEM field2 TEXT NOSTEM field3 TEXT NOSTEM field4 TEXT NOSTEM field5 TEXT NOSTEM field6 TEXT NOSTEM field7 TEXT NOSTEM field8 TEXT NOSTEM field9 TEXT NOSTEM field10 TEXT NOSTEM field11 TEXT NOSTEM field12 TEXT NOSTEM field13 TEXT NOSTEM field14 TEXT NOSTEM field15 TEXT NOSTEM field16 TEXT NOSTEM field17 TEXT NOSTEM field18 TEXT NOSTEM field19 TEXT NOSTEM field20 TEXT NOSTEM"
-            ],
-            "flush_before": true,
-            "dataset": "datasets/random_set_100k_20field_10tok.csv",
-            "duration": 200,
-            "keyspacelen": 100000,
-            "clients": 1000,
-            "sequential": true,
-            "command": "HSET rd0-{tag}:__rand_int__ field1 \"__field:field1__\" field2 \"__field:field2__\" field3 \"__field:field3__\" field4 \"__field:field4__\" field5 \"__field:field5__\" field6 \"__field:field6__\" field7 \"__field:field7__\" field8 \"__field:field8__\" field9 \"__field:field9__\" field10 \"__field:field10__\" field11 \"__field:field11__\" field12 \"__field:field12__\" field13 \"__field:field13__\" field14 \"__field:field14__\" field15 \"__field:field15__\" field16 \"__field:field16__\" field17 \"__field:field17__\" field18 \"__field:field18__\" field19 \"__field:field19__\" field20 \"__field:field20__\"",
-            "profiling": {
-              "delays": {
-                "write": {
-                  "delay": 5,
-                  "duration": 10
-                }
-              }
-            }
           }
         ]
       },
@@ -1290,7 +1238,7 @@
             "dataset": "datasets/radix_uuid_10k_1ktok.csv",
             "duration": 200,
             "keyspacelen": 10000,
-            "clients": 1000,
+            "clients": 500,
             "sequential": true,
             "command": "HSET rd0-{tag}:__rand_int__ field1 \"__field:field1__\"",
             "profiling": {
@@ -1332,31 +1280,6 @@
         "group": 14,
         "description": "Misc Tests - String intern, schema options, extreme case",
         "scenarios": [
-          {
-            "id": "a",
-            "type": "write",
-            "cluster_execution": "single",
-            "description": "100K docs × 1 field × 100 tokens - 128-char key names",
-            "setup_commands": [
-              "FT.CREATE rd0 ON HASH SCHEMA field1 TEXT"
-            ],
-            "flush_before": true,
-            "dataset": "datasets/wiki_100k_1field_100tok_uuidkey.xml",
-            "xml_root_element": "doc",
-            "duration": 200,
-            "keyspacelen": 100000,
-            "clients": 1000,
-            "sequential": true,
-            "command": "HSET __field:keyname__ field1 \"__field:field1__\"",
-            "profiling": {
-              "delays": {
-                "write": {
-                  "delay": 5,
-                  "duration": 10
-                }
-              }
-            }
-          },
           {
             "id": "b",
             "type": "write",
@@ -1382,31 +1305,6 @@
               }
             }
           },
-          {
-            "id": "c",
-            "type": "write",
-            "cluster_execution": "single",
-            "description": "50K docs × 10 fields × 100 tokens - WITHSUFFIXTRIE",
-            "setup_commands": [
-              "FT.CREATE rd0 ON HASH PREFIX 1 rd0- SCHEMA field1 TEXT WITHSUFFIXTRIE field2 TEXT WITHSUFFIXTRIE field3 TEXT WITHSUFFIXTRIE field4 TEXT WITHSUFFIXTRIE field5 TEXT WITHSUFFIXTRIE field6 TEXT WITHSUFFIXTRIE field7 TEXT WITHSUFFIXTRIE field8 TEXT WITHSUFFIXTRIE field9 TEXT WITHSUFFIXTRIE field10 TEXT WITHSUFFIXTRIE"
-            ],
-            "flush_before": true,
-            "dataset": "datasets/wiki_50k_10field_100tok.xml",
-            "xml_root_element": "doc",
-            "duration": 200,
-            "keyspacelen": 50000,
-            "clients": 1000,
-            "sequential": true,
-            "command": "HSET rd0-{tag}:__rand_int__ field1 \"__field:field1__\" field2 \"__field:field2__\" field3 \"__field:field3__\" field4 \"__field:field4__\" field5 \"__field:field5__\" field6 \"__field:field6__\" field7 \"__field:field7__\" field8 \"__field:field8__\" field9 \"__field:field9__\" field10 \"__field:field10__\"",
-            "profiling": {
-              "delays": {
-                "write": {
-                  "delay": 5,
-                  "duration": 10
-                }
-              }
-            }
-          },
           {
             "id": "d",
             "type": "write",
@@ -1432,31 +1330,6 @@
               }
             }
           },
-          {
-            "id": "e",
-            "type": "write",
-            "cluster_execution": "single",
-            "description": "50K docs × 10 fields × 100 tokens - STOPWORDS 0",
-            "setup_commands": [
-              "FT.CREATE rd0 ON HASH PREFIX 1 rd0- STOPWORDS 0 SCHEMA field1 TEXT field2 TEXT field3 TEXT field4 TEXT field5 TEXT field6 TEXT field7 TEXT field8 TEXT field9 TEXT field10 TEXT"
-            ],
-            "flush_before": true,
-            "dataset": "datasets/wiki_50k_10field_100tok.xml",
-            "xml_root_element": "doc",
-            "duration": 200,
-            "keyspacelen": 50000,
-            "clients": 1000,
-            "sequential": true,
-            "command": "HSET rd0-{tag}:__rand_int__ field1 \"__field:field1__\" field2 \"__field:field2__\" field3 \"__field:field3__\" field4 \"__field:field4__\" field5 \"__field:field5__\" field6 \"__field:field6__\" field7 \"__field:field7__\" field8 \"__field:field8__\" field9 \"__field:field9__\" field10 \"__field:field10__\"",
-            "profiling": {
-              "delays": {
-                "write": {
-                  "delay": 5,
-                  "duration": 10
-                }
-              }
-            }
-          },
           {
             "id": "f",
             "type": "write",
@@ -1555,6 +1428,41 @@
             "command": "FT.SEARCH rd0 \"(@price:[100 500])=>[KNN 10 @embedding $vec AS score]\" PARAMS 2 vec \"__field:query_vector__\" RETURN 2 price score DIALECT 2"
           }
         ]
+      },
+      {
+        "group": 16,
+        "description": "Composed Queries - Nominal Case (entries fetcher test)",
+        "scenarios": [
+          {
+            "id": "a",
+            "type": "write",
+            "cluster_execution": "single",
+            "setup_commands": [
+              "FT.CREATE rd0 ON HASH PREFIX 1 rd0- SCHEMA field1 TEXT field2 TEXT"
+            ],
+            "flush_before": true,
+            "dataset": "datasets/proximity_phrases.csv",
+            "maxdocs": 50000,
+            "clients": 1000,
+            "sequential": true,
+            "command": "HSET rd0-{tag}:__rand_int__ field1 \"__field:term1__\" field2 \"__field:term2__\""
+          },
+          {
+            "id": "b",
+            "type": "read",
+            "cluster_execution": "parallel",
+            "description": "TEXT + TEXT cross-field composed (entries fetcher optimization test)",
+            "dataset": "datasets/proximity_phrases.csv",
+            "clients": 1000,
+            "duration": 200,
+            "warmup": 60,
+            "command": "FT.SEARCH rd0 \"@field1:__field:term1__ @field2:__field:term2__\"",
+            "options": {
+              "": "",
+              "NOCONTENT": "_nocontent"
+            }
+          }
+        ]
       }
     ],
     "port": 6379,
@@ -1621,4 +1529,4 @@
       }
     ]
   }
-]
+]
@@ -28,6 +28,7 @@ The search module uses the Valkey configuration mechanism. Thus each of the name
 | search.local-fanout-queue-wait-threshold      | Number  |               | Queue wait threshold in milliseconds for preferring local node in fanout operations                                               |
 | search.thread-pool-wait-time-samples          | Number  |               | Sample queue size for thread pool wait time tracking                                                                              |
 | search.max-term-expansions                    | Number  |               | Maximum number of words to search in text operations (prefix, suffix, fuzzy) to limit memory usage                                |
+| search.tag-min-prefix-length                  | Number  |               | Minimum number of characters required before trailing `*` in TAG wildcard queries (length excludes `*`)                          |
 | search.search-result-buffer-multiplier        | String  |               | Multiplier for search result buffer size allocation                                                                               |
 | search.drain-mutation-queue-on-save           | Boolean |               | Drain the mutation queue before RDB save                                                                                          |
 | search.query-string-depth                     | Number  |               | Controls the depth of the query string parsing from the FT.SEARCH cmd                                                             |