vllm-project
diff --git a/‎config/config.yaml‎
Lines changed: 9 additions & 0 deletions b/‎config/config.yaml‎
Lines changed: 9 additions & 0 deletions
diff --git a/‎src/semantic-router/pkg/config/model_config_types.go‎
Lines changed: 22 additions & 9 deletions b/‎src/semantic-router/pkg/config/model_config_types.go‎
Lines changed: 22 additions & 9 deletions
diff --git a/‎src/semantic-router/pkg/config/reference_config_global_test.go‎
Lines changed: 6 additions & 0 deletions b/‎src/semantic-router/pkg/config/reference_config_global_test.go‎
Lines changed: 6 additions & 0 deletions
diff --git a/‎src/semantic-router/pkg/config/tool_retrieval.go‎
Lines changed: 40 additions & 0 deletions b/‎src/semantic-router/pkg/config/tool_retrieval.go‎
Lines changed: 40 additions & 0 deletions
diff --git a/‎src/semantic-router/pkg/config/validator_tool_filtering.go‎
Lines changed: 72 additions & 7 deletions b/‎src/semantic-router/pkg/config/validator_tool_filtering.go‎
Lines changed: 72 additions & 7 deletions
@@ -1697,6 +1697,7 @@ global:
       fallback_to_empty: true
       advanced_filtering:
         enabled: true
+        retrieval_strategy: weighted
         candidate_pool_size: 50
         min_lexical_overlap: 1
         min_combined_score: 0.42
@@ -1710,6 +1711,14 @@ global:
         category_confidence_threshold: 0.7
         allow_tools: [docs.search, tickets.lookup]
         block_tools: [admin.delete]
+        hybrid_history:
+          history_horizon: 8
+          min_history_steps: 1
+          history_confidence_threshold: 0
+          weight_semantic: 1
+          weight_history_transition: 1
+          weight_decision_prior: 1
+          repetition_penalty_strength: 0
     looper:
       endpoint: http://localhost:8899/v1/chat/completions
       model_endpoints:
 
@@ -193,15 +193,28 @@ type ToolFilteringWeights struct {
 }
 
 type AdvancedToolFilteringConfig struct {
-	Enabled                     bool                 `yaml:"enabled"`
-	CandidatePoolSize           *int                 `yaml:"candidate_pool_size,omitempty"`
-	MinLexicalOverlap           *int                 `yaml:"min_lexical_overlap,omitempty"`
-	MinCombinedScore            *float32             `yaml:"min_combined_score,omitempty"`
-	Weights                     ToolFilteringWeights `yaml:"weights,omitempty"`
-	UseCategoryFilter           *bool                `yaml:"use_category_filter,omitempty"`
-	CategoryConfidenceThreshold *float32             `yaml:"category_confidence_threshold,omitempty"`
-	AllowTools                  []string             `yaml:"allow_tools,omitempty"`
-	BlockTools                  []string             `yaml:"block_tools,omitempty"`
+	Enabled                     bool                              `yaml:"enabled"`
+	RetrievalStrategy           string                            `yaml:"retrieval_strategy,omitempty"`
+	CandidatePoolSize           *int                              `yaml:"candidate_pool_size,omitempty"`
+	MinLexicalOverlap           *int                              `yaml:"min_lexical_overlap,omitempty"`
+	MinCombinedScore            *float32                          `yaml:"min_combined_score,omitempty"`
+	Weights                     ToolFilteringWeights              `yaml:"weights,omitempty"`
+	UseCategoryFilter           *bool                             `yaml:"use_category_filter,omitempty"`
+	CategoryConfidenceThreshold *float32                          `yaml:"category_confidence_threshold,omitempty"`
+	AllowTools                  []string                          `yaml:"allow_tools,omitempty"`
+	BlockTools                  []string                          `yaml:"block_tools,omitempty"`
+	HybridHistory               *HybridHistoryToolRetrievalConfig `yaml:"hybrid_history,omitempty"`
+}
+
+// HybridHistoryToolRetrievalConfig tunes hybrid_history retrieval (semantic + short history + priors + repetition).
+type HybridHistoryToolRetrievalConfig struct {
+	HistoryHorizon             *int     `yaml:"history_horizon,omitempty"`
+	MinHistorySteps            *int     `yaml:"min_history_steps,omitempty"`
+	HistoryConfidenceThreshold *float32 `yaml:"history_confidence_threshold,omitempty"`
+	WeightSemantic             *float32 `yaml:"weight_semantic,omitempty"`
+	WeightHistoryTransition    *float32 `yaml:"weight_history_transition,omitempty"`
+	WeightDecisionPrior        *float32 `yaml:"weight_decision_prior,omitempty"`
+	RepetitionPenaltyStrength  *float32 `yaml:"repetition_penalty_strength,omitempty"`
 }
 
 type ToolsConfig struct {
 
@@ -145,6 +145,12 @@ func assertReferenceConfigIntegrationGlobalCoverage(t testingT, integrations map
 	assertMapCoversStructFields(t, integrations, reflect.TypeOf(CanonicalIntegrationGlobal{}), "global.integrations")
 	assertMapCoversStructFields(t, tools, reflect.TypeOf(ToolsConfig{}), "global.integrations.tools")
 	assertMapCoversStructFields(t, mustMapAt(t, tools, "advanced_filtering"), reflect.TypeOf(AdvancedToolFilteringConfig{}), "global.integrations.tools.advanced_filtering")
+	assertMapCoversStructFields(
+		t,
+		mustMapAt(t, tools, "advanced_filtering", "hybrid_history"),
+		reflect.TypeOf(HybridHistoryToolRetrievalConfig{}),
+		"global.integrations.tools.advanced_filtering.hybrid_history",
+	)
 	assertMapCoversStructFields(
 		t,
 		mustMapAt(t, tools, "advanced_filtering", "weights"),
 
@@ -0,0 +1,40 @@
+package config
+
+import "strings"
+
+const (
+	// ToolRetrievalStrategyWeighted is the default: embedding + lexical/tag/name/category weights.
+	ToolRetrievalStrategyWeighted = "weighted"
+	// ToolRetrievalStrategyHybridHistory combines semantic similarity with short-horizon tool history.
+	ToolRetrievalStrategyHybridHistory = "hybrid_history"
+)
+
+// EffectiveToolRetrievalStrategy returns normalized strategy; empty defaults to weighted.
+func EffectiveToolRetrievalStrategy(advanced *AdvancedToolFilteringConfig) string {
+	if advanced == nil {
+		return ToolRetrievalStrategyWeighted
+	}
+	s := strings.TrimSpace(strings.ToLower(advanced.RetrievalStrategy))
+	if s == "" {
+		return ToolRetrievalStrategyWeighted
+	}
+	return s
+}
+
+// IsHybridHistoryRetrieval reports whether advanced filtering should use hybrid_history ranking.
+func IsHybridHistoryRetrieval(advanced *AdvancedToolFilteringConfig) bool {
+	return EffectiveToolRetrievalStrategy(advanced) == ToolRetrievalStrategyHybridHistory
+}
+
+// ResolveHybridHistoryHorizon returns the max assistant tool names to read from history.
+func ResolveHybridHistoryHorizon(advanced *AdvancedToolFilteringConfig) int {
+	const defaultHorizon = 8
+	if advanced == nil || advanced.HybridHistory == nil || advanced.HybridHistory.HistoryHorizon == nil {
+		return defaultHorizon
+	}
+	h := *advanced.HybridHistory.HistoryHorizon
+	if h <= 0 {
+		return defaultHorizon
+	}
+	return h
+}
@@ -1,17 +1,34 @@
 package config
 
-import "fmt"
+import (
+	"fmt"
+	"strings"
+)
 
 func validateAdvancedToolFilteringConfig(cfg *RouterConfig) error {
 	if cfg == nil || cfg.Tools.AdvancedFiltering == nil {
 		return nil
 	}
-
 	advanced := cfg.Tools.AdvancedFiltering
 	if !advanced.Enabled {
 		return nil
 	}
+	if err := validateAdvancedToolFilteringIntFields(advanced); err != nil {
+		return err
+	}
+	if err := validateAdvancedToolFilteringCoreFloats(advanced); err != nil {
+		return err
+	}
+	if err := validateToolFilteringWeightFloats(advanced.Weights); err != nil {
+		return err
+	}
+	if err := validateRetrievalStrategyValue(advanced.RetrievalStrategy); err != nil {
+		return err
+	}
+	return validateHybridHistorySubconfig(advanced.HybridHistory)
+}
 
+func validateAdvancedToolFilteringIntFields(advanced *AdvancedToolFilteringConfig) error {
 	for _, field := range []struct {
 		name  string
 		value *int
@@ -23,7 +40,10 @@ func validateAdvancedToolFilteringConfig(cfg *RouterConfig) error {
 			return err
 		}
 	}
+	return nil
+}
 
+func validateAdvancedToolFilteringCoreFloats(advanced *AdvancedToolFilteringConfig) error {
 	for _, field := range []struct {
 		name  string
 		value *float32
@@ -35,22 +55,67 @@ func validateAdvancedToolFilteringConfig(cfg *RouterConfig) error {
 			return err
 		}
 	}
+	return nil
+}
 
+func validateToolFilteringWeightFloats(weights ToolFilteringWeights) error {
 	for _, field := range []struct {
 		name  string
 		value *float32
 	}{
-		{"embed", advanced.Weights.Embed},
-		{"lexical", advanced.Weights.Lexical},
-		{"tag", advanced.Weights.Tag},
-		{"name", advanced.Weights.Name},
-		{"category", advanced.Weights.Category},
+		{"embed", weights.Embed},
+		{"lexical", weights.Lexical},
+		{"tag", weights.Tag},
+		{"name", weights.Name},
+		{"category", weights.Category},
 	} {
 		if err := validateAdvancedToolFilteringUnitFloat("weights."+field.name, field.value); err != nil {
 			return err
 		}
 	}
+	return nil
+}
+
+func validateRetrievalStrategyValue(strategy string) error {
+	s := strings.TrimSpace(strings.ToLower(strategy))
+	if s == "" {
+		return nil
+	}
+	if s == ToolRetrievalStrategyWeighted || s == ToolRetrievalStrategyHybridHistory {
+		return nil
+	}
+	return fmt.Errorf("tools.advanced_filtering.retrieval_strategy must be %q or %q", ToolRetrievalStrategyWeighted, ToolRetrievalStrategyHybridHistory)
+}
 
+func validateHybridHistorySubconfig(h *HybridHistoryToolRetrievalConfig) error {
+	if h == nil {
+		return nil
+	}
+	for _, field := range []struct {
+		name  string
+		value *int
+	}{
+		{"history_horizon", h.HistoryHorizon},
+		{"min_history_steps", h.MinHistorySteps},
+	} {
+		if err := validateAdvancedToolFilteringNonNegativeInt("hybrid_history."+field.name, field.value); err != nil {
+			return err
+		}
+	}
+	for _, field := range []struct {
+		name  string
+		value *float32
+	}{
+		{"history_confidence_threshold", h.HistoryConfidenceThreshold},
+		{"weight_semantic", h.WeightSemantic},
+		{"weight_history_transition", h.WeightHistoryTransition},
+		{"weight_decision_prior", h.WeightDecisionPrior},
+		{"repetition_penalty_strength", h.RepetitionPenaltyStrength},
+	} {
+		if err := validateAdvancedToolFilteringUnitFloat("hybrid_history."+field.name, field.value); err != nil {
+			return err
+		}
+	}
 	return nil
 }