Chore: Add unit and integ tests for already upgraded search functionality in jumpstart code (#5544)

mollyheamazon · web-flow · commit 49e53e85d2d1 · 2026-02-09T14:37:53.000-08:00
* Chore: Add unit and integ tests for already upgraded search functionality in jumpstart code

* fix existing unit test error with sagemaker-train evaluate test execution

* fix existing unit test error with sagemaker-train evaluate test execution 2
diff --git a/sagemaker-core/tests/integ/jumpstart/test_search_integ.py b/sagemaker-core/tests/integ/jumpstart/test_search_integ.py
@@ -66,3 +66,19 @@ def test_search_public_hub_models_all_args():
 
     assert isinstance(results, list)
     assert all(isinstance(m, HubContent) for m in results)
+
+
+@pytest.mark.serial
+@pytest.mark.integ
+def test_search_public_hub_models_safe_from_injection():
+    """Integration test to verify malicious queries don't execute code."""
+    # This would have executed code with the old eval() implementation
+    malicious_query = "__import__('os').system('echo test')"
+    
+    # Should safely return empty results without executing code
+    results = search_public_hub_models(malicious_query)
+    
+    # Verify it returns a list (even if empty) and doesn't crash
+    assert isinstance(results, list)
+    # Should not match any models since it's not a valid filter expression
+    assert len(results) == 0
diff --git a/sagemaker-core/tests/unit/jumpstart/test_search_unit.py b/sagemaker-core/tests/unit/jumpstart/test_search_unit.py
@@ -47,6 +47,85 @@ def test_filter_match(query, keywords, expected):
     assert f.match(keywords) == expected
 
 
+@pytest.mark.parametrize(
+    "malicious_query,keywords",
+    [
+        # Code injection attempts that would work with eval()
+        ("__import__('os').system('echo pwned')", ["test"]),
+        ("exec('import os; os.system(\"ls\")')", ["test"]),
+        ("eval('1+1')", ["test"]),
+        ("__builtins__.__import__('os').system('ls')", ["test"]),
+        # Attribute access attempts
+        ("keywords.__class__.__bases__[0].__subclasses__()", ["test"]),
+        # Lambda injection
+        ("(lambda: __import__('os').system('ls'))()", ["test"]),
+        # Dict/list comprehension injection
+        ("[x for x in ().__class__.__bases__[0].__subclasses__()]", ["test"]),
+        # Function call injection
+        ("open('/etc/passwd').read()", ["test"]),
+        # Module access
+        ("sys.exit()", ["test"]),
+        ("os.system('ls')", ["test"]),
+    ],
+)
+def test_filter_blocks_code_injection(malicious_query, keywords):
+    """Test that malicious code injection attempts are safely handled."""
+    f = _Filter(malicious_query)
+    # Should not execute code, just return False for non-matching patterns
+    result = f.match(keywords)
+    assert isinstance(result, bool)
+    # The filter should safely fail to match rather than execute code
+    assert result is False
+
+
+@pytest.mark.parametrize(
+    "injection_query",
+    [
+        # Various eval-based injection patterns
+        "'; __import__('os').system('ls'); '",
+        "\"; exec('import os'); \"",
+        "') or __import__('os').system('ls') or ('",
+        # Nested injection attempts
+        "test AND (__import__('os').system('ls'))",
+        "NOT (__import__('subprocess').call(['ls']))",
+        # String escape attempts
+        "test' + str(__import__('os').system('ls')) + '",
+    ],
+)
+def test_filter_injection_variants(injection_query):
+    """Test various code injection patterns are blocked."""
+    f = _Filter(injection_query)
+    result = f.match(["test", "keyword"])
+    assert isinstance(result, bool)
+    # Should not raise exceptions or execute code
+    assert result in [True, False]
+
+
+def test_filter_no_eval_execution():
+    """Verify that expressions are parsed safely without eval()."""
+    # This would execute code if eval() was used
+    dangerous_expr = "__import__('sys').exit(1)"
+    f = _Filter(dangerous_expr)
+    
+    # Should not crash the program or execute the exit
+    result = f.match(["test"])
+    assert result is False
+
+
+def test_filter_safe_ast_parsing():
+    """Test that the filter uses AST parsing instead of eval()."""
+    f = _Filter("test AND keyword")
+    
+    # Verify AST is created
+    assert f._ast is None  # Not parsed yet
+    f.match(["test", "keyword"])
+    assert f._ast is not None  # AST created after first match
+    
+    # Verify it's an AST node, not a string for eval
+    from sagemaker.core.jumpstart.search import _ExpressionNode
+    assert isinstance(f._ast, _ExpressionNode)
+
+
 def test_search_public_hub_models():
     mock_models = [
         HubContent(
diff --git a/sagemaker-train/tests/unit/train/evaluate/test_execution.py b/sagemaker-train/tests/unit/train/evaluate/test_execution.py
@@ -57,10 +57,17 @@ class MockUnassigned:
 
 @pytest.fixture
 def mock_session():
-    """Mock SageMaker session."""
+    """Mock SageMaker session that passes isinstance checks."""
+    from sagemaker.core.helper.session_helper import Session
+    
+    # Create a mock that will pass isinstance(obj, Session) checks
     session = MagicMock()
     session.boto_region_name = DEFAULT_REGION
     session.client.return_value = MagicMock()
+    
+    # Make isinstance check pass
+    session.__class__ = type('MockSession', (Session,), {})
+    
     return session
 
 
@@ -247,7 +254,7 @@ def test_extract_with_exception(self):
 class TestGetOrCreatePipeline:
     """Tests for _get_or_create_pipeline function."""
 
-    @patch("sagemaker.train.evaluate.execution.Tag")
+    @patch("sagemaker.train.evaluate.execution.ResourceTag")
     @patch("sagemaker.train.evaluate.execution.Pipeline")
     def test_get_existing_pipeline_and_update(self, mock_pipeline_class, mock_tag_class, mock_session):
         """Test getting and updating existing pipeline via Pipeline.get_all with prefix."""
@@ -757,7 +764,7 @@ def test_get_execution_generic_exception(self, mock_pe_class, mock_session):
 class TestEvaluationPipelineExecutionGetAll:
     """Tests for EvaluationPipelineExecution.get_all() method."""
 
-    @patch("sagemaker.train.evaluate.execution.Tag")
+    @patch("sagemaker.train.evaluate.execution.ResourceTag")
     @patch("sagemaker.train.evaluate.execution.Pipeline")
     @patch("sagemaker.train.evaluate.execution.PipelineExecution")
     def test_get_all_executions(self, mock_pe_class, mock_pipeline_class, mock_tag_class, mock_session):
@@ -800,7 +807,7 @@ def test_get_all_executions(self, mock_pe_class, mock_pipeline_class, mock_tag_c
         # Verify PipelineExecution.get_all was called with the pipeline name
         mock_pe_class.get_all.assert_called_once()
 
-    @patch("sagemaker.train.evaluate.execution.Tag")
+    @patch("sagemaker.train.evaluate.execution.ResourceTag")
     @patch("sagemaker.train.evaluate.execution.Pipeline")
     @patch("sagemaker.train.evaluate.execution.PipelineExecution")
     def test_get_all_multiple_eval_types(self, mock_pe_class, mock_pipeline_class, mock_tag_class, mock_session):