test(mlserver): add model car (OCI image) deployment tests

Jooho · Jooho · commit 6cf3fe351ac7 · 2026-04-09T18:41:36.000-04:00
- Add MLServer model car tests for sklearn, xgboost, and lightgbm using OCI images.
- Add mlserver_model_car_inference_service fixture with env variable support.
- Add Standard deployment mode support in constants and utils

Signed-off-by: Jooho Lee &lt;jlee@redhat.com&gt;
diff --git a/tests/model_serving/model_runtime/mlserver/conftest.py b/tests/model_serving/model_runtime/mlserver/conftest.py
@@ -146,6 +146,50 @@ def mlserver_model_service_account(admin_client: DynamicClient, kserve_s3_secret
         yield sa
 
 
+@pytest.fixture(scope="class")
+def mlserver_model_car_inference_service(
+    request: pytest.FixtureRequest,
+    admin_client: DynamicClient,
+    model_namespace: Namespace,
+    mlserver_serving_runtime: ServingRuntime,
+) -> Generator[InferenceService]:
+    """
+    Create InferenceService for MLServer model car (OCI image) testing.
+
+    Args:
+        request: Pytest fixture request with parameters.
+        admin_client: Kubernetes dynamic client.
+        model_namespace: Namespace for deployment.
+        mlserver_serving_runtime: MLServer ServingRuntime instance.
+
+    Yields:
+        InferenceService: Configured ISVC using OCI storage.
+    """
+    params = request.param
+    storage_uri = params.get("storage-uri")
+    if not storage_uri:
+        raise ValueError("storage-uri is required in params")
+
+    deployment_mode = params.get("deployment-mode", KServeDeploymentType.RAW_DEPLOYMENT)
+    model_format = params.get("model-format")
+    if not model_format:
+        raise ValueError("model-format is required in params")
+
+    with create_isvc(
+        client=admin_client,
+        name=f"{model_format}-modelcar",
+        namespace=model_namespace.name,
+        runtime=mlserver_serving_runtime.name,
+        storage_uri=storage_uri,
+        model_format=model_format,
+        deployment_mode=deployment_mode,
+        external_route=params.get("enable_external_route"),
+        wait_for_predictor_pods=params.get("wait_for_predictor_pods", False),
+        model_env_variables=params.get("model_env_variables"),
+    ) as isvc:
+        yield isvc
+
+
 @pytest.fixture
 def mlserver_response_snapshot(snapshot: Any) -> Any:
     """
diff --git a/tests/model_serving/model_runtime/mlserver/model_car/README.md b/tests/model_serving/model_runtime/mlserver/model_car/README.md
@@ -0,0 +1,46 @@
+# MLServer Model Car (OCI Image) Tests
+
+End-to-end tests for MLServer inference using model car (OCI image-based) deployments.
+Models are packaged as OCI container images and deployed via KServe InferenceService with `storageUri: oci://...`.
+
+## Supported Model Formats
+
+- sklearn
+- xgboost
+- lightgbm
+- onnx
+
+## OCI Model Images
+
+The OCI model images used in these tests are built from:
+<https://github.com/Jooho/oci-model-images>
+
+If the version of a supported framework (xgboost, lightgbm, sklearn, onnx) changes in MLServer,
+the model images must be rebuilt and pushed from that repository.
+
+The framework versions used by MLServer can be found at:
+<https://github.com/red-hat-data-services/MLServer/blob/main/requirements/requirements-cpu.txt#L261>
+
+For e2e testing, images should be tagged with the `-e2e` suffix to pin stable versions.
+
+## Running Tests
+
+Run all model car tests:
+
+```bash
+OC_BINARY_PATH=/usr/local/bin/oc uv run pytest tests/model_serving/model_runtime/mlserver/model_car
+```
+
+Run a specific model format (e.g., onnx only):
+
+```bash
+OC_BINARY_PATH=/usr/local/bin/oc uv run pytest tests/model_serving/model_runtime/mlserver/model_car -k "onnx"
+```
+
+## Updating Snapshots
+
+If model responses change and snapshots need to be updated, add the `--snapshot-update` flag:
+
+```bash
+OC_BINARY_PATH=/usr/local/bin/oc uv run pytest tests/model_serving/model_runtime/mlserver/model_car --snapshot-update
+```
diff --git a/tests/model_serving/model_runtime/mlserver/model_car/__init__.py b/tests/model_serving/model_runtime/mlserver/model_car/__init__.py
diff --git a/tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[lightgbm-modelcar-raw-deployment].json b/tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[lightgbm-modelcar-raw-deployment].json
@@ -0,0 +1,23 @@
+{
+  "id": "lightgbm",
+  "model_name": "lightgbm-modelcar",
+  "outputs": [
+    {
+      "data": [
+        0.0017564886970520908,
+        0.008535872687680112,
+        0.9897076386152678
+      ],
+      "datatype": "FP64",
+      "name": "predict",
+      "parameters": {
+        "content_type": "np"
+      },
+      "shape": [
+        1,
+        3
+      ]
+    }
+  ],
+  "parameters": {}
+}
diff --git a/tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[lightgbm-modelcar-raw-deployment_text_type].json b/tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[lightgbm-modelcar-raw-deployment_text_type].json
@@ -0,0 +1,23 @@
+{
+  "id": "lightgbm",
+  "model_name": "lightgbm-modelcar",
+  "outputs": [
+    {
+      "data": [
+        0.0017564886970520908,
+        0.008535872687680112,
+        0.9897076386152678
+      ],
+      "datatype": "FP64",
+      "name": "predict",
+      "parameters": {
+        "content_type": "np"
+      },
+      "shape": [
+        1,
+        3
+      ]
+    }
+  ],
+  "parameters": {}
+}
diff --git a/tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[onnx-modelcar-raw-deployment].json b/tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[onnx-modelcar-raw-deployment].json
@@ -0,0 +1,23 @@
+{
+  "id": "onnx",
+  "model_name": "onnx-modelcar",
+  "outputs": [
+    {
+      "data": [
+        4.1880645751953125,
+        2.2079954147338867,
+        -4.680917263031006
+      ],
+      "datatype": "FP32",
+      "name": "predict",
+      "parameters": {
+        "content_type": "np"
+      },
+      "shape": [
+        1,
+        3
+      ]
+    }
+  ],
+  "parameters": {}
+}
diff --git a/tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[sklearn-modelcar-raw-deployment].json b/tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[sklearn-modelcar-raw-deployment].json
@@ -0,0 +1,22 @@
+{
+  "id": "sklearn",
+  "model_name": "sklearn-modelcar",
+  "outputs": [
+    {
+      "data": [
+        1,
+        1
+      ],
+      "datatype": "INT64",
+      "name": "predict",
+      "parameters": {
+        "content_type": "np"
+      },
+      "shape": [
+        2,
+        1
+      ]
+    }
+  ],
+  "parameters": {}
+}
diff --git a/tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[xgboost-modelcar-raw-deployment].json b/tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[xgboost-modelcar-raw-deployment].json
@@ -0,0 +1,22 @@
+{
+  "id": "xgboost",
+  "model_name": "xgboost-modelcar",
+  "outputs": [
+    {
+      "data": [
+        1.0,
+        1.0
+      ],
+      "datatype": "FP32",
+      "name": "predict",
+      "parameters": {
+        "content_type": "np"
+      },
+      "shape": [
+        2,
+        1
+      ]
+    }
+  ],
+  "parameters": {}
+}
diff --git a/tests/model_serving/model_runtime/mlserver/model_car/test_mlserver_model_car.py b/tests/model_serving/model_runtime/mlserver/model_car/test_mlserver_model_car.py
@@ -0,0 +1,137 @@
+"""
+Test module for MLServer model car (OCI image) deployment.
+
+This module validates MLServer inference using model car OCI images
+for sklearn, xgboost, and lightgbm formats.
+"""
+
+from typing import Any
+
+import pytest
+from ocp_resources.inference_service import InferenceService
+
+from tests.model_serving.model_runtime.mlserver.constant import MODEL_CONFIGS
+from tests.model_serving.model_runtime.mlserver.utils import (
+    get_deployment_config_dict,
+    get_model_namespace_dict,
+    get_model_storage_uri_dict,
+    get_test_case_id,
+    validate_inference_request,
+)
+from utilities.constants import ModelFormat, Protocols
+from utilities.infra import get_pods_by_isvc_label
+
+
+@pytest.mark.smoke
+@pytest.mark.parametrize(
+    (
+        "model_namespace",
+        "mlserver_model_car_inference_service",
+        "mlserver_serving_runtime",
+    ),
+    [
+        pytest.param(
+            get_model_namespace_dict(model_format_name=ModelFormat.SKLEARN, modelcar=True),
+            {
+                **get_model_storage_uri_dict(model_format_name=ModelFormat.SKLEARN, modelcar=True),
+                **get_deployment_config_dict(model_format_name=ModelFormat.SKLEARN),
+            },
+            get_deployment_config_dict(model_format_name=ModelFormat.SKLEARN),
+            id=get_test_case_id(model_format_name=ModelFormat.SKLEARN, modelcar=True),
+        ),
+        pytest.param(
+            get_model_namespace_dict(model_format_name=ModelFormat.XGBOOST, modelcar=True),
+            {
+                **get_model_storage_uri_dict(model_format_name=ModelFormat.XGBOOST, modelcar=True),
+                **get_deployment_config_dict(model_format_name=ModelFormat.XGBOOST),
+            },
+            get_deployment_config_dict(model_format_name=ModelFormat.XGBOOST),
+            id=get_test_case_id(model_format_name=ModelFormat.XGBOOST, modelcar=True),
+        ),
+        pytest.param(
+            get_model_namespace_dict(model_format_name=ModelFormat.LIGHTGBM, modelcar=True),
+            {
+                **get_model_storage_uri_dict(model_format_name=ModelFormat.LIGHTGBM, modelcar=True),
+                **get_deployment_config_dict(model_format_name=ModelFormat.LIGHTGBM),
+            },
+            get_deployment_config_dict(model_format_name=ModelFormat.LIGHTGBM),
+            id=get_test_case_id(model_format_name=ModelFormat.LIGHTGBM, modelcar=True),
+        ),
+        pytest.param(
+            {"name": f"{ModelFormat.LIGHTGBM}-model-car-text-type"},
+            {
+                **get_model_storage_uri_dict(
+                    model_format_name=ModelFormat.LIGHTGBM,
+                    modelcar=True,
+                    env_variables=[{"name": "MLSERVER_MODEL_URI", "value": "/mnt/models/model.txt"}],
+                ),
+                **get_deployment_config_dict(model_format_name=ModelFormat.LIGHTGBM),
+            },
+            get_deployment_config_dict(model_format_name=ModelFormat.LIGHTGBM),
+            id=get_test_case_id(model_format_name=ModelFormat.LIGHTGBM, modelcar=True) + "_text_type",
+        ),
+        pytest.param(
+            get_model_namespace_dict(model_format_name=ModelFormat.ONNX, modelcar=True),
+            {
+                **get_model_storage_uri_dict(model_format_name=ModelFormat.ONNX, modelcar=True),
+                **get_deployment_config_dict(model_format_name=ModelFormat.ONNX),
+            },
+            get_deployment_config_dict(model_format_name=ModelFormat.ONNX),
+            id=get_test_case_id(model_format_name=ModelFormat.ONNX, modelcar=True),
+        ),
+    ],
+    indirect=[
+        "model_namespace",
+        "mlserver_model_car_inference_service",
+        "mlserver_serving_runtime",
+    ],
+)
+class TestMLServerModelCar:
+    """
+    Test class for MLServer model car (OCI image) inference.
+
+    Validates inference functionality using OCI images for sklearn,
+    xgboost, and lightgbm model formats.
+    """
+
+    def test_mlserver_model_car_inference(
+        self,
+        mlserver_model_car_inference_service: InferenceService,
+        mlserver_response_snapshot: Any,
+    ) -> None:
+        """
+        Test model inference using MLServer model car with OCI images.
+
+        Validates that MLServer can load models from OCI images and
+        perform inference using REST protocol.
+
+        Args:
+            mlserver_model_car_inference_service: Deployed inference service.
+            mlserver_response_snapshot: Expected response for validation.
+        """
+        # Extract model format from InferenceService spec
+        model_format = mlserver_model_car_inference_service.instance.spec.predictor.model.modelFormat.name
+
+        if model_format not in MODEL_CONFIGS:
+            raise ValueError(f"Unsupported model format: {model_format}")
+
+        model_format_config = MODEL_CONFIGS[model_format]
+
+        # Get pod directly from inference service (following kserve model_car pattern)
+        pods = get_pods_by_isvc_label(
+            client=mlserver_model_car_inference_service.client,
+            isvc=mlserver_model_car_inference_service,
+        )
+        if not pods:
+            raise RuntimeError(f"No pods found for InferenceService {mlserver_model_car_inference_service.name}")
+        pod = pods[0]
+
+        validate_inference_request(
+            pod_name=pod.name,
+            isvc=mlserver_model_car_inference_service,
+            response_snapshot=mlserver_response_snapshot,
+            input_query=model_format_config["rest_query"],
+            model_version="",
+            model_output_type=model_format_config["output_type"],
+            protocol=Protocols.REST,
+        )
diff --git a/tests/model_serving/model_runtime/mlserver/utils.py b/tests/model_serving/model_runtime/mlserver/utils.py
diff --git a/utilities/constants.py b/utilities/constants.py