opendatahub-io
diff --git a/‎tests/model_serving/model_runtime/mlserver/README.md‎
Lines changed: 45 additions & 0 deletions b/‎tests/model_serving/model_runtime/mlserver/README.md‎
Lines changed: 45 additions & 0 deletions
diff --git a/‎tests/model_serving/model_runtime/mlserver/conftest.py‎
Lines changed: 46 additions & 2 deletions b/‎tests/model_serving/model_runtime/mlserver/conftest.py‎
Lines changed: 46 additions & 2 deletions
diff --git a/‎tests/model_serving/model_runtime/mlserver/constant.py‎
Lines changed: 1 addition & 2 deletions b/‎tests/model_serving/model_runtime/mlserver/constant.py‎
Lines changed: 1 addition & 2 deletions
diff --git a/‎tests/model_serving/model_runtime/mlserver/model_car/README.md‎
Lines changed: 54 additions & 0 deletions b/‎tests/model_serving/model_runtime/mlserver/model_car/README.md‎
Lines changed: 54 additions & 0 deletions
diff --git a/‎…erver/basic_model_deployment/__init__.py‎ ‎…l_runtime/mlserver/model_car/__init__.py‎tests/model_serving/model_runtime/mlserver/basic_model_deployment/__init__.py renamed to tests/model_serving/model_runtime/mlserver/model_car/__init__.py b/‎…erver/basic_model_deployment/__init__.py‎ ‎…l_runtime/mlserver/model_car/__init__.py‎tests/model_serving/model_runtime/mlserver/basic_model_deployment/__init__.py renamed to tests/model_serving/model_runtime/mlserver/model_car/__init__.py
diff --git a/‎tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[lightgbm-modelcar-RawDeployment].json‎
Lines changed: 23 additions & 0 deletions b/‎tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[lightgbm-modelcar-RawDeployment].json‎
Lines changed: 23 additions & 0 deletions
diff --git a/‎tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[lightgbm-modelcar-RawDeployment_text_type].json‎
Lines changed: 23 additions & 0 deletions b/‎tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[lightgbm-modelcar-RawDeployment_text_type].json‎
Lines changed: 23 additions & 0 deletions
diff --git a/‎tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[onnx-modelcar-RawDeployment].json‎
Lines changed: 23 additions & 0 deletions b/‎tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[onnx-modelcar-RawDeployment].json‎
Lines changed: 23 additions & 0 deletions
diff --git a/‎tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[sklearn-modelcar-RawDeployment].json‎
Lines changed: 22 additions & 0 deletions b/‎tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[sklearn-modelcar-RawDeployment].json‎
Lines changed: 22 additions & 0 deletions
diff --git a/‎tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[xgboost-modelcar-RawDeployment].json‎
Lines changed: 22 additions & 0 deletions b/‎tests/model_serving/model_runtime/mlserver/model_car/__snapshots__/test_mlserver_model_car/TestMLServerModelCar.test_mlserver_model_car_inference[xgboost-modelcar-RawDeployment].json‎
Lines changed: 22 additions & 0 deletions
@@ -0,0 +1,45 @@
+# MLServer Runtime Test Suite
+
+End-to-end tests for MLServer model serving on OpenShift AI / OpenDataHub.
+This suite validates inference behavior across different model source strategies and formats.
+
+## Sub-suites
+
+- S3 model source: [`s3/README.md`](./s3/README.md)
+- OCI model car source: [`model_car/README.md`](./model_car/README.md)
+
+## What This Suite Covers
+
+- Protocol: REST inference
+- Deployment mode: `RawDeployment`
+- Model formats: sklearn, xgboost, lightgbm, onnx
+- Response validation: snapshot-based assertions
+
+## Run All MLServer Tests
+
+```bash
+OC_BINARY_PATH=/usr/local/bin/oc uv run pytest tests/model_serving/model_runtime/mlserver \
+  --aws-access-key-id=<aws-access-key-id> \
+  --aws-secret-access-key=<aws-secret-access-key> \
+  --models-s3-bucket-name=<bucket-name> \
+  --models-s3-bucket-region=<region> \
+  --models-s3-bucket-endpoint=<endpoint-url>
+```
+
+Optional runtime image override (use only for custom/private image validation):
+
+```bash
+--mlserver-runtime-image=<mlserver-image>
+```
+
+## Snapshot Updates
+
+```bash
+OC_BINARY_PATH=/usr/local/bin/oc uv run pytest tests/model_serving/model_runtime/mlserver \
+  --snapshot-update \
+  --aws-access-key-id=<aws-access-key-id> \
+  --aws-secret-access-key=<aws-secret-access-key> \
+  --models-s3-bucket-name=<bucket-name> \
+  --models-s3-bucket-region=<region> \
+  --models-s3-bucket-endpoint=<endpoint-url>
+```
@@ -60,7 +60,7 @@ def mlserver_serving_runtime(
         name=ModelInferenceRuntime.MLSERVER_RUNTIME,
         namespace=model_namespace.name,
         template_name=RuntimeTemplates.MLSERVER,
-        deployment_type=request.param["deployment_type"],
+        deployment_type=request.param["deployment_mode"],
         runtime_image=mlserver_runtime_image,
     ) as model_runtime:
         yield model_runtime
@@ -98,7 +98,7 @@ def mlserver_inference_service(
         "storage_uri": s3_models_storage_uri,
         "model_format": mlserver_serving_runtime.instance.spec.supportedModelFormats[0].name,
         "model_service_account": mlserver_model_service_account.name,
-        "deployment_mode": params.get("deployment_type", KServeDeploymentType.RAW_DEPLOYMENT),
+        "deployment_mode": params.get("deployment_mode", KServeDeploymentType.RAW_DEPLOYMENT),
         "external_route": params.get("enable_external_route", False),
     }
 
@@ -146,6 +146,50 @@ def mlserver_model_service_account(admin_client: DynamicClient, kserve_s3_secret
         yield sa
 
 
+@pytest.fixture(scope="class")
+def mlserver_model_car_inference_service(
+    request: pytest.FixtureRequest,
+    admin_client: DynamicClient,
+    model_namespace: Namespace,
+    mlserver_serving_runtime: ServingRuntime,
+) -> Generator[InferenceService]:
+    """
+    Create InferenceService for MLServer model car (OCI image) testing.
+
+    Args:
+        request: Pytest fixture request with parameters.
+        admin_client: Kubernetes dynamic client.
+        model_namespace: Namespace for deployment.
+        mlserver_serving_runtime: MLServer ServingRuntime instance.
+
+    Yields:
+        InferenceService: Configured ISVC using OCI storage.
+    """
+    params = request.param
+    storage_uri = params.get("storage-uri")
+    if not storage_uri:
+        raise ValueError("storage-uri is required in params")
+
+    deployment_mode = params.get("deployment_mode", KServeDeploymentType.RAW_DEPLOYMENT)
+    model_format = params.get("model-format")
+    if not model_format:
+        raise ValueError("model-format is required in params")
+
+    with create_isvc(
+        client=admin_client,
+        name=f"{model_format}-modelcar",
+        namespace=model_namespace.name,
+        runtime=mlserver_serving_runtime.name,
+        storage_uri=storage_uri,
+        model_format=model_format,
+        deployment_mode=deployment_mode,
+        external_route=params.get("enable_external_route"),
+        wait_for_predictor_pods=params.get("wait_for_predictor_pods", False),
+        model_env_variables=params.get("model_env_variables"),
+    ) as isvc:
+        yield isvc
+
+
 @pytest.fixture
 def mlserver_response_snapshot(snapshot: Any) -> Any:
     """
 
@@ -18,7 +18,6 @@ class OutputType:
 
 
 LOCALHOST_URL: str = "http://localhost"
-RAW_DEPLOYMENT_TYPE: str = "raw"
 MODEL_PATH_PREFIX: str = "mlserver/model_repository"
 
 PREDICT_RESOURCES: dict[str, list[dict[str, str | dict[str, str]]] | dict[str, dict[str, str]]] = {
@@ -36,7 +35,7 @@ class OutputType:
 }
 
 BASE_RAW_DEPLOYMENT_CONFIG: dict[str, Any] = {
-    "deployment_type": KServeDeploymentType.RAW_DEPLOYMENT,
+    "deployment_mode": KServeDeploymentType.RAW_DEPLOYMENT,
     "min-replicas": 1,
     "enable_external_route": False,
 }
 
@@ -0,0 +1,54 @@
+# MLServer Model Car (OCI Image) Tests
+
+End-to-end tests for MLServer inference using model car (OCI image-based) deployments.
+Models are packaged as OCI container images and deployed via KServe InferenceService with `storageUri: oci://...`.
+
+Main suite overview:
+[`mlserver/README.md`](../README.md)
+
+## Supported Model Formats
+
+- sklearn
+- xgboost
+- lightgbm
+- onnx
+
+## OCI Model Images
+
+The OCI model images used in these tests are built from:
+<https://github.com/Jooho/oci-model-images>
+
+If the version of a supported framework (xgboost, lightgbm, sklearn, onnx) changes in MLServer,
+the model images must be rebuilt and pushed from that repository.
+
+The framework versions used by MLServer can be found at:
+<https://github.com/red-hat-data-services/MLServer/blob/main/requirements/requirements-cpu.txt#L261>
+
+For e2e testing, images should be tagged with the `-e2e` suffix to pin stable versions.
+
+## Running Tests
+
+Run all model car tests:
+
+```bash
+OC_BINARY_PATH=/usr/local/bin/oc uv run pytest tests/model_serving/model_runtime/mlserver/model_car
+```
+
+Run a specific model format (e.g., onnx only):
+
+```bash
+OC_BINARY_PATH=/usr/local/bin/oc uv run pytest tests/model_serving/model_runtime/mlserver/model_car -k "onnx"
+```
+
+## Updating Snapshots
+
+If model responses change and snapshots need to be updated, add the `--snapshot-update` flag:
+
+```bash
+OC_BINARY_PATH=/usr/local/bin/oc uv run pytest tests/model_serving/model_runtime/mlserver/model_car --snapshot-update
+```
+
+## Related Suite
+
+For S3-based MLServer tests, see:
+[`mlserver/s3/README.md`](../s3/README.md)
@@ -0,0 +1,23 @@
+{
+  "id": "lightgbm",
+  "model_name": "lightgbm-modelcar",
+  "outputs": [
+    {
+      "data": [
+        0.0017564886970520908,
+        0.008535872687680112,
+        0.9897076386152678
+      ],
+      "datatype": "FP64",
+      "name": "predict",
+      "parameters": {
+        "content_type": "np"
+      },
+      "shape": [
+        1,
+        3
+      ]
+    }
+  ],
+  "parameters": {}
+}
@@ -0,0 +1,23 @@
+{
+  "id": "lightgbm",
+  "model_name": "lightgbm-modelcar",
+  "outputs": [
+    {
+      "data": [
+        0.0017564886970520908,
+        0.008535872687680112,
+        0.9897076386152678
+      ],
+      "datatype": "FP64",
+      "name": "predict",
+      "parameters": {
+        "content_type": "np"
+      },
+      "shape": [
+        1,
+        3
+      ]
+    }
+  ],
+  "parameters": {}
+}
@@ -0,0 +1,23 @@
+{
+  "id": "onnx",
+  "model_name": "onnx-modelcar",
+  "outputs": [
+    {
+      "data": [
+        4.1880645751953125,
+        2.2079954147338867,
+        -4.680917263031006
+      ],
+      "datatype": "FP32",
+      "name": "predict",
+      "parameters": {
+        "content_type": "np"
+      },
+      "shape": [
+        1,
+        3
+      ]
+    }
+  ],
+  "parameters": {}
+}
@@ -0,0 +1,22 @@
+{
+  "id": "sklearn",
+  "model_name": "sklearn-modelcar",
+  "outputs": [
+    {
+      "data": [
+        1,
+        1
+      ],
+      "datatype": "INT64",
+      "name": "predict",
+      "parameters": {
+        "content_type": "np"
+      },
+      "shape": [
+        2,
+        1
+      ]
+    }
+  ],
+  "parameters": {}
+}
@@ -0,0 +1,22 @@
+{
+  "id": "xgboost",
+  "model_name": "xgboost-modelcar",
+  "outputs": [
+    {
+      "data": [
+        1.0,
+        1.0
+      ],
+      "datatype": "FP32",
+      "name": "predict",
+      "parameters": {
+        "content_type": "np"
+      },
+      "shape": [
+        2,
+        1
+      ]
+    }
+  ],
+  "parameters": {}
+}
Original file line number	Diff line number	Diff line change
`@@ -18,7 +18,6 @@ class OutputType:`
`18`	`18`
`19`	`19`
`20`	`20`	`LOCALHOST_URL: str = "http://localhost"`
`21`		`-RAW_DEPLOYMENT_TYPE: str = "raw"`
`22`	`21`	`MODEL_PATH_PREFIX: str = "mlserver/model_repository"`
`23`	`22`
`24`	`23`	`PREDICT_RESOURCES: dict[str, list[dict[str, str \| dict[str, str]]] \| dict[str, dict[str, str]]] = {`
`@@ -36,7 +35,7 @@ class OutputType:`
`36`	`35`	`}`
`37`	`36`
`38`	`37`	`BASE_RAW_DEPLOYMENT_CONFIG: dict[str, Any] = {`
`39`		`- "deployment_type": KServeDeploymentType.RAW_DEPLOYMENT,`
	`38`	`+ "deployment_mode": KServeDeploymentType.RAW_DEPLOYMENT,`
`40`	`39`	`"min-replicas": 1,`
`41`	`40`	`"enable_external_route": False,`
`42`	`41`	`}`