ihmeuw
diff --git a/‎pyproject.toml‎
Lines changed: 1 addition & 0 deletions b/‎pyproject.toml‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎setup.py‎
Lines changed: 9 additions & 2 deletions b/‎setup.py‎
Lines changed: 9 additions & 2 deletions
diff --git a/‎src/vivarium_testing_utils/automated_validation/data_loader.py‎
Lines changed: 14 additions & 1 deletion b/‎src/vivarium_testing_utils/automated_validation/data_loader.py‎
Lines changed: 14 additions & 1 deletion
@@ -41,5 +41,6 @@ module = [
     "py._path.local",
     "scipy.*",
     # "sklearn.*",
+    "vivarium_inputs.*",
 ]
 ignore_missing_imports = true
@@ -47,13 +47,18 @@
         "vivarium_dependencies[pandas,numpy,pyyaml,scipy,click,tables,loguru,networkx]",
         "vivarium_build_utils>=2.0.1,<3.0.0",
         "pyarrow",
-        "vivarium",
         # Type stubs
         "types-setuptools",
     ]
 
     setup_requires = ["setuptools_scm"]
 
+    validation_requirements = [
+        "vivarium",
+        "vivarium-inputs",
+        "pandera",
+    ]
+
     interactive_requirements = [
         "vivarium_dependencies[interactive]",
     ]
@@ -108,10 +113,12 @@
             "docs": doc_requirements,
             "test": test_requirements,
             "interactive": interactive_requirements,
+            "validation": validation_requirements,
             "dev": doc_requirements
             + test_requirements
             + interactive_requirements
-            + lint_requirements,
+            + lint_requirements
+            + validation_requirements,
         },
         zip_safe=False,
         use_scm_version={
 
@@ -31,6 +31,9 @@ def from_str(cls, source: str) -> DataSource:
             raise ValueError(f"Source {source} not recognized. Must be one of {DataSource}")
 
 
+NONSTANDARD_ARTIFACT_KEYS = {"population.age_bins"}
+
+
 class DataLoader:
     def __init__(self, sim_output_dir: Path, cache_size_mb: int = 1000):
         self._sim_output_dir = sim_output_dir
@@ -74,6 +77,9 @@ def upload_custom_data(self, dataset_key: str, data: pd.DataFrame) -> None:
 
     def _load_from_source(self, dataset_key: str, source: DataSource) -> pd.DataFrame:
         """Load the data from the given source via the loader mapping."""
+        if source == DataSource.ARTIFACT and dataset_key in NONSTANDARD_ARTIFACT_KEYS:
+            # Load nonstandard artifact keys from the artifact
+            return self._load_nonstandard_artifact(dataset_key)
         return self._loader_mapping[source](dataset_key)
 
     def _add_to_cache(self, dataset_key: str, source: DataSource, data: pd.DataFrame) -> None:
@@ -115,9 +121,16 @@ def _load_artifact(results_dir: Path) -> Artifact:
         ]["artifact_path"]
         return Artifact(artifact_path)
 
+    def _load_nonstandard_artifact(self, dataset_key: str) -> pd.DataFrame:
+        """Load artifact data for nonstandard (e.g. not draw or single numeric) keys."""
+        data: pd.DataFrame = self._artifact.load(dataset_key)
+        self._artifact.clear_cache()
+        return data
+
     @check_io(out=SingleNumericColumn)
     def _load_from_artifact(self, dataset_key: str) -> pd.DataFrame:
-        data = self._artifact.load(dataset_key)
+        """Load data directly from artifact, assuming correctly formatted data."""
+        data: pd.DataFrame = self._artifact.load(dataset_key)
         self._artifact.clear_cache()
         return clean_artifact_data(dataset_key, data)
Original file line number	Diff line number	Diff line change
`@@ -41,5 +41,6 @@ module = [`
`41`	`41`	`"py._path.local",`
`42`	`42`	`"scipy.*",`
`43`	`43`	`# "sklearn.*",`
	`44`	`+ "vivarium_inputs.*",`
`44`	`45`	`]`
`45`	`46`	`ignore_missing_imports = true`