Cache exposure pipeline for nonloglinear effects

stevebachmeier · stevebachmeier · commit 49cb099695fd · 2026-02-04T11:36:43.000-07:00
diff --git a/src/vivarium_public_health/risks/base_risk.py b/src/vivarium_public_health/risks/base_risk.py
@@ -13,6 +13,7 @@
 import pandas as pd
 from vivarium import Component
 from vivarium.framework.engine import Builder
+from vivarium.framework.event import Event
 from vivarium.framework.population import SimulantData
 from vivarium.framework.randomness import RandomnessStream
 
@@ -171,6 +172,7 @@ def __init__(self, risk: str):
         self.randomness_stream_name = f"initial_{self.risk.name}_propensity"
         self.propensity_name = f"{self.risk.name}.propensity"
         self.exposure_name = f"{self.risk.name}.exposure"
+        self.exposure_column_name = f"{self.risk.name}_exposure_for_non_loglinear_riskeffect"
 
     #################
     # Setup methods #
@@ -184,9 +186,20 @@ def setup(self, builder: Builder) -> None:
 
         self.randomness = self.get_randomness_stream(builder)
         self.register_exposure_pipeline(builder)
+
+        self.includes_non_loglinear_risk_effect = bool(
+            [
+                component
+                for component in builder.components.list_components()
+                if component.startswith(f"non_log_linear_risk_effect.{self.risk.name}_on_")
+            ]
+        )
+        columns_to_create = [self.propensity_name]
+        if self.includes_non_loglinear_risk_effect:
+            columns_to_create.append(self.exposure_column_name)
         builder.population.register_initializer(
             initializer=self.on_initialize_simulants,
-            columns=self.propensity_name,
+            columns=columns_to_create,
             required_resources=[self.randomness],
         )
 
@@ -279,3 +292,22 @@ def on_initialize_simulants(self, pop_data: SimulantData) -> None:
             self.randomness.get_draw(pop_data.index), name=self.propensity_name
         )
         self.population_view.update(propensity)
+        self.update_exposure_column(pop_data.index)
+
+    def on_time_step_prepare(self, event: Event) -> None:
+        self.update_exposure_column(event.index)
+
+    def update_exposure_column(self, index: pd.Index) -> None:
+        """Updates the exposure column with pipeline values.
+
+        HACK: This is effectively caching the exposure pipeline for use by other
+        components. Specifically, :meth:`vivarium_public_health.risks.effect.NonLogLinearRiskEffect.get_relative_risk_source`
+        needs the exposure values but calling that pipeline was very slow. By
+        maintaining a cached copy of the exposure values in a private column, we
+        can then request that corresponding "simple" pipeline from the population
+        view instead which is significantly faster.
+        """
+        if self.includes_non_loglinear_risk_effect:
+            exposure = self.population_view.get_attributes(index, self.exposure_name)
+            exposure.name = self.exposure_column_name
+            self.population_view.update(exposure)
diff --git a/src/vivarium_public_health/risks/effect.py b/src/vivarium_public_health/risks/effect.py
@@ -443,8 +443,12 @@ def define_rr_intervals(df: pd.DataFrame) -> pd.DataFrame:
             .reset_index()
         )
         rr_data = rr_data.drop("parameter", axis=1)
-        rr_data[f"{self.risk.name}.exposure_start"] = rr_data["left_exposure"]
-        rr_data[f"{self.risk.name}.exposure_end"] = rr_data["right_exposure"]
+        rr_data[f"{self.risk.name}_exposure_for_nonloglinear_riskeffect_start"] = rr_data[
+            "left_exposure"
+        ]
+        rr_data[f"{self.risk.name}_exposure_for_nonloglinear_riskeffect_end"] = rr_data[
+            "right_exposure"
+        ]
         # build lookup table
         rr_value_cols = ["left_exposure", "left_rr", "right_exposure", "right_rr"]
         return self.build_lookup_table(
@@ -511,8 +515,10 @@ def get_rr_at_tmrel(rr_data: pd.DataFrame) -> float:
     def get_relative_risk_source(self, builder: Builder) -> Callable[[pd.Index], pd.Series]:
         def generate_relative_risk(index: pd.Index) -> pd.Series:
             rr_intervals = self.relative_risk_table(index)
+            # NOTE: We are calling the cached exposure pipeline here for performance
+            # purposes (as opposed to the f{self.risk.name}.expousure pipeline).
             exposure = self.population_view.get_attributes(
-                index, f"{self.risk.name}.exposure"
+                index, f"{self.risk.name}_exposure_for_nonloglinear_riskeffect"
             )
             x1, x2 = (
                 rr_intervals["left_exposure"].values,