single script for score plotting

Fuhan-Yang · Fuhan-Yang · commit 337554ec4253 · 2026-02-10T11:43:28.000-05:00
diff --git a/scripts/plot_scores.py b/scripts/plot_scores.py
@@ -0,0 +1,145 @@
+import argparse
+from pathlib import Path
+
+import altair as alt
+import polars as pl
+import yaml
+from plot_data import (
+    MEDIAN_ENCODINGS,
+    TICK_KWARGS,
+    add_medians,
+    gather_n,
+    month_order,
+)
+
+LINE_OPACITY = 0.4
+
+# scores across seasons & states
+
+if __name__ == "__main__":
+    p = argparse.ArgumentParser()
+    p.add_argument("--scores", required=True)
+    p.add_argument("--output_dir", required=True)
+    p.add_argument("--config", required=True)
+
+    args = p.parse_args()
+
+    with open(args.config) as f:
+        config = yaml.safe_load(f)
+
+    scores = pl.read_parquet(args.scores)
+
+    out_dir = Path(args.output_dir)
+    out_dir.mkdir(parents=True, exist_ok=True)
+
+    fit_scores = scores.filter(
+        pl.col("forecast_date") == pl.col("forecast_date").max(),
+        pl.col("score_fun") == pl.lit("mspe"),
+    ).with_columns(pl.col("score_value").log())
+
+    sort_month = month_order(config["season"]["start_month"])
+    enc_x_month = alt.X("month", title=None, sort=sort_month)
+
+    enc_y_mspe = alt.Y(
+        "score_value", title="Score (Log(MSPE))", scale=alt.Scale(zero=False)
+    )
+
+    alt.Chart(
+        add_medians(fit_scores, group_by="season", value_col="score_value")
+    ).mark_point().encode(
+        alt.X("season", title=None),
+        enc_y_mspe,
+        *MEDIAN_ENCODINGS,
+    ).save(out_dir / "score_by_season.svg")
+
+    alt.Chart(
+        add_medians(fit_scores, group_by="geography", value_col="score_value")
+    ).mark_point().encode(
+        alt.X(
+            "geography",
+            title=None,
+            sort=alt.EncodingSortField("score_value", "median", "descending"),
+        ),
+        enc_y_mspe,
+        *MEDIAN_ENCODINGS,
+    ).save(out_dir / "score_by_geo.svg")
+
+    # scores increasing through the season?
+    # sis = score in season
+    sis_data = scores.filter(
+        pl.col("score_fun") == pl.lit("eos_abs_diff"),
+        pl.col("season") == pl.col("season").max(),
+    ).with_columns(month=pl.col("forecast_date").dt.to_string("%b"))
+
+    sis_line = (
+        alt.Chart(sis_data)
+        .mark_line(color="black", opacity=LINE_OPACITY)
+        .encode(
+            enc_x_month,
+            alt.Y("score_value", title="Score (abs. end-of-season diff.)"),
+            alt.Detail("geography"),
+        )
+    )
+
+    sis_tick_base = alt.Chart(
+        sis_data.filter(pl.col("forecast_date") == pl.col("forecast_date").max())
+        .sort("score_value")
+        .pipe(gather_n, 5)
+    ).encode(
+        enc_x_month,
+        alt.Y("score_value"),
+        alt.Text("geography"),
+    )
+
+    sis_tick = sis_tick_base.mark_point(**TICK_KWARGS)
+    sis_text = sis_tick_base.mark_text(align="left", dx=15)
+
+    (sis_line + sis_tick + sis_text).save(out_dir / "scores_increasing.svg")
+
+    ## summary of end-of-season abs diff ##
+    alt.Chart(sis_data).mark_boxplot(extent="min-max").encode(
+        enc_x_month,
+        alt.Y("score_value", title="Score (abs. end-of-season diff.)"),
+    ).save(out_dir / "eos_abs_diff_summary.svg")
+
+    # end-of-season abs diff by state #
+    state_sort = (
+        sis_data.filter(pl.col("month") == "Jul")
+        .sort(pl.col("score_value"))
+        .select("geography")
+        .to_numpy()
+        .ravel()
+        .tolist()
+    )
+    alt.Chart(sis_data).mark_line(color="black", opacity=LINE_OPACITY).encode(
+        enc_x_month,
+        alt.Y("score_value", title="Score (abs. end-of-season diff.)"),
+        alt.Facet("geography", columns=9, sort=state_sort),
+    ).save(out_dir / "eos_abs_diff_by_state.svg")
+
+    # score vs. forecast
+    avg_fit = (
+        fit_scores.group_by(["model", "geography"])
+        .agg(pl.col("score_value").median())
+        .rename({"score_value": "fit_score"})
+    )
+    fc_goodness = (
+        scores.filter(
+            pl.col("score_fun") == pl.lit("eos_abs_diff"),
+            pl.col("season") == pl.col("season").max(),
+            pl.col("forecast_date") == pl.col("forecast_date").min(),
+        )
+        .select(["geography", "model", "score_value"])
+        .rename({"score_value": "fc_score"})
+    )
+
+    alt.Chart(
+        avg_fit.join(fc_goodness, on=["model", "geography"], how="inner")
+    ).mark_point(color="black").encode(
+        alt.X(
+            "fit_score",
+            title="Fit score (median MSPE over seasons)",
+            scale=alt.Scale(zero=False),
+        ),
+        alt.Y("fc_score", title="Forecast score (abs. end-of-season diff.)"),
+    ).save(out_dir / "forecast_fit_compare.svg")