add initial version of metrics

MichaelSchuldes · MichaelSchuldes · commit 2feebf207b63 · 2025-04-29T11:23:40.000+02:00
diff --git a/README.md b/README.md
@@ -13,18 +13,25 @@
 # Omega-Prime: Data Model, Data Format and Python Library for Handling Ground Truth Traffic Data 
 
 Data Model, Format and Python Library for ground truth data containing information on dynamic objects, map and environmental factors optimized for representing urban traffic. The repository contains:
-- **Sepcification Document:** [./docs/omega_prime_specification.md](https://github.com/ika-rwth-aachen/omega-prime/tree/main/docs/omega_prime_specification.md)
-    - **Data Model**: What signals exists and how these are defined.
-    - **Data Format Specification**: How to exchange and store those signals.
-- **Python Library**: 
-    - **Creation** of omega-prime files from
-        - ASAM OSI GroundTruth trace (e.g., output of esmini)
-        - Table of moving object data (e.g., csv data)
-        - ASAM OpenDRIVE map
-        - [LevelXData datasets](https://levelxdata.com/) through [lxd-io](https://github.com/lenvt/lxd-io)
-    - **Plotting** of data
-    - **Validation** of data
-    - **Interpolation** of data
+### Data Model and Sepcification
+see [./docs/omega_prime_specification.md](https://github.com/ika-rwth-aachen/omega-prime/tree/main/docs/omega_prime_specification.md)
+
+- 🌍 **Data Model**: What signals exists and how these are defined.
+- 🧾 **Data Format Specification**: How to exchange and store those signals.
+
+### Python Library
+  - 🔨 **Create** omega-prime files from many sources (see [./tutorial.ipynb](https://github.com/ika-rwth-aachen/omega-prime/blob/main/tutorial.ipynb)):
+      - ASAM OSI GroundTruth trace (e.g., output of esmini)
+      - Table of moving object data (e.g., csv data)
+      - ASAM OpenDRIVE map
+      - [LevelXData datasets](https://levelxdata.com/) through [lxd-io](https://github.com/lenvt/lxd-io)
+      - extend yourself by subclassing [DatasetConverter](omega_prime/converters/converter.py)
+  - 🗺️ **Map Association**: Associate Object Location with Lanes from OpenDRIVE or OSI Maps (see [tutorial_locator.ipynb](https://github.com/ika-rwth-aachen/omega-prime/tree/main/tutorial_locatory.ipynb))
+  - 📺 **Plotting** of data: interative top view plots using [altair](https://altair-viz.github.io/)
+  - ✅ **Validation** of data: check if your data conforms to the omega-prime specification (e.g., correct yaw) using [pandera](https://pandera.readthedocs.io/en/stable/)
+  - 📐 **Interpolation** of data: bring your data into a fixed frequency
+  - 📈 **Metrics**: compute interaction metrics like PET, TTC, THW (see [tutorial_metrics.ipynb](https://github.com/ika-rwth-aachen/omega-prime/tree/main/tutorial_metrics.ipynb))
+  - 🚀 **Fast Processing** directly on DataFrames using [polars](https://pola.rs/), [polars-st](https://oreilles.github.io/polars-st/)
 
 The data model and format utilze [ASAM OpenDRIVE](https://publications.pages.asam.net/standards/ASAM_OpenDRIVE/ASAM_OpenDRIVE_Specification/latest/specification/index.html#) and [ASAM Open-Simulation-Interface GroundTruth messages](https://opensimulationinterface.github.io/osi-antora-generator/asamosi/V3.7.0/specification/index.html). omega-prime sets requirements on presence and quality of ASAM OSI GroundTruth messages and ASAM OpenDRIVE files and defines a file format for the exchange and storage of these.
 
diff --git a/omega_prime/__init__.py b/omega_prime/__init__.py
@@ -1,7 +1,7 @@
 __pdoc__ = {}
 __pdoc__["converters"] = False
 """ .. include:: ./../README.md """
-from . import converters
+from . import converters, metrics
 from .map_odr import MapOdr
 from .locator import LaneRelation, Locator
 from .map import Lane, LaneBoundary, Map, MapOsi
@@ -18,4 +18,5 @@
     "Locator",
     "LaneRelation",
     "converters",
+    "metrics",
 ]
diff --git a/omega_prime/metrics.py b/omega_prime/metrics.py
@@ -0,0 +1,163 @@
+import polars as pl
+from dataclasses import dataclass, field
+from collections.abc import Callable
+import polars_st as st
+from .recording import Recording
+import graphlib
+
+
+@dataclass
+class Metric:
+    compute_func: Callable[[pl.LazyFrame, ...], tuple[pl.LazyFrame, dict[str, pl.LazyFrame]]]
+    computes_columns: list[str] = field(default_factory=list)
+    computes_properties: list[str] = field(default_factory=list)
+    requires_columns: list[str] = field(default_factory=list)
+    requires_properties: list[str] = field(default_factory=list)
+
+    def compute_lazy(self, df, **kwargs) -> tuple[pl.DataFrame, dict[str, pl.DataFrame]]:
+        return self.compute_func(df, **kwargs)
+
+
+@dataclass
+class MetricManager:
+    metrics: list[Metric]
+    _dependencies: dict[int | str, list[int | str]] = field(init=False)
+    _ordered_metrics: list[Metric] = field(init=False)
+
+    def __post_init__(self):
+        self._dependencies = {
+            val: [i]
+            for i, m in enumerate(self.metrics)
+            for val in [f"column_{n}" for n in m.computes_columns] + [f"property_{n}" for n in m.computes_properties]
+        } | {
+            i: [f"column_{n}" for n in m.requires_columns] + [f"property_{n}" for n in m.requires_properties]
+            for i, m in enumerate(self.metrics)
+        }
+
+        unresovled_dependencies = {
+            k: v for k, vv in self._dependencies.items() for v in vv if v not in self._dependencies
+        }
+        if len(unresovled_dependencies) > 0:
+            error_dict = {f"self.metrics[{k}]": v for k, v in unresovled_dependencies.items()}
+            raise RuntimeError(
+                f"There are columns and properties required by metrics, that are never computed: {error_dict}"
+            )
+
+        ts = graphlib.TopologicalSorter(self._dependencies)
+        self._ordered_metrics = [self.metrics[o] for o in ts.static_order() if isinstance(o, int)]
+
+    def __repr__(self):
+        return f"computes columns: {[c for m in self._ordered_metrics for c in m.computes_columns]} - computes properties {[p for m in self._ordered_metrics for p in m.computes_properties]}"
+
+    def compute(self, r: Recording, *args, **kwargs) -> tuple[pl.DataFrame, dict[str, pl.DataFrame]]:
+        if "polygon" not in r._df.columns:
+            r._df = r._add_polygons(r._df)
+        if "geometry" not in r._df.columns:
+            r._df = r._df.with_columns(geometry=st.from_shapely("polygon"))
+
+        df = pl.LazyFrame(r._df)
+        properties = {}
+        for m in self._ordered_metrics:
+            df, new_p = m.compute_lazy(df, *args, **{k: properties[k] for k in m.requires_properties}, **kwargs)
+            properties |= new_p
+        res = pl.collect_all([df] + list(properties.values()))
+        df, computed_props = res[0], res[1:]
+        return df, {k: v for k, v in zip(properties.keys(), computed_props)}
+
+
+def add_driven_distance_and_vel(df, *args, **kwargs) -> tuple[pl.DataFrame, dict[str, pl.DataFrame]]:
+    return df.with_columns(
+        (pl.col("x").diff() ** 2 + pl.col("y").diff() ** 2)
+        .sqrt()
+        .over("idx")
+        .fill_null(0.0)
+        .cum_sum()
+        .alias("distance_traveled"),
+        (pl.col("vel_x") ** 2 + pl.col("vel_y") ** 2).sqrt().alias("vel"),
+    ), {}
+
+
+drivenDistancenAndVel = Metric(computes_columns=["distance_traveled", "vel"], compute_func=add_driven_distance_and_vel)
+
+
+def get_timegaps(df, ego_id, *args, time_buffer=2e9, **kwargs):
+    ego_df = df.filter(idx=ego_id)
+
+    crossed = df.join(ego_df, how="cross", suffix="_ego")
+
+    crossed = crossed.filter(
+        (pl.col("total_nanos_ego") - time_buffer) <= pl.col("total_nanos"),
+        (pl.col("total_nanos_ego") + time_buffer) >= pl.col("total_nanos"),
+        pl.col("idx_ego") != pl.col("idx"),
+    )
+
+    all_timegaps = (
+        crossed.filter(pl.col("geometry").st.intersects(pl.col("geometry_ego")))
+        .with_columns(timegap=(pl.col("total_nanos") - pl.col("total_nanos_ego")) / 1e9)
+        .select(
+            "idx_ego", "idx", "total_nanos_ego", "total_nanos", "timegap", "distance_traveled", "distance_traveled_ego"
+        )
+    )
+
+    timegaps = (
+        all_timegaps.group_by("idx", "idx_ego", "total_nanos_ego")
+        .agg(
+            pl.col("timegap", "total_nanos", "distance_traveled", "distance_traveled_ego").get(
+                pl.col("timegap").abs().arg_min()
+            ),
+        )
+        .sort("idx_ego", "idx", "total_nanos_ego")
+        .select(
+            "idx_ego", "idx", "total_nanos_ego", "timegap", "total_nanos", "distance_traveled", "distance_traveled_ego"
+        )
+    )
+    min_timegaps = timegaps.group_by("idx_ego", "idx").agg(
+        pl.col("timegap").get(pl.col("timegap").abs().arg_min()).alias("min_timegap")
+    )
+
+    p_timegaps = (
+        crossed.join(timegaps, how="right", suffix="_overlap", on=["idx", "idx_ego"])
+        .with_columns(
+            pl.when(pl.col("total_nanos") >= pl.col("total_nanos_overlap"))
+            .then((pl.col("total_nanos_overlap") - pl.col("total_nanos")) / 1e9)
+            .otherwise((pl.col("distance_traveled_overlap") - pl.col("distance_traveled")) / pl.col("vel"))
+            .alias("time_to_overlap"),
+            pl.when(pl.col("total_nanos_ego") >= pl.col("total_nanos_ego_overlap"))
+            .then((pl.col("total_nanos_ego_overlap") - pl.col("total_nanos_ego")) / 1e9)
+            .otherwise((pl.col("distance_traveled_ego_overlap") - pl.col("distance_traveled_ego")) / pl.col("vel_ego"))
+            .alias("time_to_overlap_ego"),
+        )
+        .with_columns(
+            -(
+                pl.col("time_to_overlap_ego")
+                - pl.col("time_to_overlap")
+                + (pl.col("total_nanos_ego") - pl.col("total_nanos")) / 1e9
+            ).alias("p_timegap")
+        )
+        .group_by("idx_ego", "idx", "total_nanos_ego")
+        .agg(
+            pl.col("p_timegap", "total_nanos")
+            .sort_by(pl.col("p_timegap").abs(), descending=False, nulls_last=True)
+            .first()
+        )
+        .sort("idx_ego", "idx", "total_nanos_ego")
+    )
+
+    min_p_timegaps = p_timegaps.group_by("idx_ego", "idx").agg(
+        pl.col("p_timegap").sort_by(pl.col("p_timegap").abs(), descending=False).first()
+    )
+
+    return df, {
+        "timegaps": timegaps,
+        "min_timegaps": min_timegaps,
+        "p_timegaps": p_timegaps,
+        "min_p_timegaps": min_p_timegaps,
+    }
+
+
+timegaps_and_p_timegaps = Metric(
+    requires_columns=["distance_traveled", "vel"],
+    compute_func=get_timegaps,
+    computes_columns=[],
+    computes_properties=["timegaps", "min_timegaps", "p_timegaps", "min_p_timegaps"],
+)
diff --git a/omega_prime/recording.py b/omega_prime/recording.py
@@ -604,6 +604,7 @@ def plot_altair(self, start_frame=0, end_frame=-1, plot_map=True, metric_column=
                 ]
             )
             self._map_df = self._map_df.with_columns(geometry=st.from_shapely("polygon"))
+            self._map_df.with_columns(pl.col("geometry").st.simplify(tolerance=1))
 
         if end_frame != -1:
             df = self._df.filter(pl.col("frame") < end_frame, pl.col("frame") >= start_frame)
@@ -631,11 +632,12 @@ def plot_altair(self, start_frame=0, end_frame=-1, plot_map=True, metric_column=
             },
             "properties": {},
         }
-        map = (
-            self._map_df["geometry", "idx", "type"]
-            .st.plot(color="green", fillOpacity=0.4)
-            .encode(tooltip=["properties.idx:N", "properties.type:O"])
-        )
+        if plot_map:
+            map = (
+                self._map_df["geometry", "idx", "type"]
+                .st.plot(color="green", fillOpacity=0.4)
+                .encode(tooltip=["properties.idx:N", "properties.type:O"])
+            )
         mvs = (
             df["geometry", "idx", "frame", "type"]
             .st.plot()
@@ -651,7 +653,7 @@ def plot_altair(self, start_frame=0, end_frame=-1, plot_map=True, metric_column=
         )
 
         map_view = (
-            (map + mvs)
+            ((map + mvs) if plot_map else mvs)
             .project("identity", reflectY=True, fit=pov)
             .properties(height=int(ymax - ymin) * 3, width=int(xmax - xmin) * 3, title="Map")
         )
diff --git a/pyproject.toml b/pyproject.toml
@@ -89,6 +89,7 @@ testpaths = [
     "tests",
     "tutorial.ipynb",
     "tutorial_locator.ipynb",
+#    "tutorial_metrics.ipynb",
     "README.md"
 ]
 log_cli = true
diff --git a/requirements.txt b/requirements.txt
@@ -14,7 +14,7 @@ betterproto2==0.3.1
     # via betterosi
 betterproto2-rust-codec==0.1.3
     # via betterproto2
-certifi==2025.1.31
+certifi==2025.4.26
     # via
     #   pyogrio
     #   pyproj
@@ -81,7 +81,7 @@ multidict==6.4.3
     # via grpclib
 mypy-extensions==1.1.0
     # via typing-inspect
-narwhals==1.36.0
+narwhals==1.37.0
     # via altair
 networkx==3.4.2
     # via omega-prime (./pyproject.toml)
@@ -115,7 +115,7 @@ pandera==0.23.1
     # via omega-prime (./pyproject.toml)
 pillow==11.2.1
     # via matplotlib
-polars==1.27.1
+polars==1.28.1
     # via
     #   omega-prime (./pyproject.toml)
     #   lxd-io
@@ -127,7 +127,7 @@ protobuf==6.30.2
     # via
     #   betterosi
     #   mcap-protobuf-support
-pyarrow==19.0.1
+pyarrow==20.0.0
     # via
     #   pandas
     #   polars-st
@@ -186,7 +186,7 @@ tqdm-joblib==0.0.4
     # via omega-prime (./pyproject.toml)
 typeguard==4.4.2
     # via pandera
-typer==0.15.2
+typer==0.15.3
     # via
     #   omega-prime (./pyproject.toml)
     #   betterosi
diff --git a/tutorial_metrics.ipynb b/tutorial_metrics.ipynb
diff --git a/uv.lock b/uv.lock

Original file line number	Diff line number	Diff line change
`@@ -89,6 +89,7 @@ testpaths = [`
`89`	`89`	`"tests",`
`90`	`90`	`"tutorial.ipynb",`
`91`	`91`	`"tutorial_locator.ipynb",`
	`92`	`+# "tutorial_metrics.ipynb",`
`92`	`93`	`"README.md"`
`93`	`94`	`]`
`94`	`95`	`log_cli = true`