Image-Analysis-Hub
diff --git a/‎pyproject.toml‎
Lines changed: 2 additions & 1 deletion b/‎pyproject.toml‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎src/epicure/editing.py‎
Lines changed: 1 addition & 1 deletion b/‎src/epicure/editing.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎src/epicure/epicuring.py‎
Lines changed: 30 additions & 4 deletions b/‎src/epicure/epicuring.py‎
Lines changed: 30 additions & 4 deletions
diff --git a/‎src/epicure/geff_export.py‎
Lines changed: 255 additions & 0 deletions b/‎src/epicure/geff_export.py‎
Lines changed: 255 additions & 0 deletions
@@ -4,7 +4,7 @@ build-backend = "setuptools.build_meta"
 
 [project]
 name = "epicure"
-version = "1.5.5"
+version = "1.6.0"
 description = "Napari plugin to manually correct epithelia segmentation in movies"
 license.file = "LICENSE"
 readme = "README.md"
@@ -45,6 +45,7 @@ dependencies = [
     "laptrack>=0.15.0",
     "joblib",
     "appose",
+    	"geff",
 ]
 
 [project.optional-dependencies]
 
@@ -1400,7 +1400,7 @@ def reset_all( self ):
         progress_bar.update(2)
         progress_bar.set_description("Reset: reinit tracks")
         self.epicure.tracked = 0
-        self.epicure.load_tracks(progress_bar)
+        self.epicure.load_tracks( None, progress_bar)
         if self.epicure.verbose > 0:
             print("Resetting done")
         progress_bar.close()
 
@@ -320,6 +320,19 @@ def add_other_chanels(self, chan, chanaxis):
                 mview.contrast_limits=tuple(np.quantile(self.others[ochan],[0.01, 0.9999]))
                 mview.gamma=0.95
                 mview.visible = False
+    
+    def import_geff(self, segpath, verbose=0):
+        """ Load segmentation and tracks from GEFF file """
+        if verbose > 1:
+            print("Importing segmentation and tracks from GEFF file")
+        import epicure.geff_import as geffy
+        tracks, graph, metadata, labels_path = geffy.import_geff( self.segpath )
+        self.epi_metadata["Import"] = "GEFF"  ## initially came from a GEFF file
+        ## copy the metadata loaded from the GEFF file to the Epicure metadata
+        if metadata is not {}:
+            for key, val in metadata.items():
+                self.epi_metadata[key] = val
+        return labels_path, graph, tracks
 
     def import_trackmate(self, segpath, verbose=0):
         """ Load segmentation and tracks from TrackMate XML file """
@@ -336,13 +349,15 @@ def import_trackmate(self, segpath, verbose=0):
         positions = tm.relabel_positions(label_mapping, positions)
         tracks = tm.relabel_tracks(label_mapping, tracks)
         segmentation = tm.relabel_segmentation(label_mapping, segmentation)
+        self.epi_metadata["Import"] = "TrackMate"  ## initially came from a TrackMate file
         return segmentation, tracks
 
 
     def load_segmentation(self, seg_input):
         """Load the segmentation file"""
         start_time = ut.start_time()
         self.graph = None ## no loaded graph
+        track_table = None ## no loaded track data
         ## compatibility to string input, the path to the image or a dictionnary
         if isinstance(seg_input, dict):
             segpath = seg_input["File"]
@@ -357,6 +372,14 @@ def load_segmentation(self, seg_input):
             if str(segpath).endswith(".xml"):
                 ## import a TrackMate file
                 self.seg, self.graph = self.import_trackmate(segpath, verbose=self.verbose>1)
+            elif str(segpath).endswith(".geff"):
+                ## import a GEFF file
+                label_path, self.graph, track_table = self.import_geff(segpath, verbose=self.verbose>1)
+                if label_path is not None:
+                    self.seg, _, _, _, _, _ = ut.open_image( label_path, get_metadata=False, verbose=self.verbose > 1)
+                else:
+                    ut.show_error( "No labelled movie found in the GEFF file. This case is not yet handled by EpiCure. Please raise an issue in the github so that we add it." )
+                    return
             else:
                 self.seg, _, _, _, _, _ = ut.open_image(segpath, get_metadata=False, verbose=self.verbose > 1)
         self.seg = np.uint32(self.seg)
@@ -388,14 +411,17 @@ def load_segmentation(self, seg_input):
             self.seglayer = self.viewer.add_labels(self.seg, name="Segmentation", blending="additive", opacity=0.5, scale=scale)
             self.viewer.dims.set_point(0, 0)
             self.seglayer.brush_size = 4  ## default label pencil drawing size
+        
         if self.verbose > 0:
             ut.show_duration(start_time, header="Segmentation loaded in ")
+        
+        return track_table
 
 
-    def load_tracks(self, progress_bar):
+    def load_tracks(self, track_table, progress_bar):
         """From the segmentation, get all the metadata"""
         tracked = "tracked"
-        self.tracking.init_tracks()
+        self.tracking.init_tracks( track_table )
         if self.tracked == 0:
             tracked = "untracked"
         else:
@@ -442,7 +468,7 @@ def go_epicure(self, outdir="epics", segmentation_input=None):
         progress_bar = progress(total=5)
         progress_bar.set_description("Reading segmented image")
         ## load the segmentation
-        self.load_segmentation(segmentation_input)
+        track_table = self.load_segmentation( segmentation_input )
         if isinstance(segmentation_input, dict):
             self.epi_metadata["SegmentationFile"] = segmentation_input["File"]
         else:
@@ -459,7 +485,7 @@ def go_epicure(self, outdir="epics", segmentation_input=None):
         self.main_widget()
         progress_bar.update(3)
         progress_bar.set_description("Load tracks")
-        self.load_tracks(progress_bar)
+        self.load_tracks( track_table, progress_bar)
         progress_bar.update(4)
 
         ## load graph if it exists
 
@@ -0,0 +1,255 @@
+from typing import Dict, List
+
+import geff
+import geff_spec
+import networkx as nx
+import numpy as np
+import pandas as pd
+import os
+from scipy.cluster.hierarchy import DisjointSet
+
+import epicure.Utils as ut
+
+def create_label_to_track_mapping(
+    divisions: Dict[int, List[int]], unique_labels: List[int]
+) -> Dict[int, int]:
+    """
+    Create a mapping from labels to track IDs using scipy's DisjointSet for efficient track grouping.
+
+    Args:
+        divisions: dict of {daughter_label: [mother_labels]} from epic.tracking.graph
+        unique_labels: list of unique labels present in the tracking data
+
+    Returns:
+        dict: {label: track_id} - mapping from each label to its track ID
+    """
+    if not divisions:
+        # No divisions - each unique label is its own track.
+        return {label: label for label in unique_labels}
+
+    ds = DisjointSet(unique_labels)
+
+    # Union connected labels based on mother-daughter relationships.
+    for daughter, mothers in divisions.items():
+        if daughter not in unique_labels:  # weirdly, this can happen
+            continue
+        for mother in mothers:
+            if mother in unique_labels:
+                ds.merge(daughter, mother)
+
+    # A connected component is a track. We use the root as track ID.
+    # Create a mapping from label to track_id (root).
+    label_to_track_id = {}
+    for label in unique_labels:
+        root = ds[label]
+        label_to_track_id[label] = root
+
+    return label_to_track_id
+
+
+def build_nodes_df(
+    track_data: np.ndarray, divisions: Dict[int, List[int]]
+) -> pd.DataFrame:
+    """Build a DataFrame representing the nodes for the GEFF graph."""
+    df = pd.DataFrame(track_data, columns=["label", "frame", "y", "x"])
+    df["node_id"] = df.index
+
+    # Generate and assign track IDs.
+    labels = list(df["label"].unique())
+    label_to_track_id = create_label_to_track_mapping(divisions, labels)
+    df["track_id"] = df["label"].map(label_to_track_id)
+
+    return df
+
+
+def build_edges_df(divisions: Dict[int, List[int]], df_nodes: pd.DataFrame):
+    """"""
+    if divisions is not None:
+        for daughter, mothers in divisions.items():
+            if len(mothers) > 1:
+                ut.show_error(f"Merge event detected. Label {daughter} "
+                              f"has the following mother labels: {mothers}.")
+    # TODO: does GEFF support merge events?
+
+    # Division edges: for each daughter-mother pair, create an edge.
+    edges_data = [
+        {"daughter": daughter, "mother": mother}
+        for daughter, mothers in divisions.items()
+        for mother in mothers
+    ]
+    df_edges = pd.DataFrame(edges_data)
+    # Labels stay the same until there is a division. But node IDs are unique.
+    # It means that in df_nodes, labels appears multiple times. Because of this
+    # we cannot easily map between df_nodes and df_edges. So we create intermediary
+    # columns to ease the mapping.
+    df_nodes["first_frame"] = df_nodes.groupby("label")["frame"].transform("min")
+    df_nodes["last_frame"] = df_nodes.groupby("label")["frame"].transform("max")
+    # A daughter is at the first frame of its label, a mother at the last frame of its label.
+    df_nodes["daughter"] = df_nodes["first_frame"] == df_nodes["frame"]
+    df_nodes["mother"] = df_nodes["last_frame"] == df_nodes["frame"]
+    df_nodes.drop(columns=["first_frame", "last_frame"], inplace=True)
+    # Now we can map between df_nodes and df_edges.
+    # The in_id is the node ID of the matching label that is a mother,
+    # and the out_id is the node ID of the matching label that is a daughter.
+    df_edges["in_id"] = df_edges["mother"].map(
+        df_nodes[df_nodes["mother"]].set_index("label")["node_id"]
+    )
+    df_edges["out_id"] = df_edges["daughter"].map(
+        df_nodes[df_nodes["daughter"]].set_index("label")["node_id"]
+    )
+    df_nodes.drop(columns=["daughter", "mother"], inplace=True)
+
+    # Non-division edges: for each label, connect consecutive nodes within that label.
+    non_division_edges = []
+    for label in df_nodes["label"].unique():
+        label_spots = df_nodes[df_nodes["label"] == label].sort_values("frame")
+        if len(label_spots) > 1:
+            for i in range(len(label_spots) - 1):
+                current_spot = label_spots.iloc[i]
+                next_spot = label_spots.iloc[i + 1]
+                non_division_edges.append(
+                    {"in_id": current_spot["node_id"], "out_id": next_spot["node_id"]}
+                )
+
+    # Combine division and non-division edges.
+    df_non_division_edges = pd.DataFrame(non_division_edges)
+    if not df_edges.empty and not df_non_division_edges.empty:
+        # Make sure both dataframes have the same columns.
+        df_edges = df_edges[["in_id", "out_id"]]
+        df_edges = pd.concat([df_edges, df_non_division_edges], ignore_index=True)
+    elif not df_non_division_edges.empty:
+        df_edges = df_non_division_edges
+
+    # Final cleanup and type conversion.
+    if not df_edges.empty:
+        # We can have NaN if a label has no mother (appears at first frame)
+        # or no daughter (disappears at last frame).
+        df_edges.dropna(inplace=True)
+        # Convert to int in case of NaN.
+        df_edges["in_id"] = df_edges["in_id"].astype(int)
+        df_edges["out_id"] = df_edges["out_id"].astype(int)
+
+    return df_edges
+
+
+def build_nx_digraph(epic) -> nx.DiGraph:
+    """Build a NetworkX directed graph from EpiCure data."""
+
+    df_nodes = build_nodes_df(epic.tracking.track_data, epic.tracking.graph)
+    df_edges = build_edges_df(epic.tracking.graph, df_nodes)
+
+    graph = nx.from_pandas_edgelist(
+        df_edges, source="in_id", target="out_id", create_using=nx.DiGraph
+    )
+    node_attrs = {row["node_id"]: row.to_dict() for _, row in df_nodes.iterrows()}
+    nx.set_node_attributes(graph, node_attrs)
+
+    return graph
+
+
+def build_props_metadata() -> Dict[str, geff_spec.PropMetadata]:
+    """Build GEFF properties metadata."""
+    md_x = geff_spec.PropMetadata(
+        identifier="x",
+        dtype="int",
+        varlength=False,
+        unit="pixel",
+        name="x",
+        description="X coordinate of center of the cell",
+    )
+    md_y = geff_spec.PropMetadata(
+        identifier="y",
+        dtype="int",
+        varlength=False,
+        unit="pixel",
+        name="y",
+        description="Y coordinate of the center of the cell",
+    )
+    md_t = geff_spec.PropMetadata(
+        identifier="frame",
+        dtype="int32",
+        varlength=False,
+        unit="frame",
+        name="frame",
+        description="Time",
+    )
+    md_label = geff_spec.PropMetadata(
+        identifier="label",
+        dtype="int64",
+        varlength=False,
+        name="label",
+        description="Label of the cell",
+    )
+    md_nid = geff_spec.PropMetadata(
+        identifier="node_id",
+        dtype="int64",
+        varlength=False,
+        name="node_id",
+        description="Unique identifier of the node",
+    )
+
+    return {"x": md_x, "y": md_y, "frame": md_t, "label": md_label, "node_id": md_nid}
+
+
+def build_geff_metadata(epic):
+    """Build GEFF metadata."""
+    axes = [
+        geff_spec.Axis(
+            name="x",
+            type="space",
+            unit="pixel",
+            scale=epic.epi_metadata.get("ScaleXY", 1),
+            scaled_unit=epic.epi_metadata.get("UnitXY"),
+        ),
+        geff_spec.Axis(
+            name="y",
+            type="space",
+            unit="pixel",
+            scale=epic.epi_metadata.get("ScaleXY", 1),
+            scaled_unit=epic.epi_metadata.get("UnitXY"),
+        ),
+        geff_spec.Axis(
+            name="frame",
+            type="time",
+            unit="frame",
+            scale=epic.epi_metadata.get("ScaleT", 1),
+            scaled_unit=epic.epi_metadata.get("UnitT"),
+        ),
+    ]
+    display_hints = geff_spec.DisplayHint(
+        display_horizontal="x",
+        display_vertical="y",
+        display_time="frame",
+    )
+
+    return geff.GeffMetadata(
+        directed=True,
+        axes=axes,
+        display_hints=display_hints,
+        node_props_metadata=build_props_metadata(),
+        edge_props_metadata={},
+        track_node_props={"lineage": "track_id", "tracklet": "label"},
+        related_objects=[
+            geff_spec.RelatedObject(
+                type="labels",
+                path=os.path.join("..", epic.imgname + "_labels.tif"),
+                label_prop="label",
+            ),
+        ],
+    )
+
+
+def save_geff(epic, outname):
+    """Save a GEFF file."""
+
+    geff_graph = build_nx_digraph(epic)
+    geff_md = build_geff_metadata(epic)
+
+    geff.write(
+        geff_graph,
+        outname,
+        metadata=geff_md,
+        zarr_format=2,  # could be 3 but 2 by default in GEFF
+        structure_validation=True,
+        overwrite=True,
+    )