childmindresearch
diff --git a/‎src/rbc/cli/all.py‎
Lines changed: 50 additions & 28 deletions b/‎src/rbc/cli/all.py‎
Lines changed: 50 additions & 28 deletions
diff --git a/‎src/rbc/cli/anatomical.py‎
Lines changed: 14 additions & 10 deletions b/‎src/rbc/cli/anatomical.py‎
Lines changed: 14 additions & 10 deletions
diff --git a/‎src/rbc/cli/functional.py‎
Lines changed: 7 additions & 4 deletions b/‎src/rbc/cli/functional.py‎
Lines changed: 7 additions & 4 deletions
diff --git a/‎src/rbc/cli/longitudinal.py‎
Lines changed: 16 additions & 18 deletions b/‎src/rbc/cli/longitudinal.py‎
Lines changed: 16 additions & 18 deletions
diff --git a/‎tests/unit/cli/test_all.py‎
Lines changed: 13 additions & 4 deletions b/‎tests/unit/cli/test_all.py‎
Lines changed: 13 additions & 4 deletions
@@ -14,7 +14,12 @@
 import polars as pl
 from tqdm import tqdm
 
-from rbc.cli import _DEFAULT_ENV_VARS, _FUNC_GROUP_ENTITIES, _SUB_SES_QUERY
+from rbc.cli import (
+    _ANAT_GROUP_ENTITIES,
+    _DEFAULT_ENV_VARS,
+    _FUNC_GROUP_ENTITIES,
+    _SUB_SES_QUERY,
+)
 from rbc.cli.base import BaseArgs, _validate_atlas, _validate_positive, _validate_task
 from rbc.cli.query import iter_session_files, load_session
 from rbc.context import PipelineContext
@@ -77,17 +82,22 @@ def main(args: AllArgs) -> int:  # noqa: C901
         dataset_dir=args.input_dir, index_fpath=None, max_workers=0, verbose=ctx.verbose
     )
 
-    filters = [pl.col("space").is_null(), pl.col("desc").is_null()]
+    filters = [
+        pl.col("ses") != "longitudinal",
+        pl.col("space").is_null(),
+        pl.col("desc").is_null(),
+    ]
     if len(args.participant_label) > 0:
         filters.append(pl.col("sub").is_in(args.participant_label))
     if len(args.session_label) > 0:
         filters.append(pl.col("ses").is_in(args.session_label))
     if args.task is not None:
         filters.append(pl.col("task") == args.task)
-    if filters:
-        df = df.filter(pl.all_horizontal(filters))
+    df = df.filter(pl.all_horizontal(filters))
 
-    for _, sub_ses_group in tqdm(df.group_by(_SUB_SES_QUERY), disable=not ctx.verbose):
+    for _, sub_ses_group in tqdm(
+        df.group_by(_SUB_SES_QUERY, maintain_order=True), disable=not ctx.verbose
+    ):
         pipe_ctx = PipelineContext(
             sub=sub_ses_group["sub"][0],
             ses=sub_ses_group["ses"][0] or None,
@@ -96,29 +106,41 @@ def main(args: AllArgs) -> int:  # noqa: C901
         session = load_session(sub_ses_group, pipe_ctx.sub, pipe_ctx.ses)
 
         # --- Anatomical (once per session, first T1w) ---
-        anat_row = session.anat.row(0, named=True)
-        t1w_fpath = Path(anat_row["root"]) / anat_row["path"]
-        ctx.logger.info(f"Anatomical: {t1w_fpath}")
-
-        anat_outputs = anatomical_preprocess(in_t1w=t1w_fpath)
-
-        anat = pipe_ctx.bids(datatype=Datatype.ANAT)
-        anat.save(anat_outputs.brain, suffix=Suffix.T1W, desc="brain")
-        anat.save(anat_outputs.brain_mask, suffix=Suffix.MASK, desc="T1w")
-        anat.save(anat_outputs.csf_mask, suffix=Suffix.MASK, desc="csf")
-        anat.save(anat_outputs.gm_mask, suffix=Suffix.MASK, desc="gm")
-        anat.save(anat_outputs.wm_mask, suffix=Suffix.MASK, desc="wm")
-        anat.save(anat_outputs.wm_bbr_mask, suffix=Suffix.MASK, desc="wmBBR")
-        anat.save(
-            anat_outputs.forward_xfm,
-            suffix="xfm",
-            extra={"from": "T1w", "to": TemplateSpace.MNI152NLIN6ASYM, "mode": "image"},
-        )
-        anat.save(
-            anat_outputs.inverse_xfm,
-            suffix="xfm",
-            extra={"from": TemplateSpace.MNI152NLIN6ASYM, "to": "T1w", "mode": "image"},
-        )
+        for _, anat_df in session.anat.filter(pl.col("suffix") == "T1w").group_by(
+            _ANAT_GROUP_ENTITIES, maintain_order=True
+        ):
+            anat_row = anat_df.filter(suffix="T1w").row(0, named=True)
+            t1w_fpath = Path(anat_row["root"]) / anat_row["path"]
+            ents = extract_entities(anat_row, ["run", "acq", "rec", "echo"])
+            ctx.logger.info(f"Anatomical: {t1w_fpath}")
+
+            anat_outputs = anatomical_preprocess(in_t1w=t1w_fpath)
+
+            anat = pipe_ctx.bids(datatype=Datatype.ANAT, entities=ents)
+            anat.save(anat_outputs.brain, suffix=Suffix.T1W, desc="brain")
+            anat.save(anat_outputs.brain_mask, suffix=Suffix.MASK, desc="T1w")
+            anat.save(anat_outputs.csf_mask, suffix=Suffix.MASK, desc="csf")
+            anat.save(anat_outputs.gm_mask, suffix=Suffix.MASK, desc="gm")
+            anat.save(anat_outputs.wm_mask, suffix=Suffix.MASK, desc="wm")
+            anat.save(anat_outputs.wm_bbr_mask, suffix=Suffix.MASK, desc="wmBBR")
+            anat.save(
+                anat_outputs.forward_xfm,
+                suffix="xfm",
+                extra={
+                    "from": "T1w",
+                    "to": TemplateSpace.MNI152NLIN6ASYM,
+                    "mode": "image",
+                },
+            )
+            anat.save(
+                anat_outputs.inverse_xfm,
+                suffix="xfm",
+                extra={
+                    "from": TemplateSpace.MNI152NLIN6ASYM,
+                    "to": "T1w",
+                    "mode": "image",
+                },
+            )
 
         # --- Functional + Metrics + QC (per BOLD run) ---
         for func_df, _anat_df in iter_session_files(
 
@@ -5,7 +5,7 @@
 from dataclasses import dataclass
 from typing import TYPE_CHECKING
 
-from rbc.cli.query import iter_session_files, load_session
+from rbc.cli.query import load_session
 
 if TYPE_CHECKING:
     import argparse
@@ -46,33 +46,37 @@ def main(args: AnatomicalArgs) -> int:
         dataset_dir=args.input_dir, index_fpath=None, max_workers=0, verbose=ctx.verbose
     )
 
-    filters = [pl.col("space").is_null(), pl.col("desc").is_null()]
+    filters = [
+        pl.col("ses") != "longitudinal",
+        pl.col("space").is_null(),
+        pl.col("desc").is_null(),
+    ]
     if len(args.participant_label) > 0:
         filters.append(pl.col("sub").is_in(args.participant_label))
     if len(args.session_label) > 0:
         filters.append(pl.col("ses").is_in(args.session_label))
-    if filters:
-        df = df.filter(pl.all_horizontal(filters))
+    df = df.filter(pl.all_horizontal(filters))
 
-    for _, sub_ses_group in tqdm(df.group_by(_SUB_SES_QUERY), disable=not ctx.verbose):
+    for _, sub_ses_group in tqdm(
+        df.group_by(_SUB_SES_QUERY, maintain_order=True), disable=not ctx.verbose
+    ):
         pipe_ctx = PipelineContext(
             sub=sub_ses_group["sub"][0],
             ses=sub_ses_group["ses"][0] or None,
             output_dir=args.output_dir,
         )
         session = load_session(sub_ses_group, pipe_ctx.sub, pipe_ctx.ses)
 
-        for _, anat_df in iter_session_files(session, groupby=_ANAT_GROUP_ENTITIES):
-            row = anat_df.filter(suffix="T1w").row(0, named=True)
+        for _, anat_df in session.anat.filter(pl.col("suffix") == "T1w").group_by(
+            _ANAT_GROUP_ENTITIES, maintain_order=True
+        ):
+            row = anat_df.row(0, named=True)
             t1w_fpath = Path(row["root"]) / row["path"]
             ents = extract_entities(row, ["run", "acq", "rec", "echo"])
             ctx.logger.info(f"Processing {t1w_fpath}")
 
             outputs = single_session_preprocess(in_t1w=t1w_fpath)
 
-            pipe_ctx = PipelineContext(
-                sub=row["sub"], ses=row.get("ses"), output_dir=args.output_dir
-            )
             anat = pipe_ctx.bids(datatype=Datatype.ANAT, entities=ents)
             anat.save(outputs.brain, suffix=Suffix.T1W, desc="brain")
             anat.save(outputs.brain_mask, suffix=Suffix.MASK, desc="T1w")
 
@@ -65,27 +65,30 @@ def main(args: FunctionalArgs) -> int:
         dataset_dir=args.input_dir, index_fpath=None, max_workers=0, verbose=ctx.verbose
     )
 
-    filters = [pl.col("space").is_null(), pl.col("desc").is_null()]
+    filters = [pl.col("ses") != "longitudinal", pl.col("space").is_null()]
     if len(args.participant_label) > 0:
         filters.append(pl.col("sub").is_in(args.participant_label))
     if len(args.session_label) > 0:
         filters.append(pl.col("ses").is_in(args.session_label))
     if args.task is not None:
         filters.append(pl.col("task") == args.task)
-    if filters:
-        df = df.filter(pl.all_horizontal(filters))
+    df = df.filter(pl.all_horizontal(filters))
 
-    for _, sub_ses_group in tqdm(df.group_by(_SUB_SES_QUERY), disable=not ctx.verbose):
+    for _, sub_ses_group in tqdm(
+        df.group_by(_SUB_SES_QUERY, maintain_order=True), disable=not ctx.verbose
+    ):
         pipe_ctx = PipelineContext(
             sub=sub_ses_group["sub"][0],
             ses=sub_ses_group["ses"][0] or None,
             output_dir=args.output_dir,
         )
+
         session = load_session(sub_ses_group, pipe_ctx.sub, pipe_ctx.ses)
 
         for func_df, anat_df in iter_session_files(
             session, groupby=_FUNC_GROUP_ENTITIES
         ):
+            func_df = func_df.filter(pl.col("desc").is_null())
             row = func_df.filter(suffix="bold").row(0, named=True)
             bold_fpath = Path(row["root"]) / row["path"]
             ents = extract_entities(row, ["task", "run", "acq", "rec", "dir", "echo"])
 
@@ -55,11 +55,12 @@ def _process_anat(
     pipe_ctx: PipelineContext, anat_df: pl.DataFrame, tpl_df: pl.DataFrame
 ) -> None:
     """Handle anatomical longitudinal processing."""
-    row = anat_df.filter(suffix="T1w").row(0, named=True)
+    anat_df = anat_df.filter(pl.col("space").is_null())
+    row = anat_df.row(0, named=True)
     ents = extract_entities(row, ["run"])
 
     anat_q = pipe_ctx.bids(datatype=Datatype.ANAT)
-    tpl_q = pipe_ctx.bids(datatype=Datatype.ANAT).derive(ses="longitudinal")
+    tpl_q = anat_q.derive(ses="longitudinal")
 
     outputs = anatomical_longitudinal(
         template=tpl_q.expect(tpl_df, suffix=Suffix.T1W),
@@ -76,7 +77,7 @@ def _process_anat(
         wm_mask=anat_q.find(anat_df, suffix=Suffix.MASK, desc="wm"),
     )
 
-    aex = pipe_ctx.bids(datatype=Datatype.ANAT, entities=ents, space="longitudinal")
+    aex = anat_q.derive(entities=ents, space="longitudinal")
     aex.save(outputs.brain, suffix=Suffix.T1W, desc="brain")
     aex.save(
         _require_file(outputs.brain_mask, "brain_mask"),
@@ -108,7 +109,7 @@ def _process_func(
     ents = extract_entities(row, ["task", "run"])
 
     func_q = pipe_ctx.bids(datatype=Datatype.FUNC, entities=ents)
-    tpl_q = pipe_ctx.bids(datatype="anat").derive(ses="longitudinal")
+    tpl_q = pipe_ctx.bids(datatype=Datatype.ANAT).derive(ses="longitudinal")
 
     outputs = functional_longitudinal(
         template=tpl_q.expect(tpl_df, suffix="T1w"),
@@ -134,7 +135,7 @@ def _process_func(
         ),
     )
 
-    fex = pipe_ctx.bids(datatype=Datatype.FUNC, entities=ents, space="longitudinal")
+    fex = func_q.derive(space="longitudinal")
     fex.save(outputs.sbref, suffix=Suffix.SBREF)
     fex.save(outputs.bold, suffix=Suffix.BOLD, desc="preproc")
     fex.save(
@@ -163,20 +164,15 @@ def main(args: LongitudinalArgs) -> int:
     )
 
     group_df = df
-    filters = [
-        pl.col("ses") != "longitudinal",
-        pl.col("space").is_null(),
-        pl.col("desc").is_null(),
-    ]
+    filters = [pl.col("ses") != "longitudinal"]
     if len(args.participant_label) > 0:
         filters.append(pl.col("sub").is_in(args.participant_label))
     if len(args.session_label) > 0:
         filters.append(pl.col("ses").is_in(args.session_label))
-    if filters:
-        group_df = df.filter(pl.all_horizontal(filters))
+    group_df = df.filter(pl.all_horizontal(filters))
 
     for _, sub_ses_group in tqdm(
-        group_df.group_by(_SUB_SES_QUERY), disable=not ctx.verbose
+        group_df.group_by(_SUB_SES_QUERY, maintain_order=True), disable=not ctx.verbose
     ):
         pipe_ctx = PipelineContext(
             sub=sub_ses_group["sub"][0],
@@ -196,12 +192,14 @@ def main(args: LongitudinalArgs) -> int:
         if tpl_df.is_empty():
             raise ValueError("No longitudinal template found")
 
-        for func_df, anat_df in iter_session_files(
-            session, groupby=_FUNC_GROUP_ENTITIES
-        ):
-            if args.anatomical:
+        if args.anatomical:
+            for _, anat_df in session.anat.filter(pl.col("suffix") == "T1w").group_by(
+                ("run", "acq"), maintain_order=True
+            ):
                 _process_anat(pipe_ctx=pipe_ctx, anat_df=anat_df, tpl_df=tpl_df)
-            if args.functional:
+
+        if args.functional:
+            for func_df, _ in iter_session_files(session, groupby=_FUNC_GROUP_ENTITIES):
                 _process_func(pipe_ctx=pipe_ctx, func_df=func_df, tpl_df=tpl_df)
         pipe_ctx.ensure_dataset_description()
 
 
@@ -98,7 +98,7 @@ def _mock_qc_outputs(
 @contextmanager
 def _patch_all(
     filtered_df: pl.DataFrame,
-    groups: list[list[str]],
+    groups: list[list[tuple[pl.DataFrame, pl.DataFrame]]],
     *,
     qc_passed: bool = True,
 ) -> Generator[tuple[Mock, Mock, Mock, Mock, Mock], None, None]:
@@ -113,17 +113,24 @@ def _patch_all(
             "suffix": ["T1w"],
             "ext": [".nii.gz"],
             "run": [None],
+            "acq": [None],
+            "part": [None],
+            "echo": [None],
+            "ce": [None],
+            "rec": [None],
+            "inv": [None],
             "space": [None],
             "desc": [None],
             "root": ["/data"],
             "path": ["sub-01/ses-baseline/anat/sub-01_ses-baseline_T1w.nii.gz"],
         }
     )
     mock_session = SessionTables(anat=mock_anat_df, func=None)
+    iter_calls = list(groups)
     with (
         patch("rbc.cli.all.load_table", return_value=filtered_df),
         patch("rbc.cli.all.load_session", return_value=mock_session),
-        patch("rbc.cli.all.iter_session_files", side_effect=groups),
+        patch("rbc.cli.all.iter_session_files", side_effect=iter_calls),
         patch(
             "rbc.cli.all.anatomical_preprocess", return_value=_mock_anat_outputs()
         ) as mock_anat,
@@ -147,7 +154,7 @@ def _make_groups(
     participant: list[str],
     session: list[str],
     task: str | None = None,
-) -> tuple[pl.DataFrame, list[list[str]]]:
+) -> tuple[pl.DataFrame, list[list[tuple[pl.DataFrame, pl.DataFrame]]]]:
     """Filter sample dataframe and build iter_session_files groups."""
     filtered_df = sample_dataframe.filter(
         pl.col("suffix") == "bold",
@@ -165,7 +172,9 @@ def _make_groups(
         )
         key = (row["sub"], row["ses"])
         sub_ses_groups.setdefault(key, [])
-        sub_ses_groups[key].append((func_group, pl.DataFrame()))
+        sub_ses_groups[key].append(
+            (func_group, pl.DataFrame({"space": [], "desc": []}))
+        )
 
     full_df = _make_filtered_df(sample_dataframe, participant, session, task)
     return full_df, list(sub_ses_groups.values())