CAREamics · melisande-c · Apr 16, 2026 · Apr 16, 2026 · Apr 16, 2026 · Apr 16, 2026
diff --git a/mypy.ini b/mypy.ini
@@ -16,4 +16,7 @@ follow_imports = skip
 follow_imports = skip
 
 [mypy-careamics.config.likelihood_model]
-follow_imports = skip
+follow_imports = skip
+
+[mypy-careamics.config.builder.*]
+disable_error_code = typeddict-unknown-key, typeddict-item
diff --git a/src/careamics/config/augmentations/xy_flip_config.py b/src/careamics/config/augmentations/xy_flip_config.py
@@ -25,15 +25,15 @@ class XYFlipConfig(BaseModel):
 
     name: Literal["XYFlip"] = "XYFlip"
     flip_x: bool = Field(
-        True,
+        default=True,
         description="Whether to flip along the X axis.",
     )
     flip_y: bool = Field(
-        True,
+        default=True,
         description="Whether to flip along the Y axis.",
     )
     p: float = Field(
-        0.5,
+        default=0.5,
         description="Probability of applying the transform.",
         ge=0,
         le=1,

diff --git a/src/careamics/config/augmentations/xy_random_rotate90_config.py b/src/careamics/config/augmentations/xy_random_rotate90_config.py
@@ -25,7 +25,7 @@ class XYRandomRotate90Config(BaseModel):
 
     name: Literal["XYRandomRotate90"] = "XYRandomRotate90"
     p: float = Field(
-        0.5,
+        default=0.5,
         description="Probability of applying the transform.",
         ge=0,
         le=1,

diff --git a/src/careamics/config/builder/builders.py b/src/careamics/config/builder/builders.py
@@ -0,0 +1,290 @@
+from collections.abc import Sequence
+from dataclasses import asdict
+from typing import Any, Literal, Self
+
+from careamics.config.data.data_config import _is_3D
+from careamics.config.factories.training_factory import update_trainer_params
+from careamics.config.lightning.training_configuration import (
+    SelfSupervisedCheckpointing,
+    SupervisedCheckpointing,
+)
+from careamics.config.support import SupportedData
+
+from .config_builder import BaseConfigBuilder, ConfigDict
+from .mixins import (
+    DataParamsMixin,
+    OptimizerParamsMixin,
+    TrainingParamsMixin,
+    UnetParamsMixin,
+)
+
+
+def minimum_unet_config_dict(
+    algorithm: Literal["n2v", "care", "n2n"],
+    experiment_name: str,
+    data_type: Literal["array", "tiff", "zarr", "czi", "custom"],
+    axes: str,
+    patch_size: Sequence[int],
+    batch_size: int,
+    # optional
+    num_epochs: int = 30,
+    num_steps: int | None = None,
+    n_channels_in: int = 1,
+    n_channels_out: int = 1,
+    seed: int | None = None,
+) -> ConfigDict:
+    config_dict: ConfigDict = {
+        "experiment_name": experiment_name,
+        "data_config": {
+            "mode": "training",
+            "axes": axes,
+            "data_type": SupportedData(data_type),
+            "patching": {"name": "stratified", "patch_size": patch_size},
+            "batch_size": batch_size,
+        },
+        "algorithm_config": {
+            "algorithm": algorithm,
+            "model": default_unet_config(
+                _is_3D(axes, SupportedData(data_type)), n_channels_in, n_channels_out
+            ),
+        },
+        "training_config": {
+            "trainer_params": update_trainer_params({}, num_epochs, num_steps)
+        },
+    }
+    if seed is not None:
+        config_dict["data_config"]["seed"] = seed
+    return config_dict
+
+
+def default_unet_config(
+    is_3D: bool,
+    n_channels_in: int,
+    n_channels_out: int,
+) -> dict[str, Any]:
+    return {
+        "architecture": "UNet",
+        "conv_dims": 3 if is_3D else 2,
+        "in_channels": n_channels_in,
+        "num_classes": n_channels_out,
+    }
+
+
+class CAREConfigBuilder(
+    TrainingParamsMixin,
+    DataParamsMixin,
+    UnetParamsMixin,
+    OptimizerParamsMixin,
+    BaseConfigBuilder,
+):
+    def __init__(
+        self,
+        experiment_name: str,
+        data_type: Literal["array", "tiff", "zarr", "czi", "custom"],
+        axes: str,
+        patch_size: Sequence[int],
+        batch_size: int,
+        # optional
+        num_epochs: int = 30,
+        num_steps: int | None = None,
+        n_channels_in: int = 1,
+        n_channels_out: int = 1,
+        seed: int | None = None,
+    ):
+        self.seed = seed
+        self.config_dict = minimum_unet_config_dict(
+            algorithm="care",
+            experiment_name=experiment_name,
+            data_type=data_type,
+            axes=axes,
+            patch_size=patch_size,
+            batch_size=batch_size,
+            num_epochs=num_epochs,
+            num_steps=num_steps,
+            n_channels_in=n_channels_in,
+            n_channels_out=n_channels_out,
+        )
+
+        # set default checkpointing params
+        # (can be overwritten with set_checkpoint_params from TrainingParamMixin)
+        self.config_dict["training_config"]["checkpoint_params"] = asdict(
+            SupervisedCheckpointing()
+        )
+
+        self.config_dict["training_config"]["early_stopping_params"] = {
+            "monitor": "val_loss",
+            "mode": "min",
+        }
+
+    def set_loss(self, loss: Literal["mae", "mse"]) -> Self:
+        self.config_dict["algorithm_config"]["loss"] = loss
+        return self
+
+
+class N2NConfigBuilder(
+    TrainingParamsMixin,
+    DataParamsMixin,
+    UnetParamsMixin,
+    OptimizerParamsMixin,
+    BaseConfigBuilder,
+):
+    def __init__(
+        self,
+        experiment_name: str,
+        data_type: Literal["array", "tiff", "zarr", "czi", "custom"],
+        axes: str,
+        patch_size: Sequence[int],
+        batch_size: int,
+        # optional
+        num_epochs: int = 30,
+        num_steps: int | None = None,
+        n_channels_in: int = 1,
+        n_channels_out: int = 1,
+        seed: int | None = None,
+    ):
+        self.seed = seed
+        self.config_dict = minimum_unet_config_dict(
+            algorithm="n2n",
+            experiment_name=experiment_name,
+            data_type=data_type,
+            axes=axes,
+            patch_size=patch_size,
+            batch_size=batch_size,
+            num_epochs=num_epochs,
+            num_steps=num_steps,
+            n_channels_in=n_channels_in,
+            n_channels_out=n_channels_out,
+        )
+
+        # set default checkpointing params (n2n self supervised)
+        # (can be overwritten with set_checkpoint_params from TrainingParamMixin)
+        self.config_dict["training_config"]["checkpoint_params"] = asdict(
+            SelfSupervisedCheckpointing()
+        )
+
+        # no early stopping by default
+        self.config_dict["training_config"]["early_stopping_params"] = None
+
+    def set_loss(self, loss: Literal["mae", "mse"]) -> Self:
+        self.config_dict["algorithm_config"]["loss"] = loss
+        return self
+
+
+class N2VConfigBuilder(
+    TrainingParamsMixin,
+    DataParamsMixin,
+    UnetParamsMixin,
+    OptimizerParamsMixin,
+    BaseConfigBuilder,
+):
+    def __init__(
+        self,
+        experiment_name: str,
+        data_type: Literal["array", "tiff", "zarr", "czi", "custom"],
+        axes: str,
+        patch_size: Sequence[int],
+        batch_size: int,
+        # optional
+        num_epochs: int = 30,
+        num_steps: int | None = None,
+        n_channels: int = 1,
+        seed: int | None = None,
+    ):
+        self.seed = seed
+        self.config_dict = minimum_unet_config_dict(
+            algorithm="n2v",
+            experiment_name=experiment_name,
+            data_type=data_type,
+            axes=axes,
+            patch_size=patch_size,
+            batch_size=batch_size,
+            num_epochs=num_epochs,
+            num_steps=num_steps,
+            n_channels_in=n_channels,
+            n_channels_out=n_channels,
+        )
+
+        # this will be used to propagate the monitor metric before building the config
+        # we have to wait for after set_checkpoint_params and set_early_stopping_params
+        # it can be changed using the set_monitor_metric method
+        self.monitor_metric: Literal["train_loss", "train_loss_epoch", "val_loss"] = (
+            "val_loss"
+        )
+
+        # set default checkpointing params
+        # (can be overwritten with set_checkpoint_params from TrainingParamMixin)
+        self.config_dict["training_config"]["checkpoint_params"] = asdict(
+            SelfSupervisedCheckpointing()
+        )
+
+        # no early stopping by default
+        self.config_dict["training_config"]["early_stopping_params"] = None
+
+        # propagate seed
+        self.config_dict["algorithm_config"]["n2v_config"] = {}
+        if self.seed is not None:
+            self.config_dict["algorithm_config"]["n2v_config"]["seed"] = self.seed
+
+    def set_n2v_params(
+        self,
+        use_n2v2: bool | None = None,
+        roi_size: int | None = None,
+        masked_pixel_percentage: float | None = None,
+        # - structN2V specific
+        struct_n2v_axis: Literal["horizontal", "vertical", "none"] | None = None,
+        struct_n2v_span: int | None = None,
+    ) -> Self:
+        n2v_manipulate_config: dict[str, Any] = {}
+        if roi_size is not None:
+            n2v_manipulate_config["roi_size"] = roi_size
+
+        if masked_pixel_percentage is not None:
+            n2v_manipulate_config["masked_pixel_percentage"] = masked_pixel_percentage
+
+        if struct_n2v_axis is not None:
+            n2v_manipulate_config["struct_mask_axis"] = struct_n2v_axis
+
+        if struct_n2v_span is not None:
+            n2v_manipulate_config["struct_mask_span"] = struct_n2v_span
+
+        if use_n2v2 is not None:
+            # already added by UnetParamMixin
+            assert isinstance(self.config_dict["algorithm_config"]["model"], dict)
+            self.config_dict["algorithm_config"]["model"]["n2v2"] = use_n2v2
+
+            n2v_manipulate_config["strategy"] = "median" if use_n2v2 else "uniform"
+
+        assert isinstance(self.config_dict["algorithm_config"]["n2v_config"], dict)
+        self.config_dict["algorithm_config"]["n2v_config"].update(n2v_manipulate_config)
+        return self
+
+    def set_monitor_metric(
+        self, monitor_metric: Literal["train_loss", "train_loss_epoch", "val_loss"]
+    ) -> Self:
+        self.monitor_metric = monitor_metric
+        self.config_dict["algorithm_config"]["monitor_metric"] = monitor_metric
+        return self
+
+    def _propagate_monitor_to_callbacks(self):
+        # only overwrite monitor if it not explicitly set
+        if "checkpoint_params" not in self.config_dict["training_config"]:
+            self.config_dict["training_config"]["checkpoint_params"] = {}
+        checkpoint_params = self.config_dict["training_config"]["checkpoint_params"]
+        if "monitor" not in checkpoint_params:
+            checkpoint_params["monitor"] = self.monitor_metric
+
+        # TODO: default value in the config is dict so we need to propagate in that case
+        # probably we want a mechanism to propagate monitor metric to default
+        if "early_stopping_params" not in self.config_dict["training_config"]:
+            self.config_dict["training_config"]["early_stopping_params"] = {}
+        early_stopping_params = self.config_dict["training_config"][
+            "early_stopping_params"
+        ]
+        has_early_stopping = early_stopping_params is not None
+        if has_early_stopping and "monitor" not in early_stopping_params:
+            assert isinstance(early_stopping_params, dict)
+            early_stopping_params["monitor"] = self.monitor_metric
+
+    def _before_build(self) -> None:
+        super()._before_build()
+        self._propagate_monitor_to_callbacks()