Path location for best model storage #1100

Minxiangliu · 2022-10-27T06:03:52Z

Minxiangliu
Oct 27, 2022

I have used monailabel to complete the training, and the best checkpoints are recorded from the log, where will this model be stored?
Thanks in advance.

The train_stats.json

{
  "rank": 0,
  "current_epoch": 2000,
  "current_iteration": 10000,
  "total_epochs": 2000,
  "total_iterations": 5,
  "epoch": 2000,
  "start_ts": 1666763633,
  "total_time": "1:24:30",
  "best_metric": 0.7582034468650818,
  "train": {
    "metrics": {
      "train_dice": 0.7764385342597961,
      "train_cancer_dice": 0.7764385342597961
    },
    "key_metric_name": "train_dice",
    "best_metric": 0.8023391366004944,
    "best_metric_epoch": 1954
  },
  "eval": {
    "metrics": {
      "val_mean_dice": 0.71221923828125,
      "val_cancer_dice": 0.71221923828125
    },
    "key_metric_name": "val_mean_dice",
    "best_metric": 0.7582034468650818,
    "best_metric_epoch": 1865
  }
}

Answered by tangy5

Oct 27, 2022

Hi @Minxiangliu , if you are using monailabel's basic trainer, the saved best metric model should be named by the key_metric_filename, if you are using the default setting, it should be the "model.pt"

MONAILabel/monailabel/tasks/train/basic_train.py

Line 110 in 22d1e54

key_metric_filename="model.pt",

View full answer

tangy5 · 2022-10-27T06:23:33Z

tangy5
Oct 27, 2022
Maintainer

Hi @Minxiangliu , if you are using monailabel's basic trainer, the saved best metric model should be named by the key_metric_filename, if you are using the default setting, it should be the "model.pt"

MONAILabel/monailabel/tasks/train/basic_train.py

Line 110 in 22d1e54

key_metric_filename="model.pt",

0 replies

Minxiangliu · 2022-10-27T06:57:39Z

Minxiangliu
Oct 27, 2022
Author

Hi @tangy5 ,
Thanks for the quick response. My main purpose is to use my trained model to calculate other accuracies, but I found that the results are much different from the log content, what am I doing wrong?

getPreTrans method

def getPreTrans(**kwargs):
    if kwargs['mode'] == 'train':
        return [
            LoadImaged(keys=['image','label'], reader='ITKReader'),
            NormalizeLabelsInDatasetd(keys='label', label_names=kwargs['labels']),
            EnsureChannelFirstd(keys=['image','label']),
            Orientationd(keys=['image','label'], axcodes='RAS'),
            Spacingd(keys=['image','label'], pixdim=kwargs['target_spacing'], mode=('bilinear', 'nearest')),
            Lambdad(keys=['image','label'], func=lambda x:np.moveaxis(x,-1,1)),
            CropForegroundd(keys=['image','label'], source_key='image',  k_divisible=kwargs['padd_size'])
        ]

path: app/lib/configs/segmentation.py

class SegmentConfig(TaskConfig):
    def init(self, name: str, model_dir: str, conf:dict, planner: Any, **kwargs):
        super().init(name, model_dir, conf, planner, **kwargs)
        # Model Files
        self.path = [
            os.path.join(self.model_dir, f"pretrained_{name}.pt"),  # pretrained
            os.path.join(self.model_dir, f"{name}.pt"),  # published
        ]
        
        self.trans_params ={
            'labels':{"cancer": 1},
            'target_spacing':(3.33, 3.33, 2.18),
            'padd_size':(96, 96, 96),
            'crop_size':(96, 96, 96)
        }

        network_params = {
            'spatial_dims':3,
            'in_channels':1,
            'out_channels':len(self.trans_params['labels']) + 1,  # labels plus background,
            'channels':(16, 32, 64, 128, 256),
            'strides':(2, 2, 2, 2),
            'num_res_units':2,
            'norm':'batch',
        }
        self.slidingWindowInfererParams = {
            'roi_size':self.trans_params['crop_size'], 'sw_batch_size':4, 'overlap':0.5, 'padding_mode':'replicate'
        }
        self.network = UNet(**network_params)

        self.description = "A model for volumetric (3D) segmentation of the HNC from PET CT image"

    def trainer(self) -> Optional[TrainTask]:
        output_dir = os.path.join(self.model_dir, self.name)
        load_path = self.path[0] if os.path.exists(self.path[0]) else self.path[1]
        _trans_params = self.trans_params.copy()
        _trans_params.update({'mode':'train'})
        task: TrainTask = lib.trainers.ModelTrain(
            description=self.description,
            model_dir=output_dir,
            publish_path=self.path[1],
            network=self.network,
            load_path=load_path,
            crop_size=self.trans_params['crop_size'],
            labels=self.trans_params['labels'],
            slidingWindowInfererParams = self.slidingWindowInfererParams,
            config=self.conf,
            preTrans=getPreTrans(**_trans_params)
        )
        return task

path: app/lib/trainers/segmentation.py

class ModelTrain(BasicTrainTask):
    def __init__(self, **kwargs):
        super().__init__(**kwargs)
        self._network = kwargs['network']
        self.crop_size = kwargs['crop_size']
        self.labels = kwargs['labels']

        self.pre_trans = kwargs['preTrans']
        self.slidingWindowInfererParams = kwargs['slidingWindowInfererParams']

    def network(self, context: Context):
        return self._network

    def optimizer(self, context: Context):
        return torch.optim.Adam(context.network.parameters(), lr=1e-4, weight_decay=1e-5)

    def loss_function(self, context: Context):
        return DiceCELoss(to_onehot_y=True, softmax=True)

    def lr_scheduler_handler(self, context: Context):
        return None

    def train_data_loader(self, context, num_workers=0, shuffle=False):
        return super().train_data_loader(context, num_workers, True)

    def train_pre_transforms(self, context: Context):
        train_transforms = self.pre_trans.copy()
        train_transforms.extend([
            EnsureTyped(keys=['image','label'], device=context.device),
            RandSpatialCropd(keys=['image', 'label'], roi_size=self.crop_size, random_size=False, random_center=True),
            RandFlipd(keys=['image','label'], prob=0.5, spatial_axis=0),
            RandFlipd(keys=['image','label'], prob=0.5, spatial_axis=1),
            RandFlipd(keys=['image','label'], prob=0.5, spatial_axis=2),
            NormalizeIntensityd(keys='image', nonzero=True, channel_wise=True),
            RandScaleIntensityd(keys='image', factors=0.1, prob=1.0), 
            RandShiftIntensityd(keys='image', offsets=0.1, prob=1.0),
            SelectItemsd(keys=['image','label'])
        ])
        return train_transforms

    def train_post_transforms(self, context: Context):
        return [
            EnsureTyped(keys="pred", device=context.device),
            Activationsd(keys="pred", softmax=True),
            AsDiscreted(
                keys=("pred", "label"),
                argmax=(True, False),
                to_onehot=(len(self.labels) + 1, len(self.labels) + 1),
            ),
        ]

    def val_pre_transforms(self, context: Context):
        val_transforms = self.pre_trans.copy()
        val_transforms.extend([
            SelectItemsd(keys=['image','label'])
        ])
        return val_transforms

    def val_inferer(self, context: Context):
        return SlidingWindowInferer(**self.slidingWindowInfererParams)

    def train_key_metric(self, context: Context):
        return region_wise_metrics(self.labels, self.TRAIN_KEY_METRIC, "train")

    def val_key_metric(self, context: Context):
        return region_wise_metrics(self.labels, self.VAL_KEY_METRIC, "val")

    def train_handlers(self, context: Context):
        handlers = super().train_handlers(context)
        if context.local_rank == 0:
            handlers.append(
                TensorBoardImageHandler(
                    log_dir=context.events_dir,
                    batch_transform=from_engine(["image", "label"]),
                    output_transform=from_engine(["pred"]),
                    interval=10,
                    epoch_level=True,
                )
            )
        return handlers

Additional verification code:

def load_model(path:str, model:UNet):
    state_dict = torch.load(path, map_location='cuda')
    model.load_state_dict(state_dict, strict=True)
    model.eval().cuda()
    return model

def getDataList():
    with open(r'D:\AI-Project-Code\HNC\Segmentation\DataSets\cvDataSets\testCV1.json', 'r') as file:
        val_ds = json.load(file)
    return val_ds

def val_dataloader(test_ds):
    return ThreadDataLoader(test_ds, 
                            num_workers=0, 
                            batch_size=1, 
                            shuffle=False,
                            drop_last=False)
trans_params ={
    'mode':'train',
    'labels':{"cancer": 1},
    'target_spacing':(3.33, 3.33, 2.18),
    'padd_size':(96, 96, 96),
    'crop_size':(96, 96, 96)
    }

transform=getPreTrans(**trans_params)
transform.extend([EnsureTyped(keys=['image','label']), ToDeviced(keys=['image','label'],device='cuda')])
transform = Compose(transform)
datasetParameter = {'transform':transform, 'cache_rate':1.0, 'copy_cache':False, 'num_workers':2}
datasetParameter['data'] = getDataList()
test_ds = CacheDataset(**datasetParameter)
loader = val_dataloader(test_ds)

network_params = {
    'spatial_dims':3,
    'in_channels':1,
    'out_channels':len(trans_params['labels']) + 1,  # labels plus background,
    'channels':(16, 32, 64, 128, 256),
    'strides':(2, 2, 2, 2),
    'num_res_units':2,
    'norm':'batch',
    }

model = UNet(**network_params)

model = load_model(
    path=r'D:\AI-Project-Code\HNC\Segmentation\monailabel\app-hnc\modelCV1\segmentation\train_01\model.pt', model=model)

post_pred = Compose([Activations(softmax=True), AsDiscrete(argmax=True, to_onehot=len(trans_params['labels']) + 1)])
post_label = Compose([AsDiscrete(argmax=False, to_onehot=len(trans_params['labels']) + 1)])
dice_metric = DiceMetric(include_background=False, reduction="mean")

for idx, batch_data in enumerate(loader):
    image, label = batch_data['image'], batch_data['label']
    outputs = sliding_window_inference(
        inputs=image, 
        roi_size=trans_params['crop_size'], 
        sw_batch_size=4, 
        predictor=model,
        overlap=0.5,
        padding_mode='replicate')

    outputs = [post_pred(i) for i in decollate_batch(outputs)]
    label = [post_label(i) for i in decollate_batch(label)]
    dice_metric(y_pred=outputs, y=label)
    
metric = dice_metric.aggregate().item()
dice_metric.reset()
print(metric)

The metric result is about 0.65
I reproduced the code according to the settings of monailabel, I can't see the difference, can you tell me what I did wrong? Thanks in advance.

1 reply

tangy5 Oct 27, 2022
Maintainer

Hi @Minxiangliu , thanks for posting the codes, before we can take detailed look at these codes, I would like to understand your question here. For "the results are much different from the log content", is this means you have external test data accuracy (test off monailabel) different from the validation data accuracy when training with monailabel?
If so, you could compare whether the pre/post transforms are same, generally, test accuracy will be a bit worse than validation/training performance, but will be in a reasonable scale.
Thanks

diazandr3s · 2022-10-27T14:02:15Z

diazandr3s
Oct 27, 2022
Maintainer

Hi @Minxiangliu,

I see two different metrics, one is DiceMetric and the other Dice + Cross Entropy (DiceCELoss). Any reason for this?

1 reply

Minxiangliu Oct 27, 2022
Author

DiceCEMetric is owned by the original sample program, I have not modified it, it should be the loss function, but what I want to know is not the loss, but the dice metric score.

Minxiangliu · 2022-10-28T01:14:29Z

Minxiangliu
Oct 28, 2022
Author

Hi @tangy5 ,
Yes, my question is as you said. I understand that the pre/post transform in the test data must be the same, and I continue to check the problem here, but I import the same pre transform(getPreTrans) method, the difference is the post transform and DiceMetric.

In the post transform, I wrote the same method according to the writing method of monailabel.

In monailabel:

def train_post_transforms(self, context: Context):
        return [
            EnsureTyped(keys="pred", device=context.device),
            Activationsd(keys="pred", softmax=True),
            AsDiscreted(
                keys=("pred", "label"),
                argmax=(True, False),
                to_onehot=(len(self.labels) + 1, len(self.labels) + 1),
            ),
        ]
def val_inferer(self, context: Context):
        self.slidingWindowInfererParams= {
            'roi_size':self.trans_params['crop_size'], 'sw_batch_size':4, 'overlap':0.5, 'padding_mode':'replicate'
        }
        return SlidingWindowInferer(**self.slidingWindowInfererParams)

In custom method:

post_pred = Compose([Activations(softmax=True), AsDiscrete(argmax=True, to_onehot=len(trans_params['labels']) + 1)])
post_label = Compose([AsDiscrete(argmax=False, to_onehot=len(trans_params['labels']) + 1)])

image, label = batch_data['image'], batch_data['label']
outputs = sliding_window_inference(
        inputs=image, 
        roi_size=trans_params['crop_size'], 
        sw_batch_size=4, 
        predictor=model,
        overlap=0.5,
        padding_mode='replicate')

outputs = [post_pred(i) for i in decollate_batch(outputs)]
label = [post_label(i) for i in decollate_batch(label)]

In DiceMetric, I refer to the writing of monailabel:

MONAILabel/monailabel/tasks/train/utils.py

Lines 17 to 28 in 22d1e54

    
           def region_wise_metrics(regions, metric, prefix, keys=("pred", "label")): 
        
               all_metrics = dict() 
        
               all_metrics[metric] = MeanDice(output_transform=from_engine(keys), include_background=False) 
        
               if regions: 
        
                   labels = regions if isinstance(regions, dict) else {name: idx for idx, name in enumerate(regions, start=1)} 
        
                   for name, idx in labels.items(): 
        
                       all_metrics[f"{prefix}_{name}_dice"] = MeanDice( 
        
                           output_transform=from_engine_idx(keys, idx), 
        
                           include_background=False, 
        
                       ) 
        
               return all_metrics

In custom method:

dice_metric = DiceMetric(include_background=False, reduction="mean")
dice_metric(y_pred=outputs, y=label)

Here I am not sure if it is consistent with the setting of monailabel.

1 reply

tangy5 Oct 28, 2022
Maintainer

The code looks good, so the test DSC is about 0.65, what about the validation DSC in the logs? You could visually look at the prediction, and see whether the predicted masks are making sense (e.g., if an obvious shift or mis-alignment exist), then we can tell whether it's a bug or the problem of model performance. And understand the gap better. Thanks

Minxiangliu · 2022-10-28T09:47:18Z

Minxiangliu
Oct 28, 2022
Author

Hi @tangy5 ,
I can open the model trained with monailabel in the 3D Slicer, and the 3D Slicer shows the accuracy of the final best DSC, as in the log, but I did not get any results after segmentation. I also confirmed in val.py that they are all parameters of Import monailabel, but I always get different results from log.

I've packaged up my code, model, and test files, can you help me identify what's the problem? Thanks for your time.

Files Link

If you are in the monailabel directory, you can use the following method to execute the monailabel server.
monailabel start_server --app app-hnc --studies DataSets --conf model sengmentaion

If you can directly execute val.py under the monailabel/app-hnc directory, it will display the DSC results.

3D Slicer Execution Screen:
There are outcome that correctly show the best model after training, but perform automatic segmentation without feedback.

monailabel log:

[2022-10-28 17:48:54,120] [8728] [MainThread] [INFO] (monailabel.endpoints.session:68) - Uncompress: False; Expiry: 0
[2022-10-28 17:48:54,121] [8728] [MainThread] [INFO] (monailabel.endpoints.session:69) - Request Files: [<starlette.datastructures.UploadFile object at 0x000002B1EBB5DE88>]
[2022-10-28 17:48:54,124] [8728] [MainThread] [INFO] (monailabel.endpoints.session:83) - 1 => <starlette.datastructures.UploadFile object at 0x000002B1EBB5DE88> => C:\Users\minxi\AppData\Local\Temp\tmprneyglgj\tmp91f29chs.nii.gz
[2022-10-28 17:48:54,130] [8728] [MainThread] [INFO] (monailabel.utils.sessions:154) - ++ Time consumed to add session bbf44680-56a5-11ed-b64f-fcaa14921cc3: 0.005003452301025391
[2022-10-28 17:48:54,131] [8728] [MainThread] [INFO] (monailabel.endpoints.session:95) - Session ID: bbf44680-56a5-11ed-b64f-fcaa14921cc3; Info: {"name": "bbf44680-56a5-11ed-b64f-fcaa14921cc3", "path": "C:\\Users\\minxi\\.cache\\monailabel\\sessions\\bbf44680-56a5-11ed-b64f-fcaa14921cc3", "image": "C:\\Users\\minxi\\.cache\\monailabel\\sessions\\bbf44680-56a5-11ed-b64f-fcaa14921cc3\\tmp91f29chs.nii.gz", "meta": {}, "create_ts": 1666950534, "last_access_ts": 1666950534, "expiry": 3600}
[2022-10-28 17:48:58,271] [8728] [MainThread] [INFO] (monailabel.endpoints.infer:160) - Infer Request: {'model': 'segmentation', 'image': 'C:\\Users\\minxi\\.cache\\monailabel\\sessions\\bbf44680-56a5-11ed-b64f-fcaa14921cc3\\tmp91f29chs.nii.gz', 'device': 'cuda', 'result_extension': '.nrrd', 'result_dtype': 'uint8', 'client_id': 'user-xyz', 'session': {'name': 'bbf44680-56a5-11ed-b64f-fcaa14921cc3', 'path': 'C:\\Users\\minxi\\.cache\\monailabel\\sessions\\bbf44680-56a5-11ed-b64f-fcaa14921cc3', 'image': 'C:\\Users\\minxi\\.cache\\monailabel\\sessions\\bbf44680-56a5-11ed-b64f-fcaa14921cc3\\tmp91f29chs.nii.gz', 'meta': {}, 'create_ts': 1666950534, 'last_access_ts': 1666950538, 'expiry': 3600}}
[2022-10-28 17:48:58,273] [8728] [MainThread] [INFO] (monailabel.tasks.infer.basic_infer:258) - Infer Request (final): {'device': 'cuda', 'model': 'segmentation', 'image': 'C:\\Users\\minxi\\.cache\\monailabel\\sessions\\bbf44680-56a5-11ed-b64f-fcaa14921cc3\\tmp91f29chs.nii.gz', 'result_extension': '.nrrd', 'result_dtype': 'uint8', 'client_id': 'user-xyz', 'session': {'name': 'bbf44680-56a5-11ed-b64f-fcaa14921cc3', 'path': 'C:\\Users\\minxi\\.cache\\monailabel\\sessions\\bbf44680-56a5-11ed-b64f-fcaa14921cc3', 'image': 'C:\\Users\\minxi\\.cache\\monailabel\\sessions\\bbf44680-56a5-11ed-b64f-fcaa14921cc3\\tmp91f29chs.nii.gz', 'meta': {}, 'create_ts': 
1666950534, 'last_access_ts': 1666950538, 'expiry': 3600}, 'description': 'A model for volumetric (3D) segmentation of the HNC from PET CT image', 'save_label': False}
[2022-10-28 17:48:58,274] [8728] [MainThread] [INFO] (monailabel.interfaces.utils.transform:63) - PRE - Run Transform(s)
[2022-10-28 17:48:58,275] [8728] [MainThread] [INFO] (monailabel.interfaces.utils.transform:64) - PRE - Input Keys: ['device', 'model', 'image', 'result_extension', 'result_dtype', 'client_id', 'session', 'description', 'save_label', 'image_path']
[2022-10-28 17:49:00,431] [8728] [MainThread] [INFO] (monailabel.interfaces.utils.transform:109) - PRE - Transform (LoadImaged): Time: 2.1555; image: (200, 200, 88)(torch.float32)
[2022-10-28 17:49:00,432] [8728] [MainThread] [INFO] (monailabel.interfaces.utils.transform:109) - PRE - Transform (EnsureChannelFirstd): Time: 0.0; image: (1, 200, 200, 88)(torch.float32)
[2022-10-28 17:49:00,444] [8728] [MainThread] [INFO] (monailabel.interfaces.utils.transform:109) - PRE - Transform (Orientationd): Time: 0.011; image: (1, 200, 200, 88)(torch.float32)
[2022-10-28 17:49:00,716] [8728] [MainThread] [INFO] (monailabel.interfaces.utils.transform:109) - PRE - Transform (Spacingd): Time: 0.2719; image: (1, 188, 188, 82)(torch.float32)
[2022-10-28 17:49:00,717] [8728] [MainThread] [INFO] (monailabel.interfaces.utils.transform:109) - PRE - Transform (Lambdad): Time: 0.001; image: (1, 82, 188, 188)(torch.float32)
[2022-10-28 17:49:00,781] [8728] [MainThread] [INFO] (monailabel.interfaces.utils.transform:109) - PRE - Transform (CropForegroundd): Time: 0.064; image: (1, 96, 192, 192)(torch.float32)
[2022-10-28 17:49:00,889] [8728] [MainThread] [INFO] (monailabel.interfaces.utils.transform:109) - PRE - Transform (EnsureTyped): Time: 0.108; image: (1, 96, 192, 192)(torch.float32)
[2022-10-28 17:49:00,890] [8728] [MainThread] [INFO] (monailabel.tasks.infer.basic_infer:426) - Inferer:: cuda => SlidingWindowInferer => {'roi_size': (96, 96, 96), 'sw_batch_size': 4, 'overlap': 0.5, 'mode': constant, 
'sigma_scale': 0.125, 'padding_mode': 'replicate', 'cval': 0.0, 'sw_device': None, 'device': None, 'progress': False, 'cpu_thresh': None, 'roi_weight_map': None}
[2022-10-28 17:49:00,891] [8728] [MainThread] [INFO] (monailabel.tasks.infer.basic_infer:375) - Infer model path: D:\Downloads\monailabel\app-hnc\model\segmentation.pt
[2022-10-28 17:49:04,586] [8728] [MainThread] [INFO] (monailabel.interfaces.utils.transform:63) - POST - Run Transform(s)
[2022-10-28 17:49:04,587] [8728] [MainThread] [INFO] (monailabel.interfaces.utils.transform:64) - POST - Input Keys: ['device', 'model', 'image', 'result_extension', 'result_dtype', 'client_id', 'session', 'description', 'save_label', 'image_path', 'image_meta_dict', 'latencies', 'foreground_start_coord', 'foreground_end_coord', 'pred']
[2022-10-28 17:49:04,588] [8728] [MainThread] [INFO] (monailabel.interfaces.utils.transform:109) - POST - Transform (EnsureTyped): Time: 0.0; image: (1, 96, 192, 192)(torch.float32); pred: (2, 96, 192, 192)(torch.float32)
[2022-10-28 17:49:04,589] [8728] [MainThread] [INFO] (monailabel.interfaces.utils.transform:109) - POST - Transform (Activationsd): Time: 0.001; image: (1, 96, 192, 192)(torch.float32); pred: (2, 96, 192, 192)(torch.float32)
[2022-10-28 17:49:05,281] [8728] [MainThread] [INFO] (monailabel.interfaces.utils.transform:109) - POST - Transform (Invertd): Time: 0.6908; image: (1, 96, 192, 192)(torch.float32); pred: (2, 200, 200, 88)(torch.float32)
[2022-10-28 17:49:05,283] [8728] [MainThread] [INFO] (monailabel.interfaces.utils.transform:109) - POST - Transform (AsDiscreted): Time: 0.001; image: (1, 96, 192, 192)(torch.float32); pred: (1, 200, 200, 88)(torch.float32)
[2022-10-28 17:49:05,284] [8728] [MainThread] [INFO] (monailabel.interfaces.utils.transform:109) - POST - Transform (BinaryMaskd): Time: 0.0; image: (1, 96, 192, 192)(torch.float32); pred: (1, 200, 200, 88)(torch.float32)
[2022-10-28 17:49:05,284] [8728] [MainThread] [INFO] (monailabel.interfaces.utils.transform:109) - POST - Transform (SqueezeDimd): Time: 0.0; image: (1, 96, 192, 192)(torch.float32); pred: (200, 200, 88)(torch.float32) 
[2022-10-28 17:49:05,285] [8728] [MainThread] [INFO] (monailabel.tasks.infer.basic_infer:458) - Writing Result...
[2022-10-28 17:49:05,285] [8728] [MainThread] [INFO] (monailabel.transform.writer:188) - Result ext: .nrrd; write_to_file: True; dtype: uint8
[2022-10-28 17:49:05,331] [8728] [MainThread] [INFO] (monailabel.tasks.infer.basic_infer:298) - ++ Latencies => Total: 7.0580; Pre: 2.6163; Inferer: 3.6959; Invert: 0.0000; Post: 0.6987; Write: 0.0460
[2022-10-28 17:49:05,332] [8728] [MainThread] [INFO] (monailabel.tasks.infer.basic_infer:314) - Result File: C:\Users\minxi\AppData\Local\Temp\tmpxmm3i93d.nrrd
[2022-10-28 17:49:05,332] [8728] [MainThread] [INFO] (monailabel.tasks.infer.basic_infer:315) - Result Json Keys: ['label_names', 'latencies']

9 replies

Minxiangliu Oct 31, 2022
Author

Hi @tangy5 , Is what I'm doing here(#1100 (comment)) different from monailabel?

tangy5 Oct 31, 2022
Maintainer

Hi @Minxiangliu , as I mentioned, the code looks good. I can't tell the difference here, post transforms are the same, if you are using same pre transforms, it should be good.
I'm trying to think about and gather reasons for causing your mentioned gaps about performance. Not sure if you notice the "Accuracy" in the Slicer UI is the "train" best metric, not validation. If your calculated Dice is for validation data, there will be gaps. In addition, monailabel training will automatically split train/validation data, the difference on the data splits can also result in gaps. Another thing to notice, not sure if your task trigger the region_wise_metric, the way for normalizing labels can results in difference.
Thanks.

Minxiangliu Oct 31, 2022
Author

Hi @tangy5 ,
"Accuracy" in the Slicer UI is the "train" best metric, not validation
I do have "best_metric": 0.7582034468650818 written in train_stats.json in the monailabel output file.

{
  "rank": 0,
  "current_epoch": 2000,
  "current_iteration": 10000,
  "total_epochs": 2000,
  "total_iterations": 5,
  "epoch": 2000,
  "start_ts": 1666763633,
  "total_time": "1:24:30",
  "best_metric": 0.7582034468650818,
  "train": {
    "metrics": {
      "train_dice": 0.7764385342597961,
      "train_cancer_dice": 0.7764385342597961
    },
    "key_metric_name": "train_dice",
    "best_metric": 0.8023391366004944,
    "best_metric_epoch": 1954
  },
  "eval": {
    "metrics": {
      "val_mean_dice": 0.71221923828125,
      "val_cancer_dice": 0.71221923828125
    },
    "key_metric_name": "val_mean_dice",
    "best_metric": 0.7582034468650818,
    "best_metric_epoch": 1865
  }
}

In addition, I have specified training data(train_ds) and test data(val_ds) in partition_datalist method fo lib/trainers/segmentation.py, so I am currently using the same test data(val_ds), unless monailabel is doing the splitting of the test data(val_ds) in the training data(train_ds) I specified, there may be different results.

    def partition_datalist(self, context: Context, shuffle=False):
        with open(r'../../DataSets/cvDataSets/trainCV1.json', 'r') as file:
            train_ds = json.load(file)

        with open(r'../../DataSets/cvDataSets/testCV1.json', 'r') as file:
            val_ds = json.load(file)

        return train_ds, val_ds

Minxiangliu Oct 31, 2022
Author

Hi @tangy5 , Please how can I use region_wise_metrics method without monailabel?

Minxiangliu Oct 31, 2022
Author

I want to start another discussion to clarify my problem.#1107 (comment)

Path location for best model storage #1100

Uh oh!

Minxiangliu Oct 27, 2022

Replies: 5 comments · 12 replies

Uh oh!

Uh oh!

tangy5 Oct 27, 2022 Maintainer

Uh oh!

Uh oh!

Minxiangliu Oct 27, 2022 Author

Uh oh!

tangy5 Oct 27, 2022 Maintainer

Uh oh!

diazandr3s Oct 27, 2022 Maintainer

Uh oh!

Uh oh!

Minxiangliu Oct 27, 2022 Author

Uh oh!

Minxiangliu Oct 28, 2022 Author

Uh oh!

Uh oh!

tangy5 Oct 28, 2022 Maintainer

Uh oh!

Uh oh!

Minxiangliu Oct 28, 2022 Author

Uh oh!

Minxiangliu Oct 31, 2022 Author

Uh oh!

tangy5 Oct 31, 2022 Maintainer

Uh oh!

Minxiangliu Oct 31, 2022 Author

Uh oh!

Minxiangliu Oct 31, 2022 Author

Uh oh!

Minxiangliu Oct 31, 2022 Author

Minxiangliu
Oct 27, 2022

Replies: 5 comments 12 replies

tangy5
Oct 27, 2022
Maintainer

Minxiangliu
Oct 27, 2022
Author

tangy5 Oct 27, 2022
Maintainer

diazandr3s
Oct 27, 2022
Maintainer

Minxiangliu Oct 27, 2022
Author

Minxiangliu
Oct 28, 2022
Author

tangy5 Oct 28, 2022
Maintainer

Minxiangliu
Oct 28, 2022
Author

Minxiangliu Oct 31, 2022
Author

tangy5 Oct 31, 2022
Maintainer

Minxiangliu Oct 31, 2022
Author

Minxiangliu Oct 31, 2022
Author

Minxiangliu Oct 31, 2022
Author