removed unnecessary comments, fixed lint errors

sobiya-22 · sobiya-22 · commit 7c08f39a3c78 · 2025-06-11T07:15:10.000+05:30
diff --git a/skore/tests/unit/sklearn/plot/roc_curve/test_comparison_cross_validation.py b/skore/tests/unit/sklearn/plot/roc_curve/test_comparison_cross_validation.py
@@ -232,3 +232,79 @@ def test_multiclass_classification_kwargs(pyplot, multiclass_classification_repo
     display.plot(despine=False)
     assert display.ax_[0].spines["top"].get_visible()
     assert display.ax_[0].spines["right"].get_visible()
+
+
+def test_data_source_binary_classification(pyplot, binary_classification_data_no_split):
+    """
+    Test passing data_source to ROC plot in ComparisonReport with CrossValidationReport
+    """
+    estimator, X, y = binary_classification_data_no_split
+    estimator_1 = LogisticRegression()
+    estimator_2 = LogisticRegression(C=10)
+
+    report = ComparisonReport(
+        reports={
+            "estimator_1": CrossValidationReport(estimator_1, X, y),
+            "estimator_2": CrossValidationReport(estimator_2, X, y),
+        }
+    )
+
+    display = report.metrics.roc(data_source="X_y", X=X, y=y)
+    assert display.data_source == "X_y"
+    display.plot()
+
+    display = report.metrics.roc(data_source="train")
+    assert display.data_source == "train"
+    display.plot()
+
+    display = report.metrics.roc(data_source="test")
+    assert display.data_source == "test"
+    display.plot()
+
+    n_reports = len(report.reports_)
+    n_splits = report.reports_[0]._cv_splitter.n_splits
+    expected_auc_entries = n_reports * n_splits
+
+    assert len(display.roc_auc) == expected_auc_entries
+    auc_values = display.roc_auc["roc_auc"].values
+    assert all(0 <= auc <= 1 for auc in auc_values)
+
+
+def test_data_source_multiclass_classification(
+    pyplot, multiclass_classification_data_no_split
+):
+    "Test data_source in ROC plot for ComparisonReport with multiclass and CV report"
+    estimator, X, y = multiclass_classification_data_no_split
+    estimator_1 = LogisticRegression()
+    estimator_2 = LogisticRegression(C=10)
+
+    report = ComparisonReport(
+        reports={
+            "estimator_1": CrossValidationReport(estimator_1, X, y),
+            "estimator_2": CrossValidationReport(estimator_2, X, y),
+        }
+    )
+
+    class_labels = np.unique(y)
+
+    display = report.metrics.roc(data_source="X_y", X=X, y=y)
+    assert display.data_source == "X_y"
+    display.plot()
+
+    display = report.metrics.roc(data_source="train")
+    assert display.data_source == "train"
+    display.plot()
+
+    display = report.metrics.roc(data_source="test")
+    assert display.data_source == "test"
+    display.plot()
+
+    n_reports = len(report.reports_)
+    n_splits = report.reports_[0]._cv_splitter.n_splits
+    n_classes = len(class_labels)
+    expected_combinations = n_reports * n_classes * n_splits
+
+    assert len(display.roc_auc) == expected_combinations
+
+    auc_values = display.roc_auc["roc_auc"].values
+    assert all(0 <= auc <= 1 for auc in auc_values)
diff --git a/skore/tests/unit/sklearn/plot/roc_curve/test_comparison_estimator.py b/skore/tests/unit/sklearn/plot/roc_curve/test_comparison_estimator.py
@@ -141,6 +141,92 @@ def test_multiclass_classification(pyplot, multiclass_classification_data):
     assert display.ax_.get_title() == "ROC Curve"
 
 
+def test_data_source_binary_classification(pyplot, binary_classification_data):
+    """Test data_source in ROC plot for ComparisonReport."""
+    estimator, X_train, X_test, y_train, y_test = binary_classification_data
+    estimator_2 = clone(estimator).set_params(C=10).fit(X_train, y_train)
+
+    report = ComparisonReport(
+        reports={
+            "estimator_1": EstimatorReport(
+                estimator,
+                X_train=X_train,
+                y_train=y_train,
+                X_test=X_test,
+                y_test=y_test,
+            ),
+            "estimator_2": EstimatorReport(
+                estimator_2,
+                X_train=X_train,
+                y_train=y_train,
+                X_test=X_test,
+                y_test=y_test,
+            ),
+        }
+    )
+
+    display = report.metrics.roc(data_source="X_y", X=X_train, y=y_train)
+    assert display.data_source == "X_y"
+    display.plot()
+
+    display = report.metrics.roc(data_source="train")
+    assert display.data_source == "train"
+    display.plot()
+
+    display = report.metrics.roc(data_source="test")
+    assert display.data_source == "test"
+    display.plot()
+
+    train_auc = display.roc_auc["roc_auc"].values
+    assert len(train_auc) == 2
+    assert all(0 <= auc <= 1 for auc in train_auc)
+
+
+def test_data_source_multiclass_classification(pyplot, multiclass_classification_data):
+    """Test data_source in ROC plot for ComparisonReport with multiclass data"""
+    estimator, X_train, X_test, y_train, y_test = multiclass_classification_data
+    estimator_2 = clone(estimator).set_params(C=10).fit(X_train, y_train)
+
+    report = ComparisonReport(
+        reports={
+            "estimator_1": EstimatorReport(
+                estimator,
+                X_train=X_train,
+                y_train=y_train,
+                X_test=X_test,
+                y_test=y_test,
+            ),
+            "estimator_2": EstimatorReport(
+                estimator_2,
+                X_train=X_train,
+                y_train=y_train,
+                X_test=X_test,
+                y_test=y_test,
+            ),
+        }
+    )
+
+    class_labels = report.reports_[0].estimator_.classes_
+
+    display = report.metrics.roc(data_source="X_y", X=X_train, y=y_train)
+    assert display.data_source == "X_y"
+    display.plot()
+
+    display = report.metrics.roc(data_source="train")
+    assert display.data_source == "train"
+    display.plot()
+
+    display = report.metrics.roc(data_source="test")
+    assert display.data_source == "test"
+    display.plot()
+
+    expected_combinations = len(report.report_names_) * len(class_labels)
+    assert len(display.roc_auc) == expected_combinations
+
+    auc_values = display.roc_auc["roc_auc"].values
+    assert all(0 <= auc <= 1 for auc in auc_values)
+
+
 def test_binary_classification_kwargs(pyplot, binary_classification_data):
     """Check that we can pass keyword arguments to the ROC curve plot for
     cross-validation."""
diff --git a/skore/tests/unit/sklearn/plot/roc_curve/test_estimator.py b/skore/tests/unit/sklearn/plot/roc_curve/test_estimator.py
@@ -59,6 +59,7 @@ def test_binary_classification(pyplot, binary_classification_data):
     assert display.ax_.get_title() == "ROC Curve for LogisticRegression"
     assert display.data_source == "test"
 
+
 def test_multiclass_classification(pyplot, multiclass_classification_data):
     """Check the attributes and default plotting behaviour of the ROC curve plot with
     multiclass data."""
@@ -110,6 +111,7 @@ def test_multiclass_classification(pyplot, multiclass_classification_data):
     assert display.ax_.get_title() == "ROC Curve for LogisticRegression"
     assert display.data_source == "test"
 
+
 def test_data_source_binary_classification(pyplot, binary_classification_data):
     """Check that we can pass the `data_source` argument to the ROC curve plot."""
     estimator, X_train, X_test, y_train, y_test = binary_classification_data
@@ -123,7 +125,7 @@ def test_data_source_binary_classification(pyplot, binary_classification_data):
         display.lines_[0].get_label()
         == f"AUC = {display.roc_auc['roc_auc'].item():0.2f}"
     )
-    
+
     display = report.metrics.roc(data_source="train")
     display.plot()
     assert (