change mp_context default from spawn to None/auto, add warning

romeokienzler · romeokienzler · commit 22cb81f52fcd · 2026-06-05T22:27:16.000+02:00
Signed-off-by: Romeo Kienzler &lt;romeo.kienzler1@ibm.com&gt;
diff --git a/gridfm_graphkit/__main__.py b/gridfm_graphkit/__main__.py
@@ -1,11 +1,27 @@
 import argparse
+import platform
+import warnings
 from datetime import datetime
 from gridfm_graphkit.cli import main_cli, benchmark_cli
 
 
 import subprocess
 import os
 
+
+def _warn_mp_context_on_linux(mp_context):
+    """On Linux, recommend 'spawn' when mp_context is unset, 'fork', or 'forkserver'."""
+    if platform.system() != "Linux":
+        return
+    if mp_context in (None, "fork", "forkserver"):
+        chosen = mp_context if mp_context is not None else "PyTorch default"
+        warnings.warn(
+            f"--mp_context is '{chosen}' on Linux. 'spawn' is recommended for safety "
+            "(avoids issues with CUDA initialization and forked processes), though "
+            "'fork'/'forkserver' may be faster.",
+            stacklevel=2,
+        )
+
 def is_lsf():
     return (
         os.environ.get("LSB_JOBID") is not None
@@ -94,13 +110,15 @@ def main():
     _mp_context_kwargs = dict(
         dest="mp_context",
         type=str,
-        default="spawn",
+        default=None,
         choices=["spawn", "fork", "forkserver"],
         help=(
             "Multiprocessing start method for DataLoader workers. "
-            "'spawn' (default) is safest and works everywhere. "
+            "Defaults to None so PyTorch picks automatically. "
+            "'spawn' is safest and works everywhere. "
             "'fork' avoids re-importing modules but is unsafe after CUDA init. "
-            "'forkserver' uses a clean server process but requires file-descriptor passing."
+            "'forkserver' uses a clean server process but requires file-descriptor passing. "
+            "On Linux, 'spawn' is recommended; other choices emit a warning."
         ),
     )
 
@@ -370,6 +388,8 @@ def main():
 
     args = parser.parse_args()
 
+    _warn_mp_context_on_linux(getattr(args, "mp_context", None))
+
     if args.command == "benchmark":
         benchmark_cli(args)
     else: