NVIDIA · azrael417 · Mar 31, 2025 · Mar 31, 2025 · Mar 31, 2025 · Mar 31, 2025
@@ -311,7 +311,7 @@ def initialize_env():
         rank = int(os.environ.get("RANK"))
         world_size = int(os.environ.get("WORLD_SIZE"))
         if "LOCAL_RANK" in os.environ:
-            local_rank = os.environ.get("LOCAL_RANK")
+            local_rank = int(os.environ.get("LOCAL_RANK"))
             if local_rank is not None:
                 local_rank = int(local_rank)
             else:
@@ -548,30 +548,30 @@ def setup(
                 manager._local_rank = local_rank
 
         manager._device = torch.device(
-            f"cuda:{manager.local_rank}" if torch.cuda.is_available() else "cpu"
+            f"cuda:{manager._local_rank}" if torch.cuda.is_available() else "cpu"
         )
 
         if manager._distributed:
             # Setup distributed process group
             try:
                 dist.init_process_group(
                     backend,
-                    rank=manager.rank,
-                    world_size=manager.world_size,
-                    device_id=manager.device,
+                    rank=manager._rank,
+                    world_size=manager._world_size,
+                    device_id=manager._device,
                 )
             except TypeError:
                 # device_id only introduced in PyTorch 2.3
                 dist.init_process_group(
                     backend,
-                    rank=manager.rank,
-                    world_size=manager.world_size,
+                    rank=manager._rank,
+                    world_size=manager._world_size,
                 )
 
         if torch.cuda.is_available():
             # Set device for this process and empty cache to optimize memory usage
-            torch.cuda.set_device(manager.device)
-            torch.cuda.device(manager.device)
+            torch.cuda.set_device(manager._device)
+            torch.cuda.device(manager._device)
             torch.cuda.empty_cache()
 
         manager._initialization_method = method