add more optimizer

zhuwq0 · zhuwq0 · commit 15bd2426c586 · 2024-10-22T00:38:15.000-07:00
diff --git a/scripts/run_adloc_cc.py b/scripts/run_adloc_cc.py
@@ -178,7 +178,10 @@
     ## invert loss
     ######################################################################################################
     # optimizer = optim.Adam(params=travel_time.parameters(), lr=0.1)
-    optimizer = optim.Adam(params=travel_time.parameters(), lr=0.01)
+    # optimizer = optim.Adam(params=travel_time.parameters(), lr=0.001)
+    optimizer = optim.RMSprop(params=travel_time.parameters(), lr=0.001)
+    # optimizer = optim.SGD(params=travel_time.parameters(), lr=0.0003)
+
     valid_index = np.ones(len(pairs), dtype=bool)
     EPOCHS = 100
     prev_loss = 1e10
@@ -298,40 +301,48 @@
             plotting_dd(events, stations, config, figure_path, events_init, suffix=f"_ddcc_{epoch//10}")
 
     # ######################################################################################################
-    # if len(pairs_df) < 1_000_000:
-    #     optimizer = optim.LBFGS(params=raw_travel_time.parameters(), max_iter=100, line_search_fn="strong_wolfe")
-
-    #     def closure():
-    #         optimizer.zero_grad()
-    #         loss = 0
-    #         # for meta in tqdm(phase_dataset, desc=f"BFGS"):
-    #         if ddp_local_rank == 0:
-    #             print(f"BFGS: ", end="")
-    #         for meta in phase_dataset:
-    #             if ddp_local_rank == 0:
-    #                 print(".", end="")
-
-    #             loss_ = travel_time(
-    #                 meta["idx_sta"],
-    #                 meta["idx_eve"],
-    #                 meta["phase_type"],
-    #                 meta["phase_time"],
-    #                 meta["phase_weight"],
-    #             )["loss"]
-    #             loss_.backward()
-
-    #             if ddp:
-    #                 dist.all_reduce(loss_, op=dist.ReduceOp.SUM)
-    #                 # loss_ /= ddp_world_size
-
-    #             loss += loss_
-
-    #         if ddp_local_rank == 0:
-    #             print(f"Loss: {loss}")
-    #         raw_travel_time.event_loc.weight.data[:, 2].clamp_(min=config["zlim_km"][0], max=config["zlim_km"][1])
-    #         return loss
-
-    #     optimizer.step(closure)
+    if len(pairs_df) < 1_000_000:
+        optimizer = optim.LBFGS(params=raw_travel_time.parameters(), max_iter=200, line_search_fn="strong_wolfe")
+
+        prev_loss = 1e10
+
+        def closure():
+            optimizer.zero_grad()
+            loss = 0
+            # for meta in tqdm(phase_dataset, desc=f"BFGS"):
+            if ddp_local_rank == 0:
+                print(f"BFGS: ", end="")
+            for meta in phase_dataset:
+                if ddp_local_rank == 0:
+                    print(".", end="")
+
+                loss_ = travel_time(
+                    meta["idx_sta"],
+                    meta["idx_eve"],
+                    meta["phase_type"],
+                    meta["phase_time"],
+                    meta["phase_weight"],
+                )["loss"]
+                loss_.backward()
+
+                if ddp:
+                    dist.all_reduce(loss_, op=dist.ReduceOp.SUM)
+                    # loss_ /= ddp_world_size
+
+                loss += loss_
+
+            if ddp:
+                dist.barrier()
+                if prev_loss < loss:
+                    print(f"{prev_loss = } {loss = }")
+                    return loss
+            prev_loss = loss.item()
+            if ddp_local_rank == 0:
+                print(f"Loss: {loss}")
+            raw_travel_time.event_loc.weight.data[:, 2].clamp_(min=config["zlim_km"][0], max=config["zlim_km"][1])
+            return loss
+
+        optimizer.step(closure)
     # ######################################################################################################
 
     # %%