Backend paddle: add optimizers with supportting regularizer

lijialin03 · lijialin03 · commit ad52e7799995 · 2024-11-28T03:29:39.000Z
diff --git a/deepxde/model.py b/deepxde/model.py
@@ -506,8 +506,13 @@ def outputs_losses_test(inputs, targets, auxiliary_vars):
         trainable_variables = (
             list(self.net.parameters()) + self.external_trainable_variables
         )
+        regularizer = getattr(self.net, 'regularizer', None)
+        if regularizer is not None:
+            weight_decay = self.net.regularizer_value if self.opt_name == "adamw" else self.net.regularizer
+        else: 
+            weight_decay = None
         self.opt = optimizers.get(
-            trainable_variables, self.opt_name, learning_rate=lr, decay=decay
+            trainable_variables, self.opt_name, learning_rate=lr, decay=decay, weight_decay=weight_decay,
         )
 
         def train_step(inputs, targets, auxiliary_vars):
diff --git a/deepxde/optimizers/paddle/optimizers.py b/deepxde/optimizers/paddle/optimizers.py
@@ -19,12 +19,14 @@ def is_external_optimizer(optimizer):
     return optimizer in ["L-BFGS", "L-BFGS-B"]
 
 
-def get(params, optimizer, learning_rate=None, decay=None):
+def get(params, optimizer, learning_rate=None, decay=None, weight_decay=None):
     """Retrieves an Optimizer instance."""
     if isinstance(optimizer, paddle.optimizer.Optimizer):
         return optimizer
 
     if optimizer in ["L-BFGS", "L-BFGS-B"]:
+        if weight_decay is not None:
+            raise ValueError("L-BFGS optimizer doesn't support weight_decay")
         if learning_rate is not None or decay is not None:
             print("Warning: learning rate is ignored for {}".format(optimizer))
         optim = paddle.optimizer.LBFGS(
@@ -46,5 +48,17 @@ def get(params, optimizer, learning_rate=None, decay=None):
         learning_rate = _get_lr_scheduler(learning_rate, decay)
 
     if optimizer == "adam":
-        return paddle.optimizer.Adam(learning_rate=learning_rate, parameters=params)
+        return paddle.optimizer.Adam(learning_rate=learning_rate, parameters=params, weight_decay=weight_decay)
+    elif optimizer == "sgd":
+        return paddle.optimizer.SGD(learning_rate=learning_rate, parameters=params, weight_decay=weight_decay)
+    elif optimizer == "rmsprop":
+        return paddle.optimizer.RMSProp(
+            learning_rate=learning_rate, parameters=params, weight_decay=weight_decay,
+        )
+    elif optimizer == "adamw":
+        if weight_decay[0] == 0:
+            raise ValueError("AdamW optimizer requires non-zero weight decay")
+        return paddle.optimizer.AdamW(
+            learning_rate=learning_rate, parameters=params, weight_decay=weight_decay[0],
+        )
     raise NotImplementedError(f"{optimizer} to be implemented for backend Paddle.")

Original file line number	Diff line number	Diff line change
`@@ -506,8 +506,13 @@ def outputs_losses_test(inputs, targets, auxiliary_vars):`
`506`	`506`	`trainable_variables = (`
`507`	`507`	`list(self.net.parameters()) + self.external_trainable_variables`
`508`	`508`	`)`
	`509`	`+ regularizer = getattr(self.net, 'regularizer', None)`
	`510`	`+ if regularizer is not None:`
	`511`	`+ weight_decay = self.net.regularizer_value if self.opt_name == "adamw" else self.net.regularizer`
	`512`	`+ else:`
	`513`	`+ weight_decay = None`
`509`	`514`	`self.opt = optimizers.get(`
`510`		`- trainable_variables, self.opt_name, learning_rate=lr, decay=decay`
	`515`	`+ trainable_variables, self.opt_name, learning_rate=lr, decay=decay, weight_decay=weight_decay,`
`511`	`516`	`)`
`512`	`517`
`513`	`518`	`def train_step(inputs, targets, auxiliary_vars):`