make u_weights and col_weights not interdependent

levimcclenny · levimcclenny · commit 1faae5934deb · 2021-03-01T22:25:42.000-06:00
diff --git a/tensordiffeq/fit.py b/tensordiffeq/fit.py
@@ -92,12 +92,22 @@ def apply_grads(n_batches, obj=obj):
         for _ in range(n_batches):
             # unstack = tf.unstack(obj.u_model.trainable_variables, axis = 2)
             obj.variables = obj.u_model.trainable_variables
-            if obj.isAdaptive:
+            if obj.isAdaptive and obj.u_weights is not None and obj.col_weights is not None:
                 obj.variables.extend([obj.u_weights, obj.col_weights])
                 loss_value, grads = obj.grad()
                 obj.tf_optimizer.apply_gradients(zip(grads[:-2], obj.u_model.trainable_variables))
                 obj.tf_optimizer_weights.apply_gradients(
                     zip([-grads[-2], -grads[-1]], [obj.u_weights, obj.col_weights]))
+            elif obj.isAdaptive and obj.u_weights is None and obj.col_weights is not None:
+                obj.variables.extend([obj.col_weights])
+                loss_value, grads = obj.grad()
+                obj.tf_optimizer.apply_gradients(zip(grads[:-1], obj.u_model.trainable_variables))
+                obj.tf_optimizer_weights.apply_gradients(zip([-grads[-1]], [obj.col_weights]))
+            elif obj.isAdaptive and obj.u_weights is not None and obj.col_weights is None:
+                obj.variables.extend([obj.u_weights])
+                loss_value, grads = obj.grad()
+                obj.tf_optimizer.apply_gradients(zip(grads[:-1], obj.u_model.trainable_variables))
+                obj.tf_optimizer_weights.apply_gradients(zip([-grads[-1]], [obj.u_weights]))
             else:
                 loss_value, grads = obj.grad()
                 obj.tf_optimizer.apply_gradients(zip(grads, obj.u_model.trainable_variables))