Fix merge LoRA adapters

andrewdalpino · andrewdalpino · commit 86b10535abab · 2025-09-20T21:56:21.000-05:00
diff --git a/fine-tune.py b/fine-tune.py
@@ -49,7 +49,7 @@ def main():
     parser.add_argument("--lora_alpha", default=1.0, type=float)
     parser.add_argument("--activation_checkpointing", action="store_true")
     parser.add_argument("--eval_interval", default=1, type=int)
-    parser.add_argument("--eval_ratio", default=0.1, type=float)
+    parser.add_argument("--num_eval_samples", default=2048, type=int)
     parser.add_argument("--checkpoint_interval", default=1, type=int)
     parser.add_argument(
         "--checkpoint_path", default="./checkpoints/checkpoint.pt", type=str
@@ -89,11 +89,6 @@ def main():
             f"Eval interval must be greater than 0, {args.eval_interval} given."
         )
 
-    if args.eval_ratio < 0 or args.eval_ratio > 1:
-        raise ValueError(
-            f"Eval ratio must be between 0 and 1, {args.eval_ratio} given."
-        )
-
     if args.checkpoint_interval < 1:
         raise ValueError(
             f"Checkpoint interval must be greater than 0, {args.checkpoint_interval} given."
@@ -151,9 +146,9 @@ def main():
 
     dataset = ConcatDataset(datasets)
 
-    training_ratio = 1.0 - args.eval_ratio
+    n_train_samples = len(dataset) - args.num_eval_samples
 
-    training, testing = random_split(dataset, (training_ratio, args.eval_ratio))
+    training, testing = random_split(dataset, [n_train_samples, args.num_eval_samples])
 
     right_pad_collate = partial(
         pad_collate,
@@ -198,7 +193,7 @@ def main():
 
     model.add_lora_parameters(**lora_args)
 
-    print("LoRA parameters added")
+    print("Added LoRA adapters")
 
     print(f"Model has {model.num_trainable_params:,} trainable parameters")
 
diff --git a/src/nope_gpt/model.py b/src/nope_gpt/model.py
@@ -126,7 +126,9 @@ def merge_lora_parameters(self) -> None:
             if not hasattr(module, "parametrizations"):
                 continue
 
-            for name in module.parametrizations.keys():
+            lora_params = [name for name in module.parametrizations.keys()]
+
+            for name in lora_params:
                 remove_parametrizations(module, name)
 
     def forward(self, x: Tensor) -> Tensor: