huggingface · qgallouedec · Apr 22, 2025 · Apr 14, 2025 · Apr 14, 2025 · Apr 17, 2025
diff --git a/trl/trainer/grpo_trainer.py b/trl/trainer/grpo_trainer.py
@@ -358,6 +358,8 @@ def __init__(
         # Processing class
         if processing_class is None:
             processing_class = AutoTokenizer.from_pretrained(model.config._name_or_path, padding_side="left")
+            if processing_class.pad_token is None:
+                processing_class.pad_token = processing_class.eos_token
-            if processing_class.pad_token is None:
-                processing_class.pad_token = processing_class.eos_token
+        if processing_class.pad_token is None:
+            processing_class.pad_token = processing_class.eos_token
-            if processing_class.pad_token is None:
-                processing_class.pad_token = processing_class.eos_token
+        if processing_class.pad_token is None:
+            processing_class.pad_token = processing_class.eos_token
 
         # Reward functions
         if not isinstance(reward_funcs, list):