apache · mawiesne · Apr 25, 2025 · Apr 16, 2025 · Apr 16, 2025 · Apr 23, 2025
diff --git a/opennlp-tools/pom.xml b/opennlp-tools/pom.xml
@@ -72,6 +72,13 @@
       <scope>test</scope>
     </dependency>
 
+    <dependency>
+      <groupId>org.assertj</groupId>
+      <artifactId>assertj-core</artifactId>
+      <version>${assertj-core.version}</version>
+      <scope>test</scope>
+    </dependency>
+
   </dependencies>
 
   <build>

diff --git a/opennlp-tools/src/main/java/opennlp/tools/commons/Trainer.java b/opennlp-tools/src/main/java/opennlp/tools/commons/Trainer.java
@@ -19,6 +19,7 @@
 
 import java.util.Map;
 
+import opennlp.tools.util.TrainingConfiguration;
 import opennlp.tools.util.TrainingParameters;
 
 /**
@@ -35,4 +36,14 @@ public interface Trainer {
    */
   void init(TrainingParameters trainParams, Map<String, String> reportMap);
 
+  /**
+   * Conducts the initialization of a {@link Trainer} via
+   * {@link TrainingParameters}, {@link Map report map} and {@link TrainingConfiguration}
+   *
+   * @param trainParams The {@link TrainingParameters} to use.
+   * @param reportMap The {@link Map} instance used as report map.
+   * @param config The {@link TrainingConfiguration} to use.
+   */
+  void init(TrainingParameters trainParams, Map<String, String> reportMap, TrainingConfiguration config);
+
 }
diff --git a/opennlp-tools/src/main/java/opennlp/tools/ml/AbstractTrainer.java b/opennlp-tools/src/main/java/opennlp/tools/ml/AbstractTrainer.java
@@ -22,12 +22,14 @@
 
 import opennlp.tools.commons.Trainer;
 import opennlp.tools.ml.maxent.GISTrainer;
+import opennlp.tools.util.TrainingConfiguration;
 import opennlp.tools.util.TrainingParameters;
 
 public abstract class AbstractTrainer implements Trainer {
 
   protected TrainingParameters trainingParameters;
   protected Map<String,String> reportMap;
+  protected TrainingConfiguration trainingConfiguration;
 
   public AbstractTrainer() {
   }
@@ -55,6 +57,20 @@ public void init(TrainingParameters trainParams, Map<String,String> reportMap) {
     this.reportMap = reportMap;
   }
 
+  /**
+   * Initializes a {@link AbstractTrainer} using following parameters.
+   *
+   * @param trainParams The {@link TrainingParameters} to use.
+   * @param reportMap The {@link Map} instance used as report map.
+   * @param config The {@link TrainingConfiguration} to use.
+   */
+  @Override
+  public void init(TrainingParameters trainParams, Map<String, String> reportMap,
+                   TrainingConfiguration config) {
+    init(trainParams, reportMap);
+    this.trainingConfiguration = config;
+  }
+
   /**
    * @return Retrieves the configured {@link TrainingParameters#ALGORITHM_PARAM} value.
    */
@@ -108,4 +124,12 @@ protected void addToReport(String key, String value) {
     reportMap.put(key, value);
   }
 
+  /**
+   * Retrieves the {@link TrainingConfiguration} associated with a {@link AbstractTrainer}.
+   * @return {@link TrainingConfiguration}
+   */
+  public TrainingConfiguration getTrainingConfiguration() {
+    return trainingConfiguration;
+  }
+
 }
diff --git a/opennlp-tools/src/main/java/opennlp/tools/ml/TrainerFactory.java b/opennlp-tools/src/main/java/opennlp/tools/ml/TrainerFactory.java
@@ -26,6 +26,8 @@
 import opennlp.tools.ml.naivebayes.NaiveBayesTrainer;
 import opennlp.tools.ml.perceptron.PerceptronTrainer;
 import opennlp.tools.ml.perceptron.SimplePerceptronSequenceTrainer;
+import opennlp.tools.monitoring.DefaultTrainingProgressMonitor;
+import opennlp.tools.util.TrainingConfiguration;
 import opennlp.tools.util.TrainingParameters;
 import opennlp.tools.util.ext.ExtensionLoader;
 import opennlp.tools.util.ext.ExtensionNotLoadedException;
@@ -180,6 +182,22 @@ public static <T> EventModelSequenceTrainer<T> getEventModelSequenceTrainer(
     }
   }
 
+  /**
+   * Works like {@link TrainerFactory#getEventTrainer(TrainingParameters, Map, TrainingConfiguration)}
+   * except that the {@link TrainingConfiguration} is initialized with {@link DefaultTrainingProgressMonitor}
+   * and a null {@link opennlp.tools.monitoring.StopCriteria}.
+   * If not provided, the actual {@link opennlp.tools.monitoring.StopCriteria}
+   * will be decided by the {@link EventTrainer} implementation.
+   *
+   */
+  public static EventTrainer getEventTrainer(
+          TrainingParameters trainParams, Map<String, String> reportMap) {
+
+    TrainingConfiguration trainingConfiguration
+        = new TrainingConfiguration(new DefaultTrainingProgressMonitor(), null);
+    return  getEventTrainer(trainParams, reportMap, trainingConfiguration);
+  }
+
   /**
    * Retrieves an {@link EventTrainer} that fits the given parameters.
    *
@@ -189,11 +207,14 @@ public static <T> EventModelSequenceTrainer<T> getEventModelSequenceTrainer(
    *                    {@link GISTrainer#MAXENT_VALUE} will be used.
    * @param reportMap A {@link Map} that shall be used during initialization of
    *                  the {@link EventTrainer}.
+   * @param config The {@link TrainingConfiguration} to be used. This determines  the type of
+   *                    {@link opennlp.tools.monitoring.TrainingProgressMonitor}
+   *                    and the {@link opennlp.tools.monitoring.StopCriteria} to be used.
    *
    * @return A valid {@link EventTrainer} for the configured {@code trainParams}.
    */
   public static EventTrainer getEventTrainer(
-          TrainingParameters trainParams, Map<String, String> reportMap) {
+      TrainingParameters trainParams, Map<String, String> reportMap, TrainingConfiguration config) {
 
     // if the trainerType is not defined -- use the GISTrainer.
     String trainerType = trainParams.getStringParameter(
@@ -205,7 +226,7 @@ public static EventTrainer getEventTrainer(
     } else {
       trainer = ExtensionLoader.instantiateExtension(EventTrainer.class, trainerType);
     }
-    trainer.init(trainParams, reportMap);
+    trainer.init(trainParams, reportMap, config);
     return trainer;
   }
 

diff --git a/opennlp-tools/src/main/java/opennlp/tools/ml/maxent/GISTrainer.java b/opennlp-tools/src/main/java/opennlp/tools/ml/maxent/GISTrainer.java
@@ -40,7 +40,13 @@
 import opennlp.tools.ml.model.OnePassDataIndexer;
 import opennlp.tools.ml.model.Prior;
 import opennlp.tools.ml.model.UniformPrior;
+import opennlp.tools.monitoring.DefaultTrainingProgressMonitor;
+import opennlp.tools.monitoring.LogLikelihoodThresholdBreached;
+import opennlp.tools.monitoring.StopCriteria;
+import opennlp.tools.monitoring.TrainingMeasure;
+import opennlp.tools.monitoring.TrainingProgressMonitor;
 import opennlp.tools.util.ObjectStream;
+import opennlp.tools.util.TrainingConfiguration;
 import opennlp.tools.util.TrainingParameters;
 
 /**
@@ -497,6 +503,11 @@ private void findParameters(int iterations, double correctionConstant) {
         new ExecutorCompletionService<>(executor);
     double prevLL = 0.0;
     double currLL;
+
+    //Get the Training Progress Monitor and the StopCriteria.
+    TrainingProgressMonitor progressMonitor = getTrainingProgressMonitor(trainingConfiguration);
+    StopCriteria stopCriteria = getStopCriteria(trainingConfiguration);
+
     logger.info("Performing {} iterations.", iterations);
     for (int i = 1; i <= iterations; i++) {
       currLL = nextIteration(correctionConstant, completionService, i);
@@ -505,13 +516,20 @@ private void findParameters(int iterations, double correctionConstant) {
           logger.warn("Model Diverging: loglikelihood decreased");
           break;
         }
-        if (currLL - prevLL < llThreshold) {
+        if (stopCriteria.test(currLL - prevLL)) {
+          progressMonitor.finishedTraining(iterations, stopCriteria);
           break;
         }
       }
       prevLL = currLL;
     }
 
+    //At this point, all iterations have finished successfully.
+    if (!progressMonitor.isTrainingFinished()) {
+      progressMonitor.finishedTraining(iterations, null);
+    }
+    progressMonitor.displayAndClear();
+
     // kill a bunch of these big objects now that we don't need them
     observedExpects = null;
     modelExpects = null;
@@ -628,8 +646,8 @@ private double nextIteration(double correctionConstant,
       }
     }
 
-    logger.info("{} - loglikelihood={}\t{}",
-        iteration, loglikelihood, ((double) numCorrect / numEvents));
+    getTrainingProgressMonitor(trainingConfiguration).
+        finishedIteration(iteration, numCorrect, numEvents, TrainingMeasure.LOG_LIKELIHOOD, loglikelihood);
 
     return loglikelihood;
   }
@@ -709,4 +727,25 @@ synchronized double getLoglikelihood() {
       return loglikelihood;
     }
   }
+
+  /**
+   * Get the {@link StopCriteria} associated with this Trainer.
+   * @param trainingConfig - If {@link TrainingConfiguration} is null or
+   * {@link TrainingConfiguration#stopCriteria()} is null then return a default {@link StopCriteria}.
+   */
+  private StopCriteria getStopCriteria(TrainingConfiguration trainingConfig) {
+    return trainingConfig != null && trainingConfig.stopCriteria() != null
+        ? trainingConfig.stopCriteria() : new LogLikelihoodThresholdBreached(trainingParameters);
+  }
+
+  /**
+   * Get the {@link TrainingProgressMonitor} associated with this Trainer.
+   * @param trainingConfig If {@link TrainingConfiguration} is null or
+   * {@link TrainingConfiguration#progMon()} is null then return a default {@link TrainingProgressMonitor}.
+   */
+  private TrainingProgressMonitor getTrainingProgressMonitor(TrainingConfiguration trainingConfig) {
+    return trainingConfig != null && trainingConfig.progMon() != null ?
+        trainingConfig.progMon() : new DefaultTrainingProgressMonitor();
+  }
+
 }
diff --git a/opennlp-tools/src/main/java/opennlp/tools/ml/perceptron/PerceptronTrainer.java b/opennlp-tools/src/main/java/opennlp/tools/ml/perceptron/PerceptronTrainer.java
@@ -28,6 +28,12 @@
 import opennlp.tools.ml.model.DataIndexer;
 import opennlp.tools.ml.model.EvalParameters;
 import opennlp.tools.ml.model.MutableContext;
+import opennlp.tools.monitoring.DefaultTrainingProgressMonitor;
+import opennlp.tools.monitoring.IterDeltaAccuracyUnderTolerance;
+import opennlp.tools.monitoring.StopCriteria;
+import opennlp.tools.monitoring.TrainingMeasure;
+import opennlp.tools.monitoring.TrainingProgressMonitor;
+import opennlp.tools.util.TrainingConfiguration;
 import opennlp.tools.util.TrainingParameters;
 
 /**
@@ -293,6 +299,10 @@ private MutableContext[] findParameters(int iterations, boolean useAverage) {
       }
     }
 
+    //Get the Training Progress Monitor and the StopCriteria.
+    TrainingProgressMonitor progressMonitor = getTrainingProgressMonitor(trainingConfiguration);
+    StopCriteria stopCriteria = getStopCriteria(trainingConfiguration);
+
     // Keep track of the previous three accuracies. The difference of
     // the mean of these and the current training set accuracy is used
     // with tolerance to decide whether to stop.
@@ -349,10 +359,12 @@ private MutableContext[] findParameters(int iterations, boolean useAverage) {
         }
       }
 
-      // Calculate the training accuracy and display.
+      // Calculate the training accuracy.
       double trainingAccuracy = (double) numCorrect / numEvents;
-      if (i < 10 || (i % 10) == 0)
-        logger.info("{}: ({}/{}) {}", i, numCorrect, numEvents, trainingAccuracy);
+      if (i < 10 || (i % 10) == 0) {
+        progressMonitor.finishedIteration(i, numCorrect, numEvents,
+            TrainingMeasure.ACCURACY, trainingAccuracy);
+      }
 
       // TODO: Make averaging configurable !!!
 
@@ -370,10 +382,10 @@ private MutableContext[] findParameters(int iterations, boolean useAverage) {
       // If the tolerance is greater than the difference between the
       // current training accuracy and all of the previous three
       // training accuracies, stop training.
-      if (StrictMath.abs(prevAccuracy1 - trainingAccuracy) < tolerance
-          && StrictMath.abs(prevAccuracy2 - trainingAccuracy) < tolerance
-          && StrictMath.abs(prevAccuracy3 - trainingAccuracy) < tolerance) {
-        logger.warn("Stopping: change in training set accuracy less than {}", tolerance);
+      if (stopCriteria.test(prevAccuracy1 - trainingAccuracy)
+          && stopCriteria.test(prevAccuracy2 - trainingAccuracy)
+          && stopCriteria.test(prevAccuracy3 - trainingAccuracy)) {
+        progressMonitor.finishedTraining(iterations, stopCriteria);
         break;
       }
 
@@ -383,6 +395,12 @@ private MutableContext[] findParameters(int iterations, boolean useAverage) {
       prevAccuracy3 = trainingAccuracy;
     }
 
+    //At this point, all iterations have finished successfully.
+    if (!progressMonitor.isTrainingFinished()) {
+      progressMonitor.finishedTraining(iterations, null);
+    }
+    progressMonitor.displayAndClear();
+
     // Output the final training stats.
     trainingStats(evalParams);
 
@@ -432,4 +450,25 @@ private static boolean isPerfectSquare(int n) {
     return root * root == n;
   }
 
+  /**
+   * Get the {@link StopCriteria} associated with this Trainer.
+   * @param trainingConfig - If {@link TrainingConfiguration} is null or
+   *        {@link TrainingConfiguration#stopCriteria()} is null then return a default {@link StopCriteria}.
+   */
+  private StopCriteria getStopCriteria(TrainingConfiguration trainingConfig) {
+    return trainingConfig != null && trainingConfig.stopCriteria() != null
+        ? trainingConfig.stopCriteria() : new IterDeltaAccuracyUnderTolerance(trainingParameters);
+  }
+
+  /**
+   * Get the {@link TrainingProgressMonitor} associated with this Trainer.
+   * @param trainingConfig - If {@link TrainingConfiguration} is null or
+   *        {@link TrainingConfiguration#progMon()}is null then
+   *        return the default {@link TrainingProgressMonitor}.
+   */
+  private TrainingProgressMonitor getTrainingProgressMonitor(TrainingConfiguration trainingConfig) {
+    return trainingConfig != null && trainingConfig.progMon() != null ? trainingConfig.progMon() :
+        new DefaultTrainingProgressMonitor();
+  }
+
 }