Fix/clamp the minimum of w[19] (#354)

L-M-Sherlock · web-flow · commit 9fda48b745a4 · 2025-07-31T14:29:40.000+08:00
* Fix/clamp the minimum of w[19] same to open-spaced-repetition/fsrs-optimizer#186 * bump version * only clamp when enable short term * revert unit test update * Refactor parameter clipping logic to remove Option type for enable_short_term, simplifying the function signature and internal logic.
diff --git a/Cargo.lock b/Cargo.lock
diff --git a/Cargo.toml b/Cargo.toml
@@ -1,6 +1,6 @@
 [package]
 name = "fsrs"
-version = "5.0.0"
+version = "5.0.1"
 authors = ["Open Spaced Repetition"]
 categories = ["algorithms", "science"]
 edition = "2024"
diff --git a/src/model.rs b/src/model.rs
@@ -273,7 +273,7 @@ pub(crate) fn parameters_to_model<B: Backend>(parameters: &Parameters) -> Model<
     let mut model = Model::new(config.clone());
     model.w = Param::from_tensor(Tensor::from_floats(
         TensorData::new(
-            clip_parameters(parameters, config.num_relearning_steps),
+            clip_parameters(parameters, config.num_relearning_steps, Default::default()),
             Shape { dims: vec![21] },
         ),
         &B::Device::default(),
diff --git a/src/parameter_clipper.rs b/src/parameter_clipper.rs
@@ -11,17 +11,26 @@ use burn::{
 pub(crate) fn parameter_clipper<B: Backend>(
     parameters: Param<Tensor<B, 1>>,
     num_relearning_steps: usize,
+    enable_short_term: bool,
 ) -> Param<Tensor<B, 1>> {
     let (id, val) = parameters.consume();
-    let clipped = clip_parameters(&val.to_data().to_vec().unwrap(), num_relearning_steps);
+    let clipped = clip_parameters(
+        &val.to_data().to_vec().unwrap(),
+        num_relearning_steps,
+        enable_short_term,
+    );
     Param::initialized(
         id,
         Tensor::from_data(TensorData::new(clipped, val.shape()), &B::Device::default())
             .require_grad(),
     )
 }
 
-pub(crate) fn clip_parameters(parameters: &Parameters, num_relearning_steps: usize) -> Vec<f32> {
+pub(crate) fn clip_parameters(
+    parameters: &Parameters,
+    num_relearning_steps: usize,
+    enable_short_term: bool,
+) -> Vec<f32> {
     let mut parameters = parameters.to_vec();
     // PLS = w11 * D ^ -w12 * [(S + 1) ^ w13 - 1] * e ^ (w14 * (1 - R))
     // PLS * e ^ (num_relearning_steps * w17 * w18) should be <= S
@@ -38,6 +47,7 @@ pub(crate) fn clip_parameters(parameters: &Parameters, num_relearning_steps: usi
     } else {
         2.0
     };
+    let w19_floor = if enable_short_term { 0.01 } else { 0.0 };
     // https://regex101.com/r/21mXNI/1
     let clamps: [(f32, f32); 21] = [
         (S_MIN, INIT_S_MAX),
@@ -59,7 +69,7 @@ pub(crate) fn clip_parameters(parameters: &Parameters, num_relearning_steps: usi
         (1.0, 6.0),
         (0.0, w17_w18_ceiling),
         (0.0, w17_w18_ceiling),
-        (0.0, 0.8),
+        (w19_floor, 0.8),
         (0.1, 0.8),
     ];
 
@@ -84,7 +94,7 @@ mod tests {
             &device,
         );
 
-        let param = parameter_clipper(Param::from_tensor(tensor), 1);
+        let param = parameter_clipper(Param::from_tensor(tensor), 1, true);
         let values = &param.to_data().to_vec::<f32>().unwrap();
 
         assert_eq!(
@@ -99,7 +109,7 @@ mod tests {
         let device = NdArrayDevice::Cpu;
         let tensor = Tensor::from_floats(DEFAULT_PARAMETERS, &device);
 
-        let param = parameter_clipper(Param::from_tensor(tensor), 2);
+        let param = parameter_clipper(Param::from_tensor(tensor), 2, true);
         let values = &param.to_data().to_vec::<f32>().unwrap();
 
         values[17..=19].assert_approx_eq([0.5425, 0.0912, 0.0658]);
diff --git a/src/training.rs b/src/training.rs
@@ -473,7 +473,11 @@ fn train<B: AutodiffBackend>(
             }
             let grads = GradientsParams::from_grads(gradients, &model);
             model = optim.step(lr, model, grads);
-            model.w = parameter_clipper(model.w, config.model.num_relearning_steps);
+            model.w = parameter_clipper(
+                model.w,
+                config.model.num_relearning_steps,
+                !config.model.freeze_short_term_stability,
+            );
             // info!("epoch: {:?} iteration: {:?} lr: {:?}", epoch, iteration, lr);
             renderer.render_train(TrainingProgress {
                 progress,
@@ -653,7 +657,11 @@ mod tests {
         let lr = 0.04;
         let grads = GradientsParams::from_grads(gradients, &model);
         model = optim.step(lr, model, grads);
-        model.w = parameter_clipper(model.w, config.model.num_relearning_steps);
+        model.w = parameter_clipper(
+            model.w,
+            config.model.num_relearning_steps,
+            !config.model.freeze_short_term_stability,
+        );
         model
             .w
             .val()
@@ -783,7 +791,11 @@ mod tests {
             ]);
         let grads = GradientsParams::from_grads(gradients, &model);
         model = optim.step(lr, model, grads);
-        model.w = parameter_clipper(model.w, config.model.num_relearning_steps);
+        model.w = parameter_clipper(
+            model.w,
+            config.model.num_relearning_steps,
+            !config.model.freeze_short_term_stability,
+        );
         model
             .w
             .val()