Release v0.3.3: navigation progress, reload saved audio, simplify load path

kenfus · kenfus · commit ade8315f6781 · 2026-03-31T18:35:08.000+02:00
Made-with: Cursor
diff --git a/pyproject.toml b/pyproject.toml
@@ -4,7 +4,7 @@ build-backend = "setuptools.build_meta"
 
 [project]
 name = "helvox"
-version = "0.3.2"
+version = "0.3.3"
 description = "A simple recording tool for Swiss German speech data."
 readme = "README.md"
 requires-python = ">=3.10"
diff --git a/src/helvox/app.py b/src/helvox/app.py
@@ -626,6 +626,12 @@ def _apply_sample_fields(self) -> None:
             self._thumb_choice = "up"
         self._sync_thumb_buttons()
 
+        self.recorder.load_saved_clip_for_sample(id_str)
+        if self.recorder.full_audio is None:
+            self.clear_waveform_canvas()
+        else:
+            self.update_waveform()
+
         self.update_progress()
         self.update_navigation_controls()
 
@@ -655,12 +661,27 @@ def show_done_state(self) -> None:
 
     def update_progress(self) -> None:
         total_count = len(self.recorder.input_data)
-        done_count = len(self.recorder.output_data) + len(self.recorder.skipped_ids)
-        done_count = min(done_count, total_count)
-        self.progress_text.set(f"Progress: {done_count} / {total_count}")
+        if total_count == 0:
+            self.progress_text.set("Progress: 0 / 0")
+            self.progress_bar["maximum"] = 1
+            self.progress_bar["value"] = 0
+            return
 
-        self.progress_bar["maximum"] = max(total_count, 1)
-        self.progress_bar["value"] = done_count
+        if self.current_id is not None:
+            ids_ordered = [str(s["id"]) for s in self.recorder.input_data]
+            try:
+                line_no = ids_ordered.index(str(self.current_id)) + 1
+            except ValueError:
+                line_no = 0
+            self.progress_text.set(f"Line {line_no} / {total_count}")
+            self.progress_bar["maximum"] = total_count
+            self.progress_bar["value"] = line_no
+        else:
+            done_count = len(self.recorder.output_data) + len(self.recorder.skipped_ids)
+            done_count = min(done_count, total_count)
+            self.progress_text.set(f"Progress: {done_count} / {total_count}")
+            self.progress_bar["maximum"] = max(total_count, 1)
+            self.progress_bar["value"] = done_count
 
     def update_navigation_controls(self) -> None:
         has_current = self.current_id is not None
diff --git a/src/helvox/utils/recorder.py b/src/helvox/utils/recorder.py
@@ -134,6 +134,8 @@ def start_recording(self):
 
         self.recording = True
         self.audio_data = []
+        self.full_audio = None
+        self.trimmed_audio = None
 
         def callback(indata: np.ndarray, frames, time, status: CallbackFlags):
             if status:
@@ -182,6 +184,41 @@ def save_audio(self, filename: str) -> float:
 
         return self.get_duration_trimmed_audio()
 
+    def load_saved_clip_for_sample(self, sample_id: Union[int, str]) -> None:
+        """Load trimmed FLAC from disk when this line was saved; else clear buffers."""
+        id_str = str(sample_id)
+        self.audio_data = []
+
+        if id_str not in self.output_index:
+            self.full_audio = None
+            self.trimmed_audio = None
+            return
+
+        audio_name = self.output_index[id_str].get("audio", "")
+        if not audio_name:
+            self.full_audio = None
+            self.trimmed_audio = None
+            return
+
+        path = self.output_folder / self.speaker_id / "audio" / Path(audio_name).name
+        if not path.is_file():
+            self.full_audio = None
+            self.trimmed_audio = None
+            return
+
+        try:
+            data, _ = sf.read(str(path), always_2d=True, dtype="float32")
+        except OSError:
+            self.full_audio = None
+            self.trimmed_audio = None
+            return
+
+        if data.shape[1] > 1:
+            data = np.mean(data, axis=1, keepdims=True)
+
+        self.trimmed_audio = np.ascontiguousarray(data)
+        self.full_audio = self.trimmed_audio.copy()
+
     def play_audio_data_full_audio(self):
         self.play_audio_data(self.full_audio)