add UUID header (#107)

YuchengZhou821 · web-flow · commit 56fbb4f498e6 · 2026-03-09T17:05:33.000-07:00
* add UUID header

* fix lint
diff --git a/src/om1_speech/audio/audio_output_live_stream.py b/src/om1_speech/audio/audio_output_live_stream.py
@@ -122,6 +122,7 @@ def zenoh_audio_message(self, data: zenoh.Sample):
             == AudioStatus.STATUS_SPEAKER.ACTIVE.value
         ):
             pending_message = json.loads(self.audio_status.sentence_to_speak.data)
+            pending_message["request_id"] = self.audio_status.header.frame_id
             self.add_request(pending_message)
 
     def _on_asr_text(self, data: zenoh.Sample):
@@ -185,19 +186,24 @@ def _process_audio(self):
         and streams them through a persistent ffplay process.
         """
         while self.running:
+            tts_request = None
             try:
                 tts_request = self._pending_requests.get()
                 if tts_request is None:
                     break
 
+                request_id = tts_request.get("request_id", "")
+
                 if not self._initialize_ffplay():
                     logger.error("Failed to initialize ffplay")
                     continue
 
                 self._stream_audio_chunk(self._create_silence_audio(10))
 
                 self._tts_callback(True)
-                self._update_audio_status(AudioStatus.STATUS_SPEAKER.ACTIVE.value)
+                self._update_audio_status(
+                    AudioStatus.STATUS_SPEAKER.ACTIVE.value, request_id
+                )
 
                 with self.openai_client.audio.speech.with_streaming_response.create(
                     model=self._tts_model,
@@ -214,12 +220,17 @@ def _process_audio(self):
                 self._finish_audio_playback()
 
                 self._tts_callback(False)
-                self._update_audio_status(AudioStatus.STATUS_SPEAKER.READY.value)
+                self._update_audio_status(
+                    AudioStatus.STATUS_SPEAKER.READY.value, request_id
+                )
 
             except Exception as e:
                 logger.error(f"Error processing audio: {e}")
                 self._tts_callback(False)
-                self._update_audio_status(AudioStatus.STATUS_SPEAKER.READY.value)
+                self._update_audio_status(
+                    AudioStatus.STATUS_SPEAKER.READY.value,
+                    tts_request.get("request_id", "") if tts_request else "",
+                )
                 continue
 
     def _initialize_ffplay(self) -> bool:
@@ -332,17 +343,19 @@ def _cleanup_ffplay(self):
                     self._ffplay_proc = None
                     self._ffplay_initialized = False
 
-    def _update_audio_status(self, speaker_status: int):
+    def _update_audio_status(self, speaker_status: int, frame_id: str = ""):
         """
         Update and publish audio status via Zenoh.
 
         Parameters
         ----------
         speaker_status : int
             The speaker status to set
+        frame_id : str
+            The frame ID (request UUID) to include in the header
         """
         state = AudioStatus(
-            header=prepare_header(),
+            header=prepare_header(frame_id),
             status_mic=(
                 self.audio_status.status_mic
                 if self.audio_status