feat: add real-time observer system for voicemail/hallucination detection

Dev-Bhumika03 · Dev-Bhumika03 · commit 1b87a60e6fee · 2026-06-14T23:19:39.000+05:30
- Add ObserverConfig type to template configurations (reuses LLMConfiguration, FlowAction)
- Add observers package: RealtimeObserver, ObserverManager, factory
- Wire observer lifecycle in agent/__init__.py (on_user_turn_started, on_function_calls_started)
- Observers read from LLMContext, run in parallel via asyncio.gather, first-writer-wins
- Uses existing get_llm_service(pooled=True) and Pipecat run_inference() — no custom HTTP clients
- Template-configurable: add any detection by writing a system_prompt, zero code changes
- Tested with real voicemail calls — observer detects and sets outcome=VOICEMAIL
diff --git a/app/ai/voice/agents/breeze_buddy/agent/__init__.py b/app/ai/voice/agents/breeze_buddy/agent/__init__.py
@@ -174,6 +174,9 @@ def __init__(
         # Stream mode transcript collector (replaces LLMContext for transcription)
         self._transcript_collector: Optional[TranscriptCollectorProcessor] = None
 
+        # Real-time observers (side-LLMs for voicemail/hallucination detection)
+        self._observer_manager: Any = None
+
         # Error tracking
         self.errors: List[Dict[str, Any]] = []
 
@@ -804,6 +807,23 @@ async def on_user_turn_started(aggregator, strategy):
                         logger.debug("Post-greeting timer cancelled - user spoke")
                 self._user_idle_callback_handler.reset_retry_count()
 
+                # Notify real-time observers that a turn completed
+                if self._observer_manager:
+                    self._observer_manager.on_turn_completed()
+
+        # Notify real-time observers of LLM function calls
+        if self._observer_manager and self.flow_manager:
+            llm_service = getattr(self.flow_manager, "_llm", None)
+            if llm_service:
+
+                @llm_service.event_handler("on_function_calls_started")
+                async def _on_fn_calls_for_observer(service, function_calls):
+                    for call in function_calls:
+                        self._observer_manager.on_function_call(
+                            call.function_name,
+                            getattr(call, "arguments", {}),
+                        )
+
     async def _handle_client_connected(self) -> None:
         """Handle client connection and initialize flow."""
         if self.is_stream_mode:
@@ -1098,6 +1118,41 @@ async def run(self, runner_args: Optional[RunnerArguments] = None) -> None:
                     mcp_global_functions=mcp_global_functions,
                 )
 
+            # ── Real-time observers ──────────────────────────────────
+            observers_config = (
+                self.configurations.observers if self.configurations else None
+            )
+            logger.info(
+                f"Observer setup: configurations={'yes' if self.configurations else 'no'}, "
+                f"observers_config={observers_config is not None}, "
+                f"is_stream={is_stream}, "
+                f"observers_count={len(observers_config) if observers_config else 0}"
+            )
+            if observers_config and not is_stream:
+                try:
+                    from app.ai.voice.agents.breeze_buddy.observers import (
+                        ObserverManager,
+                        build_observers,
+                    )
+
+                    observer_instances = await build_observers(
+                        configs=observers_config,
+                        template=self.template,
+                        agent_context=self,
+                        handler_map=self.flow_builder.handler_map,
+                    )
+                    if observer_instances:
+                        self._observer_manager = ObserverManager(
+                            observer_instances, context
+                        )
+                        logger.info(
+                            f"Initialized {len(observer_instances)} "
+                            f"real-time observer(s)"
+                        )
+                except Exception as e:
+                    logger.error(f"Failed to initialize observers: {e}")
+                    self._observer_manager = None
+
             self._register_event_handlers()
 
             runner = PipelineRunner(handle_sigint=False, force_gc=True)
@@ -1113,6 +1168,9 @@ async def run(self, runner_args: Optional[RunnerArguments] = None) -> None:
             except asyncio.CancelledError:
                 logger.info(f"{log_prefix}Pipeline task cancelled. Exiting gracefully.")
         finally:
+            if self._observer_manager:
+                await self._observer_manager.stop()
+                self._observer_manager = None
             clear_log_context()
 
     async def _handle_unexpected_disconnect(self, reason: str) -> None:
diff --git a/app/ai/voice/agents/breeze_buddy/observers/__init__.py b/app/ai/voice/agents/breeze_buddy/observers/__init__.py
@@ -0,0 +1,5 @@
+from .factory import build_observers
+from .manager import ObserverManager
+from .observer import RealtimeObserver
+
+__all__ = ["build_observers", "ObserverManager", "RealtimeObserver"]
diff --git a/app/ai/voice/agents/breeze_buddy/observers/factory.py b/app/ai/voice/agents/breeze_buddy/observers/factory.py
@@ -0,0 +1,82 @@
+"""Observer factory — builds RealtimeObserver instances from template config.
+
+Uses existing ``get_llm_service()`` for LLM service creation and existing
+``LLMConfiguration`` for config merging (inherit with override).
+"""
+
+from typing import Any, Dict, List, Optional
+
+from app.ai.voice.agents.breeze_buddy.llm import get_llm_service
+from app.ai.voice.agents.breeze_buddy.template.types import ObserverConfig
+from app.ai.voice.llm.types import LLMConfiguration
+from app.core.logger import logger
+
+from .observer import RealtimeObserver
+
+
+def merge_llm_config(
+    override: Optional[LLMConfiguration],
+    base: LLMConfiguration,
+) -> LLMConfiguration:
+    """Merge observer's optional LLM overrides on top of template's config.
+
+    Model defaults to ``gpt-4o-mini``. Temperature defaults to 0.1.
+    """
+    if override is None:
+        return LLMConfiguration(
+            provider=base.provider,
+            sdk=base.sdk,
+            model="gpt-4o-mini",
+            region=getattr(base, "region", None),
+            endpoint=base.endpoint,
+            api_key_name=base.api_key_name,
+            temperature=0.1,
+            max_tokens=100,
+        )
+
+    return LLMConfiguration(
+        provider=override.provider or base.provider,
+        sdk=override.sdk or base.sdk,
+        model=override.model or "gpt-4o-mini",
+        region=override.region or getattr(base, "region", None),
+        endpoint=override.endpoint or base.endpoint,
+        api_key_name=override.api_key_name or base.api_key_name,
+        temperature=(override.temperature if override.temperature is not None else 0.1),
+        max_tokens=(override.max_tokens if override.max_tokens is not None else 100),
+    )
+
+
+async def build_observers(
+    configs: List[ObserverConfig],
+    template: Any,
+    agent_context: Any,
+    handler_map: Dict[str, Any],
+) -> List[RealtimeObserver]:
+    """Build observer instances from template config."""
+    template_llm = template.configurations.llm_configurations
+    if template_llm is None:
+        # Template uses global env defaults — create a minimal config
+        # that will resolve to Azure gpt-4o-mini via get_llm_service()
+        logger.info(
+            "Template has no llm_configurations — "
+            "observers will use env defaults with gpt-4o-mini"
+        )
+        template_llm = LLMConfiguration()
+
+    observers: List[RealtimeObserver] = []
+
+    for cfg in configs:
+        try:
+            merged_config = merge_llm_config(cfg.llm, template_llm)
+            llm_service = await get_llm_service(merged_config, pooled=True)
+            observers.append(
+                RealtimeObserver(cfg, llm_service, agent_context, handler_map)
+            )
+            logger.info(
+                f"Built observer '{cfg.name}' with model="
+                f"{merged_config.model}, start_after_turn={cfg.start_after_turn}"
+            )
+        except Exception as e:
+            logger.error(f"Failed to build observer '{cfg.name}': {e}")
+
+    return observers
diff --git a/app/ai/voice/agents/breeze_buddy/observers/manager.py b/app/ai/voice/agents/breeze_buddy/observers/manager.py
@@ -0,0 +1,133 @@
+"""ObserverManager — coordinates N real-time observers.
+
+Reads the conversation transcript from the pipeline's existing LLMContext,
+builds a formatted transcript string, and feeds it to all eligible observers
+in parallel after every LLM turn.
+
+Not a pipeline processor. Completely separate async system.
+"""
+
+import asyncio
+import json
+from typing import Any, List
+
+from pipecat.processors.aggregators.llm_context import LLMContext
+
+from app.core.logger import logger
+
+from .observer import RealtimeObserver
+
+
+class ObserverManager:
+    """Coordinates N observers. Reads existing LLMContext.
+
+    Triggered on every LLM turn (via ``on_user_turn_started``) and on every
+    function call (via ``on_function_calls_started``). All eligible observers
+    run in parallel via ``asyncio.gather``. First to detect wins.
+    """
+
+    def __init__(
+        self,
+        observers: List[RealtimeObserver],
+        llm_context: LLMContext,
+    ):
+        self._observers = observers
+        self._llm_context = llm_context
+        self._function_calls: List[str] = []
+        self._turn_count: int = 0
+        self._action_taken: bool = False
+        self._check_lock = asyncio.Lock()
+
+    # ------------------------------------------------------------------
+    # Data ingestion (called by pipeline event hooks in agent/__init__.py)
+    # ------------------------------------------------------------------
+
+    def on_turn_completed(self):
+        """A turn completed — kick off observer checks in background."""
+        if self._action_taken:
+            return
+        self._turn_count += 1
+        asyncio.create_task(self._run_checks(), name="observer:check_round")
+
+    def on_function_call(self, function_name: str, arguments: Any):
+        """Bot called a function — record it and trigger checks."""
+        args_str = json.dumps(arguments) if arguments else ""
+        self._function_calls.append(f"{function_name}({args_str})")
+        if not self._action_taken:
+            asyncio.create_task(self._run_checks(), name="observer:check_round_fn")
+
+    # ------------------------------------------------------------------
+    # Check execution
+    # ------------------------------------------------------------------
+
+    async def _run_checks(self):
+        """Run all eligible observers in parallel. First to detect wins."""
+        if self._action_taken:
+            return
+
+        async with self._check_lock:
+            if self._action_taken:
+                return
+
+            transcript = self._build_transcript()
+
+            eligible = [
+                obs
+                for obs in self._observers
+                if not obs._detected and self._turn_count >= obs.config.start_after_turn
+            ]
+            if not eligible:
+                return
+
+            # gather() over as_completed(): as_completed wraps futures in
+            # new coroutines so the original future→observer mapping breaks.
+            # gather() returns results in input order which is deterministic
+            # and keeps the observer→result pairing trivial via zip().
+            results = await asyncio.gather(
+                *[obs.check(transcript) for obs in eligible],
+                return_exceptions=True,
+            )
+
+            for obs, result in zip(eligible, results):
+                if self._action_taken:
+                    return
+                if isinstance(result, Exception):
+                    logger.warning(f"Observer '{obs.name}' check failed: {result}")
+                    continue
+                if result is True:
+                    self._action_taken = True
+                    await obs.execute_action()
+                    return
+
+    # ------------------------------------------------------------------
+    # Transcript building
+    # ------------------------------------------------------------------
+
+    def _build_transcript(self) -> str:
+        """Build transcript from LLMContext messages + recorded function calls."""
+        lines: List[str] = []
+
+        for msg in self._llm_context.messages:
+            if not isinstance(msg, dict):
+                continue
+            role = msg.get("role", "")
+            content = msg.get("content", "")
+            if not content:
+                continue
+            if role == "user":
+                lines.append(f"[customer] {content}")
+            elif role == "assistant":
+                lines.append(f"[bot] {content}")
+
+        for fc in self._function_calls:
+            lines.append(f"[bot_action] {fc}")
+
+        return "\n".join(lines)
+
+    # ------------------------------------------------------------------
+    # Lifecycle
+    # ------------------------------------------------------------------
+
+    async def stop(self):
+        """Cleanup. Called when the call ends."""
+        self._action_taken = True
diff --git a/app/ai/voice/agents/breeze_buddy/observers/observer.py b/app/ai/voice/agents/breeze_buddy/observers/observer.py
diff --git a/app/ai/voice/agents/breeze_buddy/template/types.py b/app/ai/voice/agents/breeze_buddy/template/types.py