fix: Mark foundational knowledge clearly in RAG context

anhmtk · anhmtk · commit 1ac1fb0cc330 · 2025-12-04T11:55:27.000+07:00
- Add [foundational knowledge] prefix for CRITICAL_FOUNDATION documents
- Use 'source: CRITICAL_FOUNDATION' format to match prompt builder expectations
- Helps LLM recognize and prioritize foundational knowledge over general training data
- Fixes issue where LLM ignores RAG context for StillMe self-tracking questions
diff --git a/stillme_core/rag/rag_retrieval.py b/stillme_core/rag/rag_retrieval.py
@@ -846,16 +846,32 @@ def build_prompt_context(self, context: Dict[str, Any], max_context_tokens: int
                         logger.warning(f"Stopped adding knowledge docs at {i}/{len(context['knowledge_docs'])} due to token limit")
                         break
                     
-                    source = doc.get("metadata", {}).get("source", "Unknown")
+                    metadata = doc.get("metadata", {})
+                    source = metadata.get("source", "Unknown")
                     content = doc.get("content", "")
                     
+                    # CRITICAL: Mark foundational knowledge clearly for LLM to recognize
+                    # Prompt builder expects [foundational knowledge] or source: CRITICAL_FOUNDATION
+                    is_foundational = (
+                        source == "CRITICAL_FOUNDATION" or
+                        metadata.get("foundational") == "stillme" or
+                        metadata.get("type") == "foundational" or
+                        "CRITICAL_FOUNDATION" in str(metadata.get("tags", "")) or
+                        "foundational:stillme" in str(metadata.get("tags", ""))
+                    )
+                    
                     # Allocate tokens per document (distribute remaining tokens)
                     # Reserve some tokens for formatting
                     doc_max_tokens = remaining_tokens // max(1, len(context["knowledge_docs"]) - i + 1)
                     doc_max_tokens = min(doc_max_tokens, 2000)  # Cap each doc at 2000 tokens
                     
                     truncated_content = self._truncate_text_by_tokens(content, doc_max_tokens)
-                    doc_text = f"{i}. {truncated_content} (Source: {source})"
+                    
+                    # Format with clear foundational knowledge marker
+                    if is_foundational:
+                        doc_text = f"{i}. [foundational knowledge] {truncated_content} (source: CRITICAL_FOUNDATION)"
+                    else:
+                        doc_text = f"{i}. {truncated_content} (Source: {source})"
                     
                     doc_tokens = self._estimate_tokens(doc_text)
                     remaining_tokens -= doc_tokens