Project-N-E-K-O
diff --git a/‎.agent/rules/neko-guide.md‎
Lines changed: 1 addition & 0 deletions b/‎.agent/rules/neko-guide.md‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎config/__init__.py‎
Lines changed: 14 additions & 5 deletions b/‎config/__init__.py‎
Lines changed: 14 additions & 5 deletions
diff --git a/‎config/activity_keywords.py‎
Lines changed: 2843 additions & 0 deletions b/‎config/activity_keywords.py‎
Lines changed: 2843 additions & 0 deletions
diff --git a/‎config/prompts_activity.py‎
Lines changed: 584 additions & 0 deletions b/‎config/prompts_activity.py‎
Lines changed: 584 additions & 0 deletions
diff --git a/‎config/prompts_memory.py‎
Lines changed: 18 additions & 15 deletions b/‎config/prompts_memory.py‎
Lines changed: 18 additions & 15 deletions
@@ -7,6 +7,7 @@ trigger: always_on
 ## 基本规则
 
 - 使用 i18n 支持国际化，目前支持 en.json、ja.json、ko.json、zh-CN.json、zh-TW.json、ru.json 六种。每次改 i18n 字符串时必须同步更新全部 6 个 locale 文件，只改部分会被打回。
+- **后端 Python 多语言字符串一律落在 `config/prompts_*.py`**：无论是平铺 `dict[str, str]` 还是嵌套 `dict[str, dict[K, str]]`，凡键里出现 `'zh' / 'en' / 'ja' / 'ko' / 'ru'` 的语言映射，都必须放在 `config/prompts_*` 下。`scripts/check_prompt_hygiene.py` 只抓平铺结构，但规范是"加新语言时一次扫 `config/` 即可补全"——嵌套 dict 即使 lint 没抓也算技术债，需自觉搬迁。新增后端模块若有翻译需求，直接在 `config/prompts_<topic>.py` 加新模块或复用已有模块（如 `prompts_activity.py`、`prompts_proactive.py`、`prompts_memory.py`）。
 - 使用 `uv run` 来运行本项目的任何 Python 程序（pytest、脚本等），不要直接用系统 Python。原因：pyproject.toml 限制了 Python 版本（<3.13），uv 会自动选择合适版本并管理虚拟环境。
 - 任何涉及用户隐私（原始对话）的 log 只能用 `print` 输出，不得使用 `logger`。
 - 翻译 system prompt 时，即使出于其他原因也应当保留 `======以上为`，这是一个水印。
 
@@ -1139,10 +1139,15 @@ def translate_value(val):
 - 用途：fetch_news_content / fetch_video_content 等的 limit 参数统一值。
 - 上游：外部 web/news/video 抓取结果。"""
 
-PROACTIVE_PHASE1_TOTAL_TOPICS = 20
+PROACTIVE_PHASE1_TOTAL_TOPICS = 12
 """Phase 1 输入给筛选 LLM 的候选话题总数。
 - 用途：从所有 source 合并后去重，截到此数后送 LLM 筛选。
-- 上游：cap 后的 fetch 结果汇总。"""
+- 上游：cap 后的 fetch 结果汇总。
+- 设计依据：原值 20。早期 external 是主要信号源，候选池开得很大。
+  Phase 2 引入 vision / music / meme / reminiscence 等并行通道后，
+  external 的相对权重下降——筛选 LLM 多看 8 条边际候选无助于挑出更
+  好的 top-1，反而让 Phase 1 prompt 一次跑过 2k tokens 上限。下调到
+  12 仍给筛选 LLM 充分多样性，且单次调用 token 减半左右。"""
 
 PROACTIVE_EXTERNAL_PER_ITEM_MAX_TOKENS = 200
 """Phase 2 外部内容（news/video/social/meme 等）单条 token 上限。
@@ -1152,11 +1157,15 @@ def translate_value(val):
 - 设计依据：单条 200 token 已足够 LLM 知道"这是什么"，详细信息靠
   Phase 2 LLM 自行总结。"""
 
-PROACTIVE_EXTERNAL_TOTAL_MAX_TOKENS = 2000
-"""Phase 2 外部内容拼合后的总 token 上限。
+PROACTIVE_EXTERNAL_TOTAL_MAX_TOKENS = 1500
+"""Phase 1 外部候选拼合后的总 token 上限（Phase 2 实际只看 top-1）。
 - 用途：所有 selected web items 序列化后，再做一次总和截断。
 - 上游：cap 后的 external_section 文本。
-- 设计依据：留出主对话流的 5k 总预算给 character_prompt + memory + 历史。"""
+- 设计依据：跟 PROACTIVE_PHASE1_TOTAL_TOPICS 同步下调。原值 2000 是
+  20 候选 × 200 token 留的硬顶；候选数收到 12 之后，1500 已留出
+  ~250 token 富余，超出仍兜底截断。Phase 2 generate prompt 实际只
+  把 Phase 1 选中的单条 web_topic（~50-100 token）放进
+  external_section，本字段约束的是 Phase 1 的 prompt 大小。"""
 
 PROACTIVE_PHASE2_OUTPUT_MAX_TOKENS = 300
 """Phase 2 流式输出的 abort fence。
 
@@ -717,19 +717,19 @@ def get_emotion_analysis_prompt(lang: str = 'zh') -> str:
 # =====================================================================
 
 MEMORY_RECALL_HEADER = {
-    'zh': '======{name}尝试回忆=====\n',
-    'en': '======{name} tries to recall=====\n',
-    'ja': '======{name}の回想=====\n',
-    'ko': '======{name}의 회상=====\n',
-    'ru': '======{name} пытается вспомнить=====\n',
+    'zh': '======{name}尝试回忆======\n',
+    'en': '======{name} tries to recall======\n',
+    'ja': '======{name}の回想======\n',
+    'ko': '======{name}의 회상======\n',
+    'ru': '======{name} пытается вспомнить======\n',
 }
 
 MEMORY_RESULTS_HEADER = {
-    'zh': '====={name}的相关记忆=====\n',
-    'en': '====={name}\'s Related Memories=====\n',
-    'ja': '====={name}の関連する記憶=====\n',
-    'ko': '====={name}의 관련 기억=====\n',
-    'ru': '====={name} — связанные воспоминания=====\n',
+    'zh': '======{name}的相关记忆======\n',
+    'en': '======{name}\'s Related Memories======\n',
+    'ja': '======{name}の関連する記憶======\n',
+    'ko': '======{name}의 관련 기억======\n',
+    'ru': '======{name} — связанные воспоминания======\n',
 }
 
 # ---------- Persona header (static prefix) ----------
@@ -742,12 +742,15 @@ def get_emotion_analysis_prompt(lang: str = 'zh') -> str:
 }
 
 # ---------- Proactive chat followup header ----------
+# 文案故意"鼓励性"而非"可选性"——之前的"可以选择性地回顾"语气太弱，配合
+# Phase 2 prompt 的反复读警告，会让模型把回忆当成"高重复风险"绕开。新表述
+# 强调这些是"久远的旧话题"，与"最近 1h 内复读"明确区分。
 PROACTIVE_FOLLOWUP_HEADER = {
-    'zh': '\n[回忆线索] 以下是之前对话中的话题，可以选择性地回顾或跟进：\n',
-    'en': '\n[Memory cues] Topics from previous conversations that could be revisited:\n',
-    'ja': '\n[記憶の手がかり] 以前の会話のトピックで、再訪できるもの：\n',
-    'ko': '\n[기억 단서] 이전 대화에서 다시 다룰 수 있는 주제:\n',
-    'ru': '\n[Подсказки памяти] Темы из предыдущих разговоров, к которым можно вернуться:\n',
+    'zh': '\n[回忆线索] 以下旧话题距今较久，适合自然回忆与跟进：\n',
+    'en': '\n[Memory cues] Older topics from prior conversations — well-suited for natural reminiscence:\n',
+    'ja': '\n[記憶の手がかり] 以前の会話で出た古い話題——自然に回想して持ち出すのに向いている：\n',
+    'ko': '\n[기억 단서] 이전 대화에서 나온 오래된 화제——자연스럽게 회상하여 꺼내기 좋음:\n',
+    'ru': '\n[Подсказки памяти] Старые темы из прошлых разговоров — удачные для естественного возврата:\n',
 }
 
 # =====================================================================