Mai-with-u
diff --git a/‎pytests/A_memorix_test/test_web_import_manager_payloads.py‎
Lines changed: 147 additions & 10 deletions b/‎pytests/A_memorix_test/test_web_import_manager_payloads.py‎
Lines changed: 147 additions & 10 deletions
diff --git a/‎src/A_memorix/CONFIG_REFERENCE.md‎
Lines changed: 16 additions & 1 deletion b/‎src/A_memorix/CONFIG_REFERENCE.md‎
Lines changed: 16 additions & 1 deletion
diff --git a/‎src/A_memorix/QUICK_START.md‎
Lines changed: 7 additions & 0 deletions b/‎src/A_memorix/QUICK_START.md‎
Lines changed: 7 additions & 0 deletions
diff --git a/‎src/A_memorix/config_schema.json‎
Lines changed: 97 additions & 1 deletion b/‎src/A_memorix/config_schema.json‎
Lines changed: 97 additions & 1 deletion
@@ -1,6 +1,7 @@
 from pathlib import Path
 from types import SimpleNamespace
 
+import asyncio
 import numpy as np
 import pytest
 
@@ -18,6 +19,8 @@ def __init__(self) -> None:
         self.paragraphs: list[dict[str, object]] = []
         self.entities: list[str] = []
         self.relations: list[tuple[str, str, str]] = []
+        self.paragraph_backfills: list[tuple[str, str]] = []
+        self.relation_vector_states: list[tuple[str, str, str | None, bool]] = []
 
     def add_paragraph(self, **kwargs):
         self.paragraphs.append(dict(kwargs))
@@ -33,8 +36,17 @@ def add_relation(self, *, subject: str, predicate: str, obj: str, **kwargs) -> s
         self.relations.append((subject, predicate, obj))
         return f"relation-{len(self.relations)}"
 
-    def set_relation_vector_state(self, rel_hash: str, state: str) -> None:
-        del rel_hash, state
+    def set_relation_vector_state(
+        self,
+        rel_hash: str,
+        state: str,
+        error: str | None = None,
+        bump_retry: bool = False,
+    ) -> None:
+        self.relation_vector_states.append((rel_hash, state, error, bump_retry))
+
+    def enqueue_paragraph_vector_backfill(self, paragraph_hash: str, *, error: str = "") -> None:
+        self.paragraph_backfills.append((paragraph_hash, error))
 
     def get_live_paragraphs_by_source(self, source: str):
         return [
@@ -58,32 +70,60 @@ def add_edges(self, edges, relation_hashes=None):
 
 
 class _DummyVectorStore:
+    def __init__(self) -> None:
+        self.ids: list[str] = []
+
     def __contains__(self, item: str) -> bool:
-        del item
-        return False
+        return item in self.ids
 
     def add(self, vectors, ids):
-        del vectors, ids
+        del vectors
+        self.ids.extend(list(ids))
 
 
 class _DummyEmbeddingManager:
+    def __init__(self, *, delay: float = 0.0, fail_for: str = "") -> None:
+        self.delay = delay
+        self.fail_for = fail_for
+        self.inflight = 0
+        self.max_inflight = 0
+        self.calls: list[str] = []
+
     async def encode(self, text: str) -> np.ndarray:
-        del text
+        self.calls.append(text)
+        self.inflight += 1
+        self.max_inflight = max(self.max_inflight, self.inflight)
+        try:
+            if self.delay:
+                await asyncio.sleep(self.delay)
+            if self.fail_for and self.fail_for in text:
+                raise RuntimeError("embedding failed")
+        finally:
+            self.inflight -= 1
         return np.ones(4, dtype=np.float32)
 
 
-def _build_manager() -> tuple[ImportTaskManager, _DummyMetadataStore]:
+def _build_manager(
+    *,
+    embedding_manager: _DummyEmbeddingManager | None = None,
+    relation_vectorization_enabled: bool = False,
+) -> tuple[ImportTaskManager, _DummyMetadataStore]:
     metadata_store = _DummyMetadataStore()
+    config = {
+        "retrieval.relation_vectorization": {
+            "enabled": relation_vectorization_enabled,
+            "write_on_import": relation_vectorization_enabled,
+        }
+    }
     plugin = SimpleNamespace(
         metadata_store=metadata_store,
         graph_store=_DummyGraphStore(),
         vector_store=_DummyVectorStore(),
-        embedding_manager=_DummyEmbeddingManager(),
+        embedding_manager=embedding_manager or _DummyEmbeddingManager(),
         relation_write_service=None,
-        get_config=lambda key, default=None: default,
+        get_config=lambda key, default=None: config.get(key, default),
         _is_embedding_degraded=lambda: False,
         _allow_metadata_only_write=lambda: True,
-        write_paragraph_vector_or_enqueue=None,
     )
     manager = ImportTaskManager(plugin)
     return manager, metadata_store
@@ -260,3 +300,100 @@ async def test_persist_processed_chunk_skips_invalid_nested_items() -> None:
     assert len(metadata_store.paragraphs) == 1
     assert set(metadata_store.entities) >= {"Alice", "地图"}
     assert metadata_store.relations == [("Alice", "持有", "地图")]
+
+
+@pytest.mark.asyncio
+async def test_persist_processed_chunk_does_not_hold_storage_lock_during_embedding() -> None:
+    embedding_manager = _DummyEmbeddingManager(delay=0.05)
+    manager, metadata_store = _build_manager(embedding_manager=embedding_manager)
+    file_record = SimpleNamespace(source_path="", source_kind="paste", name="demo.txt")
+
+    await asyncio.gather(
+        manager._persist_processed_chunk(
+            file_record,
+            ProcessedChunk(
+                type=KnowledgeType.FACTUAL,
+                source=SourceInfo(file="demo.txt", offset_start=0, offset_end=4),
+                chunk=ChunkContext(chunk_id="chunk-1", index=0, text="第一段事实"),
+                data={},
+            ),
+        ),
+        manager._persist_processed_chunk(
+            file_record,
+            ProcessedChunk(
+                type=KnowledgeType.FACTUAL,
+                source=SourceInfo(file="demo.txt", offset_start=5, offset_end=9),
+                chunk=ChunkContext(chunk_id="chunk-2", index=1, text="第二段事实"),
+                data={},
+            ),
+        ),
+    )
+
+    assert len(metadata_store.paragraphs) == 2
+    assert embedding_manager.max_inflight == 2
+
+
+@pytest.mark.asyncio
+async def test_relation_vector_failure_keeps_metadata_and_marks_failed() -> None:
+    manager, metadata_store = _build_manager(
+        embedding_manager=_DummyEmbeddingManager(fail_for="关系是持有"),
+        relation_vectorization_enabled=True,
+    )
+
+    relation_hash = await manager._add_relation("Alice", "持有", "地图", source_paragraph="paragraph-1")
+
+    assert relation_hash == "relation-1"
+    assert metadata_store.relations == [("Alice", "持有", "地图")]
+    assert ("relation-1", "pending", None, False) in metadata_store.relation_vector_states
+    assert metadata_store.relation_vector_states[-1] == ("relation-1", "failed", "embedding failed", True)
+
+
+@pytest.mark.asyncio
+async def test_high_concurrency_persist_processed_chunks_keep_all_writes_consistent() -> None:
+    chunk_count = 60
+    relations_per_chunk = 2
+    entities_per_chunk = 5
+    embedding_manager = _DummyEmbeddingManager(delay=0.001)
+    manager, metadata_store = _build_manager(
+        embedding_manager=embedding_manager,
+        relation_vectorization_enabled=True,
+    )
+    file_record = SimpleNamespace(source_path="", source_kind="paste", name="stress.txt")
+
+    async def persist(index: int) -> None:
+        await manager._persist_processed_chunk(
+            file_record,
+            ProcessedChunk(
+                type=KnowledgeType.FACTUAL,
+                source=SourceInfo(file="stress.txt", offset_start=index * 10, offset_end=index * 10 + 9),
+                chunk=ChunkContext(chunk_id=f"chunk-{index}", index=index, text=f"第 {index} 段高并发事实"),
+                data={
+                    "triples": [
+                        {"subject": f"subject-{index}-a", "predicate": "关联", "object": f"object-{index}-a"},
+                    ],
+                    "relations": [
+                        {"subject": f"subject-{index}-b", "predicate": "包含", "object": f"object-{index}-b"},
+                    ],
+                    "entities": [f"marker-{index}"],
+                },
+            ),
+        )
+
+    await asyncio.wait_for(
+        asyncio.gather(*(persist(index) for index in range(chunk_count))),
+        timeout=15,
+    )
+
+    vector_ids = set(manager.plugin.vector_store.ids)
+    ready_states = [state for _, state, _, _ in metadata_store.relation_vector_states if state == "ready"]
+    failed_states = [state for _, state, _, _ in metadata_store.relation_vector_states if state == "failed"]
+
+    assert len(metadata_store.paragraphs) == chunk_count
+    assert len(metadata_store.relations) == chunk_count * relations_per_chunk
+    assert len(manager.plugin.graph_store.edges) == chunk_count * relations_per_chunk
+    assert len({paragraph["source"] for paragraph in metadata_store.paragraphs}) == 1
+    assert len(vector_ids) == chunk_count * (1 + entities_per_chunk + relations_per_chunk)
+    assert len(ready_states) == chunk_count * relations_per_chunk
+    assert failed_states == []
+    assert metadata_store.paragraph_backfills == []
+    assert embedding_manager.max_inflight > 1
@@ -107,6 +107,13 @@ max_paste_chars = 200000
 default_file_concurrency = 2
 default_chunk_concurrency = 4
 
+[web.import.timeout]
+llm_call_seconds = 240
+process_poll_seconds = 1
+process_terminate_seconds = 5
+process_kill_seconds = 3
+convert_preflight_seconds = 20
+
 [web.tuning]
 enabled = true
 max_queue_size = 8
@@ -121,7 +128,7 @@ default_sample_size = 24
 
 - 长期记忆控制台：适合修改高频项，例如 embedding、检索、Episode、人物画像、导入与调优的常用开关。
 - 原始 TOML：适合复制整份配置、批量调整参数，或修改未在可视化表单中展示的高级项。
-- raw-only 高级项仍包括：`retrieval.fusion.*`、`retrieval.search.relation_intent.*`、`retrieval.search.graph_recall.*`、`retrieval.search.posterior_graph.*`、`retrieval.aggregate.*`、`memory.orphan.*`、`advanced.extraction_model`、`web.import.llm_retry.*`、`web.import.path_aliases`、`web.import.convert.*`、`web.tuning.llm_retry.*`、`web.tuning.eval_query_timeout_seconds`。
+- raw-only 高级项仍包括：`retrieval.fusion.*`、`retrieval.search.relation_intent.*`、`retrieval.search.graph_recall.*`、`retrieval.search.posterior_graph.*`、`retrieval.aggregate.*`、`memory.orphan.*`、`advanced.extraction_model`、`web.import.llm_retry.*`、`web.import.timeout.*`、`web.import.path_aliases`、`web.import.convert.*`、`web.tuning.llm_retry.*`、`web.tuning.eval_query_timeout_seconds`。
 
 ## 1. 存储与嵌入
 
@@ -339,6 +346,14 @@ chats = ["group:123", "user:456", "stream:abc"]
 - `web.import.max_chunk_concurrency` (默认 `12`)
 - `web.import.poll_interval_ms` (默认 `1000`)
 
+### 超时
+
+- `web.import.timeout.llm_call_seconds` (默认 `240`，`0` 表示不额外限制)
+- `web.import.timeout.process_poll_seconds` (默认 `1`)
+- `web.import.timeout.process_terminate_seconds` (默认 `5`)
+- `web.import.timeout.process_kill_seconds` (默认 `3`)
+- `web.import.timeout.convert_preflight_seconds` (默认 `20`)
+
 ### 重试与路径
 
 - `web.import.llm_retry.max_attempts` (默认 `4`)
 
@@ -132,6 +132,13 @@ max_paste_chars = 200000
 default_file_concurrency = 2
 default_chunk_concurrency = 4
 
+[web.import.timeout]
+llm_call_seconds = 240
+process_poll_seconds = 1
+process_terminate_seconds = 5
+process_kill_seconds = 3
+convert_preflight_seconds = 20
+
 [web.tuning]
 enabled = true
 max_queue_size = 8
 
@@ -56,6 +56,7 @@
         "sections": [
           "advanced",
           "web.import",
+          "web.import.timeout",
           "web.tuning"
         ],
         "order": 5
@@ -1275,7 +1276,7 @@
       "description": "控制检索调优任务的队列与默认策略。",
       "icon": null,
       "collapsed": false,
-      "order": 15,
+      "order": 16,
       "fields": {
         "enabled": {
           "name": "enabled",
@@ -1396,6 +1397,101 @@
           "choices": null
         }
       }
+    },
+    "web.import.timeout": {
+      "name": "web.import.timeout",
+      "title": "导入超时",
+      "description": "控制 Web Import 中 LLM 调用、迁移/转换子进程与预检步骤的等待时间。",
+      "icon": null,
+      "collapsed": false,
+      "order": 15,
+      "fields": {
+        "llm_call_seconds": {
+          "name": "llm_call_seconds",
+          "type": "number",
+          "default": 240,
+          "description": "单次 LLM 抽取调用超时时间，0 表示不额外限制。",
+          "label": "LLM 单次调用超时（秒）",
+          "ui_type": "number",
+          "required": false,
+          "hidden": false,
+          "disabled": false,
+          "order": 1,
+          "hint": "大量导入时用于避免单个上游请求长时间挂起。",
+          "min": 0,
+          "max": 3600,
+          "step": 1,
+          "choices": null
+        },
+        "process_poll_seconds": {
+          "name": "process_poll_seconds",
+          "type": "number",
+          "default": 1,
+          "description": "迁移或转换子进程状态轮询等待时间。",
+          "label": "子进程轮询等待（秒）",
+          "ui_type": "number",
+          "required": false,
+          "hidden": false,
+          "disabled": false,
+          "order": 2,
+          "hint": "值越小取消响应越快，但轮询更频繁。",
+          "min": 0.1,
+          "max": 60,
+          "step": 0.1,
+          "choices": null
+        },
+        "process_terminate_seconds": {
+          "name": "process_terminate_seconds",
+          "type": "number",
+          "default": 5,
+          "description": "取消任务时等待子进程正常终止的时间。",
+          "label": "子进程终止等待（秒）",
+          "ui_type": "number",
+          "required": false,
+          "hidden": false,
+          "disabled": false,
+          "order": 3,
+          "hint": "超时后会尝试强制结束子进程。",
+          "min": 0.1,
+          "max": 120,
+          "step": 0.1,
+          "choices": null
+        },
+        "process_kill_seconds": {
+          "name": "process_kill_seconds",
+          "type": "number",
+          "default": 3,
+          "description": "强制结束子进程后的等待时间。",
+          "label": "子进程强杀等待（秒）",
+          "ui_type": "number",
+          "required": false,
+          "hidden": false,
+          "disabled": false,
+          "order": 4,
+          "hint": "用于取消任务时回收转换/迁移子进程。",
+          "min": 0.1,
+          "max": 120,
+          "step": 0.1,
+          "choices": null
+        },
+        "convert_preflight_seconds": {
+          "name": "convert_preflight_seconds",
+          "type": "number",
+          "default": 20,
+          "description": "LPMM 转换依赖预检的超时时间。",
+          "label": "转换预检超时（秒）",
+          "ui_type": "number",
+          "required": false,
+          "hidden": false,
+          "disabled": false,
+          "order": 5,
+          "hint": "依赖环境较慢时可以适当调大。",
+          "min": 0.1,
+          "max": 600,
+          "step": 0.1,
+          "choices": null
+        }
+      }
     }
   }
 }