diff --git a/astrbot/core/db/vec_db/faiss_impl/document_storage.py b/astrbot/core/db/vec_db/faiss_impl/document_storage.py
index 58ec8dc1c5..84069ba52f 100644
--- a/astrbot/core/db/vec_db/faiss_impl/document_storage.py
+++ b/astrbot/core/db/vec_db/faiss_impl/document_storage.py
@@ -1,5 +1,6 @@
 import json
 import os
+from asyncio import Lock
 from contextlib import asynccontextmanager
 from datetime import datetime
 from pathlib import Path
@@ -17,6 +18,7 @@
     build_fts5_or_query,
     load_stopwords,
     to_fts5_search_text,
+    tokenize_text,
 )
 
 FTS_TABLE_NAME = "documents_fts"
@@ -58,44 +60,49 @@ def __init__(self, db_path: str) -> None:
         self._fts_contentless_delete = False
         self._fts_index_ready = False
         self._stopwords: set[str] | None = None
+        self._fts_rebuild_lock = Lock()
 
     async def initialize(self) -> None:
         """Initialize the SQLite database and create the documents table if it doesn't exist."""
         await self.connect()
         async with self.engine.begin() as conn:  # type: ignore
             await self._ensure_documents_table(conn)
-
-            try:
-                await conn.execute(
-                    text(
-                        "ALTER TABLE documents ADD COLUMN kb_doc_id TEXT "
-                        "GENERATED ALWAYS AS (json_extract(metadata, '$.kb_doc_id')) STORED",
-                    ),
-                )
-                await conn.execute(
-                    text(
-                        "ALTER TABLE documents ADD COLUMN user_id TEXT "
-                        "GENERATED ALWAYS AS (json_extract(metadata, '$.user_id')) STORED",
-                    ),
-                )
-
-                # Create indexes
-                await conn.execute(
-                    text(
-                        "CREATE INDEX IF NOT EXISTS idx_documents_kb_doc_id ON documents(kb_doc_id)",
-                    ),
-                )
-                await conn.execute(
-                    text(
-                        "CREATE INDEX IF NOT EXISTS idx_documents_user_id ON documents(user_id)",
-                    ),
-                )
-            except BaseException:
-                pass
+            await self._ensure_generated_columns(conn)
 
             await self._initialize_fts5(conn)
             await conn.commit()
 
+    async def _table_columns(self, executor, table_name: str) -> set[str]:
+        result = await executor.execute(text(f"PRAGMA table_xinfo({table_name})"))
+        return {row[1] for row in result.fetchall()}
+
+    async def _ensure_generated_columns(self, executor) -> None:
+        generated_columns = {
+            "kb_doc_id": "json_extract(metadata, '$.kb_doc_id')",
+            "user_id": "json_extract(metadata, '$.user_id')",
+            "kb_id": "json_extract(metadata, '$.kb_id')",
+        }
+        columns = await self._table_columns(executor, "documents")
+        for column_name, expression in generated_columns.items():
+            if column_name in columns:
+                continue
+            await executor.execute(
+                text(
+                    f"ALTER TABLE documents ADD COLUMN {column_name} TEXT "
+                    f"GENERATED ALWAYS AS ({expression}) VIRTUAL",
+                ),
+            )
+            columns.add(column_name)
+
+        index_statements = [
+            "CREATE INDEX IF NOT EXISTS idx_documents_kb_doc_id "
+            "ON documents(kb_doc_id)",
+            "CREATE INDEX IF NOT EXISTS idx_documents_user_id ON documents(user_id)",
+            "CREATE INDEX IF NOT EXISTS idx_documents_kb_id ON documents(kb_id)",
+        ]
+        for statement in index_statements:
+            await executor.execute(text(statement))
+
     async def _ensure_documents_table(self, executor) -> None:
         """Create the document table from the SQLModel definition."""
         result = await executor.execute(
@@ -302,11 +309,11 @@ async def get_documents(
 
         async with self.get_session() as session:
             query = select(Document)
-
-            for key, val in metadata_filters.items():
-                query = query.where(
-                    text(f"json_extract(metadata, '$.{key}') = :filter_{key}"),
-                ).params(**{f"filter_{key}": val})
+            query = await self._apply_metadata_filters(
+                session,
+                query,
+                metadata_filters,
+            )
 
             if ids is not None and len(ids) > 0:
                 valid_ids = [int(i) for i in ids if i != -1]
@@ -468,11 +475,11 @@ async def delete_documents(self, metadata_filters: dict) -> None:
 
         async with self.get_session() as session, session.begin():
             query = select(Document)
-
-            for key, val in metadata_filters.items():
-                query = query.where(
-                    text(f"json_extract(metadata, '$.{key}') = :filter_{key}"),
-                ).params(**{f"filter_{key}": val})
+            query = await self._apply_metadata_filters(
+                session,
+                query,
+                metadata_filters,
+            )
 
             result = await session.execute(query)
             documents = result.scalars().all()
@@ -499,15 +506,144 @@ async def count_documents(self, metadata_filters: dict | None = None) -> int:
             query = select(func.count(col(Document.id)))
 
             if metadata_filters:
-                for key, val in metadata_filters.items():
-                    query = query.where(
-                        text(f"json_extract(metadata, '$.{key}') = :filter_{key}"),
-                    ).params(**{f"filter_{key}": val})
+                query = await self._apply_metadata_filters(
+                    session,
+                    query,
+                    metadata_filters,
+                )
 
             result = await session.execute(query)
             count = result.scalar_one_or_none()
             return count if count is not None else 0
 
+    async def search_documents(
+        self,
+        query_text: str,
+        metadata_filters: dict | None = None,
+        offset: int = 0,
+        limit: int = 100,
+    ) -> tuple[list[dict], int] | None:
+        """Search documents with FTS5 and optional metadata filters.
+
+        Returns None when FTS5 is unavailable so callers can choose whether to
+        fall back to an alternate search strategy.
+        """
+        if limit <= 0:
+            return [], 0
+        if not await self.ensure_fts_index():
+            return None
+
+        match_query = build_fts5_or_query(tokenize_text(query_text, self.stopwords))
+        if not match_query:
+            return [], 0
+
+        metadata_filters = metadata_filters or {}
+        async with self.get_session() as session:
+            filters_sql, filter_params = await self._metadata_filter_sql(
+                session,
+                metadata_filters,
+                table_alias="d",
+            )
+            where_clause = f"{FTS_TABLE_NAME} MATCH :query"
+            if filters_sql:
+                where_clause = f"{where_clause} AND {' AND '.join(filters_sql)}"
+            params = {
+                "query": match_query,
+                "limit": int(limit),
+                "offset": int(offset),
+                **filter_params,
+            }
+            try:
+                count_result = await session.execute(
+                    text(
+                        f"""
+                        SELECT count(*)
+                        FROM {FTS_TABLE_NAME}
+                        JOIN documents d ON d.id = {FTS_TABLE_NAME}.rowid
+                        WHERE {where_clause}
+                        """,
+                    ),
+                    params,
+                )
+                total = int(count_result.scalar_one_or_none() or 0)
+                result = await session.execute(
+                    text(
+                        f"""
+                        SELECT
+                            d.id AS id,
+                            d.doc_id AS doc_id,
+                            d.text AS text,
+                            d.metadata AS metadata,
+                            d.created_at AS created_at,
+                            d.updated_at AS updated_at,
+                            bm25({FTS_TABLE_NAME}) AS score
+                        FROM {FTS_TABLE_NAME}
+                        JOIN documents d ON d.id = {FTS_TABLE_NAME}.rowid
+                        WHERE {where_clause}
+                        ORDER BY score ASC, d.id ASC
+                        LIMIT :limit
+                        OFFSET :offset
+                        """,
+                    ),
+                    params,
+                )
+            except Exception as e:
+                logger.warning(
+                    f"FTS5 document search failed for {self.db_path}: {e}",
+                )
+                self.fts5_available = False
+                return None
+
+            rows = result.mappings().all()
+            return [
+                {
+                    "id": row["id"],
+                    "doc_id": row["doc_id"],
+                    "text": row["text"],
+                    "metadata": row["metadata"],
+                    "created_at": row["created_at"],
+                    "updated_at": row["updated_at"],
+                    "score": float(row["score"]),
+                }
+                for row in rows
+            ], total
+
+    async def _apply_metadata_filters(
+        self,
+        session: AsyncSession,
+        query,
+        metadata_filters: dict,
+    ):
+        filters_sql, params = await self._metadata_filter_sql(
+            session,
+            metadata_filters,
+        )
+        for filter_sql in filters_sql:
+            query = query.where(text(filter_sql))
+        if params:
+            query = query.params(**params)
+        return query
+
+    async def _metadata_filter_sql(
+        self,
+        session: AsyncSession,
+        metadata_filters: dict,
+        table_alias: str | None = None,
+    ) -> tuple[list[str], dict]:
+        columns = await self._table_columns(session, "documents")
+        prefix = f"{table_alias}." if table_alias else ""
+        filters_sql = []
+        params = {}
+        for key, val in metadata_filters.items():
+            if key in {"kb_id", "kb_doc_id", "user_id"} and key in columns:
+                filters_sql.append(f"{prefix}{key} = :filter_{key}")
+            else:
+                filters_sql.append(
+                    f"json_extract({prefix}metadata, '$.{key}') = :filter_{key}"
+                )
+            params[f"filter_{key}"] = val
+        return filters_sql, params
+
     async def ensure_fts_index(self) -> bool:
         """Ensure the FTS5 sparse index exists and matches the documents table."""
         if not self.fts5_available:
@@ -517,22 +653,30 @@ async def ensure_fts_index(self) -> bool:
 
         assert self.engine is not None, "Database connection is not initialized."
 
-        async with self.get_session() as session:
-            doc_count = await self._count_documents_in_session(session)
-            fts_count = await self._count_fts_rows(session)
-            if doc_count == fts_count:
-                self._fts_index_ready = True
+        async with self._fts_rebuild_lock:
+            if self._fts_index_ready:
                 return True
 
-        logger.info(
-            f"Rebuilding FTS5 sparse index for {self.db_path}: "
-            f"documents={doc_count}, fts_rows={fts_count}",
-        )
-        await self.rebuild_fts_index()
-        return self.fts5_available
+            async with self.get_session() as session:
+                doc_count = await self._count_documents_in_session(session)
+                fts_count = await self._count_fts_rows(session)
+                if doc_count == fts_count:
+                    self._fts_index_ready = True
+                    return True
+
+            logger.info(
+                f"Rebuilding FTS5 sparse index for {self.db_path}: "
+                f"documents={doc_count}, fts_rows={fts_count}",
+            )
+            await self._rebuild_fts_index_unlocked()
+            return self.fts5_available
 
     async def rebuild_fts_index(self) -> None:
         """Rebuild the contentless FTS5 sparse index from documents."""
+        async with self._fts_rebuild_lock:
+            await self._rebuild_fts_index_unlocked()
+
+    async def _rebuild_fts_index_unlocked(self) -> None:
         if not self.fts5_available:
             return
 
@@ -577,7 +721,7 @@ async def search_sparse(
         sparse retrieval implementation.
         """
         if limit <= 0:
-            return []
+            return None
         if not await self.ensure_fts_index():
             return None
 
diff --git a/astrbot/core/db/vec_db/faiss_impl/embedding_storage.py b/astrbot/core/db/vec_db/faiss_impl/embedding_storage.py
index dc6977cf8a..d7d9479046 100644
--- a/astrbot/core/db/vec_db/faiss_impl/embedding_storage.py
+++ b/astrbot/core/db/vec_db/faiss_impl/embedding_storage.py
@@ -4,21 +4,180 @@
     raise ImportError(
         "faiss 未安装。请使用 'pip install faiss-cpu' 或 'pip install faiss-gpu' 安装。",
     )
+import asyncio
 import os
+import shutil
+from datetime import datetime, timezone
+from pathlib import Path
 
 import numpy as np
 
 
+def _safe_normalize_l2(vectors: np.ndarray) -> None:
+    """L2 归一化，对零向量抛出明确错误
+
+    正常的 embedding 模型不应产生零向量。零向量无法归一化（会产生 NaN），
+    说明 embedding provider 返回了异常数据，应当尽早暴露问题。
+    """
+    # 检测全零行
+    if vectors.ndim == 2:
+        norms = np.linalg.norm(vectors, axis=1, keepdims=True)
+        zero_count = int((norms < 1e-12).sum())
+        if zero_count > 0:
+            raise ValueError(
+                f"向量归一化失败：检测到 {zero_count} 个零向量。"
+                "Embedding Provider 返回了全零向量，这可能说明 API 密钥无效、"
+                "模型不支持当前输入、或服务端异常。请检查 Embedding Provider 配置。"
+            )
+    elif vectors.ndim == 1:
+        if np.linalg.norm(vectors) < 1e-12:
+            raise ValueError(
+                "向量归一化失败：检测到零向量。"
+                "Embedding Provider 返回了全零向量，这可能说明 API 密钥无效、"
+                "模型不支持当前输入、或服务端异常。请检查 Embedding Provider 配置。"
+            )
+
+    faiss.normalize_L2(vectors)
+
+
 class EmbeddingStorage:
-    def __init__(self, dimension: int, path: str | None = None) -> None:
+    def __init__(
+        self,
+        dimension: int,
+        path: str | None = None,
+        index_type: str = "flat",
+    ) -> None:
         self.dimension = dimension
         self.path = path
         self.index = None
+        self.index_type = index_type  # "flat" | "hnsw"
+        self._write_lock = asyncio.Lock()
         if path and os.path.exists(path):
             self.index = faiss.read_index(path)
+            # 验证加载的索引维度是否匹配
+            loaded_dim = self.index.d
+            if loaded_dim != self.dimension:
+                raise ValueError(
+                    f"索引维度不匹配: 磁盘索引维度={loaded_dim}, "
+                    f"当前 Embedding Provider 维度={self.dimension}。"
+                    f"请确认 Embedding Provider 与已有索引一致，"
+                    f"或删除旧索引后重新创建知识库。"
+                )
+            self._migrate_l2_to_ip_if_needed()
         else:
-            base_index = faiss.IndexFlatL2(dimension)
+            self.index = self._create_index()
+
+    def _create_index(self):
+        """根据 index_type 创建 FAISS 索引"""
+        if self.index_type == "hnsw":
+            # HNSW32 with Inner Product metric for cosine similarity
+            base_index = faiss.index_factory(
+                self.dimension,
+                "HNSW32",
+                faiss.METRIC_INNER_PRODUCT,
+            )
+            return faiss.IndexIDMap(base_index)
+        # 默认: flat (精确搜索)
+        return faiss.IndexIDMap(faiss.IndexFlatIP(self.dimension))
+
+    def _migrate_l2_to_ip_if_needed(self) -> None:
+        """检测并迁移旧版 L2 索引到 IP (余弦相似度)
+
+        旧版使用 IndexFlatL2，新版使用 IndexFlatIP + 归一化向量。
+        迁移过程：保留原 external ids → reconstruct 所有向量 → L2 归一化 → 重建为 IP 索引。
+        """
+        assert self.index is not None
+        # IndexIDMap 包装了 base index，需要解包检查
+        base_index = self.index.index if hasattr(self.index, "index") else self.index
+        if getattr(base_index, "metric_type", None) != faiss.METRIC_L2:
+            return  # 已经是 IP 或其他类型，无需迁移
+
+        import warnings
+
+        ntotal = self.index.ntotal
+        if ntotal == 0:
+            warnings.warn(
+                "检测到空的旧版 L2 索引，将重建为 IP 索引。",
+                stacklevel=2,
+            )
+            base_index = faiss.IndexFlatIP(self.dimension)
             self.index = faiss.IndexIDMap(base_index)
+            return
+
+        warnings.warn(
+            f"检测到旧版 L2 索引 (含 {ntotal} 个向量)，正在自动迁移到 IP 索引..."
+            "这可能需要几秒钟。迁移后旧索引将被覆盖。",
+            stacklevel=2,
+        )
+
+        # 重建所有向量并归一化
+        # 注意: IndexIDMap.reconstruct 在某些 FAISS 构建版本中不可用
+        try:
+            ids = self._get_index_ids()
+            vectors = np.zeros((ntotal, self.dimension), dtype=np.float32)
+            reconstruct_index = (
+                self.index.index if hasattr(self.index, "index") else self.index
+            )
+            for pos in range(ntotal):
+                vectors[pos] = reconstruct_index.reconstruct(pos)
+        except Exception as exc:
+            raise RuntimeError(
+                "无法从旧索引重建向量（reconstruct 不可用），"
+                "已保留旧索引文件未覆盖。请重新上传文档或手动重建知识库索引。"
+            ) from exc
+
+        _safe_normalize_l2(vectors)
+
+        # 重建为 IP 索引
+        new_index = faiss.IndexIDMap(faiss.IndexFlatIP(self.dimension))
+        new_index.add_with_ids(vectors, ids)
+
+        self._backup_existing_index_before_migration()
+        self.index = new_index
+        # 立即保存迁移后的索引
+        faiss.write_index(self.index, self.path)
+
+    def _backup_existing_index_before_migration(self) -> Path:
+        if self.path is None:
+            raise RuntimeError("无法备份旧索引：索引文件路径为空，已保留旧索引未覆盖。")
+
+        index_path = Path(self.path)
+        if not index_path.exists():
+            raise RuntimeError(
+                f"无法备份旧索引：索引文件不存在 {index_path}，已保留旧索引未覆盖。"
+            )
+
+        timestamp = datetime.now(timezone.utc).strftime("%Y%m%dT%H%M%SZ")
+        backup_path = index_path.with_name(f"{index_path.name}.bak.{timestamp}")
+        counter = 1
+        while backup_path.exists():
+            backup_path = index_path.with_name(
+                f"{index_path.name}.bak.{timestamp}.{counter}"
+            )
+            counter += 1
+
+        try:
+            shutil.copy2(index_path, backup_path)
+        except OSError as exc:
+            raise RuntimeError(
+                f"无法备份旧索引到 {backup_path}，已保留旧索引未覆盖。"
+            ) from exc
+
+        return backup_path
+
+    def _get_index_ids(self) -> np.ndarray:
+        assert self.index is not None
+        ntotal = self.index.ntotal
+        id_map = getattr(self.index, "id_map", None)
+        if id_map is None:
+            return np.arange(ntotal, dtype=np.int64)
+
+        ids = faiss.vector_to_array(id_map).astype(np.int64)
+        if len(ids) != ntotal:
+            raise RuntimeError(
+                f"FAISS IDMap 数量异常: ntotal={ntotal}, id_map={len(ids)}",
+            )
+        return ids
 
     async def insert(self, vector: np.ndarray, id: int) -> None:
         """插入向量
@@ -30,13 +189,16 @@ async def insert(self, vector: np.ndarray, id: int) -> None:
             ValueError: 如果向量的维度与存储的维度不匹配
 
         """
-        assert self.index is not None, "FAISS index is not initialized."
-        if vector.shape[0] != self.dimension:
-            raise ValueError(
-                f"向量维度不匹配, 期望: {self.dimension}, 实际: {vector.shape[0]}",
-            )
-        self.index.add_with_ids(vector.reshape(1, -1), np.array([id]))
-        await self.save_index()
+        async with self._write_lock:
+            assert self.index is not None, "FAISS index is not initialized."
+            if vector.shape[0] != self.dimension:
+                raise ValueError(
+                    f"向量维度不匹配, 期望: {self.dimension}, 实际: {vector.shape[0]}",
+                )
+            v_2d = vector.reshape(1, -1)
+            _safe_normalize_l2(v_2d)
+            self.index.add_with_ids(v_2d, np.array([id]))
+            await self._save_index_locked()
 
     async def insert_batch(self, vectors: np.ndarray, ids: list[int]) -> None:
         """批量插入向量
@@ -48,13 +210,15 @@ async def insert_batch(self, vectors: np.ndarray, ids: list[int]) -> None:
             ValueError: 如果向量的维度与存储的维度不匹配
 
         """
-        assert self.index is not None, "FAISS index is not initialized."
-        if vectors.shape[1] != self.dimension:
-            raise ValueError(
-                f"向量维度不匹配, 期望: {self.dimension}, 实际: {vectors.shape[1]}",
-            )
-        self.index.add_with_ids(vectors, np.array(ids))
-        await self.save_index()
+        async with self._write_lock:
+            assert self.index is not None, "FAISS index is not initialized."
+            if vectors.shape[1] != self.dimension:
+                raise ValueError(
+                    f"向量维度不匹配, 期望: {self.dimension}, 实际: {vectors.shape[1]}",
+                )
+            _safe_normalize_l2(vectors)
+            self.index.add_with_ids(vectors, np.array(ids))
+            await self._save_index_locked()
 
     async def search(self, vector: np.ndarray, k: int) -> tuple:
         """搜索最相似的向量
@@ -67,7 +231,7 @@ async def search(self, vector: np.ndarray, k: int) -> tuple:
 
         """
         assert self.index is not None, "FAISS index is not initialized."
-        faiss.normalize_L2(vector)
+        _safe_normalize_l2(vector)
         distances, indices = self.index.search(vector, k)
         return distances, indices
 
@@ -78,18 +242,25 @@ async def delete(self, ids: list[int]) -> None:
             ids (list[int]): 要删除的向量ID列表
 
         """
-        assert self.index is not None, "FAISS index is not initialized."
-        id_array = np.array(ids, dtype=np.int64)
-        self.index.remove_ids(id_array)
-        await self.save_index()
-
-    async def save_index(self) -> None:
-        """保存索引
+        async with self._write_lock:
+            assert self.index is not None, "FAISS index is not initialized."
+            id_array = np.array(ids, dtype=np.int64)
+            self.index.remove_ids(id_array)
+            await self._save_index_locked()
 
-        Args:
-            path (str): 保存索引的路径
+    async def _save_index_locked(self) -> None:
+        """内部方法：在已持有 _write_lock 的情况下保存索引到磁盘。
 
+        调用者必须已经获取 _write_lock。
         """
         if self.index is None:
             return
-        faiss.write_index(self.index, self.path)
+        await asyncio.to_thread(faiss.write_index, self.index, self.path)
+
+    async def save_index(self) -> None:
+        """保存索引（在单独线程中执行以避免阻塞事件循环）
+
+        公共方法，自动获取写锁以确保线程安全。
+        """
+        async with self._write_lock:
+            await self._save_index_locked()
diff --git a/astrbot/core/db/vec_db/faiss_impl/vec_db.py b/astrbot/core/db/vec_db/faiss_impl/vec_db.py
index 0474683754..1cafd1c45d 100644
--- a/astrbot/core/db/vec_db/faiss_impl/vec_db.py
+++ b/astrbot/core/db/vec_db/faiss_impl/vec_db.py
@@ -1,5 +1,7 @@
 import time
 import uuid
+from collections import OrderedDict
+from hashlib import sha256
 
 import numpy as np
 
@@ -12,6 +14,50 @@
 from .embedding_storage import EmbeddingStorage
 
 
+class EmbeddingCache:
+    """基于 LRU 的文本 → 嵌入向量缓存（线程安全）
+
+    使用 SHA256 哈希文本作为缓存 key，避免对相同内容重复调用 embedding API。
+    """
+
+    def __init__(self, max_size: int = 10000) -> None:
+        import asyncio
+
+        self._cache: OrderedDict[str, np.ndarray] = OrderedDict()
+        self._max_size = max_size
+        self._lock = asyncio.Lock()
+
+    @staticmethod
+    def _hash(text: str) -> str:
+        return sha256(text.encode()).hexdigest()
+
+    async def get(self, text: str) -> np.ndarray | None:
+        async with self._lock:
+            key = self._hash(text)
+            if key in self._cache:
+                self._cache.move_to_end(key)
+                return self._cache[key].copy()
+            return None
+
+    async def put(self, text: str, embedding: np.ndarray) -> None:
+        async with self._lock:
+            key = self._hash(text)
+            if key not in self._cache:
+                if len(self._cache) >= self._max_size:
+                    self._cache.popitem(last=False)
+            else:
+                self._cache.move_to_end(key)
+            self._cache[key] = embedding.copy()
+
+    async def clear(self) -> None:
+        async with self._lock:
+            self._cache.clear()
+
+    async def __len__(self) -> int:
+        async with self._lock:
+            return len(self._cache)
+
+
 class FaissVecDB(BaseVecDB):
     """A class to represent a vector database."""
 
@@ -21,6 +67,7 @@ def __init__(
         index_store_path: str,
         embedding_provider: EmbeddingProvider,
         rerank_provider: RerankProvider | None = None,
+        index_type: str = "flat",
     ) -> None:
         self.doc_store_path = doc_store_path
         self.index_store_path = index_store_path
@@ -29,9 +76,11 @@ def __init__(
         self.embedding_storage = EmbeddingStorage(
             embedding_provider.get_dim(),
             index_store_path,
+            index_type=index_type,
         )
         self.embedding_provider = embedding_provider
         self.rerank_provider = rerank_provider
+        self.embedding_cache = EmbeddingCache()
 
     async def initialize(self) -> None:
         await self.document_storage.initialize()
@@ -81,6 +130,9 @@ async def insert_batch(
             )
             return []
 
+        # 空列表快速返回后，确保不再处理零向量
+        assert len(contents) > 0, "contents must not be empty"
+
         content_count = len(contents)
         if len(metadatas) != content_count:
             raise KnowledgeBaseUploadError(
@@ -107,54 +159,65 @@ async def insert_batch(
                 },
             )
 
+        # 检查嵌入缓存，分离已缓存的文本和需要计算的文本
         start = time.time()
-        logger.debug(f"Generating embeddings for {len(contents)} contents...")
-        vectors = await self.embedding_provider.get_embeddings_batch(
-            contents,
-            batch_size=batch_size,
-            tasks_limit=tasks_limit,
-            max_retries=max_retries,
-            progress_callback=progress_callback,
-        )
-        end = time.time()
+        cached_vectors: dict[int, np.ndarray] = {}
+        uncached_indices: list[int] = []
+        uncached_texts: list[str] = []
+
+        for idx, text in enumerate(contents):
+            cached = await self.embedding_cache.get(text)
+            if cached is not None:
+                cached_vectors[idx] = cached
+            else:
+                uncached_indices.append(idx)
+                uncached_texts.append(text)
+
+        cache_hits = len(cached_vectors)
+        cache_misses = len(uncached_texts)
         logger.debug(
-            f"Generated embeddings for {len(contents)} contents in {end - start:.2f} seconds.",
+            f"Embedding cache: {cache_hits} hits, {cache_misses} misses "
+            f"out of {len(contents)} contents.",
         )
-        if len(vectors) != content_count:
-            raise KnowledgeBaseUploadError(
-                stage="embedding",
-                user_message=(
-                    "向量化失败：嵌入模型返回的向量数量与文本分块数量不一致"
-                    f"（期望 {content_count}，实际 {len(vectors)}）。"
-                    "这通常说明当前 Embedding 接口未完整返回批量结果，"
-                    "或该服务不兼容当前批量请求格式。"
-                ),
-                details={
-                    "expected_contents": content_count,
-                    "actual_vectors": len(vectors),
-                },
+
+        # 只对未缓存的文本生成嵌入
+        vectors = [np.empty(0, dtype=np.float32) for _ in contents]
+        if uncached_texts:
+            new_embeddings = await self.embedding_provider.get_embeddings_batch(
+                uncached_texts,
+                batch_size=batch_size,
+                tasks_limit=tasks_limit,
+                max_retries=max_retries,
+                progress_callback=progress_callback,
             )
+            # 验证返回数量
+            if len(new_embeddings) != len(uncached_texts):
+                raise KnowledgeBaseUploadError(
+                    stage="embedding",
+                    user_message=(
+                        "向量化失败：嵌入模型返回的向量数量与文本分块数量不一致"
+                        f"（期望 {len(uncached_texts)}，实际 {len(new_embeddings)}）。"
+                        "这通常说明当前 Embedding 接口未完整返回批量结果，"
+                        "或该服务不兼容当前批量请求格式。"
+                    ),
+                    details={
+                        "expected_contents": len(uncached_texts),
+                        "actual_vectors": len(new_embeddings),
+                    },
+                )
+            for i, idx in enumerate(uncached_indices):
+                vectors[idx] = np.asarray(new_embeddings[i], dtype=np.float32)
+                await self.embedding_cache.put(uncached_texts[i], vectors[idx])
+
+        for idx, cached_vec in cached_vectors.items():
+            vectors[idx] = cached_vec
 
-        # 使用 DocumentStorage 的批量插入方法
-        int_ids = await self.document_storage.insert_documents_batch(
-            ids,
-            contents,
-            metadatas,
+        end = time.time()
+        logger.debug(
+            f"Embeddings ready for {len(contents)} contents "
+            f"in {end - start:.2f}s (cached: {cache_hits}, fresh: {cache_misses}).",
         )
-        if len(int_ids) != content_count:
-            raise KnowledgeBaseUploadError(
-                stage="storage",
-                user_message=(
-                    f"存储失败：写入文档索引后返回的内部 ID 数量与文本分块数量不一致"
-                    f"（期望 {content_count}，实际 {len(int_ids)}）。"
-                ),
-                details={
-                    "expected_contents": content_count,
-                    "actual_int_ids": len(int_ids),
-                },
-            )
 
-        # 批量插入向量到 FAISS
         try:
             vectors_array = np.asarray(vectors, dtype=np.float32)
         except (TypeError, ValueError) as exc:
@@ -187,9 +250,63 @@ async def insert_batch(
                     "actual_dimension": int(vectors_array.shape[1]),
                 },
             )
-        await self.embedding_storage.insert_batch(vectors_array, int_ids)
+
+        int_ids = await self.document_storage.insert_documents_batch(
+            ids,
+            contents,
+            metadatas,
+        )
+        if len(int_ids) != content_count:
+            await self._cleanup_batch_insert(int_ids=[], doc_ids=ids)
+            raise KnowledgeBaseUploadError(
+                stage="storage",
+                user_message=(
+                    f"存储失败：写入文档索引后返回的内部 ID 数量与文本分块数量不一致"
+                    f"（期望 {content_count}，实际 {len(int_ids)}）。"
+                ),
+                details={
+                    "expected_contents": content_count,
+                    "actual_int_ids": len(int_ids),
+                },
+            )
+
+        try:
+            await self.embedding_storage.insert_batch(vectors_array, int_ids)
+        except Exception:
+            logger.warning(
+                "Failed to insert FAISS vectors; cleaning up inserted document rows.",
+                exc_info=True,
+            )
+            await self._cleanup_batch_insert(int_ids=int_ids, doc_ids=ids)
+            raise
         return int_ids
 
+    async def _cleanup_batch_insert(
+        self,
+        *,
+        int_ids: list[int],
+        doc_ids: list[str],
+    ) -> None:
+        """Best-effort cleanup for a failed batch insert."""
+        if int_ids:
+            try:
+                await self.embedding_storage.delete(int_ids)
+            except Exception:
+                logger.warning(
+                    "Failed to clean up FAISS vectors after batch insert failure.",
+                    exc_info=True,
+                )
+
+        for doc_id in doc_ids:
+            try:
+                await self.document_storage.delete_document_by_doc_id(doc_id)
+            except Exception:
+                logger.warning(
+                    f"Failed to clean up document row {doc_id} "
+                    "after batch insert failure.",
+                    exc_info=True,
+                )
+
     async def retrieve(
         self,
         query: str,
@@ -211,15 +328,24 @@ async def retrieve(
             List[Result]: 查询结果
 
         """
-        embedding = await self.embedding_provider.get_embedding(query)
+        # 先查缓存，再调 embedding provider
+        cached = await self.embedding_cache.get(query)
+        if cached is not None:
+            embedding = cached
+        else:
+            embedding = await self.embedding_provider.get_embedding(query)
+            await self.embedding_cache.put(
+                query,
+                np.asarray(embedding, dtype=np.float32),
+            )
         scores, indices = await self.embedding_storage.search(
             vector=np.array([embedding]).astype("float32"),
             k=fetch_k if metadata_filters else k,
         )
         if len(indices[0]) == 0 or indices[0][0] == -1:
             return []
-        # normalize scores
-        scores[0] = 1.0 - (scores[0] / 2.0)
+        # 将内积分数 (余弦相似度, 范围 [-1, 1]) 映射到 [0, 1]
+        scores[0] = (scores[0] + 1.0) / 2.0
         # NOTE: maybe the size is less than k.
         fetched_docs = await self.document_storage.get_documents(
             metadata_filters=metadata_filters or {},
@@ -255,17 +381,18 @@ async def retrieve(
 
         return top_k_results
 
-    async def delete(self, doc_id: str) -> None:
+    async def delete(self, doc_id: str) -> bool:
         """删除一条文档块（chunk）"""
         # 获得对应的 int id
         result = await self.document_storage.get_document_by_doc_id(doc_id)
         int_id = result["id"] if result else None
         if int_id is None:
-            return
+            return False
 
         # 使用 DocumentStorage 的删除方法
         await self.document_storage.delete_document_by_doc_id(doc_id)
         await self.embedding_storage.delete([int_id])
+        return True
 
     async def close(self) -> None:
         await self.document_storage.close()
diff --git a/astrbot/core/knowledge_base/capabilities.py b/astrbot/core/knowledge_base/capabilities.py
new file mode 100644
index 0000000000..9367604514
--- /dev/null
+++ b/astrbot/core/knowledge_base/capabilities.py
@@ -0,0 +1,110 @@
+"""Knowledge base capabilities and default limits."""
+
+from typing import Any
+
+ALLOWED_UPLOAD_EXTENSIONS = frozenset(
+    {
+        "adoc",
+        "docx",
+        "epub",
+        "md",
+        "markdown",
+        "pdf",
+        "rst",
+        "txt",
+        "xls",
+        "xlsx",
+    },
+)
+
+MAX_UPLOAD_FILE_SIZE = 128 * 1024 * 1024
+MAX_UPLOAD_FILES = 10
+MAX_BATCH_DELETE_DOCUMENTS = 100
+MAX_BATCH_REBUILD_DOCUMENTS = 100
+MAX_RETRIEVE_TOP_K = 100
+DEFAULT_KB_PAGE_SIZE = 20
+DEFAULT_DOCUMENT_PAGE_SIZE = 10
+DEFAULT_CHUNK_PAGE_SIZE = 10
+DEFAULT_BULK_PAGE_SIZE = 100
+DOCUMENT_PAGE_SIZE_OPTIONS = (10, 20, 50, 100)
+CHUNK_PAGE_SIZE_OPTIONS = (10, 25, 50, 100)
+
+DOCUMENT_FILTER_STATUSES = (
+    "pending",
+    "parsing",
+    "chunking",
+    "embedding",
+    "ready",
+    "failed",
+)
+DOCUMENT_FILTER_SOURCE_TYPES = ("file", "url", "import")
+
+FEATURE_SPARSE_RETRIEVAL = True
+FEATURE_RERANK = True
+FEATURE_URL_IMPORT = True
+FEATURE_DOCUMENT_REBUILD = True
+FEATURE_KB_REBUILD = True
+FEATURE_CONSISTENCY_CHECK = True
+FEATURE_CONSISTENCY_REPAIR = True
+FEATURE_BATCH_DELETE = True
+FEATURE_BATCH_REBUILD = True
+
+DEFAULT_CHUNK_SIZE = 512
+DEFAULT_CHUNK_OVERLAP = 50
+DEFAULT_TOP_K_DENSE = 50
+DEFAULT_TOP_K_SPARSE = 50
+DEFAULT_TOP_M_FINAL = 5
+DEFAULT_INDEX_TYPE = "flat"
+DEFAULT_UPLOAD_BATCH_SIZE = 32
+DEFAULT_UPLOAD_TASKS_LIMIT = 3
+DEFAULT_UPLOAD_MAX_RETRIES = 3
+
+
+def get_knowledge_base_capabilities() -> dict[str, Any]:
+    """Return API-safe knowledge base capabilities."""
+    return {
+        "upload": {
+            "allowed_extensions": sorted(ALLOWED_UPLOAD_EXTENSIONS),
+            "max_file_size_bytes": MAX_UPLOAD_FILE_SIZE,
+            "max_files_per_upload": MAX_UPLOAD_FILES,
+        },
+        "defaults": {
+            "chunk_size": DEFAULT_CHUNK_SIZE,
+            "chunk_overlap": DEFAULT_CHUNK_OVERLAP,
+            "batch_size": DEFAULT_UPLOAD_BATCH_SIZE,
+            "tasks_limit": DEFAULT_UPLOAD_TASKS_LIMIT,
+            "max_retries": DEFAULT_UPLOAD_MAX_RETRIES,
+            "top_k_dense": DEFAULT_TOP_K_DENSE,
+            "top_k_sparse": DEFAULT_TOP_K_SPARSE,
+            "top_m_final": DEFAULT_TOP_M_FINAL,
+            "index_type": DEFAULT_INDEX_TYPE,
+        },
+        "limits": {
+            "max_retrieve_top_k": MAX_RETRIEVE_TOP_K,
+            "max_batch_delete_documents": MAX_BATCH_DELETE_DOCUMENTS,
+            "max_batch_rebuild_documents": MAX_BATCH_REBUILD_DOCUMENTS,
+        },
+        "pagination": {
+            "document_page_size_options": list(DOCUMENT_PAGE_SIZE_OPTIONS),
+            "chunk_page_size_options": list(CHUNK_PAGE_SIZE_OPTIONS),
+            "default_kb_page_size": DEFAULT_KB_PAGE_SIZE,
+            "default_document_page_size": DEFAULT_DOCUMENT_PAGE_SIZE,
+            "default_chunk_page_size": DEFAULT_CHUNK_PAGE_SIZE,
+            "bulk_page_size": DEFAULT_BULK_PAGE_SIZE,
+        },
+        "document_filters": {
+            "statuses": list(DOCUMENT_FILTER_STATUSES),
+            "source_types": list(DOCUMENT_FILTER_SOURCE_TYPES),
+        },
+        "features": {
+            "sparse_retrieval": FEATURE_SPARSE_RETRIEVAL,
+            "rerank": FEATURE_RERANK,
+            "url_import": FEATURE_URL_IMPORT,
+            "document_rebuild": FEATURE_DOCUMENT_REBUILD,
+            "kb_rebuild": FEATURE_KB_REBUILD,
+            "consistency_check": FEATURE_CONSISTENCY_CHECK,
+            "consistency_repair": FEATURE_CONSISTENCY_REPAIR,
+            "batch_delete": FEATURE_BATCH_DELETE,
+            "batch_rebuild": FEATURE_BATCH_REBUILD,
+        },
+    }
diff --git a/astrbot/core/knowledge_base/chunking/markdown.py b/astrbot/core/knowledge_base/chunking/markdown.py
index 9ace43110d..e8813bf470 100644
--- a/astrbot/core/knowledge_base/chunking/markdown.py
+++ b/astrbot/core/knowledge_base/chunking/markdown.py
@@ -16,10 +16,35 @@ class _Section:
     """解析后的 Markdown 章节"""
 
     heading_path: list[str]
+    title_path: list[str]
+    section_index: int | None
     text: str
     has_body: bool
 
 
+@dataclass
+class MarkdownChunk:
+    """A Markdown chunk with source structure metadata."""
+
+    text: str
+    title_path: list[str] | None = None
+    section_index: int | None = None
+
+
+@dataclass
+class _ChunkDraft:
+    text: str
+    has_body: bool
+    title_path: list[str] | None
+    section_index: int | None
+
+
+@dataclass
+class _MarkdownBlock:
+    kind: str
+    text: str
+
+
 class MarkdownChunker(BaseChunker):
     """Markdown 感知分块器
 
@@ -72,31 +97,29 @@ async def chunk(self, text: str, **kwargs) -> list[str]:
             list[str]: 分块后的文本列表
 
         """
+        chunks = await self.chunk_with_metadata(text, **kwargs)
+        return [chunk.text for chunk in chunks]
+
+    async def chunk_with_metadata(self, text: str, **kwargs) -> list[MarkdownChunk]:
+        """Split Markdown text and keep per-chunk structure metadata."""
+        text = self._strip_front_matter(text)
         if not text or not text.strip():
             return []
 
         chunk_size = kwargs.get("chunk_size", self.chunk_size)
         chunk_overlap = kwargs.get("chunk_overlap", self.chunk_overlap)
 
-        # 解析 Markdown 结构
         sections = self._parse_sections(text)
 
         if not sections:
-            # 没有识别到标题结构，回退到递归分割
-            return await self._fallback_chunker.chunk(
+            chunks = await self._split_section_preserving_blocks(
                 text, chunk_size=chunk_size, chunk_overlap=chunk_overlap
             )
+            return [MarkdownChunk(text=chunk) for chunk in chunks]
 
-        # 将 sections 转换为 raw chunks
         raw_chunks = await self._sections_to_chunks(sections, chunk_size, chunk_overlap)
-
-        # 合并纯标题节到下一个有内容的 chunk
         merged = self._merge_heading_only_chunks(raw_chunks, chunk_size)
-
-        # 合并过短的相邻 chunk
-        merged = self._merge_short_chunks(merged, chunk_size)
-
-        return merged
+        return self._merge_short_chunks(merged, chunk_size)
 
     def _estimate_prefix_length(self, heading_path: list[str]) -> int:
         """估算标题上下文前缀的最大长度（用于扣除子块可用空间）"""
@@ -109,13 +132,15 @@ def _estimate_prefix_length(self, heading_path: list[str]) -> int:
 
     async def _sections_to_chunks(
         self, sections: list[_Section], chunk_size: int, chunk_overlap: int
-    ) -> list[tuple[str, bool]]:
+    ) -> list[_ChunkDraft]:
         """将解析后的 sections 转换为 (chunk_text, has_body) 列表"""
-        raw_chunks: list[tuple[str, bool]] = []
+        raw_chunks: list[_ChunkDraft] = []
 
         for section in sections:
             section_text = section.text
             heading_path = section.heading_path
+            title_path = self._normalize_title_path(section.title_path)
+            section_index = section.section_index
             has_body = section.has_body
 
             # 构建带上下文的文本
@@ -123,23 +148,30 @@ async def _sections_to_chunks(
             full_text = context_prefix + section_text
 
             if len(full_text) <= chunk_size:
-                raw_chunks.append((full_text.strip(), has_body))
+                raw_chunks.append(
+                    _ChunkDraft(
+                        text=full_text.strip(),
+                        has_body=has_body,
+                        title_path=title_path,
+                        section_index=section_index,
+                    )
+                )
             else:
-                # 章节过长，内部递归分割
-                # 扣除前缀长度，确保添加前缀后不超过 chunk_size
-                prefix_len = self._estimate_prefix_length(heading_path)
-                effective_chunk_size = max(chunk_size // 4, chunk_size - prefix_len)
-
-                sub_chunks = await self._fallback_chunker.chunk(
+                sub_chunks = await self._split_section_preserving_blocks(
                     section_text,
-                    chunk_size=effective_chunk_size,
+                    heading_path=heading_path,
+                    chunk_size=chunk_size,
                     chunk_overlap=chunk_overlap,
                 )
                 for i, sub_chunk in enumerate(sub_chunks):
-                    chunk_text = self._apply_heading_context(
-                        heading_path, sub_chunk, is_continuation=(i > 0)
+                    raw_chunks.append(
+                        _ChunkDraft(
+                            text=sub_chunk,
+                            has_body=True,
+                            title_path=title_path,
+                            section_index=section_index,
+                        )
                     )
-                    raw_chunks.append((chunk_text, True))
 
         return raw_chunks
 
@@ -161,75 +193,818 @@ def _apply_heading_context(
             return f"{self.continuation_prefix} {title}\n\n{content}".strip()
         return f"{title}\n\n{content}".strip()
 
-    def _merge_heading_only_chunks(
-        self, raw_chunks: list[tuple[str, bool]], chunk_size: int
+    async def _split_section_preserving_blocks(
+        self,
+        text: str,
+        *,
+        chunk_size: int,
+        chunk_overlap: int,
+        heading_path: list[str] | None = None,
+    ) -> list[str]:
+        heading_path = heading_path or []
+        prefix_len = self._estimate_prefix_length(heading_path)
+        effective_chunk_size = max(chunk_size // 4, chunk_size - prefix_len)
+        blocks = self._parse_markdown_blocks(text)
+        if not blocks:
+            chunks = await self._fallback_chunker.chunk(
+                text,
+                chunk_size=effective_chunk_size,
+                chunk_overlap=chunk_overlap,
+            )
+            return [
+                self._apply_heading_context(heading_path, chunk, i > 0)
+                for i, chunk in enumerate(chunks)
+                if chunk.strip()
+            ]
+
+        chunks: list[str] = []
+        current = ""
+        piece_index = 0
+
+        for block in blocks:
+            pieces = await self._split_block(block, effective_chunk_size, chunk_overlap)
+            for piece in pieces:
+                piece = piece.strip()
+                if not piece:
+                    continue
+                if not current:
+                    current = piece
+                    continue
+                combined = current + "\n\n" + piece
+                if len(combined) <= effective_chunk_size:
+                    current = combined
+                    continue
+
+                chunks.append(
+                    self._apply_heading_context(
+                        heading_path,
+                        current,
+                        piece_index > 0,
+                    )
+                )
+                piece_index += 1
+                current = piece
+
+        if current:
+            chunks.append(
+                self._apply_heading_context(
+                    heading_path,
+                    current,
+                    piece_index > 0,
+                )
+            )
+
+        return chunks
+
+    async def _split_block(
+        self, block: _MarkdownBlock, chunk_size: int, chunk_overlap: int
+    ) -> list[str]:
+        text = block.text.strip()
+        if not text:
+            return []
+        if len(text) <= chunk_size:
+            return [text]
+
+        if block.kind == "table":
+            return self._split_table_block(text, chunk_size)
+        if block.kind == "code":
+            return self._split_fenced_code_block(text, chunk_size)
+        if block.kind == "math":
+            return self._split_wrapped_line_block(text, chunk_size)
+        if block.kind in {"blockquote", "list", "html"}:
+            return self._split_line_block(text, chunk_size)
+        if block.kind in {"paragraph", "text"}:
+            return self._split_text_preserving_inline_spans(text, chunk_size)
+
+        return await self._fallback_chunker.chunk(
+            text,
+            chunk_size=chunk_size,
+            chunk_overlap=chunk_overlap,
+        )
+
+    def _parse_markdown_blocks(self, text: str) -> list[_MarkdownBlock]:
+        lines = text.splitlines(keepends=True)
+        blocks: list[_MarkdownBlock] = []
+        i = 0
+        while i < len(lines):
+            line = lines[i]
+            if not line.strip():
+                i += 1
+                continue
+
+            if self._is_fence_start(line):
+                block_lines, i = self._collect_fenced_code_block(lines, i)
+                blocks.append(_MarkdownBlock("code", "".join(block_lines).strip()))
+                continue
+
+            if self._is_math_block_start(line):
+                block_lines, i = self._collect_math_block(lines, i)
+                blocks.append(_MarkdownBlock("math", "".join(block_lines).strip()))
+                continue
+
+            if self._is_markdown_table_start(lines, i):
+                block_lines, i = self._collect_markdown_table(lines, i)
+                blocks.append(_MarkdownBlock("table", "".join(block_lines).strip()))
+                continue
+
+            if self._is_html_block_start(line):
+                block_lines, i = self._collect_html_block(lines, i)
+                blocks.append(_MarkdownBlock("html", "".join(block_lines).strip()))
+                continue
+
+            if line.lstrip().startswith(">"):
+                block_lines, i = self._collect_prefixed_block(
+                    lines,
+                    i,
+                    lambda candidate: candidate.lstrip().startswith(">"),
+                )
+                blocks.append(
+                    _MarkdownBlock("blockquote", "".join(block_lines).strip())
+                )
+                continue
+
+            if self._is_list_item(line):
+                block_lines, i = self._collect_list_block(lines, i)
+                blocks.append(_MarkdownBlock("list", "".join(block_lines).strip()))
+                continue
+
+            if self._is_link_reference(line):
+                block_lines, i = self._collect_prefixed_block(
+                    lines,
+                    i,
+                    self._is_link_reference,
+                )
+                blocks.append(
+                    _MarkdownBlock("link_reference", "".join(block_lines).strip())
+                )
+                continue
+
+            block_lines, i = self._collect_paragraph(lines, i)
+            blocks.append(_MarkdownBlock("paragraph", "".join(block_lines).strip()))
+
+        return [block for block in blocks if block.text.strip()]
+
+    @staticmethod
+    def _strip_front_matter(text: str) -> str:
+        if not text.startswith(("---\n", "+++\n")):
+            return text
+
+        marker = text[:3]
+        lines = text.splitlines(keepends=True)
+        for idx in range(1, min(len(lines), 200)):
+            if lines[idx].strip() == marker:
+                return "".join(lines[idx + 1 :]).lstrip("\n")
+        return text
+
+    @staticmethod
+    def _is_fence_start(line: str) -> bool:
+        stripped = line.lstrip()
+        indent = len(line) - len(stripped)
+        return indent <= 3 and (
+            stripped.startswith("```") or stripped.startswith("~~~")
+        )
+
+    @staticmethod
+    def _fence_marker(line: str) -> tuple[str, int] | None:
+        stripped = line.lstrip()
+        if stripped.startswith("```"):
+            return "`", len(stripped) - len(stripped.lstrip("`"))
+        if stripped.startswith("~~~"):
+            return "~", len(stripped) - len(stripped.lstrip("~"))
+        return None
+
+    def _collect_fenced_code_block(
+        self, lines: list[str], start: int
+    ) -> tuple[list[str], int]:
+        marker = self._fence_marker(lines[start])
+        if marker is None:
+            return [lines[start]], start + 1
+        fence_char, fence_len = marker
+        block_lines = [lines[start]]
+        i = start + 1
+        while i < len(lines):
+            block_lines.append(lines[i])
+            candidate = lines[i].lstrip()
+            indent = len(lines[i]) - len(candidate)
+            if (
+                indent <= 3
+                and candidate.startswith(fence_char * fence_len)
+                and set(candidate.strip()) <= {fence_char}
+            ):
+                i += 1
+                break
+            i += 1
+        return block_lines, i
+
+    @staticmethod
+    def _is_table_separator(line: str) -> bool:
+        stripped = line.strip()
+        if "|" not in stripped:
+            return False
+        cells = [cell.strip() for cell in stripped.strip("|").split("|")]
+        if not cells:
+            return False
+        return all(re.fullmatch(r":?-{3,}:?", cell or "") for cell in cells)
+
+    @staticmethod
+    def _is_table_row(line: str) -> bool:
+        stripped = line.strip()
+        return bool(stripped) and "|" in stripped
+
+    def _is_markdown_table_start(self, lines: list[str], index: int) -> bool:
+        return (
+            index + 1 < len(lines)
+            and self._is_table_row(lines[index])
+            and self._is_table_separator(lines[index + 1])
+        )
+
+    def _collect_markdown_table(
+        self, lines: list[str], start: int
+    ) -> tuple[list[str], int]:
+        block_lines = [lines[start], lines[start + 1]]
+        i = start + 2
+        while i < len(lines) and self._is_table_row(lines[i]):
+            block_lines.append(lines[i])
+            i += 1
+        return block_lines, i
+
+    @staticmethod
+    def _is_html_block_start(line: str) -> bool:
+        stripped = line.lstrip().lower()
+        return stripped.startswith(
+            (
+                "<table",
+                "<pre",
+                "<code",
+                "<blockquote",
+                "<details",
+                "<div",
+            )
+        )
+
+    @staticmethod
+    def _html_closing_tag(line: str) -> str | None:
+        stripped = line.lstrip().lower()
+        for tag in ("table", "pre", "code", "blockquote", "details", "div"):
+            if stripped.startswith(f"<{tag}"):
+                return f"</{tag}>"
+        return None
+
+    def _collect_html_block(
+        self, lines: list[str], start: int
+    ) -> tuple[list[str], int]:
+        closing_tag = self._html_closing_tag(lines[start])
+        block_lines = [lines[start]]
+        i = start + 1
+        if closing_tag is None or closing_tag in lines[start].lower():
+            return block_lines, i
+
+        while i < len(lines):
+            block_lines.append(lines[i])
+            if closing_tag in lines[i].lower():
+                i += 1
+                break
+            i += 1
+        return block_lines, i
+
+    @staticmethod
+    def _is_list_item(line: str) -> bool:
+        return bool(re.match(r"^\s{0,3}(?:[-*+]|\d+[.)])\s+", line))
+
+    @staticmethod
+    def _is_link_reference(line: str) -> bool:
+        return bool(re.match(r"^\s{0,3}\[[^\]]+\]:\s+\S+", line))
+
+    def _collect_prefixed_block(
+        self,
+        lines: list[str],
+        start: int,
+        predicate,
+    ) -> tuple[list[str], int]:
+        block_lines = []
+        i = start
+        while i < len(lines) and (predicate(lines[i]) or not lines[i].strip()):
+            if (
+                not lines[i].strip()
+                and i + 1 < len(lines)
+                and not predicate(lines[i + 1])
+            ):
+                break
+            block_lines.append(lines[i])
+            i += 1
+        return block_lines, i
+
+    def _collect_list_block(
+        self, lines: list[str], start: int
+    ) -> tuple[list[str], int]:
+        block_lines = [lines[start]]
+        i = start + 1
+        while i < len(lines):
+            line = lines[i]
+            if self._is_fence_start(line) or self._is_markdown_table_start(lines, i):
+                break
+            if self._is_list_item(line) or line.startswith((" ", "\t")):
+                block_lines.append(line)
+                i += 1
+                continue
+            if not line.strip() and i + 1 < len(lines):
+                next_line = lines[i + 1]
+                if self._is_list_item(next_line) or next_line.startswith((" ", "\t")):
+                    block_lines.append(line)
+                    i += 1
+                    continue
+            break
+        return block_lines, i
+
+    def _collect_paragraph(self, lines: list[str], start: int) -> tuple[list[str], int]:
+        block_lines = []
+        i = start
+        while i < len(lines):
+            line = lines[i]
+            if not line.strip():
+                break
+            if i != start and (
+                self._is_fence_start(line)
+                or self._is_math_block_start(line)
+                or self._is_markdown_table_start(lines, i)
+                or self._is_html_block_start(line)
+                or self._is_list_item(line)
+                or line.lstrip().startswith(">")
+                or self._is_link_reference(line)
+            ):
+                break
+            block_lines.append(line)
+            i += 1
+        return block_lines, i
+
+    def _split_table_block(self, text: str, chunk_size: int) -> list[str]:
+        lines = text.splitlines()
+        if len(lines) <= 2:
+            return [text]
+
+        header = lines[:2]
+        rows = lines[2:]
+        chunks = []
+        current_rows: list[str] = []
+
+        for row in rows:
+            candidate_lines = header + current_rows + [row]
+            candidate = "\n".join(candidate_lines)
+            if current_rows and len(candidate) > chunk_size:
+                chunks.append("\n".join(header + current_rows))
+                current_rows = [row]
+            else:
+                current_rows.append(row)
+
+        if current_rows:
+            chunks.append("\n".join(header + current_rows))
+
+        return chunks or [text]
+
+    @staticmethod
+    def _is_math_block_start(line: str) -> bool:
+        stripped = line.strip()
+        return (
+            stripped.startswith("$$")
+            or stripped.startswith(r"\[")
+            or bool(
+                re.match(
+                    r"^\\begin\{(?:equation|align|gather|multline|cases)\*?\}", stripped
+                )
+            )
+        )
+
+    @staticmethod
+    def _math_block_closer(line: str) -> str:
+        stripped = line.strip()
+        if stripped.startswith("$$"):
+            return "$$"
+        if stripped.startswith(r"\["):
+            return r"\]"
+
+        env_match = re.match(r"^\\begin\{([^}]+)\}", stripped)
+        if env_match:
+            return rf"\end{{{env_match.group(1)}}}"
+        return ""
+
+    def _collect_math_block(
+        self, lines: list[str], start: int
+    ) -> tuple[list[str], int]:
+        opener_line = lines[start]
+        closer = self._math_block_closer(opener_line)
+        block_lines = [opener_line]
+        if not closer:
+            return block_lines, start + 1
+
+        opener_stripped = opener_line.strip()
+        if (
+            closer in opener_stripped[len(closer) :]
+            if closer in {"$$", r"\]"}
+            else closer in opener_stripped
+        ):
+            return block_lines, start + 1
+
+        i = start + 1
+        while i < len(lines):
+            block_lines.append(lines[i])
+            if closer in lines[i].strip():
+                i += 1
+                break
+            i += 1
+        return block_lines, i
+
+    @staticmethod
+    def _split_wrapped_line_block(text: str, chunk_size: int) -> list[str]:
+        lines = text.splitlines()
+        if len(lines) <= 2:
+            return [text]
+
+        opener = lines[0]
+        closer = lines[-1]
+        body = lines[1:-1]
+        chunks = []
+        current: list[str] = []
+
+        for line in body:
+            candidate = "\n".join([opener, *current, line, closer])
+            if current and len(candidate) > chunk_size:
+                chunks.append("\n".join([opener, *current, closer]))
+                current = [line]
+            else:
+                current.append(line)
+
+        if current:
+            chunks.append("\n".join([opener, *current, closer]))
+
+        return chunks or [text]
+
+    @staticmethod
+    def _split_fenced_code_block(text: str, chunk_size: int) -> list[str]:
+        lines = text.splitlines()
+        if len(lines) <= 2:
+            return [text]
+
+        opener = lines[0]
+        closer = lines[-1] if lines[-1].lstrip().startswith(("```", "~~~")) else ""
+        body = lines[1:-1] if closer else lines[1:]
+        chunks = []
+        current: list[str] = []
+
+        for line in body:
+            candidate_lines = [opener, *current, line]
+            if closer:
+                candidate_lines.append(closer)
+            candidate = "\n".join(candidate_lines)
+            if current and len(candidate) > chunk_size:
+                chunk_lines = [opener, *current]
+                if closer:
+                    chunk_lines.append(closer)
+                chunks.append("\n".join(chunk_lines))
+                current = [line]
+            else:
+                current.append(line)
+
+        if current:
+            chunk_lines = [opener, *current]
+            if closer:
+                chunk_lines.append(closer)
+            chunks.append("\n".join(chunk_lines))
+
+        return chunks or [text]
+
+    @staticmethod
+    def _split_line_block(text: str, chunk_size: int) -> list[str]:
+        lines = text.splitlines()
+        chunks = []
+        current: list[str] = []
+        for line in lines:
+            candidate = "\n".join([*current, line])
+            if current and len(candidate) > chunk_size:
+                chunks.append("\n".join(current))
+                current = [line]
+            else:
+                current.append(line)
+        if current:
+            chunks.append("\n".join(current))
+        return chunks or [text]
+
+    def _split_text_preserving_inline_spans(
+        self, text: str, chunk_size: int
     ) -> list[str]:
+        tokens = self._tokenize_protected_inline_spans(text)
+        chunks = []
+        current = ""
+        for token in tokens:
+            if not token:
+                continue
+            candidate = current + token if current else token.lstrip()
+            if current and len(candidate) > chunk_size:
+                chunks.append(current.strip())
+                current = token.lstrip()
+            else:
+                current = candidate
+
+            if len(current) > chunk_size and not self._is_inline_protected_token(
+                current
+            ):
+                split_chunks = self._split_long_plain_token(current, chunk_size)
+                chunks.extend(split_chunks[:-1])
+                current = split_chunks[-1] if split_chunks else ""
+
+        if current.strip():
+            chunks.append(current.strip())
+        return [chunk for chunk in chunks if chunk]
+
+    def _tokenize_protected_inline_spans(self, text: str) -> list[str]:
+        spans = self._find_protected_inline_spans(text)
+        tokens: list[str] = []
+        cursor = 0
+        for start, end in spans:
+            if start > cursor:
+                tokens.extend(re.findall(r"\S+\s*|\s+", text[cursor:start]))
+            tokens.append(text[start:end])
+            cursor = end
+        if cursor < len(text):
+            tokens.extend(re.findall(r"\S+\s*|\s+", text[cursor:]))
+        return tokens
+
+    def _find_protected_inline_spans(self, text: str) -> list[tuple[int, int]]:
+        spans: list[tuple[int, int]] = []
+        i = 0
+        while i < len(text):
+            end = self._match_markdown_link(text, i)
+            if end is None:
+                end = self._match_autolink(text, i)
+            if end is None:
+                end = self._match_inline_math(text, i)
+            if end is not None:
+                if not spans or i >= spans[-1][1]:
+                    spans.append((i, end))
+                i = end
+                continue
+            i += 1
+        return spans
+
+    @staticmethod
+    def _match_markdown_link(text: str, start: int) -> int | None:
+        marker_start = start
+        if text.startswith("![", start):
+            start += 1
+        elif text[start] != "[":
+            return None
+
+        label_end = text.find("]", start + 1)
+        if label_end == -1 or label_end + 1 >= len(text):
+            return None
+
+        next_char = text[label_end + 1]
+        if next_char == "(":
+            link_end = text.find(")", label_end + 2)
+            return link_end + 1 if link_end != -1 else None
+        if next_char == "[":
+            ref_end = text.find("]", label_end + 2)
+            return ref_end + 1 if ref_end != -1 else None
+
+        return None if marker_start == start else None
+
+    @staticmethod
+    def _match_autolink(text: str, start: int) -> int | None:
+        if text.startswith(("<http://", "<https://"), start):
+            end = text.find(">", start + 1)
+            return end + 1 if end != -1 else None
+
+        if not (
+            text.startswith("http://", start) or text.startswith("https://", start)
+        ):
+            return None
+
+        end = start
+        while end < len(text) and not text[end].isspace():
+            end += 1
+        while end > start and text[end - 1] in ".,;:!?)>]":
+            end -= 1
+        return end
+
+    @staticmethod
+    def _match_inline_math(text: str, start: int) -> int | None:
+        if text.startswith(r"\(", start):
+            end = text.find(r"\)", start + 2)
+            return end + 2 if end != -1 else None
+
+        if text[start] != "$":
+            return None
+        if text.startswith("$$", start):
+            return None
+        if start > 0 and text[start - 1] == "\\":
+            return None
+        if start + 1 >= len(text) or text[start + 1].isspace():
+            return None
+
+        i = start + 1
+        while i < len(text):
+            if text[i] == "$" and text[i - 1] != "\\":
+                if i > start + 1 and not text[i - 1].isspace():
+                    return i + 1
+                return None
+            i += 1
+        return None
+
+    @staticmethod
+    def _is_inline_protected_token(token: str) -> bool:
+        stripped = token.strip()
+        return (
+            stripped.startswith("[")
+            or stripped.startswith("![")
+            or stripped.startswith("<http")
+            or stripped.startswith("http")
+            or stripped.startswith("$")
+            or stripped.startswith(r"\(")
+        )
+
+    @staticmethod
+    def _split_long_plain_token(text: str, chunk_size: int) -> list[str]:
+        if chunk_size <= 0:
+            return [text]
+        return [text[i : i + chunk_size] for i in range(0, len(text), chunk_size)]
+
+    def _merge_heading_only_chunks(
+        self, raw_chunks: list[_ChunkDraft], chunk_size: int
+    ) -> list[MarkdownChunk]:
         """合并没有实质正文的 chunk 到下一个有正文的 chunk"""
-        merged: list[str] = []
-        pending = ""
+        merged: list[MarkdownChunk] = []
+        pending_text = ""
+        pending_title_path: list[str] | None = None
+        pending_section_index: int | None = None
 
-        for chunk_text, has_body in raw_chunks:
+        for chunk in raw_chunks:
+            chunk_text = chunk.text
             if not chunk_text:
                 continue
-            if not has_body:
+            if not chunk.has_body:
                 # 纯标题节，暂存；但如果 pending 已经够长，先 flush
-                if pending and len(pending) + len(chunk_text) + 2 > chunk_size:
-                    merged.append(pending.strip())
-                    pending = ""
-                pending += chunk_text + "\n\n"
+                if (
+                    pending_text
+                    and len(pending_text) + len(chunk_text) + 2 > chunk_size
+                ):
+                    merged.append(
+                        MarkdownChunk(
+                            text=pending_text.strip(),
+                            title_path=pending_title_path,
+                            section_index=pending_section_index,
+                        )
+                    )
+                    pending_text = ""
+                    pending_title_path = None
+                    pending_section_index = None
+                pending_text += chunk_text + "\n\n"
+                pending_title_path = chunk.title_path or pending_title_path
+                pending_section_index = chunk.section_index
             else:
-                if pending:
-                    combined = pending + chunk_text
+                if pending_text:
+                    combined = pending_text + chunk_text
                     if len(combined) <= chunk_size:
-                        merged.append(combined.strip())
+                        merged.append(
+                            MarkdownChunk(
+                                text=combined.strip(),
+                                title_path=chunk.title_path or pending_title_path,
+                                section_index=chunk.section_index,
+                            )
+                        )
                     else:
-                        merged.append(pending.strip())
-                        merged.append(chunk_text.strip())
-                    pending = ""
+                        merged.append(
+                            MarkdownChunk(
+                                text=pending_text.strip(),
+                                title_path=pending_title_path,
+                                section_index=pending_section_index,
+                            )
+                        )
+                        merged.append(
+                            MarkdownChunk(
+                                text=chunk_text.strip(),
+                                title_path=chunk.title_path,
+                                section_index=chunk.section_index,
+                            )
+                        )
+                    pending_text = ""
+                    pending_title_path = None
+                    pending_section_index = None
                 else:
-                    merged.append(chunk_text.strip())
+                    merged.append(
+                        MarkdownChunk(
+                            text=chunk_text.strip(),
+                            title_path=chunk.title_path,
+                            section_index=chunk.section_index,
+                        )
+                    )
 
         # 处理尾部残留的 pending
-        if pending:
-            pending_text = pending.strip()
-            if merged and len(merged[-1] + "\n\n" + pending_text) <= chunk_size:
-                merged[-1] = merged[-1] + "\n\n" + pending_text
+        if pending_text:
+            trailing_text = pending_text.strip()
+            if merged and len(merged[-1].text + "\n\n" + trailing_text) <= chunk_size:
+                merged[-1] = MarkdownChunk(
+                    text=merged[-1].text + "\n\n" + trailing_text,
+                    title_path=self._merge_title_paths(
+                        [merged[-1].title_path, pending_title_path]
+                    ),
+                    section_index=self._merge_section_indexes(
+                        [merged[-1].section_index, pending_section_index]
+                    ),
+                )
             else:
-                merged.append(pending_text)
+                merged.append(
+                    MarkdownChunk(
+                        text=trailing_text,
+                        title_path=pending_title_path,
+                        section_index=pending_section_index,
+                    )
+                )
 
-        return [c for c in merged if c.strip()]
+        return [chunk for chunk in merged if chunk.text.strip()]
 
-    def _merge_short_chunks(self, chunks: list[str], chunk_size: int) -> list[str]:
+    def _merge_short_chunks(
+        self, chunks: list[MarkdownChunk], chunk_size: int
+    ) -> list[MarkdownChunk]:
         """合并过短的相邻 chunk（低于 min_chunk_size）"""
         if self.min_chunk_size <= 0 or len(chunks) <= 1:
             return chunks
 
-        final: list[str] = []
-        buf = ""
+        final: list[MarkdownChunk] = []
+        buf: MarkdownChunk | None = None
 
-        for c in chunks:
+        for chunk in chunks:
             if buf:
-                combined = buf + "\n\n" + c
+                combined = buf.text + "\n\n" + chunk.text
                 if len(combined) <= chunk_size:
-                    buf = combined
+                    buf = MarkdownChunk(
+                        text=combined,
+                        title_path=self._merge_title_paths(
+                            [buf.title_path, chunk.title_path]
+                        ),
+                        section_index=self._merge_section_indexes(
+                            [buf.section_index, chunk.section_index]
+                        ),
+                    )
                 else:
                     final.append(buf)
-                    buf = c if len(c) < self.min_chunk_size else ""
-                    if len(c) >= self.min_chunk_size:
-                        final.append(c)
-            elif len(c) < self.min_chunk_size:
-                buf = c
+                    if len(chunk.text) < self.min_chunk_size:
+                        buf = chunk
+                    else:
+                        buf = None
+                        final.append(chunk)
+            elif len(chunk.text) < self.min_chunk_size:
+                buf = chunk
             else:
-                final.append(c)
+                final.append(chunk)
 
         if buf:
-            if final and len(final[-1] + "\n\n" + buf) <= chunk_size:
-                final[-1] = final[-1] + "\n\n" + buf
+            if final and len(final[-1].text + "\n\n" + buf.text) <= chunk_size:
+                final[-1] = MarkdownChunk(
+                    text=final[-1].text + "\n\n" + buf.text,
+                    title_path=self._merge_title_paths(
+                        [final[-1].title_path, buf.title_path]
+                    ),
+                    section_index=self._merge_section_indexes(
+                        [final[-1].section_index, buf.section_index]
+                    ),
+                )
             else:
                 final.append(buf)
 
         return final
 
+    @staticmethod
+    def _normalize_title_path(title_path: list[str]) -> list[str] | None:
+        path = [title.strip() for title in title_path if title and title.strip()]
+        return path or None
+
+    @staticmethod
+    def _merge_title_paths(paths: list[list[str] | None]) -> list[str] | None:
+        non_empty_paths = [path for path in paths if path]
+        if not non_empty_paths:
+            return None
+
+        common = list(non_empty_paths[0])
+        for path in non_empty_paths[1:]:
+            prefix: list[str] = []
+            for left, right in zip(common, path, strict=False):
+                if left != right:
+                    break
+                prefix.append(left)
+            common = prefix
+            if not common:
+                return None
+        return common
+
+    @staticmethod
+    def _merge_section_indexes(indexes: list[int | None]) -> int | None:
+        non_empty_indexes = [index for index in indexes if index is not None]
+        if not non_empty_indexes:
+            return None
+        first_index = non_empty_indexes[0]
+        if all(index == first_index for index in non_empty_indexes):
+            return first_index
+        return None
+
     def _parse_sections(self, text: str) -> list[_Section]:
         """解析 Markdown 文本为章节列表
 
@@ -264,11 +1039,21 @@ def _parse_sections(self, text: str) -> list[_Section]:
             return []
 
         sections: list[_Section] = []
+        section_index = 0
 
         # 处理第一个标题之前的内容（如果有）
         preamble = text[: headings[0]["start"]].strip()
         if preamble:
-            sections.append(_Section(heading_path=[], text=preamble, has_body=True))
+            sections.append(
+                _Section(
+                    heading_path=[],
+                    title_path=[],
+                    section_index=section_index,
+                    text=preamble,
+                    has_body=True,
+                )
+            )
+            section_index += 1
 
         # 维护标题栈来追踪层级路径
         heading_stack: list[dict] = []
@@ -297,14 +1082,18 @@ def _parse_sections(self, text: str) -> list[_Section]:
 
             # 构建标题路径
             heading_path = [h["title"] for h in heading_stack[:-1]]
+            title_path = [h["title"] for h in heading_stack]
 
             sections.append(
                 _Section(
                     heading_path=heading_path,
+                    title_path=title_path,
+                    section_index=section_index,
                     text=section_text,
                     has_body=bool(body),
                 )
             )
+            section_index += 1
 
         return sections
 
diff --git a/astrbot/core/knowledge_base/document_metadata.py b/astrbot/core/knowledge_base/document_metadata.py
new file mode 100644
index 0000000000..4c78efe410
--- /dev/null
+++ b/astrbot/core/knowledge_base/document_metadata.py
@@ -0,0 +1,61 @@
+"""Helpers for knowledge-base document governance metadata."""
+
+import hashlib
+import re
+import uuid
+from pathlib import Path
+
+from .chunking.base import BaseChunker
+from .parsers.base import BaseParser
+
+DEFAULT_PARSER_VERSION = "1"
+DEFAULT_CHUNKER_VERSION = "1"
+
+
+def build_content_hash(content: bytes | str | list[str]) -> str:
+    """Return a stable SHA256 hash for source content."""
+    digest = hashlib.sha256()
+    if isinstance(content, bytes):
+        digest.update(content)
+    elif isinstance(content, str):
+        digest.update(content.encode("utf-8"))
+    else:
+        for chunk in content:
+            digest.update(chunk.encode("utf-8"))
+            digest.update(b"\x00")
+    return digest.hexdigest()
+
+
+def get_parser_name(parser: BaseParser | None) -> str | None:
+    if parser is None:
+        return None
+    return parser.__class__.__name__
+
+
+def get_chunker_name(chunker: BaseChunker | None) -> str | None:
+    if chunker is None:
+        return None
+    return chunker.__class__.__name__
+
+
+def sanitize_source_filename(file_name: str | None, fallback_suffix: str = "") -> str:
+    """Return a filename safe for storage inside a KB-owned directory."""
+    raw = (file_name or "").replace("\\", "/").split("/")[-1].replace("\x00", "")
+    safe = re.sub(r"[^A-Za-z0-9._ -]", "_", raw).strip(" .")
+    if not safe:
+        safe = f"document_{uuid.uuid4().hex[:8]}{fallback_suffix}"
+    return safe[:255]
+
+
+def build_stored_source_path(
+    files_dir: Path,
+    *,
+    doc_id: str,
+    file_name: str,
+    file_type: str,
+) -> Path:
+    suffix = Path(file_name).suffix
+    if not suffix and file_type:
+        suffix = f".{file_type}"
+    safe_name = sanitize_source_filename(file_name, fallback_suffix=suffix)
+    return files_dir / doc_id / safe_name
diff --git a/astrbot/core/knowledge_base/kb_db_sqlite.py b/astrbot/core/knowledge_base/kb_db_sqlite.py
index 2734ccb8d9..10f82e5635 100644
--- a/astrbot/core/knowledge_base/kb_db_sqlite.py
+++ b/astrbot/core/knowledge_base/kb_db_sqlite.py
@@ -1,8 +1,11 @@
+import asyncio
+import json
 from contextlib import asynccontextmanager
+from datetime import datetime, timezone
 from pathlib import Path
 from typing import TYPE_CHECKING
 
-from sqlalchemy import delete, event, func, select, text, update
+from sqlalchemy import delete, event, func, or_, select, text, update
 from sqlalchemy.ext.asyncio import AsyncSession, async_sessionmaker, create_async_engine
 from sqlalchemy.pool import NullPool
 from sqlmodel import col, desc
@@ -11,6 +14,7 @@
 from astrbot.core.knowledge_base.models import (
     BaseKBModel,
     KBDocument,
+    KBIngestionTask,
     KBMedia,
     KnowledgeBase,
 )
@@ -19,6 +23,8 @@
 if TYPE_CHECKING:
     from astrbot.core.db.vec_db.faiss_impl import FaissVecDB
 
+_UNSET = object()
+
 
 def _configure_sqlite_connection(dbapi_connection, connection_record) -> None:
     cursor = dbapi_connection.cursor()
@@ -106,6 +112,15 @@ async def migrate_to_v1(self) -> None:
         async with self.get_db() as session:
             session: AsyncSession
             async with session.begin():
+                await self._ensure_column(
+                    session,
+                    table_name="knowledge_bases",
+                    column_name="index_type",
+                    column_sql="index_type TEXT DEFAULT 'flat'",
+                )
+                await self._ensure_document_governance_columns(session)
+                await self._ensure_ingestion_task_table(session)
+
                 # 创建知识库表索引
                 await session.execute(
                     text(
@@ -157,6 +172,24 @@ async def migrate_to_v1(self) -> None:
                         "ON kb_documents(created_at)",
                     ),
                 )
+                await session.execute(
+                    text(
+                        "CREATE INDEX IF NOT EXISTS idx_doc_content_hash "
+                        "ON kb_documents(content_hash)",
+                    ),
+                )
+                await session.execute(
+                    text(
+                        "CREATE INDEX IF NOT EXISTS idx_doc_status "
+                        "ON kb_documents(status)",
+                    ),
+                )
+                await session.execute(
+                    text(
+                        "CREATE INDEX IF NOT EXISTS idx_doc_parent_doc_id "
+                        "ON kb_documents(parent_doc_id)",
+                    ),
+                )
 
                 # 创建多媒体表索引
                 await session.execute(
@@ -182,9 +215,126 @@ async def migrate_to_v1(self) -> None:
                         "ON kb_media(media_type)",
                     ),
                 )
+                await self._ensure_ingestion_task_indexes(session)
 
                 await session.commit()
 
+    async def _ensure_column(
+        self,
+        session: AsyncSession,
+        *,
+        table_name: str,
+        column_name: str,
+        column_sql: str,
+    ) -> None:
+        """Add a column when upgrading an existing SQLite table."""
+        result = await session.execute(text(f"PRAGMA table_xinfo({table_name})"))
+        columns = {row[1] for row in result.fetchall()}
+        if column_name in columns:
+            return
+        logger.info(
+            f"知识库数据库迁移: 为表 {table_name} 添加列 {column_name}",
+        )
+        await session.execute(text(f"ALTER TABLE {table_name} ADD COLUMN {column_sql}"))
+
+    async def _ensure_document_governance_columns(
+        self,
+        session: AsyncSession,
+    ) -> None:
+        columns = {
+            "source_type": "source_type TEXT NOT NULL DEFAULT 'file'",
+            "source_uri": "source_uri TEXT",
+            "content_hash": "content_hash VARCHAR(64)",
+            "parser_name": "parser_name VARCHAR(100)",
+            "parser_version": "parser_version VARCHAR(50)",
+            "chunker_name": "chunker_name VARCHAR(100)",
+            "chunker_version": "chunker_version VARCHAR(50)",
+            "status": "status TEXT NOT NULL DEFAULT 'ready'",
+            "error_stage": "error_stage VARCHAR(50)",
+            "error_message": "error_message TEXT",
+            "version": "version INTEGER NOT NULL DEFAULT 1",
+            "parent_doc_id": "parent_doc_id VARCHAR(36)",
+            "indexed_at": "indexed_at DATETIME",
+        }
+        for column_name, column_sql in columns.items():
+            await self._ensure_column(
+                session,
+                table_name="kb_documents",
+                column_name=column_name,
+                column_sql=column_sql,
+            )
+
+    async def _ensure_ingestion_task_table(self, session: AsyncSession) -> None:
+        await session.execute(
+            text(
+                """
+                CREATE TABLE IF NOT EXISTS kb_ingestion_tasks (
+                    id INTEGER PRIMARY KEY AUTOINCREMENT,
+                    task_id VARCHAR(36) NOT NULL UNIQUE,
+                    kb_id VARCHAR(36) NOT NULL,
+                    task_type VARCHAR(30) NOT NULL,
+                    status VARCHAR(20) NOT NULL DEFAULT 'pending',
+                    progress_stage VARCHAR(50),
+                    progress_current INTEGER NOT NULL DEFAULT 0,
+                    progress_total INTEGER NOT NULL DEFAULT 100,
+                    progress TEXT,
+                    result TEXT,
+                    error TEXT,
+                    created_at DATETIME NOT NULL,
+                    updated_at DATETIME NOT NULL
+                )
+                """,
+            ),
+        )
+
+    async def _ensure_ingestion_task_indexes(self, session: AsyncSession) -> None:
+        indexes = {
+            "idx_task_task_id": "task_id",
+            "idx_task_kb_id": "kb_id",
+            "idx_task_type": "task_type",
+            "idx_task_status": "status",
+            "idx_task_created_at": "created_at",
+        }
+        for index_name, column_name in indexes.items():
+            await session.execute(
+                text(
+                    f"CREATE INDEX IF NOT EXISTS {index_name} "
+                    f"ON kb_ingestion_tasks({column_name})",
+                ),
+            )
+
+    @staticmethod
+    def _encode_json(value) -> str | None:
+        if value is None:
+            return None
+        return json.dumps(value, ensure_ascii=False, default=str)
+
+    @staticmethod
+    def _decode_json(value: str | None):
+        if value is None:
+            return None
+        try:
+            return json.loads(value)
+        except json.JSONDecodeError:
+            return value
+
+    @classmethod
+    def _task_to_dict(cls, task: KBIngestionTask) -> dict:
+        return {
+            "task_id": task.task_id,
+            "kb_id": task.kb_id,
+            "task_type": task.task_type,
+            "status": task.status,
+            "progress_stage": task.progress_stage,
+            "progress_current": task.progress_current,
+            "progress_total": task.progress_total,
+            "progress": cls._decode_json(task.progress),
+            "result": cls._decode_json(task.result),
+            "error": cls._decode_json(task.error),
+            "created_at": task.created_at.isoformat(),
+            "updated_at": task.updated_at.isoformat(),
+        }
+
     async def close(self) -> None:
         """关闭数据库连接"""
         await self.engine.dispose()
@@ -204,15 +354,22 @@ async def get_kb_by_name(self, kb_name: str) -> KnowledgeBase | None:
             result = await session.execute(stmt)
             return result.scalar_one_or_none()
 
-    async def list_kbs(self, offset: int = 0, limit: int = 100) -> list[KnowledgeBase]:
+    async def list_kbs(
+        self,
+        offset: int = 0,
+        limit: int | None = None,
+    ) -> list[KnowledgeBase]:
         """列出所有知识库"""
         async with self.get_db() as session:
             stmt = (
                 select(KnowledgeBase)
                 .offset(offset)
-                .limit(limit)
-                .order_by(desc(KnowledgeBase.created_at))
+                .order_by(
+                    desc(KnowledgeBase.created_at),
+                )
             )
+            if limit is not None:
+                stmt = stmt.limit(limit)
             result = await session.execute(stmt)
             return list(result.scalars().all())
 
@@ -223,6 +380,146 @@ async def count_kbs(self) -> int:
             result = await session.execute(stmt)
             return result.scalar() or 0
 
+    # ===== 任务查询 =====
+
+    async def create_ingestion_task(
+        self,
+        *,
+        task_id: str,
+        kb_id: str,
+        task_type: str,
+        status: str = "pending",
+        progress_stage: str | None = None,
+        progress_current: int = 0,
+        progress_total: int = 100,
+        progress: dict | None = None,
+    ) -> dict:
+        task = KBIngestionTask(
+            task_id=task_id,
+            kb_id=kb_id,
+            task_type=task_type,
+            status=status,
+            progress_stage=progress_stage,
+            progress_current=progress_current,
+            progress_total=progress_total,
+            progress=self._encode_json(progress),
+        )
+        async with self.get_db() as session:
+            session.add(task)
+            await session.commit()
+            await session.refresh(task)
+            return self._task_to_dict(task)
+
+    async def update_ingestion_task(
+        self,
+        task_id: str,
+        *,
+        status: str | object = _UNSET,
+        progress_stage: str | None | object = _UNSET,
+        progress_current: int | object = _UNSET,
+        progress_total: int | object = _UNSET,
+        progress: dict | None | object = _UNSET,
+        result: dict | None | object = _UNSET,
+        error: str | None | object = _UNSET,
+    ) -> dict | None:
+        async with self.get_db() as session:
+            stmt = select(KBIngestionTask).where(
+                col(KBIngestionTask.task_id) == task_id,
+            )
+            query_result = await session.execute(stmt)
+            task = query_result.scalar_one_or_none()
+            if task is None:
+                return None
+
+            if status is not _UNSET:
+                task.status = status  # type: ignore[assignment]
+            if progress_stage is not _UNSET:
+                task.progress_stage = progress_stage  # type: ignore[assignment]
+            if progress_current is not _UNSET:
+                task.progress_current = progress_current  # type: ignore[assignment]
+            if progress_total is not _UNSET:
+                task.progress_total = progress_total  # type: ignore[assignment]
+            if progress is not _UNSET:
+                task.progress = self._encode_json(progress)
+            if result is not _UNSET:
+                task.result = self._encode_json(result)
+            if error is not _UNSET:
+                task.error = self._encode_json(error)
+            task.updated_at = datetime.now(timezone.utc)
+
+            session.add(task)
+            await session.commit()
+            await session.refresh(task)
+            return self._task_to_dict(task)
+
+    async def get_ingestion_task(self, task_id: str) -> dict | None:
+        async with self.get_db() as session:
+            stmt = select(KBIngestionTask).where(
+                col(KBIngestionTask.task_id) == task_id,
+            )
+            result = await session.execute(stmt)
+            task = result.scalar_one_or_none()
+            return self._task_to_dict(task) if task is not None else None
+
+    @staticmethod
+    def _build_ingestion_task_conditions(
+        *,
+        kb_id: str | None = None,
+        status: str | None = None,
+        task_type: str | None = None,
+    ) -> list:
+        conditions = []
+        if kb_id is not None:
+            conditions.append(col(KBIngestionTask.kb_id) == kb_id)
+        if status is not None:
+            conditions.append(col(KBIngestionTask.status) == status)
+        if task_type is not None:
+            conditions.append(col(KBIngestionTask.task_type) == task_type)
+        return conditions
+
+    async def list_ingestion_tasks(
+        self,
+        *,
+        kb_id: str | None = None,
+        status: str | None = None,
+        task_type: str | None = None,
+        offset: int = 0,
+        limit: int = 100,
+    ) -> list[dict]:
+        conditions = self._build_ingestion_task_conditions(
+            kb_id=kb_id,
+            status=status,
+            task_type=task_type,
+        )
+
+        async with self.get_db() as session:
+            stmt = (
+                select(KBIngestionTask)
+                .where(*conditions)
+                .offset(offset)
+                .limit(limit)
+                .order_by(desc(KBIngestionTask.created_at))
+            )
+            result = await session.execute(stmt)
+            return [self._task_to_dict(task) for task in result.scalars().all()]
+
+    async def count_ingestion_tasks(
+        self,
+        *,
+        kb_id: str | None = None,
+        status: str | None = None,
+        task_type: str | None = None,
+    ) -> int:
+        conditions = self._build_ingestion_task_conditions(
+            kb_id=kb_id,
+            status=status,
+            task_type=task_type,
+        )
+        async with self.get_db() as session:
+            stmt = select(func.count(col(KBIngestionTask.id))).where(*conditions)
+            result = await session.execute(stmt)
+            return result.scalar() or 0
+
     # ===== 文档查询 =====
 
     async def get_document_by_id(self, doc_id: str) -> KBDocument | None:
@@ -232,17 +529,70 @@ async def get_document_by_id(self, doc_id: str) -> KBDocument | None:
             result = await session.execute(stmt)
             return result.scalar_one_or_none()
 
+    async def get_document_by_content_hash(
+        self,
+        *,
+        kb_id: str,
+        content_hash: str,
+    ) -> KBDocument | None:
+        """Return an existing active document with the same source content hash."""
+        async with self.get_db() as session:
+            stmt = (
+                select(KBDocument)
+                .where(
+                    col(KBDocument.kb_id) == kb_id,
+                    col(KBDocument.content_hash) == content_hash,
+                    col(KBDocument.status) != "failed",
+                )
+                .order_by(desc(KBDocument.created_at))
+                .limit(1)
+            )
+            result = await session.execute(stmt)
+            return result.scalar_one_or_none()
+
+    @staticmethod
+    def _build_document_filters(
+        *,
+        kb_id: str,
+        search: str | None = None,
+        status: str | None = None,
+        source_type: str | None = None,
+    ) -> list:
+        conditions = [col(KBDocument.kb_id) == kb_id]
+        if search:
+            pattern = f"%{search}%"
+            conditions.append(
+                or_(
+                    col(KBDocument.doc_name).ilike(pattern),
+                    col(KBDocument.file_type).ilike(pattern),
+                ),
+            )
+        if status:
+            conditions.append(col(KBDocument.status) == status)
+        if source_type:
+            conditions.append(col(KBDocument.source_type) == source_type)
+        return conditions
+
     async def list_documents_by_kb(
         self,
         kb_id: str,
         offset: int = 0,
         limit: int = 100,
+        search: str | None = None,
+        status: str | None = None,
+        source_type: str | None = None,
     ) -> list[KBDocument]:
         """列出知识库的所有文档"""
         async with self.get_db() as session:
+            conditions = self._build_document_filters(
+                kb_id=kb_id,
+                search=search,
+                status=status,
+                source_type=source_type,
+            )
             stmt = (
                 select(KBDocument)
-                .where(col(KBDocument.kb_id) == kb_id)
+                .where(*conditions)
                 .offset(offset)
                 .limit(limit)
                 .order_by(desc(KBDocument.created_at))
@@ -250,12 +600,22 @@ async def list_documents_by_kb(
             result = await session.execute(stmt)
             return list(result.scalars().all())
 
-    async def count_documents_by_kb(self, kb_id: str) -> int:
+    async def count_documents_by_kb(
+        self,
+        kb_id: str,
+        search: str | None = None,
+        status: str | None = None,
+        source_type: str | None = None,
+    ) -> int:
         """统计知识库的文档数量"""
         async with self.get_db() as session:
-            stmt = select(func.count(col(KBDocument.id))).where(
-                col(KBDocument.kb_id) == kb_id,
+            conditions = self._build_document_filters(
+                kb_id=kb_id,
+                search=search,
+                status=status,
+                source_type=source_type,
             )
+            stmt = select(func.count(col(KBDocument.id))).where(*conditions)
             result = await session.execute(stmt)
             return result.scalar() or 0
 
@@ -317,17 +677,98 @@ async def get_documents_with_metadata_batch(
 
         return metadata_map
 
-    async def delete_document_by_id(self, doc_id: str, vec_db: "FaissVecDB") -> None:
+    async def delete_document_by_id(
+        self,
+        doc_id: str,
+        vec_db: "FaissVecDB",
+        kb_id: str | None = None,
+    ) -> bool:
         """删除单个文档及其相关数据"""
-        # 在知识库表中删除
+        doc = await self.get_document_by_id(doc_id)
+        if not doc or (kb_id is not None and doc.kb_id != kb_id):
+            return False
+
+        metadata_filters = {"kb_doc_id": doc_id}
+        if kb_id is not None:
+            metadata_filters["kb_id"] = kb_id
+
+        # 先删向量库；如果失败，保留 metadata 以便重试/修复。
+        await vec_db.delete_documents(metadata_filters=metadata_filters)
+
         async with self.get_db() as session, session.begin():
-            # 删除文档记录
             delete_stmt = delete(KBDocument).where(col(KBDocument.doc_id) == doc_id)
+            if kb_id is not None:
+                delete_stmt = delete_stmt.where(col(KBDocument.kb_id) == kb_id)
             await session.execute(delete_stmt)
-            await session.commit()
+            await session.execute(delete(KBMedia).where(col(KBMedia.doc_id) == doc_id))
+
+        return True
+
+    async def delete_documents_by_ids(
+        self,
+        doc_ids: list[str],
+        vec_db: "FaissVecDB",
+        kb_id: str | None = None,
+    ) -> dict[str, bool]:
+        """批量删除文档及其向量数据。
+
+        先删除向量数据，再删除 metadata；单个文档的 vec_db 删除失败
+        不影响其他文档（best-effort），失败项保留 metadata 以便重试。
+        """
+        if not doc_ids:
+            return {}
+
+        requested_doc_ids = list(dict.fromkeys(doc_ids))
+        results = dict.fromkeys(requested_doc_ids, False)
+
+        candidates = requested_doc_ids
+        if kb_id is not None:
+            async with self.get_db() as session:
+                stmt = select(KBDocument.doc_id).where(
+                    col(KBDocument.doc_id).in_(requested_doc_ids),
+                    col(KBDocument.kb_id) == kb_id,
+                )
+                result = await session.execute(stmt)
+                candidates = [row[0] for row in result.fetchall()]
+
+        if not candidates:
+            return results
+
+        async def _delete_one(doc_id: str) -> tuple[str, bool]:
+            metadata_filters = {"kb_doc_id": doc_id}
+            if kb_id is not None:
+                metadata_filters["kb_id"] = kb_id
+            try:
+                await vec_db.delete_documents(metadata_filters=metadata_filters)
+                return doc_id, True
+            except Exception as e:
+                logger.error(
+                    f"删除文档 {doc_id} 的向量数据失败: {e}",
+                )
+                return doc_id, False
+
+        vec_results = await asyncio.gather(
+            *[_delete_one(doc_id) for doc_id in candidates],
+        )
+        successful_doc_ids = []
+        for doc_id, success in vec_results:
+            results[doc_id] = success
+            if success:
+                successful_doc_ids.append(doc_id)
+
+        if successful_doc_ids:
+            async with self.get_db() as session, session.begin():
+                delete_stmt = delete(KBDocument).where(
+                    col(KBDocument.doc_id).in_(successful_doc_ids),
+                )
+                if kb_id is not None:
+                    delete_stmt = delete_stmt.where(col(KBDocument.kb_id) == kb_id)
+                await session.execute(delete_stmt)
+                await session.execute(
+                    delete(KBMedia).where(col(KBMedia.doc_id).in_(successful_doc_ids)),
+                )
 
-        # 在 vec db 中删除相关向量
-        await vec_db.delete_documents(metadata_filters={"kb_doc_id": doc_id})
+        return results
 
     # ===== 多媒体查询 =====
 
@@ -347,7 +788,7 @@ async def get_media_by_id(self, media_id: str) -> KBMedia | None:
 
     async def update_kb_stats(self, kb_id: str, vec_db: "FaissVecDB") -> None:
         """更新知识库统计信息"""
-        chunk_cnt = await vec_db.count_documents()
+        chunk_cnt = await vec_db.count_documents(metadata_filter={"kb_id": kb_id})
 
         async with self.get_db() as session, session.begin():
             update_stmt = (
@@ -363,3 +804,84 @@ async def update_kb_stats(self, kb_id: str, vec_db: "FaissVecDB") -> None:
 
             await session.execute(update_stmt)
             await session.commit()
+
+    async def get_kb_stats(self, kb_id: str) -> dict | None:
+        """Return persisted document statistics for a knowledge base."""
+        async with self.get_db() as session:
+            kb_result = await session.execute(
+                select(KnowledgeBase).where(col(KnowledgeBase.kb_id) == kb_id),
+            )
+            kb = kb_result.scalar_one_or_none()
+            if kb is None:
+                return None
+
+            status_result = await session.execute(
+                select(KBDocument.status, func.count(col(KBDocument.id)))
+                .where(col(KBDocument.kb_id) == kb_id)
+                .group_by(KBDocument.status),
+            )
+            status_counts = {
+                status or "unknown": count for status, count in status_result.all()
+            }
+
+            chunk_result = await session.execute(
+                select(func.coalesce(func.sum(col(KBDocument.chunk_count)), 0)).where(
+                    col(KBDocument.kb_id) == kb_id,
+                ),
+            )
+            document_chunk_count = int(chunk_result.scalar() or 0)
+
+            media_result = await session.execute(
+                select(func.count(col(KBMedia.id))).where(col(KBMedia.kb_id) == kb_id),
+            )
+            media_count = int(media_result.scalar() or 0)
+            source_file_count_result = await session.execute(
+                select(func.count(col(KBDocument.id))).where(
+                    col(KBDocument.kb_id) == kb_id,
+                    col(KBDocument.source_type) == "file",
+                    col(KBDocument.file_path) != "",
+                ),
+            )
+            source_file_count = int(source_file_count_result.scalar() or 0)
+            document_storage_result = await session.execute(
+                select(func.coalesce(func.sum(col(KBDocument.file_size)), 0)).where(
+                    col(KBDocument.kb_id) == kb_id,
+                    col(KBDocument.file_path) != "",
+                ),
+            )
+            document_storage_bytes = int(document_storage_result.scalar() or 0)
+            media_storage_result = await session.execute(
+                select(func.coalesce(func.sum(col(KBMedia.file_size)), 0)).where(
+                    col(KBMedia.kb_id) == kb_id,
+                ),
+            )
+            media_storage_bytes = int(media_storage_result.scalar() or 0)
+
+            document_count = sum(status_counts.values())
+            ready_document_count = status_counts.get("ready", 0)
+            failed_document_count = status_counts.get("failed", 0)
+            pending_document_count = status_counts.get("pending", 0)
+            processing_document_count = sum(
+                status_counts.get(status, 0)
+                for status in ("parsing", "chunking", "embedding")
+            )
+
+            return {
+                "kb_id": kb.kb_id,
+                "kb_name": kb.kb_name,
+                "doc_count": kb.doc_count,
+                "chunk_count": kb.chunk_count,
+                "document_count": document_count,
+                "ready_document_count": ready_document_count,
+                "failed_document_count": failed_document_count,
+                "pending_document_count": pending_document_count,
+                "processing_document_count": processing_document_count,
+                "indexed_chunk_count": kb.chunk_count,
+                "document_chunk_count": document_chunk_count,
+                "media_count": media_count,
+                "source_file_count": source_file_count,
+                "storage_bytes": document_storage_bytes + media_storage_bytes,
+                "status_counts": status_counts,
+                "created_at": kb.created_at.isoformat(),
+                "updated_at": kb.updated_at.isoformat(),
+            }
diff --git a/astrbot/core/knowledge_base/kb_helper.py b/astrbot/core/knowledge_base/kb_helper.py
index c29e45876d..36a597bdf0 100644
--- a/astrbot/core/knowledge_base/kb_helper.py
+++ b/astrbot/core/knowledge_base/kb_helper.py
@@ -3,6 +3,7 @@
 import re
 import time
 import uuid
+from datetime import datetime, timezone
 from pathlib import Path
 from typing import TYPE_CHECKING
 
@@ -11,7 +12,6 @@
 from astrbot.core import logger
 from astrbot.core.db.vec_db.base import BaseVecDB
 from astrbot.core.exceptions import KnowledgeBaseUploadError
-from astrbot.core.provider.manager import ProviderManager
 from astrbot.core.provider.provider import (
     EmbeddingProvider,
     RerankProvider,
@@ -20,17 +20,59 @@
     Provider as LLMProvider,
 )
 
+from .capabilities import (
+    DEFAULT_CHUNK_OVERLAP,
+    DEFAULT_CHUNK_SIZE,
+    DEFAULT_UPLOAD_BATCH_SIZE,
+    DEFAULT_UPLOAD_MAX_RETRIES,
+    DEFAULT_UPLOAD_TASKS_LIMIT,
+)
 from .chunking.base import BaseChunker
 from .chunking.markdown import MarkdownChunker
 from .chunking.recursive import RecursiveCharacterChunker
+from .document_metadata import (
+    DEFAULT_CHUNKER_VERSION,
+    DEFAULT_PARSER_VERSION,
+    build_content_hash,
+    build_stored_source_path,
+    get_chunker_name,
+    get_parser_name,
+)
 from .kb_db_sqlite import KBSQLiteDatabase
 from .models import KBDocument, KBMedia, KnowledgeBase
-from .parsers.url_parser import extract_text_from_url
+from .parsers.base import TextSegment
+from .parsers.url_parser import URLExtractor, extract_text_from_url
 from .parsers.util import select_parser
 from .prompts import TEXT_REPAIR_SYSTEM_PROMPT
 
 if TYPE_CHECKING:
     from astrbot.core.db.vec_db.faiss_impl.vec_db import FaissVecDB
+    from astrbot.core.provider.manager import ProviderManager
+
+
+DOCUMENT_REBUILD_PAGE_SIZE = 100
+CONSISTENCY_CHECK_PAGE_SIZE = 1000
+CONSISTENCY_REPAIR_TYPES = frozenset(
+    {
+        "orphan_vectors",
+        "chunk_count_mismatches",
+    },
+)
+NON_PERSISTED_FAILURE_STAGES = frozenset({"deduplication"})
+MARKDOWN_AWARE_EXTENSIONS = frozenset(
+    {
+        ".adoc",
+        ".docx",
+        ".epub",
+        ".md",
+        ".markdown",
+        ".mdx",
+        ".mkd",
+        ".rst",
+        ".xls",
+        ".xlsx",
+    },
+)
 
 
 class RateLimiter:
@@ -40,18 +82,20 @@ def __init__(self, max_rpm: int) -> None:
         self.max_per_minute = max_rpm
         self.interval = 60.0 / max_rpm if max_rpm > 0 else 0
         self.last_call_time = 0
+        self._lock = asyncio.Lock()
 
     async def __aenter__(self):
         if self.interval == 0:
             return
 
-        now = time.monotonic()
-        elapsed = now - self.last_call_time
+        async with self._lock:
+            now = time.monotonic()
+            elapsed = now - self.last_call_time
 
-        if elapsed < self.interval:
-            await asyncio.sleep(self.interval - elapsed)
+            if elapsed < self.interval:
+                await asyncio.sleep(self.interval - elapsed)
 
-        self.last_call_time = time.monotonic()
+            self.last_call_time = time.monotonic()
 
     async def __aexit__(self, exc_type, exc_val, exc_tb):
         pass
@@ -114,6 +158,114 @@ def _compact_chunks(chunks: list[str]) -> list[str]:
     return [chunk.strip() for chunk in chunks if chunk and chunk.strip()]
 
 
+def _estimate_text_tokens(text: str) -> int:
+    chinese_count = sum(1 for char in text if "\u4e00" <= char <= "\u9fff")
+    other_count = len(text) - chinese_count
+    return int(chinese_count * 0.6 + other_count * 0.3)
+
+
+def _build_chunk_metadata(
+    *,
+    kb_id: str,
+    doc_id: str,
+    chunks_text: list[str],
+    chunk_ids: list[str],
+    chunk_extra_metadatas: list[dict] | None = None,
+) -> list[dict]:
+    if chunk_extra_metadatas is not None and len(chunk_extra_metadatas) != len(
+        chunks_text
+    ):
+        raise ValueError("chunk_extra_metadatas length must match chunks_text length")
+
+    metadatas = []
+    start_offset = 0
+    for idx, chunk_text in enumerate(chunks_text):
+        end_offset = start_offset + len(chunk_text)
+        metadata = {
+            "kb_id": kb_id,
+            "kb_doc_id": doc_id,
+            "chunk_index": idx,
+            "section_index": idx,
+            "content_hash": build_content_hash(chunk_text),
+            "char_count": len(chunk_text),
+            "token_count_estimate": _estimate_text_tokens(chunk_text),
+            "start_offset": start_offset,
+            "end_offset": end_offset,
+            "previous_chunk_id": chunk_ids[idx - 1] if idx > 0 else None,
+            "next_chunk_id": chunk_ids[idx + 1] if idx < len(chunk_ids) - 1 else None,
+        }
+        if chunk_extra_metadatas is not None:
+            metadata.update(chunk_extra_metadatas[idx])
+        metadatas.append(metadata)
+        start_offset = end_offset
+    return metadatas
+
+
+async def _chunk_text_with_metadata(
+    *,
+    chunker: BaseChunker,
+    text: str,
+    chunk_size: int,
+    chunk_overlap: int,
+    extra_metadata: dict | None = None,
+) -> tuple[list[str], list[dict] | None]:
+    chunks_text = await chunker.chunk(
+        text,
+        chunk_size=chunk_size,
+        chunk_overlap=chunk_overlap,
+    )
+    chunks_text = _compact_chunks(chunks_text)
+    if not chunks_text:
+        return [], [] if extra_metadata is not None else None
+    if extra_metadata is None:
+        return chunks_text, None
+    return chunks_text, [dict(extra_metadata) for _ in chunks_text]
+
+
+async def _chunk_text_segments_with_metadata(
+    *,
+    chunker: BaseChunker,
+    text_segments: list[TextSegment],
+    chunk_size: int,
+    chunk_overlap: int,
+) -> tuple[list[str], list[dict]]:
+    chunks_text: list[str] = []
+    chunk_extra_metadatas: list[dict] = []
+    for segment in text_segments:
+        segment_text = getattr(segment, "text", "")
+        segment_metadata = getattr(segment, "metadata", None) or {}
+        segment_chunks, segment_metadatas = await _chunk_text_with_metadata(
+            chunker=chunker,
+            text=segment_text,
+            chunk_size=chunk_size,
+            chunk_overlap=chunk_overlap,
+            extra_metadata=segment_metadata,
+        )
+        chunks_text.extend(segment_chunks)
+        chunk_extra_metadatas.extend(segment_metadatas or [])
+    return chunks_text, chunk_extra_metadatas
+
+
+def _build_duplicate_document_error(
+    *,
+    file_name: str,
+    content_hash: str,
+    existing_doc: KBDocument,
+) -> KnowledgeBaseUploadError:
+    return KnowledgeBaseUploadError(
+        stage="deduplication",
+        user_message=(
+            f"重复文档：{file_name} 与已存在文档 {existing_doc.doc_name} 内容相同。"
+        ),
+        details={
+            "file_name": file_name,
+            "content_hash": content_hash,
+            "existing_doc_id": existing_doc.doc_id,
+            "existing_doc_name": existing_doc.doc_name,
+        },
+    )
+
+
 class KBHelper:
     vec_db: BaseVecDB
     kb: KnowledgeBase
@@ -123,7 +275,7 @@ def __init__(
         self,
         kb_db: KBSQLiteDatabase,
         kb: KnowledgeBase,
-        provider_manager: ProviderManager,
+        provider_manager: "ProviderManager",
         kb_root_dir: str,
         chunker: BaseChunker,
     ) -> None:
@@ -133,6 +285,8 @@ def __init__(
         self.kb_root_dir = kb_root_dir
         self.chunker = chunker
         self.init_error = None
+        self.init_retry_count = 0
+        self.last_init_retry_at = 0.0
 
         self.kb_dir = Path(self.kb_root_dir) / self.kb.kb_id
         self.kb_medias_dir = Path(self.kb_dir) / "medias" / self.kb.kb_id
@@ -189,6 +343,7 @@ async def _ensure_vec_db(self) -> "FaissVecDB":
             index_store_path=str(self.kb_dir / "index.faiss"),
             embedding_provider=ep,
             rerank_provider=rp,
+            index_type=self.kb.index_type or "flat",
         )
         await vec_db.initialize()
         self.vec_db = vec_db
@@ -208,18 +363,162 @@ async def terminate(self) -> None:
         if hasattr(self, "vec_db") and self.vec_db:
             await self.vec_db.close()
 
+    async def _ensure_not_duplicate_document(
+        self,
+        *,
+        file_name: str,
+        content_hash: str | None,
+    ) -> None:
+        if not content_hash:
+            return
+        try:
+            existing_doc = await self.kb_db.get_document_by_content_hash(
+                kb_id=self.kb.kb_id,
+                content_hash=content_hash,
+            )
+        except KnowledgeBaseUploadError:
+            raise
+        except Exception as exc:
+            raise KnowledgeBaseUploadError(
+                stage="deduplication",
+                user_message=("重复检测失败：无法确认文档是否已存在，请稍后重试。"),
+                details={"file_name": file_name, "content_hash": content_hash},
+            ) from exc
+        if existing_doc is not None:
+            raise _build_duplicate_document_error(
+                file_name=file_name,
+                content_hash=content_hash,
+                existing_doc=existing_doc,
+            )
+
+    @staticmethod
+    def _get_upload_failure_stage(error: Exception) -> str:
+        if isinstance(error, KnowledgeBaseUploadError):
+            return error.stage
+        return "unknown"
+
+    async def _persist_failed_document(
+        self,
+        *,
+        doc_id: str,
+        file_name: str,
+        file_type: str,
+        file_size: int,
+        stored_file_path: Path | None,
+        source_type: str,
+        source_uri: str,
+        content_hash: str | None,
+        parser_name: str | None,
+        chunker_name: str | None,
+        parent_doc_id: str | None,
+        document_version: int,
+        error: Exception,
+    ) -> bool:
+        """Persist a failed document record for ingestion diagnostics."""
+        error_stage = self._get_upload_failure_stage(error)
+        if error_stage in NON_PERSISTED_FAILURE_STAGES:
+            return False
+
+        failed_doc = KBDocument(
+            doc_id=doc_id,
+            kb_id=self.kb.kb_id,
+            doc_name=file_name,
+            file_type=file_type,
+            file_size=file_size,
+            file_path=str(stored_file_path) if stored_file_path else "",
+            source_type=source_type,
+            source_uri=source_uri,
+            content_hash=content_hash,
+            parser_name=parser_name,
+            parser_version=DEFAULT_PARSER_VERSION if parser_name else None,
+            chunker_name=chunker_name,
+            chunker_version=DEFAULT_CHUNKER_VERSION if chunker_name else None,
+            status="failed",
+            error_stage=error_stage,
+            error_message=str(error).strip() or error.__class__.__name__,
+            version=document_version,
+            parent_doc_id=parent_doc_id,
+        )
+
+        try:
+            async with self.kb_db.get_db() as session:
+                async with session.begin():
+                    session.add(failed_doc)
+                    await session.commit()
+                await session.refresh(failed_doc)
+        except Exception as persist_err:
+            logger.warning(
+                f"记录失败文档 {doc_id} 的元数据失败: {persist_err}",
+            )
+            return False
+
+        try:
+            await self.kb_db.update_kb_stats(
+                kb_id=self.kb.kb_id,
+                vec_db=self.vec_db,  # type: ignore[arg-type]
+            )
+            await self.refresh_kb()
+            await self.refresh_document(doc_id)
+        except Exception as stats_err:
+            logger.warning(
+                f"刷新失败文档 {doc_id} 的知识库统计失败: {stats_err}",
+            )
+        return True
+
+    @staticmethod
+    def _build_url_file_name(url: str) -> str:
+        file_name = url.split("/")[-1] or f"document_from_{url}"
+        if not Path(file_name).suffix:
+            file_name += ".url"
+        return file_name
+
+    async def _persist_failed_url_document(
+        self,
+        *,
+        url: str,
+        text_content: str | None,
+        parent_doc_id: str | None,
+        document_version: int,
+        error: Exception,
+    ) -> bool:
+        return await self._persist_failed_document(
+            doc_id=str(uuid.uuid4()),
+            file_name=self._build_url_file_name(url),
+            file_type="url",
+            file_size=len(text_content) if text_content else 0,
+            stored_file_path=None,
+            source_type="url",
+            source_uri=url,
+            content_hash=(
+                build_content_hash(text_content) if text_content is not None else None
+            ),
+            parser_name=URLExtractor.__name__,
+            chunker_name=get_chunker_name(self.chunker),
+            parent_doc_id=parent_doc_id,
+            document_version=document_version,
+            error=error,
+        )
+
     async def upload_document(
         self,
         file_name: str,
         file_content: bytes | None,
         file_type: str,
-        chunk_size: int = 512,
-        chunk_overlap: int = 50,
-        batch_size: int = 32,
-        tasks_limit: int = 3,
-        max_retries: int = 3,
+        chunk_size: int = DEFAULT_CHUNK_SIZE,
+        chunk_overlap: int = DEFAULT_CHUNK_OVERLAP,
+        batch_size: int = DEFAULT_UPLOAD_BATCH_SIZE,
+        tasks_limit: int = DEFAULT_UPLOAD_TASKS_LIMIT,
+        max_retries: int = DEFAULT_UPLOAD_MAX_RETRIES,
         progress_callback=None,
         pre_chunked_text: list[str] | None = None,
+        source_type: str | None = None,
+        source_uri: str | None = None,
+        source_content_hash: str | None = None,
+        source_parser_name: str | None = None,
+        source_chunker_name: str | None = None,
+        parent_doc_id: str | None = None,
+        document_version: int = 1,
+        skip_duplicate_check: bool = False,
     ) -> KBDocument:
         """上传并处理文档（带原子性保证和失败清理）
 
@@ -242,20 +541,37 @@ async def upload_document(
         await self._ensure_vec_db()
         doc_id = str(uuid.uuid4())
         media_paths: list[Path] = []
+        stored_file_path: Path | None = None
         file_size = 0
-
-        # file_path = self.kb_files_dir / f"{doc_id}.{file_type}"
-        # async with aiofiles.open(file_path, "wb") as f:
-        #     await f.write(file_content)
+        vectors_stored = False  # 标记向量是否已写入, 用于失败回滚
+        metadata_stored = False
+        failed_metadata_stored = False
+        effective_source_type = source_type or (
+            "import" if pre_chunked_text is not None else "file"
+        )
+        effective_source_uri = source_uri or file_name
+        content_hash: str | None = source_content_hash
+        parser_name: str | None = source_parser_name
+        chunker_name: str | None = source_chunker_name
 
         try:
             chunks_text = []
+            chunk_extra_metadatas: list[dict] | None = None
             saved_media = []
 
             if pre_chunked_text is not None:
                 # 如果提供了预分块文本，直接使用
                 chunks_text = _compact_chunks(pre_chunked_text)
                 file_size = sum(len(chunk) for chunk in chunks_text)
+                if content_hash is None:
+                    content_hash = build_content_hash(chunks_text)
+                if chunker_name is None:
+                    chunker_name = "pre_chunked"
+                if not skip_duplicate_check:
+                    await self._ensure_not_duplicate_document(
+                        file_name=file_name,
+                        content_hash=content_hash,
+                    )
                 logger.info(f"使用预分块文本进行上传，共 {len(chunks_text)} 个块。")
             else:
                 # 否则，执行标准的文件解析和分块流程
@@ -265,6 +581,22 @@ async def upload_document(
                     )
 
                 file_size = len(file_content)
+                content_hash = build_content_hash(file_content)
+                if not skip_duplicate_check:
+                    await self._ensure_not_duplicate_document(
+                        file_name=file_name,
+                        content_hash=content_hash,
+                    )
+
+                stored_file_path = build_stored_source_path(
+                    self.kb_files_dir,
+                    doc_id=doc_id,
+                    file_name=file_name,
+                    file_type=file_type,
+                )
+                stored_file_path.parent.mkdir(parents=True, exist_ok=True)
+                async with aiofiles.open(stored_file_path, "wb") as f:
+                    await f.write(file_content)
 
                 # 阶段1: 解析文档
                 if progress_callback:
@@ -272,6 +604,7 @@ async def upload_document(
 
                 try:
                     parser = await select_parser(f".{file_type}")
+                    parser_name = get_parser_name(parser)
                     parse_result = await parser.parse(file_content, file_name)
                 except KnowledgeBaseUploadError:
                     raise
@@ -286,6 +619,7 @@ async def upload_document(
                     ) from exc
                 text_content = parse_result.text
                 media_items = parse_result.media
+                text_segments = getattr(parse_result, "text_segments", None)
                 if not text_content or not text_content.strip():
                     raise KnowledgeBaseUploadError(
                         stage="parsing",
@@ -316,24 +650,58 @@ async def upload_document(
                     await progress_callback("chunking", 0, 100)
 
                 try:
-                    # 根据文件类型选择分块器：Markdown 文件使用结构感知分块
+                    # Use structure-aware chunking for Markdown and MarkItDown output.
                     effective_chunker = self.chunker
                     file_ext = Path(file_name).suffix.lower() if file_name else ""
-                    if file_ext in (".md", ".markdown", ".mkd", ".mdx"):
+                    if file_ext in MARKDOWN_AWARE_EXTENSIONS:
                         effective_chunker = MarkdownChunker(
                             chunk_size=chunk_size,
                             chunk_overlap=chunk_overlap,
                         )
                         logger.info(
-                            f"检测到 Markdown 文件 '{file_name}'，使用 MarkdownChunker 进行结构化分块"
+                            f"检测到 Markdown 兼容文档 '{file_name}'，使用 MarkdownChunker 进行结构化分块"
                         )
 
-                    chunks_text = await effective_chunker.chunk(
-                        text_content,
-                        chunk_size=chunk_size,
-                        chunk_overlap=chunk_overlap,
-                    )
-                    chunks_text = _compact_chunks(chunks_text)
+                    chunker_name = get_chunker_name(effective_chunker)
+                    if isinstance(effective_chunker, MarkdownChunker):
+                        structured_chunks = await effective_chunker.chunk_with_metadata(
+                            text_content,
+                            chunk_size=chunk_size,
+                            chunk_overlap=chunk_overlap,
+                        )
+                        chunks_text = []
+                        chunk_extra_metadatas = []
+                        for chunk in structured_chunks:
+                            chunk_text = chunk.text.strip()
+                            if not chunk_text:
+                                continue
+                            chunks_text.append(chunk_text)
+                            chunk_extra_metadatas.append(
+                                {
+                                    "title_path": chunk.title_path,
+                                    "section_index": chunk.section_index,
+                                }
+                            )
+                    elif text_segments:
+                        (
+                            chunks_text,
+                            chunk_extra_metadatas,
+                        ) = await _chunk_text_segments_with_metadata(
+                            chunker=effective_chunker,
+                            text_segments=text_segments,
+                            chunk_size=chunk_size,
+                            chunk_overlap=chunk_overlap,
+                        )
+                    else:
+                        (
+                            chunks_text,
+                            chunk_extra_metadatas,
+                        ) = await _chunk_text_with_metadata(
+                            chunker=effective_chunker,
+                            text=text_content,
+                            chunk_size=chunk_size,
+                            chunk_overlap=chunk_overlap,
+                        )
                 except KnowledgeBaseUploadError:
                     raise
                 except Exception as exc:
@@ -363,16 +731,16 @@ async def upload_document(
                     )
 
             contents = []
-            metadatas = []
             for idx, chunk_text in enumerate(chunks_text):
                 contents.append(chunk_text)
-                metadatas.append(
-                    {
-                        "kb_id": self.kb.kb_id,
-                        "kb_doc_id": doc_id,
-                        "chunk_index": idx,
-                    },
-                )
+            chunk_ids = [str(uuid.uuid4()) for _ in chunks_text]
+            metadatas = _build_chunk_metadata(
+                kb_id=self.kb.kb_id,
+                doc_id=doc_id,
+                chunks_text=chunks_text,
+                chunk_ids=chunk_ids,
+                chunk_extra_metadatas=chunk_extra_metadatas,
+            )
 
             if progress_callback:
                 await progress_callback("chunking", 100, 100)
@@ -386,11 +754,13 @@ async def embedding_progress_callback(current, total) -> None:
                 await self.vec_db.insert_batch(
                     contents=contents,
                     metadatas=metadatas,
+                    ids=chunk_ids,
                     batch_size=batch_size,
                     tasks_limit=tasks_limit,
                     max_retries=max_retries,
                     progress_callback=embedding_progress_callback,
                 )
+                vectors_stored = True
             except KnowledgeBaseUploadError:
                 raise
             except Exception as exc:
@@ -407,10 +777,20 @@ async def embedding_progress_callback(current, total) -> None:
                 doc_name=file_name,
                 file_type=file_type,
                 file_size=file_size,
-                # file_path=str(file_path),
-                file_path="",
+                file_path=str(stored_file_path) if stored_file_path else "",
+                source_type=effective_source_type,
+                source_uri=effective_source_uri,
+                content_hash=content_hash,
+                parser_name=parser_name,
+                parser_version=DEFAULT_PARSER_VERSION if parser_name else None,
+                chunker_name=chunker_name,
+                chunker_version=DEFAULT_CHUNKER_VERSION if chunker_name else None,
+                status="ready",
+                indexed_at=datetime.now(timezone.utc),
+                version=document_version,
+                parent_doc_id=parent_doc_id,
                 chunk_count=len(chunks_text),
-                media_count=0,
+                media_count=len(saved_media),
             )
             try:
                 async with self.kb_db.get_db() as session:
@@ -419,6 +799,7 @@ async def embedding_progress_callback(current, total) -> None:
                         for media in saved_media:
                             session.add(media)
                         await session.commit()
+                        metadata_stored = True
 
                     await session.refresh(doc)
             except KnowledgeBaseUploadError:
@@ -453,15 +834,57 @@ async def embedding_progress_callback(current, total) -> None:
                 logger.warning(f"上传文档失败: {e}", extra={"details": e.details})
             else:
                 logger.error(f"上传文档失败: {e}", exc_info=True)
-            # if file_path.exists():
-            #     file_path.unlink()
 
-            for media_path in media_paths:
+            # 回滚已写入的向量, 防止孤数据
+            if vectors_stored and not metadata_stored:
                 try:
-                    if media_path.exists():
-                        media_path.unlink()
-                except Exception as me:
-                    logger.warning(f"清理多媒体文件失败 {media_path}: {me}")
+                    vec_db: FaissVecDB = self.vec_db  # type: ignore
+                    await vec_db.delete_documents(
+                        metadata_filters={"kb_doc_id": doc_id},
+                    )
+                    logger.info(f"已清理文档 {doc_id} 的孤数据向量")
+                except Exception as cleanup_err:
+                    logger.error(
+                        f"清理文档 {doc_id} 向量回滚失败: {cleanup_err}",
+                    )
+
+            if not metadata_stored:
+                failed_metadata_stored = await self._persist_failed_document(
+                    doc_id=doc_id,
+                    file_name=file_name,
+                    file_type=file_type,
+                    file_size=file_size,
+                    stored_file_path=stored_file_path,
+                    source_type=effective_source_type,
+                    source_uri=effective_source_uri,
+                    content_hash=content_hash,
+                    parser_name=parser_name,
+                    chunker_name=chunker_name,
+                    parent_doc_id=parent_doc_id,
+                    document_version=document_version,
+                    error=e,
+                )
+
+            if (
+                stored_file_path
+                and stored_file_path.exists()
+                and not metadata_stored
+                and not failed_metadata_stored
+            ):
+                try:
+                    stored_file_path.unlink()
+                    if stored_file_path.parent != self.kb_files_dir:
+                        stored_file_path.parent.rmdir()
+                except Exception as fe:
+                    logger.warning(f"清理原始文件失败 {stored_file_path}: {fe}")
+
+            if not metadata_stored:
+                for media_path in media_paths:
+                    try:
+                        if media_path.exists():
+                            media_path.unlink()
+                    except Exception as me:
+                        logger.warning(f"清理多媒体文件失败 {media_path}: {me}")
 
             raise
 
@@ -469,32 +892,379 @@ async def list_documents(
         self,
         offset: int = 0,
         limit: int = 100,
+        search: str | None = None,
+        status: str | None = None,
+        source_type: str | None = None,
     ) -> list[KBDocument]:
         """列出知识库的所有文档"""
-        docs = await self.kb_db.list_documents_by_kb(self.kb.kb_id, offset, limit)
+        docs = await self.kb_db.list_documents_by_kb(
+            self.kb.kb_id,
+            offset,
+            limit,
+            search,
+            status=status,
+            source_type=source_type,
+        )
         return docs
 
+    async def count_documents(
+        self,
+        search: str | None = None,
+        status: str | None = None,
+        source_type: str | None = None,
+    ) -> int:
+        """统计知识库的所有文档数量"""
+        return await self.kb_db.count_documents_by_kb(
+            self.kb.kb_id,
+            search,
+            status=status,
+            source_type=source_type,
+        )
+
     async def get_document(self, doc_id: str) -> KBDocument | None:
         """获取单个文档"""
         doc = await self.kb_db.get_document_by_id(doc_id)
+        if doc and doc.kb_id != self.kb.kb_id:
+            return None
         return doc
 
     async def delete_document(self, doc_id: str) -> None:
         """删除单个文档及其相关数据"""
-        await self.kb_db.delete_document_by_id(
+        doc = await self.get_document(doc_id)
+        if not doc:
+            raise ValueError(f"无法找到 ID 为 {doc_id} 的文档")
+        media_items = await self.kb_db.list_media_by_doc(doc_id)
+        deleted = await self.kb_db.delete_document_by_id(
             doc_id=doc_id,
             vec_db=self.vec_db,  # type: ignore
+            kb_id=self.kb.kb_id,
         )
+        if not deleted:
+            raise ValueError(f"无法找到 ID 为 {doc_id} 的文档")
+        self._cleanup_document_files(doc, media_items)
         await self.kb_db.update_kb_stats(
             kb_id=self.kb.kb_id,
             vec_db=self.vec_db,  # type: ignore
         )
         await self.refresh_kb()
 
+    async def delete_documents(self, doc_ids: list[str]) -> dict[str, bool]:
+        """批量删除文档，单次更新统计。
+
+        vec_db 删除失败不阻塞其他文档（best-effort）。
+        """
+        docs_by_id = {
+            doc_id: doc
+            for doc_id in dict.fromkeys(doc_ids)
+            if (doc := await self.get_document(doc_id)) is not None
+        }
+        media_by_doc_id = {
+            doc_id: await self.kb_db.list_media_by_doc(doc_id) for doc_id in docs_by_id
+        }
+        results = await self.kb_db.delete_documents_by_ids(
+            doc_ids=doc_ids,
+            vec_db=self.vec_db,  # type: ignore
+            kb_id=self.kb.kb_id,
+        )
+        for doc_id, deleted in results.items():
+            if deleted and doc_id in docs_by_id:
+                self._cleanup_document_files(
+                    docs_by_id[doc_id],
+                    media_by_doc_id.get(doc_id, []),
+                )
+        await self.kb_db.update_kb_stats(
+            kb_id=self.kb.kb_id,
+            vec_db=self.vec_db,  # type: ignore
+        )
+        await self.refresh_kb()
+        return results
+
+    async def rebuild_document(
+        self,
+        doc_id: str,
+        *,
+        chunk_size: int | None = None,
+        chunk_overlap: int | None = None,
+        batch_size: int = DEFAULT_UPLOAD_BATCH_SIZE,
+        tasks_limit: int = DEFAULT_UPLOAD_TASKS_LIMIT,
+        max_retries: int = DEFAULT_UPLOAD_MAX_RETRIES,
+        progress_callback=None,
+    ) -> KBDocument:
+        doc = await self.get_document(doc_id)
+        if not doc:
+            raise ValueError(f"无法找到 ID 为 {doc_id} 的文档")
+        next_version = (doc.version or 1) + 1
+        parent_doc_id = doc.parent_doc_id or doc.doc_id
+        effective_chunk_size = (
+            chunk_size
+            if chunk_size is not None
+            else self.kb.chunk_size or DEFAULT_CHUNK_SIZE
+        )
+        effective_chunk_overlap = (
+            chunk_overlap
+            if chunk_overlap is not None
+            else self.kb.chunk_overlap or DEFAULT_CHUNK_OVERLAP
+        )
+
+        if doc.source_type == "file" and doc.file_path:
+            source_path = Path(doc.file_path).resolve(strict=False)
+            files_root = self.kb_files_dir.resolve(strict=False)
+            if not source_path.is_relative_to(files_root) or not source_path.exists():
+                raise ValueError("无法找到可用于重建的原始文件")
+
+            rebuilt_doc = await self.upload_document(
+                file_name=doc.doc_name,
+                file_content=source_path.read_bytes(),
+                file_type=doc.file_type,
+                chunk_size=effective_chunk_size,
+                chunk_overlap=effective_chunk_overlap,
+                batch_size=batch_size,
+                tasks_limit=tasks_limit,
+                max_retries=max_retries,
+                progress_callback=progress_callback,
+                source_type=doc.source_type,
+                source_uri=doc.source_uri or doc.doc_name,
+                parent_doc_id=parent_doc_id,
+                document_version=next_version,
+                skip_duplicate_check=True,
+            )
+        elif doc.source_type == "url":
+            if not doc.source_uri:
+                raise ValueError("无法找到可用于重建的 URL 来源")
+            rebuilt_doc = await self.upload_from_url(
+                url=doc.source_uri,
+                chunk_size=effective_chunk_size,
+                chunk_overlap=effective_chunk_overlap,
+                batch_size=batch_size,
+                tasks_limit=tasks_limit,
+                max_retries=max_retries,
+                progress_callback=progress_callback,
+                parent_doc_id=parent_doc_id,
+                document_version=next_version,
+                skip_duplicate_check=True,
+            )
+        elif doc.source_type == "import":
+            imported_chunks = await self._get_import_rebuild_chunks(doc.doc_id)
+            if not imported_chunks:
+                raise ValueError("无法找到可用于重建的导入文本块")
+            rebuilt_doc = await self.upload_document(
+                file_name=doc.doc_name,
+                file_content=None,
+                file_type=doc.file_type,
+                chunk_size=effective_chunk_size,
+                chunk_overlap=effective_chunk_overlap,
+                batch_size=batch_size,
+                tasks_limit=tasks_limit,
+                max_retries=max_retries,
+                progress_callback=progress_callback,
+                pre_chunked_text=imported_chunks,
+                source_type="import",
+                source_uri=doc.source_uri or doc.doc_name,
+                source_content_hash=build_content_hash(imported_chunks),
+                source_chunker_name=doc.chunker_name or "pre_chunked",
+                parent_doc_id=parent_doc_id,
+                document_version=next_version,
+                skip_duplicate_check=True,
+            )
+        else:
+            raise ValueError("当前仅支持重建已保存原始文件、URL 或导入来源的文档")
+
+        try:
+            await self.delete_document(doc_id)
+        except Exception as exc:
+            try:
+                await self.delete_document(rebuilt_doc.doc_id)
+            except Exception as cleanup_exc:
+                logger.error(
+                    f"重建文档 {doc_id} 后清理新版本失败: {cleanup_exc}",
+                )
+            raise KnowledgeBaseUploadError(
+                stage="rebuild",
+                user_message=(
+                    "重建失败：新版本已生成，但替换旧文档时失败，已尝试回滚新版本。"
+                ),
+                details={
+                    "doc_id": doc_id,
+                    "new_doc_id": rebuilt_doc.doc_id,
+                },
+            ) from exc
+        return rebuilt_doc
+
+    async def _get_import_rebuild_chunks(self, doc_id: str) -> list[str]:
+        chunks: list[dict] = []
+        offset = 0
+        while True:
+            page = await self.get_chunks_by_doc_id(
+                doc_id,
+                offset=offset,
+                limit=DOCUMENT_REBUILD_PAGE_SIZE,
+            )
+            if not page:
+                break
+            chunks.extend(page)
+            if len(page) < DOCUMENT_REBUILD_PAGE_SIZE:
+                break
+            offset += DOCUMENT_REBUILD_PAGE_SIZE
+
+        chunks.sort(key=lambda chunk: int(chunk.get("chunk_index") or 0))
+        return [
+            chunk["content"]
+            for chunk in chunks
+            if isinstance(chunk.get("content"), str) and chunk["content"].strip()
+        ]
+
+    async def rebuild_all_documents(
+        self,
+        *,
+        chunk_size: int | None = None,
+        chunk_overlap: int | None = None,
+        batch_size: int = DEFAULT_UPLOAD_BATCH_SIZE,
+        tasks_limit: int = DEFAULT_UPLOAD_TASKS_LIMIT,
+        max_retries: int = DEFAULT_UPLOAD_MAX_RETRIES,
+        progress_callback=None,
+    ) -> dict:
+        docs: list[KBDocument] = []
+        offset = 0
+        while True:
+            page = await self.list_documents(
+                offset=offset,
+                limit=DOCUMENT_REBUILD_PAGE_SIZE,
+            )
+            docs.extend(page)
+            if len(page) < DOCUMENT_REBUILD_PAGE_SIZE:
+                break
+            offset += DOCUMENT_REBUILD_PAGE_SIZE
+
+        rebuilt_docs = []
+        failed_docs = []
+
+        total = len(docs)
+        for index, doc in enumerate(docs, start=1):
+            if progress_callback:
+                await progress_callback("rebuilding", index - 1, total)
+            try:
+                rebuilt = await self.rebuild_document(
+                    doc.doc_id,
+                    chunk_size=chunk_size,
+                    chunk_overlap=chunk_overlap,
+                    batch_size=batch_size,
+                    tasks_limit=tasks_limit,
+                    max_retries=max_retries,
+                    progress_callback=progress_callback,
+                )
+                rebuilt_docs.append(rebuilt.model_dump())
+            except Exception as e:
+                logger.error(f"重建文档 {doc.doc_id} 失败: {e}")
+                failed_docs.append(
+                    {
+                        "doc_id": doc.doc_id,
+                        "doc_name": doc.doc_name,
+                        "error": str(e),
+                    },
+                )
+
+        if progress_callback:
+            await progress_callback("rebuilding", total, total)
+
+        return {
+            "rebuilt": rebuilt_docs,
+            "failed": failed_docs,
+            "total": total,
+            "success_count": len(rebuilt_docs),
+            "failed_count": len(failed_docs),
+        }
+
+    async def rebuild_documents(
+        self,
+        doc_ids: list[str],
+        *,
+        chunk_size: int | None = None,
+        chunk_overlap: int | None = None,
+        batch_size: int = DEFAULT_UPLOAD_BATCH_SIZE,
+        tasks_limit: int = DEFAULT_UPLOAD_TASKS_LIMIT,
+        max_retries: int = DEFAULT_UPLOAD_MAX_RETRIES,
+        progress_callback=None,
+    ) -> dict:
+        rebuilt_docs = []
+        failed_docs = []
+        normalized_doc_ids = list(dict.fromkeys(doc_ids))
+
+        total = len(normalized_doc_ids)
+        for index, doc_id in enumerate(normalized_doc_ids, start=1):
+            if progress_callback:
+                await progress_callback("rebuilding", index - 1, total)
+            try:
+                rebuilt = await self.rebuild_document(
+                    doc_id,
+                    chunk_size=chunk_size,
+                    chunk_overlap=chunk_overlap,
+                    batch_size=batch_size,
+                    tasks_limit=tasks_limit,
+                    max_retries=max_retries,
+                    progress_callback=progress_callback,
+                )
+                rebuilt_docs.append(rebuilt.model_dump())
+            except Exception as e:
+                logger.error(f"重建文档 {doc_id} 失败: {e}")
+                failed_doc = await self.get_document(doc_id)
+                failed_docs.append(
+                    {
+                        "doc_id": doc_id,
+                        "doc_name": failed_doc.doc_name if failed_doc else doc_id,
+                        "error": str(e),
+                    },
+                )
+
+        if progress_callback:
+            await progress_callback("rebuilding", total, total)
+
+        return {
+            "rebuilt": rebuilt_docs,
+            "failed": failed_docs,
+            "total": total,
+            "success_count": len(rebuilt_docs),
+            "failed_count": len(failed_docs),
+        }
+
+    def _cleanup_document_files(
+        self,
+        doc: KBDocument,
+        media_items: list[KBMedia],
+    ) -> None:
+        file_paths: list[Path] = []
+        if doc.file_path:
+            file_paths.append(Path(doc.file_path))
+        file_paths.extend(Path(media.file_path) for media in media_items)
+
+        cleanup_roots = (
+            self.kb_files_dir.resolve(strict=False),
+            self.kb_medias_dir.resolve(strict=False),
+        )
+        for file_path in file_paths:
+            resolved_path = file_path.resolve(strict=False)
+            if not any(resolved_path.is_relative_to(root) for root in cleanup_roots):
+                logger.warning(
+                    f"跳过清理知识库目录外文件: {resolved_path}",
+                )
+                continue
+            try:
+                if resolved_path.exists():
+                    resolved_path.unlink()
+                    parent = resolved_path.parent
+                    if any(parent.is_relative_to(root) for root in cleanup_roots):
+                        try:
+                            parent.rmdir()
+                        except OSError:
+                            pass
+            except Exception as e:
+                logger.warning(f"清理知识库文件失败 {resolved_path}: {e}")
+
     async def delete_chunk(self, chunk_id: str, doc_id: str) -> None:
         """删除单个文本块及其相关数据"""
         vec_db: FaissVecDB = self.vec_db  # type: ignore
-        await vec_db.delete(chunk_id)
+        deleted = await vec_db.delete(chunk_id)
+        if not deleted:
+            raise ValueError(f"无法找到 ID 为 {chunk_id} 的文本块")
         await self.kb_db.update_kb_stats(
             kb_id=self.kb.kb_id,
             vec_db=self.vec_db,  # type: ignore
@@ -534,20 +1304,102 @@ async def get_chunks_by_doc_id(
             offset=offset,
             limit=limit,
         )
-        result = []
-        for chunk in chunks:
-            chunk_md = json.loads(chunk["metadata"])
-            result.append(
-                {
-                    "chunk_id": chunk["doc_id"],
-                    "doc_id": chunk_md["kb_doc_id"],
-                    "kb_id": chunk_md["kb_id"],
-                    "chunk_index": chunk_md["chunk_index"],
-                    "content": chunk["text"],
-                    "char_count": len(chunk["text"]),
-                },
+        return [self._format_chunk_response(chunk) for chunk in chunks]
+
+    async def search_chunks_by_doc_id(
+        self,
+        doc_id: str,
+        search: str | None = None,
+        offset: int = 0,
+        limit: int = 100,
+    ) -> tuple[list[dict], int]:
+        """Search or list chunks for one document with a matching total."""
+        if not search:
+            chunks = await self.get_chunks_by_doc_id(
+                doc_id=doc_id,
+                offset=offset,
+                limit=limit,
+            )
+            return chunks, await self.get_chunk_count_by_doc_id(doc_id)
+
+        vec_db: FaissVecDB = self.vec_db  # type: ignore
+        search_documents = getattr(vec_db.document_storage, "search_documents", None)
+        if search_documents is None:
+            return [], 0
+
+        result = await search_documents(
+            search,
+            metadata_filters={"kb_doc_id": doc_id},
+            offset=offset,
+            limit=limit,
+        )
+        if result is None:
+            return [], 0
+        chunks, total = result
+        return [self._format_chunk_response(chunk) for chunk in chunks], total
+
+    @staticmethod
+    def _format_chunk_response(chunk: dict) -> dict:
+        chunk_md = json.loads(chunk["metadata"])
+        char_count = chunk_md.get("char_count", len(chunk["text"]))
+        return {
+            "chunk_id": chunk["doc_id"],
+            "doc_id": chunk_md["kb_doc_id"],
+            "kb_id": chunk_md["kb_id"],
+            "chunk_index": chunk_md["chunk_index"],
+            "section_index": chunk_md.get("section_index"),
+            "content": chunk["text"],
+            "char_count": char_count,
+            "token_count_estimate": chunk_md.get("token_count_estimate"),
+            "content_hash": chunk_md.get("content_hash"),
+            "start_offset": chunk_md.get("start_offset"),
+            "end_offset": chunk_md.get("end_offset"),
+            "previous_chunk_id": chunk_md.get("previous_chunk_id"),
+            "next_chunk_id": chunk_md.get("next_chunk_id"),
+            "title_path": chunk_md.get("title_path"),
+            "page_number": chunk_md.get("page_number"),
+            "parent_chunk_id": chunk_md.get("parent_chunk_id"),
+        }
+
+    async def get_chunk_by_id(
+        self,
+        chunk_id: str,
+        doc_id: str | None = None,
+    ) -> dict | None:
+        """获取单个文本块及其元数据"""
+        vec_db: FaissVecDB = self.vec_db  # type: ignore
+        chunk = await vec_db.document_storage.get_document_by_doc_id(chunk_id)
+        if not chunk:
+            return None
+        formatted_chunk = self._format_chunk_response(chunk)
+        if doc_id and formatted_chunk["doc_id"] != doc_id:
+            return None
+        return formatted_chunk
+
+    async def get_chunk_context(self, chunk_id: str, doc_id: str) -> dict:
+        """获取文本块和相邻上下文块"""
+        current = await self.get_chunk_by_id(chunk_id, doc_id)
+        if not current:
+            raise ValueError(f"无法找到 ID 为 {chunk_id} 的文本块")
+
+        previous_chunk = None
+        next_chunk = None
+        if current.get("previous_chunk_id"):
+            previous_chunk = await self.get_chunk_by_id(
+                current["previous_chunk_id"],
+                doc_id,
+            )
+        if current.get("next_chunk_id"):
+            next_chunk = await self.get_chunk_by_id(
+                current["next_chunk_id"],
+                doc_id,
             )
-        return result
+
+        return {
+            "previous": previous_chunk,
+            "current": current,
+            "next": next_chunk,
+        }
 
     async def get_chunk_count_by_doc_id(self, doc_id: str) -> int:
         """获取文档的块数量"""
@@ -555,6 +1407,434 @@ async def get_chunk_count_by_doc_id(self, doc_id: str) -> int:
         count = await vec_db.count_documents(metadata_filter={"kb_doc_id": doc_id})
         return count
 
+    async def check_consistency(self) -> dict:
+        """Return a read-only consistency report for document metadata and chunks."""
+        docs = await self._list_all_documents_for_consistency()
+        doc_by_id = {doc.doc_id: doc for doc in docs}
+        stored_chunks = await self._list_all_chunks_for_consistency()
+
+        chunks_by_doc_id: dict[str, list[dict]] = {}
+        orphan_vectors: list[dict] = []
+        invalid_vector_metadata: list[dict] = []
+
+        for chunk in stored_chunks:
+            try:
+                metadata = self._parse_stored_chunk_metadata(chunk)
+            except ValueError as exc:
+                invalid_vector_metadata.append(
+                    self._format_vector_issue(chunk, metadata_error=str(exc)),
+                )
+                continue
+
+            doc_id = metadata.get("kb_doc_id")
+            if not isinstance(doc_id, str) or not doc_id:
+                invalid_vector_metadata.append(
+                    self._format_vector_issue(
+                        chunk,
+                        metadata=metadata,
+                        metadata_error="missing kb_doc_id",
+                    ),
+                )
+                continue
+
+            if doc_id not in doc_by_id:
+                orphan_vectors.append(
+                    self._format_vector_issue(chunk, metadata=metadata),
+                )
+                continue
+
+            chunks_by_doc_id.setdefault(doc_id, []).append(chunk)
+
+        missing_vectors: list[dict] = []
+        chunk_count_mismatches: list[dict] = []
+        for doc in docs:
+            expected_chunk_count = int(doc.chunk_count or 0)
+            actual_chunk_count = len(chunks_by_doc_id.get(doc.doc_id, []))
+            if expected_chunk_count > 0 and actual_chunk_count == 0:
+                missing_vectors.append(
+                    self._format_document_issue(
+                        doc,
+                        expected_chunk_count=expected_chunk_count,
+                        actual_chunk_count=actual_chunk_count,
+                    ),
+                )
+            if expected_chunk_count != actual_chunk_count:
+                chunk_count_mismatches.append(
+                    self._format_document_issue(
+                        doc,
+                        expected_chunk_count=expected_chunk_count,
+                        actual_chunk_count=actual_chunk_count,
+                    ),
+                )
+
+        missing_source_files, unsafe_source_paths, source_file_count = (
+            self._check_source_file_consistency(docs)
+        )
+
+        status_counts: dict[str, int] = {}
+        for doc in docs:
+            status = doc.status or "unknown"
+            status_counts[status] = status_counts.get(status, 0) + 1
+
+        issues = {
+            "missing_vectors": missing_vectors,
+            "orphan_vectors": orphan_vectors,
+            "missing_source_files": missing_source_files,
+            "chunk_count_mismatches": chunk_count_mismatches,
+            "invalid_vector_metadata": invalid_vector_metadata,
+            "unsafe_source_paths": unsafe_source_paths,
+        }
+        issue_counts = {name: len(items) for name, items in issues.items()}
+
+        return {
+            "kb_id": self.kb.kb_id,
+            "kb_name": self.kb.kb_name,
+            "checked_at": datetime.now(timezone.utc).isoformat(),
+            "summary": {
+                "sqlite_document_count": len(docs),
+                "ready_document_count": status_counts.get("ready", 0),
+                "failed_document_count": status_counts.get("failed", 0),
+                "document_chunk_count": sum(int(doc.chunk_count or 0) for doc in docs),
+                "indexed_chunk_count": len(stored_chunks),
+                "source_file_count": source_file_count,
+                "status_counts": status_counts,
+                **issue_counts,
+                "healthy": all(count == 0 for count in issue_counts.values()),
+            },
+            "issues": issues,
+        }
+
+    async def repair_consistency(
+        self,
+        repair_types: list[str] | None = None,
+    ) -> dict:
+        """Repair low-risk consistency issues and report skipped unsafe issues."""
+        selected_repair_types = self._normalize_consistency_repair_types(repair_types)
+        pre_check = await self.check_consistency()
+
+        repaired: list[dict] = []
+        skipped: list[dict] = []
+        failed: list[dict] = []
+
+        if "orphan_vectors" in selected_repair_types:
+            orphan_vectors = pre_check["issues"].get("orphan_vectors", [])
+            orphan_doc_ids = sorted(
+                {
+                    issue.get("doc_id")
+                    for issue in orphan_vectors
+                    if isinstance(issue.get("doc_id"), str) and issue.get("doc_id")
+                },
+            )
+            for doc_id in orphan_doc_ids:
+                issue_count = sum(
+                    1 for issue in orphan_vectors if issue.get("doc_id") == doc_id
+                )
+                try:
+                    await self.vec_db.delete_documents(  # type: ignore[attr-defined]
+                        metadata_filters={
+                            "kb_id": self.kb.kb_id,
+                            "kb_doc_id": doc_id,
+                        },
+                    )
+                    repaired.append(
+                        {
+                            "type": "orphan_vectors",
+                            "doc_id": doc_id,
+                            "count": issue_count,
+                            "action": "deleted_vectors",
+                        },
+                    )
+                except Exception as exc:
+                    failed.append(
+                        {
+                            "type": "orphan_vectors",
+                            "doc_id": doc_id,
+                            "count": issue_count,
+                            "action": "delete_vectors",
+                            "error": str(exc),
+                        },
+                    )
+
+        if "chunk_count_mismatches" in selected_repair_types:
+            for issue in pre_check["issues"].get("chunk_count_mismatches", []):
+                doc_id = issue.get("doc_id")
+                expected_count = int(issue.get("expected_chunk_count") or 0)
+                actual_count = int(issue.get("actual_chunk_count") or 0)
+                if not isinstance(doc_id, str) or not doc_id:
+                    skipped.append(
+                        {
+                            "type": "chunk_count_mismatches",
+                            "reason": "missing_doc_id",
+                            "issue": issue,
+                        },
+                    )
+                    continue
+
+                if expected_count > actual_count:
+                    skipped.append(
+                        {
+                            "type": "chunk_count_mismatches",
+                            "doc_id": doc_id,
+                            "reason": "missing_vectors_require_rebuild",
+                            "expected_chunk_count": expected_count,
+                            "actual_chunk_count": actual_count,
+                        },
+                    )
+                    continue
+
+                try:
+                    await self.refresh_document(doc_id)
+                    repaired.append(
+                        {
+                            "type": "chunk_count_mismatches",
+                            "doc_id": doc_id,
+                            "action": "refreshed_document_chunk_count",
+                            "expected_chunk_count": expected_count,
+                            "actual_chunk_count": actual_count,
+                        },
+                    )
+                except Exception as exc:
+                    failed.append(
+                        {
+                            "type": "chunk_count_mismatches",
+                            "doc_id": doc_id,
+                            "action": "refresh_document",
+                            "expected_chunk_count": expected_count,
+                            "actual_chunk_count": actual_count,
+                            "error": str(exc),
+                        },
+                    )
+
+        for issue_type in (
+            "missing_vectors",
+            "missing_source_files",
+            "invalid_vector_metadata",
+            "unsafe_source_paths",
+        ):
+            for issue in pre_check["issues"].get(issue_type, []):
+                skipped.append(
+                    {
+                        "type": issue_type,
+                        "doc_id": issue.get("doc_id"),
+                        "chunk_id": issue.get("chunk_id"),
+                        "reason": self._get_consistency_repair_skip_reason(
+                            issue_type,
+                        ),
+                        "issue": issue,
+                    },
+                )
+
+        if repaired or failed:
+            await self.kb_db.update_kb_stats(
+                kb_id=self.kb.kb_id,
+                vec_db=self.vec_db,  # type: ignore
+            )
+            await self.refresh_kb()
+
+        post_check = await self.check_consistency()
+        return {
+            "kb_id": self.kb.kb_id,
+            "kb_name": self.kb.kb_name,
+            "repaired_at": datetime.now(timezone.utc).isoformat(),
+            "repair_types": selected_repair_types,
+            "summary": {
+                "repaired_count": len(repaired),
+                "skipped_count": len(skipped),
+                "failed_count": len(failed),
+                "healthy_after_repair": post_check["summary"]["healthy"],
+            },
+            "actions": {
+                "repaired": repaired,
+                "skipped": skipped,
+                "failed": failed,
+            },
+            "pre_check": pre_check,
+            "post_check": post_check,
+        }
+
+    @staticmethod
+    def _normalize_consistency_repair_types(
+        repair_types: list[str] | None,
+    ) -> list[str]:
+        if repair_types is None:
+            return sorted(CONSISTENCY_REPAIR_TYPES)
+
+        normalized = list(
+            dict.fromkeys(
+                repair_type.strip()
+                for repair_type in repair_types
+                if isinstance(repair_type, str) and repair_type.strip()
+            ),
+        )
+        invalid_types = sorted(set(normalized) - CONSISTENCY_REPAIR_TYPES)
+        if invalid_types:
+            raise ValueError(
+                f"不支持的一致性修复类型: {', '.join(invalid_types)}",
+            )
+        return normalized
+
+    @staticmethod
+    def _get_consistency_repair_skip_reason(issue_type: str) -> str:
+        skip_reasons = {
+            "missing_vectors": "document_rebuild_required",
+            "missing_source_files": "source_file_missing_manual_action_required",
+            "invalid_vector_metadata": "invalid_metadata_manual_action_required",
+            "unsafe_source_paths": "unsafe_source_path_manual_action_required",
+        }
+        return skip_reasons.get(issue_type, "manual_action_required")
+
+    async def _list_all_documents_for_consistency(self) -> list[KBDocument]:
+        return await self._collect_paginated_documents(
+            page_size=CONSISTENCY_CHECK_PAGE_SIZE,
+        )
+
+    async def _list_all_chunks_for_consistency(self) -> list[dict]:
+        return await self._collect_paginated_vector_documents(
+            page_size=CONSISTENCY_CHECK_PAGE_SIZE,
+            unsupported_message="当前知识库存储后端不支持一致性检查",
+        )
+
+    @staticmethod
+    def _parse_stored_chunk_metadata(chunk: dict) -> dict:
+        raw_metadata = chunk.get("metadata")
+        if raw_metadata is None:
+            return {}
+        if isinstance(raw_metadata, dict):
+            return raw_metadata
+        try:
+            metadata = json.loads(raw_metadata)
+        except (TypeError, json.JSONDecodeError) as exc:
+            raise ValueError("invalid metadata JSON") from exc
+        if not isinstance(metadata, dict):
+            raise ValueError("metadata must be a JSON object")
+        return metadata
+
+    @staticmethod
+    def _format_vector_issue(
+        chunk: dict,
+        *,
+        metadata: dict | None = None,
+        metadata_error: str | None = None,
+    ) -> dict:
+        issue = {
+            "chunk_id": chunk.get("doc_id"),
+            "storage_id": chunk.get("id"),
+        }
+        if metadata:
+            issue.update(
+                {
+                    "doc_id": metadata.get("kb_doc_id"),
+                    "kb_id": metadata.get("kb_id"),
+                    "chunk_index": metadata.get("chunk_index"),
+                },
+            )
+        if metadata_error:
+            issue["metadata_error"] = metadata_error
+        return issue
+
+    @staticmethod
+    def _format_document_issue(
+        doc: KBDocument,
+        *,
+        expected_chunk_count: int | None = None,
+        actual_chunk_count: int | None = None,
+        reason: str | None = None,
+    ) -> dict:
+        issue = {
+            "doc_id": doc.doc_id,
+            "doc_name": doc.doc_name,
+            "status": doc.status,
+            "source_type": doc.source_type,
+            "file_path": doc.file_path,
+        }
+        if expected_chunk_count is not None:
+            issue["expected_chunk_count"] = expected_chunk_count
+        if actual_chunk_count is not None:
+            issue["actual_chunk_count"] = actual_chunk_count
+        if reason:
+            issue["reason"] = reason
+        return issue
+
+    def _check_source_file_consistency(
+        self,
+        docs: list[KBDocument],
+    ) -> tuple[list[dict], list[dict], int]:
+        missing_source_files: list[dict] = []
+        unsafe_source_paths: list[dict] = []
+        source_file_count = 0
+        files_root = self.kb_files_dir.resolve(strict=False)
+
+        for doc in docs:
+            if doc.source_type != "file":
+                continue
+
+            if not doc.file_path:
+                if doc.status == "ready":
+                    missing_source_files.append(
+                        self._format_document_issue(doc, reason="empty_file_path"),
+                    )
+                continue
+
+            file_path = Path(doc.file_path).resolve(strict=False)
+            if not file_path.is_relative_to(files_root):
+                unsafe_source_paths.append(
+                    self._format_document_issue(
+                        doc,
+                        reason="outside_kb_files_dir",
+                    ),
+                )
+                continue
+            if file_path.exists():
+                source_file_count += 1
+            else:
+                missing_source_files.append(
+                    self._format_document_issue(doc, reason="not_found"),
+                )
+
+        return missing_source_files, unsafe_source_paths, source_file_count
+
+    async def _collect_paginated_documents(self, *, page_size: int) -> list[KBDocument]:
+        docs: list[KBDocument] = []
+        offset = 0
+        while True:
+            page = await self.list_documents(
+                offset=offset,
+                limit=page_size,
+            )
+            docs.extend(page)
+            if len(page) < page_size:
+                break
+            offset += page_size
+        return docs
+
+    async def _collect_paginated_vector_documents(
+        self,
+        *,
+        page_size: int,
+        unsupported_message: str,
+    ) -> list[dict]:
+        document_storage = getattr(self.vec_db, "document_storage", None)
+        get_documents = getattr(document_storage, "get_documents", None)
+        if get_documents is None:
+            raise ValueError(unsupported_message)
+
+        chunks: list[dict] = []
+        offset = 0
+        while True:
+            page_result = get_documents(
+                metadata_filters={"kb_id": self.kb.kb_id},
+                offset=offset,
+                limit=page_size,
+            )
+            if not hasattr(page_result, "__await__"):
+                raise ValueError(unsupported_message)
+            page = await page_result
+            chunks.extend(page)
+            if len(page) < page_size:
+                break
+            offset += page_size
+        return chunks
+
     async def _save_media(
         self,
         doc_id: str,
@@ -589,14 +1869,17 @@ async def _save_media(
     async def upload_from_url(
         self,
         url: str,
-        chunk_size: int = 512,
-        chunk_overlap: int = 50,
-        batch_size: int = 32,
-        tasks_limit: int = 3,
-        max_retries: int = 3,
+        chunk_size: int = DEFAULT_CHUNK_SIZE,
+        chunk_overlap: int = DEFAULT_CHUNK_OVERLAP,
+        batch_size: int = DEFAULT_UPLOAD_BATCH_SIZE,
+        tasks_limit: int = DEFAULT_UPLOAD_TASKS_LIMIT,
+        max_retries: int = DEFAULT_UPLOAD_MAX_RETRIES,
         progress_callback=None,
         enable_cleaning: bool = False,
         cleaning_provider_id: str | None = None,
+        parent_doc_id: str | None = None,
+        document_version: int = 1,
+        skip_duplicate_check: bool = False,
     ) -> KBDocument:
         """从 URL 上传并处理文档（带原子性保证和失败清理）
         Args:
@@ -616,52 +1899,100 @@ async def upload_from_url(
             ValueError: 如果 URL 为空或无法提取内容
             IOError: 如果网络请求失败
         """
-        # 获取 Tavily API 密钥
-        config = self.prov_mgr.acm.default_conf
-        tavily_keys = config.get("provider_settings", {}).get(
-            "websearch_tavily_key", []
-        )
-        if not tavily_keys:
-            raise ValueError(
-                "Error: Tavily API key is not configured in provider_settings."
+        text_content: str | None = None
+        try:
+            # 获取 Tavily API 密钥
+            config = self.prov_mgr.acm.default_conf
+            tavily_keys = config.get("provider_settings", {}).get(
+                "websearch_tavily_key", []
             )
+            if not tavily_keys:
+                raise KnowledgeBaseUploadError(
+                    stage="configuration",
+                    user_message=(
+                        "URL 导入失败：Tavily API key 未配置。"
+                        "请先在 provider_settings 中配置 websearch_tavily_key。"
+                    ),
+                    details={"url": url},
+                )
 
-        # 阶段1: 从 URL 提取内容
-        if progress_callback:
-            await progress_callback("extracting", 0, 100)
+            # 阶段1: 从 URL 提取内容
+            if progress_callback:
+                await progress_callback("extracting", 0, 100)
 
-        try:
-            text_content = await extract_text_from_url(url, tavily_keys)
-        except Exception as e:
-            logger.error(f"Failed to extract content from URL {url}: {e}")
-            raise OSError(f"Failed to extract content from URL {url}: {e}") from e
+            try:
+                text_content = await extract_text_from_url(url, tavily_keys)
+            except KnowledgeBaseUploadError:
+                raise
+            except Exception as e:
+                logger.error(f"Failed to extract content from URL {url}: {e}")
+                raise KnowledgeBaseUploadError(
+                    stage="extracting",
+                    user_message=(
+                        "URL 导入失败：无法提取网页内容。"
+                        "请确认 URL 可访问且 Tavily 配置有效。"
+                    ),
+                    details={"url": url},
+                ) from e
 
-        if not text_content:
-            raise ValueError(f"No content extracted from URL: {url}")
+            if not text_content or not text_content.strip():
+                raise KnowledgeBaseUploadError(
+                    stage="extracting",
+                    user_message=(
+                        "URL 导入失败：未能从网页中提取可索引文本。"
+                        "请确认页面存在正文内容，或尝试更换 URL。"
+                    ),
+                    details={"url": url},
+                )
 
-        if progress_callback:
-            await progress_callback("extracting", 100, 100)
+            if progress_callback:
+                await progress_callback("extracting", 100, 100)
 
-        # 阶段2: (可选)清洗内容并分块
-        final_chunks = await self._clean_and_rechunk_content(
-            content=text_content,
-            url=url,
-            progress_callback=progress_callback,
-            enable_cleaning=enable_cleaning,
-            cleaning_provider_id=cleaning_provider_id,
-            chunk_size=chunk_size,
-            chunk_overlap=chunk_overlap,
-        )
+            # 阶段2: (可选)清洗内容并分块
+            try:
+                final_chunks = await self._clean_and_rechunk_content(
+                    content=text_content,
+                    url=url,
+                    progress_callback=progress_callback,
+                    enable_cleaning=enable_cleaning,
+                    cleaning_provider_id=cleaning_provider_id,
+                    chunk_size=chunk_size,
+                    chunk_overlap=chunk_overlap,
+                )
+            except KnowledgeBaseUploadError:
+                raise
+            except Exception as e:
+                stage = "cleaning" if enable_cleaning else "chunking"
+                raise KnowledgeBaseUploadError(
+                    stage=stage,
+                    user_message=(
+                        "URL 导入失败：网页内容切分失败。"
+                        "请稍后重试，或调整分块参数后再次导入。"
+                    ),
+                    details={"url": url},
+                ) from e
 
-        if enable_cleaning and not final_chunks:
-            raise ValueError(
-                "内容清洗后未提取到有效文本。请尝试关闭内容清洗功能，或更换更高性能的LLM模型后重试。"
+            if enable_cleaning and not final_chunks:
+                raise KnowledgeBaseUploadError(
+                    stage="cleaning",
+                    user_message=(
+                        "URL 导入失败：内容清洗后未提取到有效文本。"
+                        "请尝试关闭内容清洗功能，或更换更高性能的 LLM 模型后重试。"
+                    ),
+                    details={"url": url},
+                )
+        except Exception as e:
+            await self._persist_failed_url_document(
+                url=url,
+                text_content=text_content,
+                parent_doc_id=parent_doc_id,
+                document_version=document_version,
+                error=e,
             )
+            raise
 
         # 创建一个虚拟文件名
-        file_name = url.split("/")[-1] or f"document_from_{url}"
-        if not Path(file_name).suffix:
-            file_name += ".url"
+        file_name = self._build_url_file_name(url)
 
         # 复用现有的 upload_document 方法，但传入预分块文本
         return await self.upload_document(
@@ -675,6 +2006,14 @@ async def upload_from_url(
             max_retries=max_retries,
             progress_callback=progress_callback,
             pre_chunked_text=final_chunks,
+            source_type="url",
+            source_uri=url,
+            source_content_hash=build_content_hash(text_content),
+            source_parser_name=URLExtractor.__name__,
+            source_chunker_name=get_chunker_name(self.chunker),
+            parent_doc_id=parent_doc_id,
+            document_version=document_version,
+            skip_duplicate_check=skip_duplicate_check,
         )
 
     async def _clean_and_rechunk_content(
@@ -685,8 +2024,8 @@ async def _clean_and_rechunk_content(
         enable_cleaning: bool = False,
         cleaning_provider_id: str | None = None,
         repair_max_rpm: int = 60,
-        chunk_size: int = 512,
-        chunk_overlap: int = 50,
+        chunk_size: int = DEFAULT_CHUNK_SIZE,
+        chunk_overlap: int = DEFAULT_CHUNK_OVERLAP,
     ) -> list[str]:
         """
         对从 URL 获取的内容进行清洗、修复、翻译和重新分块。
diff --git a/astrbot/core/knowledge_base/kb_mgr.py b/astrbot/core/knowledge_base/kb_mgr.py
index 3285d42c79..dc1dab016e 100644
--- a/astrbot/core/knowledge_base/kb_mgr.py
+++ b/astrbot/core/knowledge_base/kb_mgr.py
@@ -1,22 +1,80 @@
+import asyncio
+import time
 from pathlib import Path
+from typing import TYPE_CHECKING
+
+from sqlalchemy import delete
+from sqlmodel import col
 
 from astrbot.core import logger
-from astrbot.core.provider.manager import ProviderManager
 from astrbot.core.utils.astrbot_path import get_astrbot_knowledge_base_path
 
 # from .chunking.fixed_size import FixedSizeChunker
+from .capabilities import (
+    DEFAULT_CHUNK_OVERLAP,
+    DEFAULT_CHUNK_SIZE,
+    DEFAULT_INDEX_TYPE,
+    DEFAULT_TOP_K_DENSE,
+    DEFAULT_TOP_K_SPARSE,
+    DEFAULT_TOP_M_FINAL,
+    DEFAULT_UPLOAD_BATCH_SIZE,
+    DEFAULT_UPLOAD_MAX_RETRIES,
+    DEFAULT_UPLOAD_TASKS_LIMIT,
+)
 from .chunking.recursive import RecursiveCharacterChunker
 from .kb_db_sqlite import KBSQLiteDatabase
 from .kb_helper import KBHelper
-from .models import KBDocument, KnowledgeBase
+from .models import (
+    KBDocument,
+    KBMedia,
+    KnowledgeBase,
+)
 from .retrieval.manager import RetrievalManager, RetrievalResult
 from .retrieval.rank_fusion import RankFusion
 from .retrieval.sparse_retriever import SparseRetriever
 
+if TYPE_CHECKING:
+    from astrbot.core.provider.manager import ProviderManager
+
 FILES_PATH = get_astrbot_knowledge_base_path()
 DB_PATH = Path(FILES_PATH) / "kb.db"
 """Knowledge Base storage root directory"""
 CHUNKER = RecursiveCharacterChunker()
+_UNSET = object()
+INIT_RETRY_COOLDOWN_SECONDS = 60.0
+INIT_RETRY_MAX_ATTEMPTS = 3
+VALID_INDEX_TYPES = {"flat", "hnsw"}
+
+
+def _validate_kb_options(
+    *,
+    chunk_size: int | None,
+    chunk_overlap: int | None,
+    top_k_dense: int | None,
+    top_k_sparse: int | None,
+    top_m_final: int | None,
+    index_type: str | None,
+) -> None:
+    if chunk_size is not None and chunk_size <= 0:
+        raise ValueError("chunk_size 必须大于 0")
+    if chunk_overlap is not None and chunk_overlap < 0:
+        raise ValueError("chunk_overlap 不能为负数")
+    if (
+        chunk_size is not None
+        and chunk_overlap is not None
+        and chunk_overlap >= chunk_size
+    ):
+        raise ValueError("chunk_overlap 必须小于 chunk_size")
+    if top_k_dense is not None and top_k_dense <= 0:
+        raise ValueError("top_k_dense 必须大于 0")
+    if top_k_sparse is not None and top_k_sparse <= 0:
+        raise ValueError("top_k_sparse 必须大于 0")
+    if top_m_final is not None and top_m_final <= 0:
+        raise ValueError("top_m_final 必须大于 0")
+    if index_type is not None and index_type not in VALID_INDEX_TYPES:
+        raise ValueError(
+            f"index_type 必须是 {', '.join(sorted(VALID_INDEX_TYPES))} 之一"
+        )
 
 
 class KnowledgeBaseManager:
@@ -25,13 +83,86 @@ class KnowledgeBaseManager:
 
     def __init__(
         self,
-        provider_manager: ProviderManager,
+        provider_manager: "ProviderManager",
     ) -> None:
         DB_PATH.parent.mkdir(parents=True, exist_ok=True)
         self.provider_manager = provider_manager
         self._session_deleted_callback_registered = False
 
         self.kb_insts: dict[str, KBHelper] = {}
+        self._kb_name_index: dict[str, str] = {}
+        self._kb_instances_lock = asyncio.Lock()
+
+    def _ensure_kb_name_index(self) -> None:
+        if not hasattr(self, "kb_insts"):
+            self.kb_insts = {}
+        if not hasattr(self, "_kb_name_index"):
+            self._kb_name_index = {}
+        known_ids = set(self.kb_insts)
+        self._kb_name_index = {
+            name: kb_id
+            for name, kb_id in self._kb_name_index.items()
+            if kb_id in known_ids
+        }
+        for kb_id, kb_helper in self.kb_insts.items():
+            self._kb_name_index[kb_helper.kb.kb_name] = kb_id
+
+    def _ensure_kb_instances_lock(self) -> asyncio.Lock:
+        if not hasattr(self, "_kb_instances_lock"):
+            self._kb_instances_lock = asyncio.Lock()
+        return self._kb_instances_lock
+
+    def _set_kb_instance(self, kb_id: str, kb_helper: KBHelper) -> None:
+        self._ensure_kb_name_index()
+        self.kb_insts[kb_id] = kb_helper
+        self._kb_name_index = {
+            name: indexed_kb_id
+            for name, indexed_kb_id in self._kb_name_index.items()
+            if indexed_kb_id != kb_id
+        }
+        self._kb_name_index[kb_helper.kb.kb_name] = kb_id
+
+    def _get_kb_unlocked(self, kb_id: str) -> KBHelper | None:
+        if not hasattr(self, "kb_insts"):
+            self.kb_insts = {}
+        return self.kb_insts.get(kb_id)
+
+    def _can_retry_helper_init(self, kb_helper: KBHelper) -> bool:
+        if not kb_helper.init_error:
+            return False
+        retry_count = getattr(kb_helper, "init_retry_count", 0)
+        if retry_count >= INIT_RETRY_MAX_ATTEMPTS:
+            return False
+        last_retry_at = getattr(kb_helper, "last_init_retry_at", 0.0)
+        return time.monotonic() - last_retry_at >= INIT_RETRY_COOLDOWN_SECONDS
+
+    async def _retry_helper_init_if_due(self, kb_helper: KBHelper) -> None:
+        if not self._can_retry_helper_init(kb_helper):
+            return
+
+        kb_helper.init_retry_count = getattr(kb_helper, "init_retry_count", 0) + 1
+        kb_helper.last_init_retry_at = time.monotonic()
+        try:
+            await kb_helper.initialize()
+            kb_helper.init_error = None
+            kb_helper.init_retry_count = 0
+            kb_helper.last_init_retry_at = 0.0
+        except Exception as e:
+            kb_helper.init_error = str(e)
+            logger.warning(
+                f"知识库 {kb_helper.kb.kb_name}({kb_helper.kb.kb_id}) "
+                f"第 {kb_helper.init_retry_count} 次重新初始化失败: {e}",
+                exc_info=True,
+            )
+
+    def _remove_kb_instance(self, kb_id: str) -> None:
+        self._ensure_kb_name_index()
+        self.kb_insts.pop(kb_id, None)
+        self._kb_name_index = {
+            name: indexed_kb_id
+            for name, indexed_kb_id in self._kb_name_index.items()
+            if indexed_kb_id != kb_id
+        }
 
     async def initialize(self) -> None:
         """初始化知识库模块"""
@@ -76,11 +207,13 @@ async def load_kbs(self) -> None:
                 await kb_helper.initialize()
             except Exception as e:
                 kb_helper.init_error = str(e)
+                kb_helper.init_retry_count = 0
+                kb_helper.last_init_retry_at = time.monotonic()
                 logger.error(
                     f"知识库 {record.kb_name}({record.kb_id}) 初始化失败: {e}",
                     exc_info=True,
                 )
-            self.kb_insts[record.kb_id] = kb_helper
+            self._set_kb_instance(record.kb_id, kb_helper)
 
     async def create_kb(
         self,
@@ -94,206 +227,335 @@ async def create_kb(
         top_k_dense: int | None = None,
         top_k_sparse: int | None = None,
         top_m_final: int | None = None,
+        index_type: str | None = None,
     ) -> KBHelper:
         """创建新的知识库实例"""
         if embedding_provider_id is None:
             raise ValueError("创建知识库时必须提供embedding_provider_id")
+        effective_chunk_size = (
+            chunk_size if chunk_size is not None else DEFAULT_CHUNK_SIZE
+        )
+        effective_chunk_overlap = (
+            chunk_overlap if chunk_overlap is not None else DEFAULT_CHUNK_OVERLAP
+        )
+        effective_top_k_dense = (
+            top_k_dense if top_k_dense is not None else DEFAULT_TOP_K_DENSE
+        )
+        effective_top_k_sparse = (
+            top_k_sparse if top_k_sparse is not None else DEFAULT_TOP_K_SPARSE
+        )
+        effective_top_m_final = (
+            top_m_final if top_m_final is not None else DEFAULT_TOP_M_FINAL
+        )
+        effective_index_type = (
+            index_type if index_type is not None else DEFAULT_INDEX_TYPE
+        )
+        _validate_kb_options(
+            chunk_size=effective_chunk_size,
+            chunk_overlap=effective_chunk_overlap,
+            top_k_dense=effective_top_k_dense,
+            top_k_sparse=effective_top_k_sparse,
+            top_m_final=effective_top_m_final,
+            index_type=effective_index_type,
+        )
         kb = KnowledgeBase(
             kb_name=kb_name,
             description=description,
             emoji=emoji or "📚",
             embedding_provider_id=embedding_provider_id,
             rerank_provider_id=rerank_provider_id,
-            chunk_size=chunk_size if chunk_size is not None else 512,
-            chunk_overlap=chunk_overlap if chunk_overlap is not None else 50,
-            top_k_dense=top_k_dense if top_k_dense is not None else 50,
-            top_k_sparse=top_k_sparse if top_k_sparse is not None else 50,
-            top_m_final=top_m_final if top_m_final is not None else 5,
+            chunk_size=effective_chunk_size,
+            chunk_overlap=effective_chunk_overlap,
+            top_k_dense=effective_top_k_dense,
+            top_k_sparse=effective_top_k_sparse,
+            top_m_final=effective_top_m_final,
+            index_type=effective_index_type,
         )
+        kb_helper: KBHelper | None = None
         try:
-            async with self.kb_db.get_db() as session:
-                session.add(kb)
-                await session.flush()
-
-                kb_helper = KBHelper(
-                    kb_db=self.kb_db,
-                    kb=kb,
-                    provider_manager=self.provider_manager,
-                    kb_root_dir=FILES_PATH,
-                    chunker=CHUNKER,
-                )
-                await kb_helper.initialize()
-                await session.commit()
-                self.kb_insts[kb.kb_id] = kb_helper
-                return kb_helper
+            async with self._ensure_kb_instances_lock():
+                async with self.kb_db.get_db() as session:
+                    session.add(kb)
+                    await session.flush()
+
+                    kb_helper = KBHelper(
+                        kb_db=self.kb_db,
+                        kb=kb,
+                        provider_manager=self.provider_manager,
+                        kb_root_dir=FILES_PATH,
+                        chunker=CHUNKER,
+                    )
+                    await kb_helper.initialize()
+                    await session.commit()
+                    self._set_kb_instance(kb.kb_id, kb_helper)
+                    return kb_helper
         except Exception as e:
+            if kb_helper is not None:
+                try:
+                    await kb_helper.delete_vec_db()
+                except Exception as cleanup_err:
+                    logger.warning(
+                        f"创建知识库 {kb_name} 失败后清理文件目录失败: {cleanup_err}",
+                    )
             if "kb_name" in str(e):
                 raise ValueError(f"知识库名称 '{kb_name}' 已存在")
             raise
 
     async def get_kb(self, kb_id: str) -> KBHelper | None:
         """获取知识库实例"""
-        if kb_id in self.kb_insts:
-            return self.kb_insts[kb_id]
+        async with self._ensure_kb_instances_lock():
+            kb_helper = self._get_kb_unlocked(kb_id)
+            if kb_helper is not None:
+                await self._retry_helper_init_if_due(kb_helper)
+            return kb_helper
 
     async def get_kb_by_name(self, kb_name: str) -> KBHelper | None:
         """通过名称获取知识库实例"""
-        for kb_helper in self.kb_insts.values():
-            if kb_helper.kb.kb_name == kb_name:
-                return kb_helper
-        return None
+        async with self._ensure_kb_instances_lock():
+            self._ensure_kb_name_index()
+            kb_id = self._kb_name_index.get(kb_name)
+            if kb_id:
+                return self.kb_insts.get(kb_id)
+            return None
 
     async def delete_kb(self, kb_id: str) -> bool:
         """删除知识库实例"""
-        kb_helper = await self.get_kb(kb_id)
-        if not kb_helper:
-            return False
+        async with self._ensure_kb_instances_lock():
+            kb_helper = self._get_kb_unlocked(kb_id)
+            if not kb_helper:
+                return False
 
-        await kb_helper.delete_vec_db()
-        async with self.kb_db.get_db() as session:
-            await session.delete(kb_helper.kb)
-            await session.commit()
+            async with self.kb_db.get_db() as session:
+                await session.execute(
+                    delete(KBMedia).where(col(KBMedia.kb_id) == kb_id)
+                )
+                await session.execute(
+                    delete(KBDocument).where(col(KBDocument.kb_id) == kb_id)
+                )
+                await session.execute(
+                    delete(KnowledgeBase).where(col(KnowledgeBase.kb_id) == kb_id)
+                )
+                await session.commit()
 
-        self.kb_insts.pop(kb_id, None)
-        return True
+            try:
+                await kb_helper.delete_vec_db()
+            except Exception as e:
+                logger.warning(
+                    f"知识库 {kb_id} 数据库记录已删除，但文件目录清理失败: {e}"
+                )
+
+            self._remove_kb_instance(kb_id)
+            return True
 
     async def list_kbs(self) -> list[KnowledgeBase]:
         """列出所有知识库实例"""
-        kbs = [kb_helper.kb for kb_helper in self.kb_insts.values()]
-        return kbs
+        async with self._ensure_kb_instances_lock():
+            kbs = [kb_helper.kb for kb_helper in self.kb_insts.values()]
+            return kbs
 
     async def update_kb(
         self,
         kb_id: str,
-        kb_name: str,
+        kb_name: str | None = None,
         description: str | None = None,
         emoji: str | None = None,
         embedding_provider_id: str | None = None,
-        rerank_provider_id: str | None = None,
+        rerank_provider_id: str | None | object = _UNSET,
         chunk_size: int | None = None,
         chunk_overlap: int | None = None,
         top_k_dense: int | None = None,
         top_k_sparse: int | None = None,
         top_m_final: int | None = None,
+        index_type: str | None = None,
     ) -> KBHelper | None:
         """更新知识库实例"""
-        kb_helper = await self.get_kb(kb_id)
-        if not kb_helper:
-            return None
-
-        kb = kb_helper.kb
-        previous_state = {
-            "kb_name": kb.kb_name,
-            "description": kb.description,
-            "emoji": kb.emoji,
-            "embedding_provider_id": kb.embedding_provider_id,
-            "rerank_provider_id": kb.rerank_provider_id,
-            "chunk_size": kb.chunk_size,
-            "chunk_overlap": kb.chunk_overlap,
-            "top_k_dense": kb.top_k_dense,
-            "top_k_sparse": kb.top_k_sparse,
-            "top_m_final": kb.top_m_final,
-        }
-        previous_init_error = kb_helper.init_error
-
-        if kb_name is not None:
-            kb.kb_name = kb_name
-        if description is not None:
-            kb.description = description
-        if emoji is not None:
-            kb.emoji = emoji
-        if embedding_provider_id is not None:
-            kb.embedding_provider_id = embedding_provider_id
-        kb.rerank_provider_id = rerank_provider_id  # 允许设置为 None
-        if chunk_size is not None:
-            kb.chunk_size = chunk_size
-        if chunk_overlap is not None:
-            kb.chunk_overlap = chunk_overlap
-        if top_k_dense is not None:
-            kb.top_k_dense = top_k_dense
-        if top_k_sparse is not None:
-            kb.top_k_sparse = top_k_sparse
-        if top_m_final is not None:
-            kb.top_m_final = top_m_final
-
-        # Build a new helper first. Keep current vec_db alive until new init succeeds.
-        new_helper = KBHelper(
-            kb_db=self.kb_db,
-            kb=kb,
-            provider_manager=self.provider_manager,
-            kb_root_dir=FILES_PATH,
-            chunker=CHUNKER,
-        )
-
-        try:
-            await new_helper.initialize()
-        except Exception as e:
-            # Roll back in-memory settings and keep current helper available.
-            kb.kb_name = previous_state["kb_name"]
-            kb.description = previous_state["description"]
-            kb.emoji = previous_state["emoji"]
-            kb.embedding_provider_id = previous_state["embedding_provider_id"]
-            kb.rerank_provider_id = previous_state["rerank_provider_id"]
-            kb.chunk_size = previous_state["chunk_size"]
-            kb.chunk_overlap = previous_state["chunk_overlap"]
-            kb.top_k_dense = previous_state["top_k_dense"]
-            kb.top_k_sparse = previous_state["top_k_sparse"]
-            kb.top_m_final = previous_state["top_m_final"]
-            kb_helper.init_error = previous_init_error
-            logger.error(
-                f"知识库 {kb.kb_name}({kb.kb_id}) 重新初始化失败，继续使用旧实例: {e}",
-                exc_info=True,
+        async with self._ensure_kb_instances_lock():
+            kb_helper = self._get_kb_unlocked(kb_id)
+            if not kb_helper:
+                return None
+
+            kb = kb_helper.kb
+            previous_state = {
+                "kb_name": kb.kb_name,
+                "description": kb.description,
+                "emoji": kb.emoji,
+                "embedding_provider_id": kb.embedding_provider_id,
+                "rerank_provider_id": kb.rerank_provider_id,
+                "chunk_size": kb.chunk_size,
+                "chunk_overlap": kb.chunk_overlap,
+                "top_k_dense": kb.top_k_dense,
+                "top_k_sparse": kb.top_k_sparse,
+                "top_m_final": kb.top_m_final,
+                "index_type": kb.index_type,
+            }
+            previous_init_error = kb_helper.init_error
+
+            candidate_state = previous_state.copy()
+            if kb_name is not None:
+                candidate_state["kb_name"] = kb_name
+            if description is not None:
+                candidate_state["description"] = description
+            if emoji is not None:
+                candidate_state["emoji"] = emoji
+            if embedding_provider_id is not None:
+                candidate_state["embedding_provider_id"] = embedding_provider_id
+            if rerank_provider_id is not _UNSET:
+                candidate_state["rerank_provider_id"] = rerank_provider_id
+            if chunk_size is not None:
+                candidate_state["chunk_size"] = chunk_size
+            if chunk_overlap is not None:
+                candidate_state["chunk_overlap"] = chunk_overlap
+            if top_k_dense is not None:
+                candidate_state["top_k_dense"] = top_k_dense
+            if top_k_sparse is not None:
+                candidate_state["top_k_sparse"] = top_k_sparse
+            if top_m_final is not None:
+                candidate_state["top_m_final"] = top_m_final
+            if index_type is not None:
+                candidate_state["index_type"] = index_type
+            _validate_kb_options(
+                chunk_size=candidate_state["chunk_size"],
+                chunk_overlap=candidate_state["chunk_overlap"],
+                top_k_dense=candidate_state["top_k_dense"],
+                top_k_sparse=candidate_state["top_k_sparse"],
+                top_m_final=candidate_state["top_m_final"],
+                index_type=candidate_state["index_type"],
+            )
+            kb.kb_name = candidate_state["kb_name"]
+            kb.description = candidate_state["description"]
+            kb.emoji = candidate_state["emoji"]
+            kb.embedding_provider_id = candidate_state["embedding_provider_id"]
+            kb.rerank_provider_id = candidate_state["rerank_provider_id"]  # type: ignore[assignment]
+            kb.chunk_size = candidate_state["chunk_size"]
+            kb.chunk_overlap = candidate_state["chunk_overlap"]
+            kb.top_k_dense = candidate_state["top_k_dense"]
+            kb.top_k_sparse = candidate_state["top_k_sparse"]
+            kb.top_m_final = candidate_state["top_m_final"]
+            kb.index_type = candidate_state["index_type"]
+
+            # Build a new helper first. Keep current vec_db alive until new init succeeds.
+            new_helper = KBHelper(
+                kb_db=self.kb_db,
+                kb=kb,
+                provider_manager=self.provider_manager,
+                kb_root_dir=FILES_PATH,
+                chunker=CHUNKER,
             )
-            return kb_helper
 
-        async with self.kb_db.get_db() as session:
-            session.add(kb)
-            await session.commit()
-            await session.refresh(kb)
+            try:
+                await new_helper.initialize()
+            except Exception as e:
+                # Roll back in-memory settings and keep current helper available.
+                kb.kb_name = previous_state["kb_name"]
+                kb.description = previous_state["description"]
+                kb.emoji = previous_state["emoji"]
+                kb.embedding_provider_id = previous_state["embedding_provider_id"]
+                kb.rerank_provider_id = previous_state["rerank_provider_id"]
+                kb.chunk_size = previous_state["chunk_size"]
+                kb.chunk_overlap = previous_state["chunk_overlap"]
+                kb.top_k_dense = previous_state["top_k_dense"]
+                kb.top_k_sparse = previous_state["top_k_sparse"]
+                kb.top_m_final = previous_state["top_m_final"]
+                kb.index_type = previous_state["index_type"]
+                kb_helper.init_error = previous_init_error
+                logger.error(
+                    f"知识库 {kb.kb_name}({kb.kb_id}) 重新初始化失败，继续使用旧实例: {e}",
+                    exc_info=True,
+                )
+                return kb_helper
+
+            async with self.kb_db.get_db() as session:
+                session.add(kb)
+                await session.commit()
+                await session.refresh(kb)
 
-        old_helper = kb_helper
-        self.kb_insts[kb_id] = new_helper
-        await old_helper.terminate()
-        new_helper.init_error = None
-        return new_helper
+            old_helper = kb_helper
+            self._set_kb_instance(kb_id, new_helper)
+            await old_helper.terminate()
+            new_helper.init_error = None
+            return new_helper
 
     async def retrieve(
         self,
         query: str,
-        kb_names: list[str],
+        kb_names: list[str] | None = None,
+        kb_ids: list[str] | None = None,
         top_k_fusion: int = 20,
-        top_m_final: int = 5,
+        top_m_final: int = DEFAULT_TOP_M_FINAL,
+        include_trace: bool = False,
+        retrieval_overrides: dict | None = None,
     ) -> dict | None:
         """从指定知识库中检索相关内容"""
-        kb_ids = []
+        resolved_kb_ids = []
         kb_id_helper_map = {}
         unavailable_kbs = []
-        for kb_name in kb_names:
-            if kb_helper := await self.get_kb_by_name(kb_name):
-                if kb_helper.init_error:
-                    unavailable_kbs.append((kb_name, kb_helper.init_error))
-                    logger.warning(f"知识库 {kb_name} 不可用: {kb_helper.init_error}")
-                    continue
-                kb_ids.append(kb_helper.kb.kb_id)
-                kb_id_helper_map[kb_helper.kb.kb_id] = kb_helper
+        if kb_ids:
+            for kb_id in kb_ids:
+                if kb_helper := await self.get_kb(kb_id):
+                    if kb_helper.init_error:
+                        unavailable_kbs.append((kb_id, kb_helper.init_error))
+                        logger.warning(f"知识库 {kb_id} 不可用: {kb_helper.init_error}")
+                        continue
+                    resolved_kb_ids.append(kb_helper.kb.kb_id)
+                    kb_id_helper_map[kb_helper.kb.kb_id] = kb_helper
+        elif kb_names:
+            for kb_name in kb_names:
+                if kb_helper := await self.get_kb_by_name(kb_name):
+                    if kb_helper.init_error:
+                        unavailable_kbs.append((kb_name, kb_helper.init_error))
+                        logger.warning(
+                            f"知识库 {kb_name} 不可用: {kb_helper.init_error}",
+                        )
+                        continue
+                    resolved_kb_ids.append(kb_helper.kb.kb_id)
+                    kb_id_helper_map[kb_helper.kb.kb_id] = kb_helper
+        else:
+            return {}
 
         # all requested KBs are unavailable
-        if not kb_ids and unavailable_kbs:
+        if not resolved_kb_ids and unavailable_kbs:
             errors = "; ".join(f"{n}: {e}" for n, e in unavailable_kbs)
             raise ValueError(f"所有请求的知识库均不可用: {errors}")
 
-        if not kb_ids:
+        if not resolved_kb_ids:
             return {}
 
-        results = await self.retrieval_manager.retrieve(
-            query=query,
-            kb_ids=kb_ids,
-            kb_id_helper_map=kb_id_helper_map,
-            top_k_fusion=top_k_fusion,
-            top_m_final=top_m_final,
-        )
+        trace_payload = None
+        if include_trace:
+            retrieval_response = await self.retrieval_manager.retrieve_with_trace(
+                query=query,
+                kb_ids=resolved_kb_ids,
+                kb_id_helper_map=kb_id_helper_map,
+                top_k_fusion=top_k_fusion,
+                top_m_final=top_m_final,
+                retrieval_overrides=retrieval_overrides,
+            )
+            results = retrieval_response.results
+            trace_payload = retrieval_response.trace.to_dict()
+        else:
+            results = await self.retrieval_manager.retrieve(
+                query=query,
+                kb_ids=resolved_kb_ids,
+                kb_id_helper_map=kb_id_helper_map,
+                top_k_fusion=top_k_fusion,
+                top_m_final=top_m_final,
+                retrieval_overrides=retrieval_overrides,
+            )
         if not results:
-            return None
+            empty_response = {
+                "context_text": "",
+                "results": [],
+            }
+            if include_trace:
+                empty_response["trace"] = trace_payload or {
+                    "dense": [],
+                    "sparse": [],
+                    "fusion": [],
+                    "dedup": [],
+                    "rerank": [],
+                    "final": [],
+                }
+            return empty_response if include_trace else None
 
         context_text = self._format_context(results)
 
@@ -305,6 +567,7 @@ async def retrieve(
                 "kb_name": r.kb_name,
                 "doc_name": r.doc_name,
                 "chunk_index": r.metadata.get("chunk_index", 0),
+                "source": self._format_result_source(r),
                 "content": r.content,
                 "score": r.score,
                 "char_count": r.metadata.get("char_count", 0),
@@ -312,10 +575,40 @@ async def retrieve(
             for r in results
         ]
 
-        return {
+        response = {
             "context_text": context_text,
             "results": results_dict,
         }
+        if include_trace:
+            response["trace"] = trace_payload
+        return response
+
+    def _format_result_source(self, result: RetrievalResult) -> dict:
+        return {
+            "kb_name": result.kb_name,
+            "document_name": result.doc_name,
+            "chunk_index": result.metadata.get("chunk_index", 0),
+            "section_index": result.metadata.get("section_index"),
+            "title_path": result.metadata.get("title_path"),
+            "page_number": result.metadata.get("page_number"),
+            "parent_chunk_id": result.metadata.get("parent_chunk_id"),
+        }
+
+    def _format_source_label(self, result: RetrievalResult) -> str:
+        source = self._format_result_source(result)
+        details = []
+        title_path = source.get("title_path")
+        if isinstance(title_path, list) and title_path:
+            details.append(" > ".join(str(title) for title in title_path))
+        if source.get("page_number") is not None:
+            details.append(f"第 {source['page_number']} 页")
+        if source.get("section_index") is not None:
+            details.append(f"章节 {source['section_index']}")
+
+        base = f"{result.kb_name} / {result.doc_name}"
+        if details:
+            return f"{base} ({'; '.join(details)})"
+        return base
 
     def _format_context(self, results: list[RetrievalResult]) -> str:
         """格式化知识上下文
@@ -331,7 +624,7 @@ def _format_context(self, results: list[RetrievalResult]) -> str:
 
         for i, result in enumerate(results, 1):
             lines.append(f"【知识 {i}】")
-            lines.append(f"来源: {result.kb_name} / {result.doc_name}")
+            lines.append(f"来源: {self._format_source_label(result)}")
             lines.append(f"内容: {result.content}")
             lines.append(f"相关度: {result.score:.2f}")
             lines.append("")
@@ -359,11 +652,11 @@ async def upload_from_url(
         self,
         kb_id: str,
         url: str,
-        chunk_size: int = 512,
-        chunk_overlap: int = 50,
-        batch_size: int = 32,
-        tasks_limit: int = 3,
-        max_retries: int = 3,
+        chunk_size: int = DEFAULT_CHUNK_SIZE,
+        chunk_overlap: int = DEFAULT_CHUNK_OVERLAP,
+        batch_size: int = DEFAULT_UPLOAD_BATCH_SIZE,
+        tasks_limit: int = DEFAULT_UPLOAD_TASKS_LIMIT,
+        max_retries: int = DEFAULT_UPLOAD_MAX_RETRIES,
         progress_callback=None,
     ) -> KBDocument:
         """从 URL 上传文档到指定的知识库
diff --git a/astrbot/core/knowledge_base/models.py b/astrbot/core/knowledge_base/models.py
index da919a384a..cd0e8290f0 100644
--- a/astrbot/core/knowledge_base/models.py
+++ b/astrbot/core/knowledge_base/models.py
@@ -3,6 +3,15 @@
 
 from sqlmodel import Field, MetaData, SQLModel, Text, UniqueConstraint
 
+from .capabilities import (
+    DEFAULT_CHUNK_OVERLAP,
+    DEFAULT_CHUNK_SIZE,
+    DEFAULT_INDEX_TYPE,
+    DEFAULT_TOP_K_DENSE,
+    DEFAULT_TOP_K_SPARSE,
+    DEFAULT_TOP_M_FINAL,
+)
+
 
 class BaseKBModel(SQLModel, table=False):
     metadata = MetaData()
@@ -34,12 +43,14 @@ class KnowledgeBase(BaseKBModel, table=True):
     embedding_provider_id: str | None = Field(default=None, max_length=100)
     rerank_provider_id: str | None = Field(default=None, max_length=100)
     # 分块配置参数
-    chunk_size: int | None = Field(default=512, nullable=True)
-    chunk_overlap: int | None = Field(default=50, nullable=True)
+    chunk_size: int | None = Field(default=DEFAULT_CHUNK_SIZE, nullable=True)
+    chunk_overlap: int | None = Field(default=DEFAULT_CHUNK_OVERLAP, nullable=True)
+    # 索引类型: "flat" (精确) 或 "hnsw" (近似最近邻，适合大规模)
+    index_type: str | None = Field(default=DEFAULT_INDEX_TYPE, max_length=10)
     # 检索配置参数
-    top_k_dense: int | None = Field(default=50, nullable=True)
-    top_k_sparse: int | None = Field(default=50, nullable=True)
-    top_m_final: int | None = Field(default=5, nullable=True)
+    top_k_dense: int | None = Field(default=DEFAULT_TOP_K_DENSE, nullable=True)
+    top_k_sparse: int | None = Field(default=DEFAULT_TOP_K_SPARSE, nullable=True)
+    top_m_final: int | None = Field(default=DEFAULT_TOP_M_FINAL, nullable=True)
     created_at: datetime = Field(default_factory=lambda: datetime.now(timezone.utc))
     updated_at: datetime = Field(
         default_factory=lambda: datetime.now(timezone.utc),
@@ -81,6 +92,18 @@ class KBDocument(BaseKBModel, table=True):
     file_type: str = Field(max_length=20, nullable=False)
     file_size: int = Field(nullable=False)
     file_path: str = Field(max_length=512, nullable=False)
+    source_type: str = Field(default="file", max_length=20, nullable=False)
+    source_uri: str | None = Field(default=None, sa_type=Text)
+    content_hash: str | None = Field(default=None, max_length=64, index=True)
+    parser_name: str | None = Field(default=None, max_length=100)
+    parser_version: str | None = Field(default=None, max_length=50)
+    chunker_name: str | None = Field(default=None, max_length=100)
+    chunker_version: str | None = Field(default=None, max_length=50)
+    status: str = Field(default="ready", max_length=20, nullable=False, index=True)
+    error_stage: str | None = Field(default=None, max_length=50)
+    error_message: str | None = Field(default=None, sa_type=Text)
+    version: int = Field(default=1, nullable=False)
+    parent_doc_id: str | None = Field(default=None, max_length=36, index=True)
     chunk_count: int = Field(default=0, nullable=False)
     media_count: int = Field(default=0, nullable=False)
     created_at: datetime = Field(default_factory=lambda: datetime.now(timezone.utc))
@@ -88,6 +111,7 @@ class KBDocument(BaseKBModel, table=True):
         default_factory=lambda: datetime.now(timezone.utc),
         sa_column_kwargs={"onupdate": datetime.now(timezone.utc)},
     )
+    indexed_at: datetime | None = Field(default=None)
 
 
 class KBMedia(BaseKBModel, table=True):
@@ -118,3 +142,36 @@ class KBMedia(BaseKBModel, table=True):
     file_size: int = Field(nullable=False)
     mime_type: str = Field(max_length=100, nullable=False)
     created_at: datetime = Field(default_factory=lambda: datetime.now(timezone.utc))
+
+
+class KBIngestionTask(BaseKBModel, table=True):
+    """Persistent knowledge-base ingestion task state."""
+
+    __tablename__ = "kb_ingestion_tasks"  # type: ignore
+
+    id: int | None = Field(
+        primary_key=True,
+        sa_column_kwargs={"autoincrement": True},
+        default=None,
+    )
+    task_id: str = Field(
+        max_length=36,
+        nullable=False,
+        unique=True,
+        default_factory=lambda: str(uuid.uuid4()),
+        index=True,
+    )
+    kb_id: str = Field(max_length=36, nullable=False, index=True)
+    task_type: str = Field(max_length=30, nullable=False, index=True)
+    status: str = Field(default="pending", max_length=20, nullable=False, index=True)
+    progress_stage: str | None = Field(default=None, max_length=50)
+    progress_current: int = Field(default=0, nullable=False)
+    progress_total: int = Field(default=100, nullable=False)
+    progress: str | None = Field(default=None, sa_type=Text)
+    result: str | None = Field(default=None, sa_type=Text)
+    error: str | None = Field(default=None, sa_type=Text)
+    created_at: datetime = Field(default_factory=lambda: datetime.now(timezone.utc))
+    updated_at: datetime = Field(
+        default_factory=lambda: datetime.now(timezone.utc),
+        sa_column_kwargs={"onupdate": datetime.now(timezone.utc)},
+    )
diff --git a/astrbot/core/knowledge_base/parsers/base.py b/astrbot/core/knowledge_base/parsers/base.py
index 4ffca9c6f2..c204adcfeb 100644
--- a/astrbot/core/knowledge_base/parsers/base.py
+++ b/astrbot/core/knowledge_base/parsers/base.py
@@ -20,6 +20,14 @@ class MediaItem:
     mime_type: str
 
 
+@dataclass
+class TextSegment:
+    """Parsed text segment with optional source location metadata."""
+
+    text: str
+    metadata: dict
+
+
 @dataclass
 class ParseResult:
     """解析结果
@@ -29,6 +37,7 @@ class ParseResult:
 
     text: str
     media: list[MediaItem]
+    text_segments: list[TextSegment] | None = None
 
 
 class BaseParser(ABC):
diff --git a/astrbot/core/knowledge_base/parsers/pdf_parser.py b/astrbot/core/knowledge_base/parsers/pdf_parser.py
index aeeea930a2..811341f25c 100644
--- a/astrbot/core/knowledge_base/parsers/pdf_parser.py
+++ b/astrbot/core/knowledge_base/parsers/pdf_parser.py
@@ -11,6 +11,7 @@
     BaseParser,
     MediaItem,
     ParseResult,
+    TextSegment,
 )
 
 
@@ -35,13 +36,20 @@ async def parse(self, file_content: bytes, file_name: str) -> ParseResult:
         reader = PdfReader(pdf_file)
 
         text_parts = []
+        text_segments = []
         media_items = []
 
         # 提取文本
-        for page in reader.pages:
+        for page_number, page in enumerate(reader.pages, start=1):
             text = page.extract_text()
             if text:
                 text_parts.append(text)
+                text_segments.append(
+                    TextSegment(
+                        text=text,
+                        metadata={"page_number": page_number},
+                    )
+                )
 
         # 提取图片
         image_counter = 0
@@ -98,4 +106,8 @@ async def parse(self, file_content: bytes, file_name: str) -> ParseResult:
                 continue
 
         full_text = "\n\n".join(text_parts)
-        return ParseResult(text=full_text, media=media_items)
+        return ParseResult(
+            text=full_text,
+            media=media_items,
+            text_segments=text_segments,
+        )
diff --git a/astrbot/core/knowledge_base/retrieval/__init__.py b/astrbot/core/knowledge_base/retrieval/__init__.py
index b7c88075d5..26508c31f2 100644
--- a/astrbot/core/knowledge_base/retrieval/__init__.py
+++ b/astrbot/core/knowledge_base/retrieval/__init__.py
@@ -3,7 +3,12 @@
 from typing import TYPE_CHECKING
 
 if TYPE_CHECKING:
-    from .manager import RetrievalManager, RetrievalResult
+    from .manager import (
+        RetrievalManager,
+        RetrievalResult,
+        RetrievalTrace,
+        RetrievalWithTrace,
+    )
     from .rank_fusion import FusedResult, RankFusion
     from .sparse_retriever import SparseResult, SparseRetriever
 
@@ -12,18 +17,32 @@
     "RankFusion",
     "RetrievalManager",
     "RetrievalResult",
+    "RetrievalTrace",
+    "RetrievalWithTrace",
     "SparseResult",
     "SparseRetriever",
 ]
 
 
 def __getattr__(name: str):
-    if name in {"RetrievalManager", "RetrievalResult"}:
-        from .manager import RetrievalManager, RetrievalResult
+    if name in {
+        "RetrievalManager",
+        "RetrievalResult",
+        "RetrievalTrace",
+        "RetrievalWithTrace",
+    }:
+        from .manager import (
+            RetrievalManager,
+            RetrievalResult,
+            RetrievalTrace,
+            RetrievalWithTrace,
+        )
 
         return {
             "RetrievalManager": RetrievalManager,
             "RetrievalResult": RetrievalResult,
+            "RetrievalTrace": RetrievalTrace,
+            "RetrievalWithTrace": RetrievalWithTrace,
         }[name]
 
     if name in {"FusedResult", "RankFusion"}:
diff --git a/astrbot/core/knowledge_base/retrieval/manager.py b/astrbot/core/knowledge_base/retrieval/manager.py
index 1d65401ce5..dbb5a483c9 100644
--- a/astrbot/core/knowledge_base/retrieval/manager.py
+++ b/astrbot/core/knowledge_base/retrieval/manager.py
@@ -3,14 +3,20 @@
 协调稠密检索、稀疏检索和 Rerank,提供统一的检索接口
 """
 
+import json
 import time
 from dataclasses import dataclass
 from typing import TYPE_CHECKING
 
 from astrbot import logger
 from astrbot.core.db.vec_db.base import Result
+from astrbot.core.knowledge_base.capabilities import (
+    DEFAULT_TOP_K_DENSE,
+    DEFAULT_TOP_K_SPARSE,
+    DEFAULT_TOP_M_FINAL,
+)
 from astrbot.core.knowledge_base.kb_db_sqlite import KBSQLiteDatabase
-from astrbot.core.knowledge_base.retrieval.rank_fusion import RankFusion
+from astrbot.core.knowledge_base.retrieval.rank_fusion import FusedResult, RankFusion
 from astrbot.core.knowledge_base.retrieval.sparse_retriever import SparseRetriever
 from astrbot.core.provider.provider import RerankProvider
 
@@ -20,6 +26,13 @@
     from astrbot.core.db.vec_db.faiss_impl import FaissVecDB
 
 
+RetrievalOverrideValue = int | str | None
+RetrievalOverrides = dict[str, RetrievalOverrideValue]
+
+DEDUP_SHINGLE_SIZE = 5
+DEDUP_JACCARD_THRESHOLD = 0.92
+
+
 @dataclass
 class RetrievalResult:
     """检索结果"""
@@ -34,6 +47,38 @@ class RetrievalResult:
     metadata: dict
 
 
+@dataclass
+class RetrievalTrace:
+    """Detailed retrieval pipeline trace for diagnostics."""
+
+    dense: list[dict]
+    sparse: list[dict]
+    fusion: list[dict]
+    dedup: list[dict]
+    dedup_removed: list[dict]
+    rerank: list[dict]
+    final: list[dict]
+
+    def to_dict(self) -> dict:
+        return {
+            "dense": self.dense,
+            "sparse": self.sparse,
+            "fusion": self.fusion,
+            "dedup": self.dedup,
+            "dedup_removed": self.dedup_removed,
+            "rerank": self.rerank,
+            "final": self.final,
+        }
+
+
+@dataclass
+class RetrievalWithTrace:
+    """Retrieval results with optional pipeline diagnostics."""
+
+    results: list[RetrievalResult]
+    trace: RetrievalTrace
+
+
 class RetrievalManager:
     """检索管理器
 
@@ -67,7 +112,8 @@ async def retrieve(
         kb_ids: list[str],
         kb_id_helper_map: dict[str, KBHelper],
         top_k_fusion: int = 20,
-        top_m_final: int = 5,
+        top_m_final: int = DEFAULT_TOP_M_FINAL,
+        retrieval_overrides: RetrievalOverrides | None = None,
     ) -> list[RetrievalResult]:
         """混合检索
 
@@ -90,24 +136,11 @@ async def retrieve(
         if not kb_ids:
             return []
 
-        kb_options: dict = {}
-        new_kb_ids = []
-        for kb_id in kb_ids:
-            kb_helper = kb_id_helper_map.get(kb_id)
-            if kb_helper:
-                kb = kb_helper.kb
-                kb_options[kb_id] = {
-                    "top_k_dense": kb.top_k_dense or 50,
-                    "top_k_sparse": kb.top_k_sparse or 50,
-                    "top_m_final": kb.top_m_final or 5,
-                    "vec_db": kb_helper.vec_db,
-                    "rerank_provider_id": kb.rerank_provider_id,
-                }
-                new_kb_ids.append(kb_id)
-            else:
-                logger.warning(f"知识库 ID {kb_id} 实例未找到, 已跳过该知识库的检索")
-
-        kb_ids = new_kb_ids
+        kb_ids, kb_options = self._build_kb_options(
+            kb_ids,
+            kb_id_helper_map,
+            retrieval_overrides=retrieval_overrides,
+        )
 
         # 1. 稠密检索
         time_start = time.time()
@@ -140,15 +173,302 @@ async def retrieve(
             sparse_results=sparse_results,
             top_k=top_k_fusion,
         )
+        deduped_results = self._deduplicate_fused_results(fused_results)
         time_end = time.time()
         logger.debug(
-            f"Rank fusion took {time_end - time_start:.2f}s and returned {len(fused_results)} results.",
+            f"Rank fusion took {time_end - time_start:.2f}s and returned "
+            f"{len(fused_results)} results; dedup kept {len(deduped_results)}.",
         )
 
         # 4. 转换为 RetrievalResult (批量获取元数据)
-        doc_ids = {fr.doc_id for fr in fused_results}
+        doc_ids = {fr.doc_id for fr in deduped_results}
+        metadata_map = await self.kb_db.get_documents_with_metadata_batch(doc_ids)
+        retrieval_results = self._build_retrieval_results(
+            fused_results=deduped_results,
+            metadata_map=metadata_map,
+        )
+
+        # 5. Rerank
+        first_rerank = self._get_first_rerank_provider(kb_ids, kb_options)
+        if first_rerank and retrieval_results:
+            try:
+                retrieval_results = await self._rerank(
+                    query=query,
+                    results=retrieval_results,
+                    top_k=top_m_final,
+                    rerank_provider=first_rerank,
+                )
+            except Exception as e:
+                logger.warning(f"Rerank 执行失败，已跳过重排序并使用融合结果: {e}")
+
+        return retrieval_results[:top_m_final]
+
+    async def retrieve_with_trace(
+        self,
+        query: str,
+        kb_ids: list[str],
+        kb_id_helper_map: dict[str, KBHelper],
+        top_k_fusion: int = 20,
+        top_m_final: int = DEFAULT_TOP_M_FINAL,
+        retrieval_overrides: RetrievalOverrides | None = None,
+    ) -> RetrievalWithTrace:
+        """Hybrid retrieval with detailed stage diagnostics."""
+        if not kb_ids:
+            return RetrievalWithTrace(
+                results=[],
+                trace=RetrievalTrace(
+                    dense=[],
+                    sparse=[],
+                    fusion=[],
+                    dedup=[],
+                    dedup_removed=[],
+                    rerank=[],
+                    final=[],
+                ),
+            )
+
+        kb_ids, kb_options = self._build_kb_options(
+            kb_ids,
+            kb_id_helper_map,
+            retrieval_overrides=retrieval_overrides,
+        )
+
+        dense_results = await self._dense_retrieve(
+            query=query,
+            kb_ids=kb_ids,
+            kb_options=kb_options,
+        )
+        sparse_results = await self.sparse_retriever.retrieve(
+            query=query,
+            kb_ids=kb_ids,
+            kb_options=kb_options,
+        )
+        fused_results = await self.rank_fusion.fuse(
+            dense_results=dense_results,
+            sparse_results=sparse_results,
+            top_k=top_k_fusion,
+        )
+        deduped_results, dedup_removed_results = (
+            self._deduplicate_fused_results_with_trace(
+                fused_results,
+            )
+        )
+
+        doc_ids = self._collect_trace_doc_ids(
+            dense_results=dense_results,
+            sparse_results=sparse_results,
+            fused_results=fused_results,
+        )
         metadata_map = await self.kb_db.get_documents_with_metadata_batch(doc_ids)
+        doc_lookup = {
+            doc_id: {
+                "doc_name": metadata["document"].doc_name,
+                "kb_name": metadata["knowledge_base"].kb_name,
+            }
+            for doc_id, metadata in metadata_map.items()
+        }
+
+        retrieval_results = self._build_retrieval_results(
+            fused_results=deduped_results,
+            metadata_map=metadata_map,
+        )
 
+        rerank_results: list[RetrievalResult] = []
+        first_rerank = self._get_first_rerank_provider(kb_ids, kb_options)
+        if first_rerank and retrieval_results:
+            try:
+                retrieval_results = await self._rerank(
+                    query=query,
+                    results=retrieval_results,
+                    top_k=top_m_final,
+                    rerank_provider=first_rerank,
+                )
+                rerank_results = retrieval_results
+            except Exception as e:
+                logger.warning(f"Rerank 执行失败，已跳过重排序并使用融合结果: {e}")
+
+        final_results = retrieval_results[:top_m_final]
+        trace = RetrievalTrace(
+            dense=self._serialize_dense_trace(dense_results, doc_lookup),
+            sparse=self._serialize_sparse_trace(sparse_results, doc_lookup),
+            fusion=self._serialize_fusion_trace(fused_results, doc_lookup),
+            dedup=self._serialize_fusion_trace(deduped_results, doc_lookup),
+            dedup_removed=self._serialize_dedup_removed_trace(
+                dedup_removed_results,
+                doc_lookup,
+            ),
+            rerank=self._serialize_retrieval_trace(rerank_results, "rerank"),
+            final=self._serialize_retrieval_trace(final_results, "final"),
+        )
+        return RetrievalWithTrace(results=final_results, trace=trace)
+
+    def _build_kb_options(
+        self,
+        kb_ids: list[str],
+        kb_id_helper_map: dict[str, KBHelper],
+        *,
+        retrieval_overrides: RetrievalOverrides | None = None,
+    ) -> tuple[list[str], dict]:
+        kb_options: dict = {}
+        valid_kb_ids = []
+        for kb_id in kb_ids:
+            kb_helper = kb_id_helper_map.get(kb_id)
+            if not kb_helper:
+                logger.warning(f"知识库 ID {kb_id} 实例未找到, 已跳过该知识库的检索")
+                continue
+            kb = kb_helper.kb
+            kb_option = {
+                "top_k_dense": kb.top_k_dense or DEFAULT_TOP_K_DENSE,
+                "top_k_sparse": kb.top_k_sparse or DEFAULT_TOP_K_SPARSE,
+                "top_m_final": kb.top_m_final or DEFAULT_TOP_M_FINAL,
+                "vec_db": kb_helper.vec_db,
+                "rerank_provider_id": kb.rerank_provider_id,
+            }
+            if retrieval_overrides:
+                for field_name in (
+                    "top_k_dense",
+                    "top_k_sparse",
+                    "top_m_final",
+                    "rerank_provider_id",
+                ):
+                    if field_name in retrieval_overrides:
+                        kb_option[field_name] = retrieval_overrides[field_name]
+            kb_options[kb_id] = kb_option
+            valid_kb_ids.append(kb_id)
+        return valid_kb_ids, kb_options
+
+    def _collect_trace_doc_ids(
+        self,
+        *,
+        dense_results: list[Result],
+        sparse_results,
+        fused_results,
+    ) -> set[str]:
+        doc_ids = {result.doc_id for result in sparse_results}
+        doc_ids.update(result.doc_id for result in fused_results)
+        for result in dense_results:
+            metadata = self._safe_metadata(result.data.get("metadata"))
+            doc_id = metadata.get("kb_doc_id")
+            if doc_id:
+                doc_ids.add(doc_id)
+        return doc_ids
+
+    def _deduplicate_fused_results(
+        self,
+        fused_results: list[FusedResult],
+    ) -> list[FusedResult]:
+        deduped_results, _ = self._deduplicate_fused_results_with_trace(fused_results)
+        return deduped_results
+
+    def _deduplicate_fused_results_with_trace(
+        self,
+        fused_results: list[FusedResult],
+    ) -> tuple[list[FusedResult], list[dict]]:
+        selected: list[FusedResult] = []
+        removed: list[dict] = []
+        signatures: list[tuple[FusedResult, str, frozenset[str]]] = []
+
+        for result in fused_results:
+            normalized = self._normalize_content_for_dedup(result.content)
+            if not normalized:
+                selected.append(result)
+                continue
+
+            shingles = self._build_content_shingles(normalized)
+            duplicate_of = self._find_duplicate_signature(
+                normalized,
+                shingles,
+                signatures,
+            )
+            if duplicate_of:
+                selected_result, selected_normalized, selected_shingles = duplicate_of
+                removed.append(
+                    {
+                        "result": result,
+                        "duplicate_of": selected_result,
+                        "similarity": self._dedup_similarity(
+                            normalized,
+                            shingles,
+                            selected_normalized,
+                            selected_shingles,
+                        ),
+                    },
+                )
+                continue
+
+            selected.append(result)
+            signatures.append((result, normalized, shingles))
+
+        return selected, removed
+
+    @staticmethod
+    def _normalize_content_for_dedup(content: str) -> str:
+        return "".join(str(content or "").lower().split())
+
+    @staticmethod
+    def _build_content_shingles(
+        normalized_content: str,
+        size: int = DEDUP_SHINGLE_SIZE,
+    ) -> frozenset[str]:
+        if not normalized_content:
+            return frozenset()
+        if len(normalized_content) <= size:
+            return frozenset({normalized_content})
+        return frozenset(
+            normalized_content[index : index + size]
+            for index in range(len(normalized_content) - size + 1)
+        )
+
+    @staticmethod
+    def _is_duplicate_signature(
+        normalized: str,
+        shingles: frozenset[str],
+        existing: tuple[FusedResult, str, frozenset[str]],
+    ) -> bool:
+        _, existing_normalized, existing_shingles = existing
+        return (
+            RetrievalManager._dedup_similarity(
+                normalized,
+                shingles,
+                existing_normalized,
+                existing_shingles,
+            )
+            >= DEDUP_JACCARD_THRESHOLD
+        )
+
+    @staticmethod
+    def _dedup_similarity(
+        normalized: str,
+        shingles: frozenset[str],
+        existing_normalized: str,
+        existing_shingles: frozenset[str],
+    ) -> float:
+        if normalized == existing_normalized:
+            return 1.0
+        if not shingles or not existing_shingles:
+            return 0.0
+        union = len(shingles | existing_shingles)
+        if union == 0:
+            return 0.0
+        return len(shingles & existing_shingles) / union
+
+    def _find_duplicate_signature(
+        self,
+        normalized: str,
+        shingles: frozenset[str],
+        signatures: list[tuple[FusedResult, str, frozenset[str]]],
+    ) -> tuple[FusedResult, str, frozenset[str]] | None:
+        for signature in signatures:
+            if self._is_duplicate_signature(normalized, shingles, signature):
+                return signature
+        return None
+
+    def _build_retrieval_results(
+        self,
+        *,
+        fused_results,
+        metadata_map: dict,
+    ) -> list[RetrievalResult]:
         retrieval_results = []
         for fr in fused_results:
             metadata_dict = metadata_map.get(fr.doc_id)
@@ -163,13 +483,22 @@ async def retrieve(
                         content=fr.content,
                         score=fr.score,
                         metadata={
+                            **(fr.metadata or {}),
                             "chunk_index": fr.chunk_index,
                             "char_count": len(fr.content),
+                            "dense_rank": fr.dense_rank,
+                            "sparse_rank": fr.sparse_rank,
+                            "dense_score": fr.dense_score,
+                            "sparse_score": fr.sparse_score,
+                            "rrf_score": fr.rrf_score
+                            if fr.rrf_score is not None
+                            else fr.score,
                         },
                     ),
                 )
+        return retrieval_results
 
-        # 5. Rerank
+    def _get_first_rerank_provider(self, kb_ids: list[str], kb_options: dict):
         first_rerank = None
         for kb_id in kb_ids:
             vec_db = kb_options[kb_id]["vec_db"]
@@ -188,18 +517,186 @@ async def retrieve(
             ):
                 first_rerank = rerank_provider
                 break
-        if first_rerank and retrieval_results:
-            try:
-                retrieval_results = await self._rerank(
-                    query=query,
-                    results=retrieval_results,
-                    top_k=top_m_final,
-                    rerank_provider=first_rerank,
-                )
-            except Exception as e:
-                logger.warning(f"Rerank 执行失败，已跳过重排序并使用融合结果: {e}")
+        return first_rerank
 
-        return retrieval_results[:top_m_final]
+    @staticmethod
+    def _content_preview(content: str, limit: int = 240) -> str:
+        if len(content) <= limit:
+            return content
+        return f"{content[:limit]}..."
+
+    def _serialize_dense_trace(
+        self,
+        dense_results: list[Result],
+        doc_lookup: dict[str, dict],
+    ) -> list[dict]:
+        trace = []
+        for rank, result in enumerate(dense_results, 1):
+            chunk_id = result.data.get("doc_id")
+            metadata = self._safe_metadata(result.data.get("metadata"))
+            doc_id = metadata.get("kb_doc_id")
+            source = doc_lookup.get(doc_id, {})
+            trace.append(
+                {
+                    "rank": rank,
+                    "chunk_id": chunk_id,
+                    "doc_id": doc_id,
+                    "doc_name": source.get("doc_name"),
+                    "kb_id": metadata.get("kb_id"),
+                    "kb_name": source.get("kb_name"),
+                    "chunk_index": metadata.get("chunk_index", 0),
+                    "score": result.similarity,
+                    "dense_score": result.similarity,
+                    "title_path": metadata.get("title_path"),
+                    "page_number": metadata.get("page_number"),
+                    "section_index": metadata.get("section_index"),
+                    "content_preview": self._content_preview(
+                        result.data.get("text", ""),
+                    ),
+                },
+            )
+        return trace
+
+    def _serialize_sparse_trace(
+        self,
+        sparse_results,
+        doc_lookup: dict[str, dict],
+    ) -> list[dict]:
+        trace = []
+        for rank, result in enumerate(sparse_results, 1):
+            source = doc_lookup.get(result.doc_id, {})
+            trace.append(
+                {
+                    "rank": rank,
+                    "chunk_id": result.chunk_id,
+                    "doc_id": result.doc_id,
+                    "doc_name": source.get("doc_name"),
+                    "kb_id": result.kb_id,
+                    "kb_name": source.get("kb_name"),
+                    "chunk_index": result.chunk_index,
+                    "score": result.score,
+                    "sparse_score": result.score,
+                    "title_path": (result.metadata or {}).get("title_path"),
+                    "page_number": (result.metadata or {}).get("page_number"),
+                    "section_index": (result.metadata or {}).get("section_index"),
+                    "content_preview": self._content_preview(result.content),
+                },
+            )
+        return trace
+
+    def _serialize_fusion_trace(
+        self,
+        fused_results,
+        doc_lookup: dict[str, dict],
+    ) -> list[dict]:
+        trace = []
+        for rank, result in enumerate(fused_results, 1):
+            source = doc_lookup.get(result.doc_id, {})
+            trace.append(
+                {
+                    "rank": rank,
+                    "chunk_id": result.chunk_id,
+                    "doc_id": result.doc_id,
+                    "doc_name": source.get("doc_name"),
+                    "kb_id": result.kb_id,
+                    "kb_name": source.get("kb_name"),
+                    "chunk_index": result.chunk_index,
+                    "score": result.score,
+                    "dense_rank": result.dense_rank,
+                    "sparse_rank": result.sparse_rank,
+                    "dense_score": result.dense_score,
+                    "sparse_score": result.sparse_score,
+                    "rrf_score": result.rrf_score
+                    if result.rrf_score is not None
+                    else result.score,
+                    "title_path": (result.metadata or {}).get("title_path"),
+                    "page_number": (result.metadata or {}).get("page_number"),
+                    "section_index": (result.metadata or {}).get("section_index"),
+                    "content_preview": self._content_preview(result.content),
+                },
+            )
+        return trace
+
+    def _serialize_dedup_removed_trace(
+        self,
+        removed_results: list[dict],
+        doc_lookup: dict[str, dict],
+    ) -> list[dict]:
+        trace = []
+        for rank, removed in enumerate(removed_results, 1):
+            result = removed["result"]
+            duplicate_of = removed["duplicate_of"]
+            source = doc_lookup.get(result.doc_id, {})
+            trace.append(
+                {
+                    "rank": rank,
+                    "chunk_id": result.chunk_id,
+                    "doc_id": result.doc_id,
+                    "doc_name": source.get("doc_name"),
+                    "kb_id": result.kb_id,
+                    "kb_name": source.get("kb_name"),
+                    "chunk_index": result.chunk_index,
+                    "score": result.score,
+                    "dense_rank": result.dense_rank,
+                    "sparse_rank": result.sparse_rank,
+                    "dense_score": result.dense_score,
+                    "sparse_score": result.sparse_score,
+                    "rrf_score": result.rrf_score
+                    if result.rrf_score is not None
+                    else result.score,
+                    "duplicate_of_chunk_id": duplicate_of.chunk_id,
+                    "duplicate_of_doc_id": duplicate_of.doc_id,
+                    "dedup_similarity": removed["similarity"],
+                    "title_path": (result.metadata or {}).get("title_path"),
+                    "page_number": (result.metadata or {}).get("page_number"),
+                    "section_index": (result.metadata or {}).get("section_index"),
+                    "content_preview": self._content_preview(result.content),
+                },
+            )
+        return trace
+
+    def _serialize_retrieval_trace(
+        self,
+        results: list[RetrievalResult],
+        stage: str,
+    ) -> list[dict]:
+        trace = []
+        for rank, result in enumerate(results, 1):
+            trace.append(
+                {
+                    "rank": rank,
+                    "chunk_id": result.chunk_id,
+                    "doc_id": result.doc_id,
+                    "doc_name": result.doc_name,
+                    "kb_id": result.kb_id,
+                    "kb_name": result.kb_name,
+                    "chunk_index": result.metadata.get("chunk_index", 0),
+                    "score": result.score,
+                    "dense_rank": result.metadata.get("dense_rank"),
+                    "sparse_rank": result.metadata.get("sparse_rank"),
+                    "dense_score": result.metadata.get("dense_score"),
+                    "sparse_score": result.metadata.get("sparse_score"),
+                    "rrf_score": result.metadata.get("rrf_score"),
+                    "rerank_score": result.metadata.get("rerank_score"),
+                    "title_path": result.metadata.get("title_path"),
+                    "page_number": result.metadata.get("page_number"),
+                    "section_index": result.metadata.get("section_index"),
+                    "stage": stage,
+                    "content_preview": self._content_preview(result.content),
+                },
+            )
+        return trace
+
+    @staticmethod
+    def _safe_metadata(raw_metadata) -> dict:
+        if not raw_metadata:
+            return {}
+        if isinstance(raw_metadata, dict):
+            return raw_metadata
+        try:
+            return json.loads(raw_metadata)
+        except Exception:
+            return {}
 
     async def _dense_retrieve(
         self,
@@ -209,7 +706,7 @@ async def _dense_retrieve(
     ):
         """稠密检索 (向量相似度)
 
-        为每个知识库使用独立的向量数据库进行检索,然后合并结果。
+        为每个知识库使用独立的向量数据库进行并行检索，然后合并结果。
 
         Args:
             query: 查询文本
@@ -220,10 +717,11 @@ async def _dense_retrieve(
             List[Result]: 检索结果列表
 
         """
-        all_results: list[Result] = []
-        for kb_id in kb_ids:
+        import asyncio
+
+        async def _retrieve_one(kb_id: str) -> list[Result]:
             if kb_id not in kb_options:
-                continue
+                return []
             try:
                 vec_db: FaissVecDB = kb_options[kb_id]["vec_db"]
                 dense_k = int(kb_options[kb_id]["top_k_dense"])
@@ -234,17 +732,31 @@ async def _dense_retrieve(
                     rerank=False,  # 稠密检索阶段不进行 rerank
                     metadata_filters={"kb_id": kb_id},
                 )
-
-                all_results.extend(vec_results)
+                return vec_results
             except Exception as e:
-                logger.error(f"知识库 {kb_id} 稠密检索失败: {e}", exc_info=True)
+                logger.error(
+                    f"知识库 {kb_id} 稠密检索失败: {e}",
+                    exc_info=True,
+                )
                 if len(kb_ids) == 1:
-                    raise RuntimeError(f"知识库 {kb_id} 稠密检索失败: {e}") from e
+                    raise RuntimeError(
+                        f"知识库 {kb_id} 稠密检索失败: {e}",
+                    ) from e
                 # multi-KB: skip the faulty KB and continue
+                return []
+
+        tasks = [_retrieve_one(kb_id) for kb_id in kb_ids]
+        results_per_kb = await asyncio.gather(*tasks, return_exceptions=True)
+
+        all_results: list[Result] = []
+        for result in results_per_kb:
+            if isinstance(result, Exception):
+                logger.error(f"稠密检索异常: {result}", exc_info=True)
+                continue
+            all_results.extend(result)
 
-        # 按相似度排序并返回 top_k
+        # 按相似度排序并返回
         all_results.sort(key=lambda x: x.similarity, reverse=True)
-        # return all_results[: len(all_results) // len(kb_ids)]
         return all_results
 
     async def _rerank(
@@ -283,6 +795,7 @@ async def _rerank(
             idx = rerank_result.index
             if idx < len(results):
                 result = results[idx]
+                result.metadata["rerank_score"] = rerank_result.relevance_score
                 result.score = rerank_result.relevance_score
                 reranked_list.append(result)
 
diff --git a/astrbot/core/knowledge_base/retrieval/rank_fusion.py b/astrbot/core/knowledge_base/retrieval/rank_fusion.py
index 40afd97484..2dbb1a5bef 100644
--- a/astrbot/core/knowledge_base/retrieval/rank_fusion.py
+++ b/astrbot/core/knowledge_base/retrieval/rank_fusion.py
@@ -6,6 +6,7 @@
 import json
 from dataclasses import dataclass
 
+from astrbot.core import logger
 from astrbot.core.db.vec_db.base import Result
 from astrbot.core.knowledge_base.kb_db_sqlite import KBSQLiteDatabase
 from astrbot.core.knowledge_base.retrieval.sparse_retriever import SparseResult
@@ -21,6 +22,12 @@ class FusedResult:
     kb_id: str
     content: str
     score: float
+    metadata: dict | None = None
+    dense_rank: int | None = None
+    sparse_rank: int | None = None
+    dense_score: float | None = None
+    sparse_score: float | None = None
+    rrf_score: float | None = None
 
 
 class RankFusion:
@@ -62,28 +69,27 @@ async def fuse(
             List[FusedResult]: 融合后的结果列表
 
         """
-        # 1. 构建排名映射
+        # 1. Build rank maps keyed by vector-storage chunk IDs.
         dense_ranks = {
             r.data["doc_id"]: (idx + 1) for idx, r in enumerate(dense_results)
-        }  # 这里的 doc_id 实际上是 chunk_id
+        }
         sparse_ranks = {r.chunk_id: (idx + 1) for idx, r in enumerate(sparse_results)}
 
-        # 2. 收集所有唯一的 ID
-        # 需要统一为 chunk_id
+        # 2. Collect all unique chunk IDs.
         all_chunk_ids = set()
-        vec_doc_id_to_dense: dict[str, Result] = {}  # vec_doc_id -> Result
-        chunk_id_to_sparse: dict[str, SparseResult] = {}  # chunk_id -> SparseResult
+        chunk_id_to_dense: dict[str, Result] = {}
+        chunk_id_to_sparse: dict[str, SparseResult] = {}
 
         # 处理稀疏检索结果
         for r in sparse_results:
             all_chunk_ids.add(r.chunk_id)
             chunk_id_to_sparse[r.chunk_id] = r
 
-        # 处理稠密检索结果 (需要转换 vec_doc_id 到 chunk_id)
+        # Dense results use Document.doc_id, which stores the chunk UUID.
         for r in dense_results:
-            vec_doc_id = r.data["doc_id"]
-            all_chunk_ids.add(vec_doc_id)
-            vec_doc_id_to_dense[vec_doc_id] = r
+            chunk_id = r.data["doc_id"]
+            all_chunk_ids.add(chunk_id)
+            chunk_id_to_dense[chunk_id] = r
 
         # 3. 计算 RRF 分数
         rrf_scores: dict[str, float] = {}
@@ -108,6 +114,15 @@ async def fuse(
             reverse=True,
         )[:top_k]
 
+        if logger.isEnabledFor(10):  # DEBUG
+            details = []
+            for cid in sorted_ids[:5]:
+                d_rank = dense_ranks.get(cid, "-")
+                s_rank = sparse_ranks.get(cid, "-")
+                rrf = rrf_scores[cid]
+                details.append(f"{cid[:8]}(d={d_rank},s={s_rank},rrf={rrf:.4f})")
+            logger.debug(f"RRF top-5: {' | '.join(details)}")
+
         # 5. 构建融合结果
         fused_results = []
         for identifier in sorted_ids:
@@ -122,11 +137,21 @@ async def fuse(
                         kb_id=sr.kb_id,
                         content=sr.content,
                         score=rrf_scores[identifier],
+                        metadata=sr.metadata,
+                        dense_rank=dense_ranks.get(identifier),
+                        sparse_rank=sparse_ranks.get(identifier),
+                        dense_score=(
+                            chunk_id_to_dense[identifier].similarity
+                            if identifier in chunk_id_to_dense
+                            else None
+                        ),
+                        sparse_score=sr.score,
+                        rrf_score=rrf_scores[identifier],
                     ),
                 )
-            elif identifier in vec_doc_id_to_dense:
+            elif identifier in chunk_id_to_dense:
                 # 从向量检索获取信息,需要从数据库获取块的详细信息
-                vec_result = vec_doc_id_to_dense[identifier]
+                vec_result = chunk_id_to_dense[identifier]
                 chunk_md = json.loads(vec_result.data["metadata"])
                 fused_results.append(
                     FusedResult(
@@ -136,6 +161,12 @@ async def fuse(
                         kb_id=chunk_md["kb_id"],
                         content=vec_result.data["text"],
                         score=rrf_scores[identifier],
+                        metadata=chunk_md,
+                        dense_rank=dense_ranks.get(identifier),
+                        sparse_rank=sparse_ranks.get(identifier),
+                        dense_score=vec_result.similarity,
+                        sparse_score=None,
+                        rrf_score=rrf_scores[identifier],
                     ),
                 )
 
diff --git a/astrbot/core/knowledge_base/retrieval/sparse_retriever.py b/astrbot/core/knowledge_base/retrieval/sparse_retriever.py
index f06eb50909..8790d0224c 100644
--- a/astrbot/core/knowledge_base/retrieval/sparse_retriever.py
+++ b/astrbot/core/knowledge_base/retrieval/sparse_retriever.py
@@ -10,6 +10,7 @@
 
 from rank_bm25 import BM25Okapi
 
+from astrbot.core import logger
 from astrbot.core.knowledge_base.kb_db_sqlite import KBSQLiteDatabase
 from astrbot.core.knowledge_base.retrieval.tokenizer import (
     load_stopwords,
@@ -22,7 +23,10 @@
 
 @dataclass
 class SparseResult:
-    """稀疏检索结果"""
+    """稀疏检索结果
+
+    score 语义: 越低越相关 (0 = 最佳匹配), 统一按升序排列后送入 RRF 融合。
+    """
 
     chunk_index: int
     chunk_id: str
@@ -30,25 +34,15 @@ class SparseResult:
     kb_id: str
     content: str
     score: float
+    metadata: dict | None = None
 
 
 class SparseRetriever:
-    """BM25 稀疏检索器
-
-    职责:
-    - 基于关键词的文档检索
-    - 使用 BM25 算法计算相关度
-    """
+    """BM25 稀疏检索器"""
 
     def __init__(self, kb_db: KBSQLiteDatabase) -> None:
-        """初始化稀疏检索器
-
-        Args:
-            kb_db: 知识库数据库实例
-
-        """
         self.kb_db = kb_db
-        self._index_cache = {}  # 缓存 BM25 索引
+        self._index_cache = {}
 
         self.hit_stopwords = load_stopwords(
             os.path.join(os.path.dirname(__file__), "hit_stopwords.txt"),
@@ -62,18 +56,13 @@ async def retrieve(
     ) -> list[SparseResult]:
         """执行稀疏检索
 
-        Args:
-            query: 查询文本
-            kb_ids: 知识库 ID 列表
-            kb_options: 每个知识库的检索选项
-
-        Returns:
-            List[SparseResult]: 检索结果列表
-
+        优先使用 FTS5 全文索引; 不可用时回退到内存 BM25。
+        结果按 score 升序排列 (lower-is-better), 直接喂给 RRF。
         """
         fts_results = []
         fallback_kb_ids = []
         query_tokens = tokenize_text(query, self.hit_stopwords)
+
         for kb_id in kb_ids:
             vec_db: FaissVecDB | None = kb_options.get(kb_id, {}).get("vec_db")
             if not vec_db:
@@ -89,6 +78,7 @@ async def retrieve(
 
             for doc in result:
                 chunk_md = json.loads(doc["metadata"])
+                # FTS5 bm25(): 0=最佳, 极短文档可能为负值 → clamp 到 0
                 fts_results.append(
                     SparseResult(
                         chunk_id=doc["doc_id"],
@@ -96,7 +86,8 @@ async def retrieve(
                         doc_id=chunk_md["kb_doc_id"],
                         kb_id=kb_id,
                         content=doc["text"],
-                        score=-float(doc["score"]),
+                        score=max(0.0, float(doc["score"])),
+                        metadata=chunk_md,
                     ),
                 )
 
@@ -107,70 +98,106 @@ async def retrieve(
                 kb_ids=fallback_kb_ids,
                 kb_options=kb_options,
             )
+
         results = fts_results + fallback_results
-        results.sort(key=lambda x: x.score, reverse=True)
+        results.sort(key=lambda x: x.score)
+
+        if logger.isEnabledFor(10):  # DEBUG
+            fts_top = [f"{r.chunk_id[:8]}={r.score:.4f}" for r in fts_results[:5]]
+            bm_top = [f"{r.chunk_id[:8]}={r.score:.4f}" for r in fallback_results[:5]]
+            merged_top = [f"{r.chunk_id[:8]}={r.score:.4f}" for r in results[:5]]
+            logger.debug(
+                f"Sparse top-5 | FTS5({len(fts_results)}): [{', '.join(fts_top)}] | "
+                f"BM25({len(fallback_results)}): [{', '.join(bm_top)}] | "
+                f"Merged({len(results)}): [{', '.join(merged_top)}]",
+            )
+
         return results
 
+    # BM25 回退路径单次最多加载的文档数，防止 OOM
+    MAX_BM25_DOCS = 10_000
+
     async def _retrieve_with_bm25(
         self,
         query: str,
         kb_ids: list[str],
         kb_options: dict,
     ) -> list[SparseResult]:
+        """FTS5 不可用时的 BM25Okapi 回退路径。
+
+        BM25Okapi 原始分值 higher-is-better → 取反统一为 lower-is-better。
+        单 KB 最多加载 MAX_BM25_DOCS 条 chunk，超限时截断并打 warning。
+        """
         top_k_sparse = 0
-        chunks = []
+        all_kb_chunks: list[dict] = []
+
         for kb_id in kb_ids:
             vec_db: FaissVecDB | None = kb_options.get(kb_id, {}).get("vec_db")
             if not vec_db:
                 continue
+            kb_top_k = kb_options.get(kb_id, {}).get("top_k_sparse", 50)
+            top_k_sparse = max(top_k_sparse, kb_top_k)
+
             result = await vec_db.document_storage.get_documents(
-                metadata_filters={},
-                limit=None,
-                offset=None,
+                metadata_filters={"kb_id": kb_id},
+                limit=self.MAX_BM25_DOCS,
+                offset=0,
             )
+            if len(result) >= self.MAX_BM25_DOCS:
+                logger.warning(
+                    f"知识库 {kb_id} 的 BM25 回退检索已触及 {self.MAX_BM25_DOCS} "
+                    f"条 chunk 上限，结果可能不完整。建议检查 FTS5 索引状态。",
+                )
             chunk_mds = [json.loads(doc["metadata"]) for doc in result]
-            result = [
+            kb_chunks = [
                 {
                     "chunk_id": doc["doc_id"],
                     "chunk_index": chunk_md["chunk_index"],
                     "doc_id": chunk_md["kb_doc_id"],
                     "kb_id": kb_id,
                     "text": doc["text"],
+                    "kb_top_k": kb_top_k,
+                    "metadata": chunk_md,
                 }
                 for doc, chunk_md in zip(result, chunk_mds)
             ]
-            chunks.extend(result)
-            top_k_sparse += kb_options.get(kb_id, {}).get("top_k_sparse", 50)
+            all_kb_chunks.append(kb_chunks)
 
-        if not chunks:
+        if not any(all_kb_chunks):
             return []
 
-        # 2. 准备文档和索引
-        corpus = [chunk["text"] for chunk in chunks]
-        tokenized_corpus = [tokenize_text(doc, self.hit_stopwords) for doc in corpus]
-
-        # 3. 构建 BM25 索引
-        bm25 = BM25Okapi(tokenized_corpus)
-
-        # 4. 执行检索
-        tokenized_query = tokenize_text(query, self.hit_stopwords)
-        scores = bm25.get_scores(tokenized_query)
-
-        # 5. 排序并返回 Top-K
-        results = []
-        for idx, score in enumerate(scores):
-            chunk = chunks[idx]
-            results.append(
-                SparseResult(
-                    chunk_id=chunk["chunk_id"],
-                    chunk_index=chunk["chunk_index"],
-                    doc_id=chunk["doc_id"],
-                    kb_id=chunk["kb_id"],
-                    content=chunk["text"],
-                    score=float(score),
-                ),
-            )
+        # 每个知识库独立计算 BM25 分数并截断，再合并。
+        merged_results: list[SparseResult] = []
+        for kb_chunks in all_kb_chunks:
+            if not kb_chunks:
+                continue
+            kb_top_k = kb_chunks[0]["kb_top_k"]
+
+            corpus = [chunk["text"] for chunk in kb_chunks]
+            tokenized_corpus = [
+                tokenize_text(doc, self.hit_stopwords) for doc in corpus
+            ]
+            bm25 = BM25Okapi(tokenized_corpus)
+
+            tokenized_query = tokenize_text(query, self.hit_stopwords)
+            scores = bm25.get_scores(tokenized_query)
+
+            kb_results: list[SparseResult] = []
+            for idx, score in enumerate(scores):
+                chunk = kb_chunks[idx]
+                kb_results.append(
+                    SparseResult(
+                        chunk_id=chunk["chunk_id"],
+                        chunk_index=chunk["chunk_index"],
+                        doc_id=chunk["doc_id"],
+                        kb_id=chunk["kb_id"],
+                        content=chunk["text"],
+                        score=-float(score),
+                        metadata=chunk["metadata"],
+                    ),
+                )
+
+            merged_results.extend(sorted(kb_results, key=lambda x: x.score)[:kb_top_k])
 
-        results.sort(key=lambda x: x.score, reverse=True)
-        # return results[: len(results) // len(kb_ids)]
-        return results[:top_k_sparse]
+        merged_results.sort(key=lambda x: x.score)
+        return merged_results[:top_k_sparse]
diff --git a/astrbot/core/tools/knowledge_base_tools.py b/astrbot/core/tools/knowledge_base_tools.py
index e082fd4253..da00c18f47 100644
--- a/astrbot/core/tools/knowledge_base_tools.py
+++ b/astrbot/core/tools/knowledge_base_tools.py
@@ -53,7 +53,7 @@ async def retrieve_knowledge_base(
                 f"[知识库] 会话 {umo} 配置的以下知识库无效: {invalid_kb_ids}",
             )
         if not kb_names:
-            return None
+            return "会话配置的知识库均不存在或未加载，请检查知识库设置。"
         logger.debug(f"[知识库] 使用会话级配置，知识库数量: {len(kb_names)}")
     else:
         kb_names = config.get("kb_names", [])
diff --git a/astrbot/dashboard/routes/knowledge_base.py b/astrbot/dashboard/routes/knowledge_base.py
index 1b6f7a435d..ca97f296ea 100644
--- a/astrbot/dashboard/routes/knowledge_base.py
+++ b/astrbot/dashboard/routes/knowledge_base.py
@@ -11,6 +11,29 @@
 
 from astrbot.core import logger
 from astrbot.core.core_lifecycle import AstrBotCoreLifecycle
+from astrbot.core.knowledge_base.capabilities import (
+    ALLOWED_UPLOAD_EXTENSIONS,
+    DEFAULT_CHUNK_OVERLAP,
+    DEFAULT_CHUNK_PAGE_SIZE,
+    DEFAULT_CHUNK_SIZE,
+    DEFAULT_DOCUMENT_PAGE_SIZE,
+    DEFAULT_INDEX_TYPE,
+    DEFAULT_KB_PAGE_SIZE,
+    DEFAULT_TOP_K_DENSE,
+    DEFAULT_TOP_K_SPARSE,
+    DEFAULT_TOP_M_FINAL,
+    DEFAULT_UPLOAD_BATCH_SIZE,
+    DEFAULT_UPLOAD_MAX_RETRIES,
+    DEFAULT_UPLOAD_TASKS_LIMIT,
+    DOCUMENT_FILTER_SOURCE_TYPES,
+    DOCUMENT_FILTER_STATUSES,
+    MAX_BATCH_DELETE_DOCUMENTS,
+    MAX_BATCH_REBUILD_DOCUMENTS,
+    MAX_RETRIEVE_TOP_K,
+    MAX_UPLOAD_FILE_SIZE,
+    MAX_UPLOAD_FILES,
+    get_knowledge_base_capabilities,
+)
 from astrbot.core.provider.provider import EmbeddingProvider, RerankProvider
 from astrbot.core.utils.astrbot_path import get_astrbot_temp_path
 
@@ -41,12 +64,16 @@ def __init__(
         # 注册路由
         self.routes = {
             # 知识库管理
+            "/kb/capabilities": ("GET", self.get_capabilities),
             "/kb/list": ("GET", self.list_kbs),
             "/kb/create": ("POST", self.create_kb),
             "/kb/get": ("GET", self.get_kb),
             "/kb/update": ("POST", self.update_kb),
             "/kb/delete": ("POST", self.delete_kb),
             "/kb/stats": ("GET", self.get_kb_stats),
+            "/kb/consistency/check": ("GET", self.check_kb_consistency),
+            "/kb/consistency/repair": ("POST", self.repair_kb_consistency),
+            "/kb/rebuild": ("POST", self.rebuild_kb),
             # 文档管理
             "/kb/document/list": ("GET", self.list_documents),
             "/kb/document/upload": ("POST", self.upload_document),
@@ -54,9 +81,15 @@ def __init__(
             "/kb/document/upload/url": ("POST", self.upload_document_from_url),
             "/kb/document/upload/progress": ("GET", self.get_upload_progress),
             "/kb/document/get": ("GET", self.get_document),
+            "/kb/document/rebuild": ("POST", self.rebuild_document),
+            "/kb/document/batch-rebuild": ("POST", self.batch_rebuild_documents),
             "/kb/document/delete": ("POST", self.delete_document),
+            "/kb/document/batch-delete": ("POST", self.batch_delete_documents),
+            "/kb/task/get": ("GET", self.get_task),
+            "/kb/task/list": ("GET", self.list_tasks),
             # # 块管理
             "/kb/chunk/list": ("GET", self.list_chunks),
+            "/kb/chunk/context": ("GET", self.get_chunk_context),
             "/kb/chunk/delete": ("POST", self.delete_chunk),
             # # 多媒体管理
             # "/kb/media/list": ("GET", self.list_media),
@@ -69,6 +102,77 @@ def __init__(
     def _get_kb_manager(self):
         return self.core_lifecycle.kb_manager
 
+    def _get_kb_db(self):
+        if not hasattr(self, "core_lifecycle"):
+            return None
+        kb_manager = self._get_kb_manager()
+        return getattr(kb_manager, "kb_db", None)
+
+    @staticmethod
+    def _get_positive_query_int(name: str, default: int) -> int:
+        value = request.args.get(name, default, type=int)
+        return max(value if value is not None else default, 1)
+
+    async def get_capabilities(self):
+        """Return knowledge base capabilities, defaults, and limits."""
+        return Response().ok(get_knowledge_base_capabilities()).__dict__
+
+    async def _create_persistent_task(
+        self,
+        *,
+        task_id: str,
+        kb_id: str | None,
+        task_type: str,
+        status: str,
+        progress: dict | None = None,
+    ) -> None:
+        kb_db = self._get_kb_db()
+        if not kb_db or not kb_id:
+            return
+        try:
+            await kb_db.create_ingestion_task(
+                task_id=task_id,
+                kb_id=kb_id,
+                task_type=task_type,
+                status=status,
+                progress_stage=(progress or {}).get("stage"),
+                progress_current=(progress or {}).get("current", 0),
+                progress_total=(progress or {}).get("total", 100),
+                progress=progress,
+            )
+        except Exception as e:
+            logger.warning(f"创建知识库持久任务记录失败 {task_id}: {e}")
+
+    async def _update_persistent_task(self, task_id: str, **updates) -> None:
+        kb_db = self._get_kb_db()
+        if not kb_db:
+            return
+        try:
+            await kb_db.update_ingestion_task(task_id, **updates)
+        except Exception as e:
+            logger.warning(f"更新知识库持久任务记录失败 {task_id}: {e}")
+
+    async def _get_persistent_task(self, task_id: str) -> dict | None:
+        kb_db = self._get_kb_db()
+        if not kb_db:
+            return None
+        try:
+            return await kb_db.get_ingestion_task(task_id)
+        except Exception as e:
+            logger.warning(f"读取知识库持久任务记录失败 {task_id}: {e}")
+            return None
+
+    def _get_persistent_progress_updates(self, task_id: str) -> dict:
+        progress = self.upload_progress.get(task_id)
+        if not progress:
+            return {}
+        return {
+            "progress_stage": progress.get("stage"),
+            "progress_current": progress.get("current", 0),
+            "progress_total": progress.get("total", 100),
+            "progress": progress,
+        }
+
     def _init_task(self, task_id: str, status: str = "pending") -> None:
         self.upload_tasks[task_id] = {
             "status": status,
@@ -87,6 +191,21 @@ def _set_task_result(
         if task_id in self.upload_progress:
             self.upload_progress[task_id]["status"] = status
 
+    def _cleanup_task(self, task_id: str) -> None:
+        """清理已完成/失败的任务，释放内存。幂等操作。"""
+        self.upload_tasks.pop(task_id, None)
+        self.upload_progress.pop(task_id, None)
+
+    async def _schedule_delayed_cleanup(
+        self, task_id: str, delay_seconds: int = 300
+    ) -> None:
+        """延迟清理任务，作为客户端不轮询时的兜底机制。"""
+        try:
+            await asyncio.sleep(delay_seconds)
+        except asyncio.CancelledError:
+            return
+        self._cleanup_task(task_id)
+
     def _update_progress(
         self,
         task_id: str,
@@ -114,6 +233,16 @@ def _update_progress(
         if total is not None:
             p["total"] = total
 
+    async def _persist_progress(self, task_id: str) -> None:
+        progress = self.upload_progress.get(task_id)
+        if not progress:
+            return
+        await self._update_persistent_task(
+            task_id,
+            status=progress.get("status"),
+            **self._get_persistent_progress_updates(task_id),
+        )
+
     def _make_progress_callback(self, task_id: str, file_idx: int, file_name: str):
         async def _callback(stage: str, current: int, total: int) -> None:
             self._update_progress(
@@ -125,16 +254,140 @@ async def _callback(stage: str, current: int, total: int) -> None:
                 current=current,
                 total=total,
             )
+            await self._persist_progress(task_id)
 
         return _callback
 
     @staticmethod
     def _format_failed_doc_error(file_name: str, error: Exception) -> str:
         message = str(error).strip() or "上传失败：发生未知错误。"
-        if message.startswith(file_name):
+        if message.startswith(f"{file_name}:"):
             return message
         return f"{file_name}: {message}"
 
+    @staticmethod
+    def _resolve_batch_task_status(success_count: int, failed_count: int) -> str:
+        if failed_count == 0:
+            return "completed"
+        if success_count > 0:
+            return "partial_failed"
+        return "failed"
+
+    @staticmethod
+    def _build_batch_failure_error(
+        failed_docs: list[dict],
+        success_count: int = 0,
+        action: str = "上传",
+    ) -> str | None:
+        if not failed_docs:
+            return None
+        if len(failed_docs) == 1:
+            return failed_docs[0].get("error") or "上传失败：发生未知错误。"
+        if success_count > 0:
+            return f"部分文档{action}失败，共 {len(failed_docs)} 个失败。"
+        return f"所有文档{action}失败，共 {len(failed_docs)} 个失败。"
+
+    @staticmethod
+    def _format_size_limit(size_bytes: int) -> str:
+        size_mb = size_bytes / (1024 * 1024)
+        if size_mb.is_integer():
+            return f"{int(size_mb)}MB"
+        return f"{size_mb:.2f}MB"
+
+    @staticmethod
+    def _coerce_optional_int(value: Any, field_name: str) -> int | None:
+        if value in (None, ""):
+            return None
+        try:
+            return int(value)
+        except (TypeError, ValueError) as e:
+            raise ValueError(f"{field_name} 必须是整数") from e
+
+    @staticmethod
+    def _coerce_optional_bool(value: Any, field_name: str) -> bool:
+        if isinstance(value, bool):
+            return value
+        if value in (None, ""):
+            return False
+        if isinstance(value, str):
+            lowered = value.strip().lower()
+            if lowered in {"true", "1", "yes", "on"}:
+                return True
+            if lowered in {"false", "0", "no", "off"}:
+                return False
+        raise ValueError(f"{field_name} 必须是布尔值")
+
+    @staticmethod
+    def _validate_chunk_options(
+        *,
+        chunk_size: int | None,
+        chunk_overlap: int | None,
+    ) -> None:
+        if chunk_size is not None and chunk_size <= 0:
+            raise ValueError("chunk_size 必须大于 0")
+        if chunk_overlap is not None and chunk_overlap < 0:
+            raise ValueError("chunk_overlap 不能为负数")
+        if (
+            chunk_size is not None
+            and chunk_overlap is not None
+            and chunk_overlap >= chunk_size
+        ):
+            raise ValueError("chunk_overlap 必须小于 chunk_size")
+
+    @staticmethod
+    def _validate_positive_int(value: int | None, field_name: str) -> None:
+        if value is not None and value <= 0:
+            raise ValueError(f"{field_name} 必须大于 0")
+
+    @classmethod
+    def _validate_kb_options(
+        cls,
+        *,
+        chunk_size: int | None,
+        chunk_overlap: int | None,
+        top_k_dense: int | None,
+        top_k_sparse: int | None,
+        top_m_final: int | None,
+        index_type: str | None,
+    ) -> None:
+        cls._validate_chunk_options(
+            chunk_size=chunk_size,
+            chunk_overlap=chunk_overlap,
+        )
+        cls._validate_positive_int(top_k_dense, "top_k_dense")
+        cls._validate_positive_int(top_k_sparse, "top_k_sparse")
+        cls._validate_positive_int(top_m_final, "top_m_final")
+        if index_type is not None and index_type not in {"flat", "hnsw"}:
+            raise ValueError("index_type 必须是 flat 或 hnsw")
+
+    @classmethod
+    def _validate_upload_options(
+        cls,
+        *,
+        chunk_size: int,
+        chunk_overlap: int,
+        batch_size: int,
+        tasks_limit: int,
+        max_retries: int,
+    ) -> None:
+        cls._validate_chunk_options(
+            chunk_size=chunk_size,
+            chunk_overlap=chunk_overlap,
+        )
+        cls._validate_positive_int(batch_size, "batch_size")
+        cls._validate_positive_int(tasks_limit, "tasks_limit")
+        if max_retries < 0:
+            raise ValueError("max_retries 不能为负数")
+
+    @staticmethod
+    def _validate_upload_file(file_name: str, file_size: int) -> None:
+        file_type = file_name.rsplit(".", 1)[-1].lower() if "." in file_name else ""
+        if file_type not in ALLOWED_UPLOAD_EXTENSIONS:
+            raise ValueError(f"不支持的文件类型: {file_name}")
+        if file_size > MAX_UPLOAD_FILE_SIZE:
+            limit = KnowledgeBaseRoute._format_size_limit(MAX_UPLOAD_FILE_SIZE)
+            raise ValueError(f"文件超过 {limit} 限制: {file_name}")
+
     async def _background_upload_task(
         self,
         task_id: str,
@@ -158,6 +411,7 @@ async def _background_upload_task(
                 "current": 0,
                 "total": 100,
             }
+            await self._persist_progress(task_id)
 
             uploaded_docs = []
             failed_docs = []
@@ -174,6 +428,7 @@ async def _background_upload_task(
                         current=0,
                         total=100,
                     )
+                    await self._persist_progress(task_id)
 
                     # 创建进度回调函数
                     progress_callback = self._make_progress_callback(
@@ -214,12 +469,42 @@ async def _background_upload_task(
                 "failed_count": len(failed_docs),
             }
 
-            self._set_task_result(task_id, "completed", result=result)
+            task_status = self._resolve_batch_task_status(
+                len(uploaded_docs),
+                len(failed_docs),
+            )
+            task_error = self._build_batch_failure_error(
+                failed_docs,
+                success_count=len(uploaded_docs),
+                action="上传",
+            )
+            self._set_task_result(
+                task_id,
+                task_status,
+                result=result,
+                error=task_error,
+            )
+            await self._update_persistent_task(
+                task_id,
+                status=task_status,
+                result=result,
+                error=task_error,
+                **self._get_persistent_progress_updates(task_id),
+            )
 
         except Exception as e:
             logger.error(f"后台上传任务 {task_id} 失败: {e}")
             logger.error(traceback.format_exc())
             self._set_task_result(task_id, "failed", error=str(e))
+            await self._update_persistent_task(
+                task_id,
+                status="failed",
+                error=str(e),
+                **self._get_persistent_progress_updates(task_id),
+            )
+        finally:
+            # 兜底清理：防止客户端不轮询 get_upload_progress 导致内存泄漏
+            asyncio.create_task(self._schedule_delayed_cleanup(task_id))
 
     async def _background_import_task(
         self,
@@ -242,6 +527,7 @@ async def _background_import_task(
                 "current": 0,
                 "total": 100,
             }
+            await self._persist_progress(task_id)
 
             uploaded_docs = []
             failed_docs = []
@@ -261,6 +547,7 @@ async def _background_import_task(
                         current=0,
                         total=100,
                     )
+                    await self._persist_progress(task_id)
 
                     # 创建进度回调函数
                     progress_callback = self._make_progress_callback(
@@ -282,6 +569,8 @@ async def _background_import_task(
                         max_retries=max_retries,
                         progress_callback=progress_callback,
                         pre_chunked_text=chunks,
+                        source_type="import",
+                        source_uri=file_name,
                     )
 
                     uploaded_docs.append(doc.model_dump())
@@ -304,32 +593,327 @@ async def _background_import_task(
                 "failed_count": len(failed_docs),
             }
 
-            self._set_task_result(task_id, "completed", result=result)
+            task_status = self._resolve_batch_task_status(
+                len(uploaded_docs),
+                len(failed_docs),
+            )
+            task_error = self._build_batch_failure_error(
+                failed_docs,
+                success_count=len(uploaded_docs),
+                action="导入",
+            )
+            self._set_task_result(
+                task_id,
+                task_status,
+                result=result,
+                error=task_error,
+            )
+            await self._update_persistent_task(
+                task_id,
+                status=task_status,
+                result=result,
+                error=task_error,
+                **self._get_persistent_progress_updates(task_id),
+            )
 
         except Exception as e:
             logger.error(f"后台导入任务 {task_id} 失败: {e}")
             logger.error(traceback.format_exc())
             self._set_task_result(task_id, "failed", error=str(e))
+            await self._update_persistent_task(
+                task_id,
+                status="failed",
+                error=str(e),
+                **self._get_persistent_progress_updates(task_id),
+            )
+        finally:
+            asyncio.create_task(self._schedule_delayed_cleanup(task_id))
+
+    async def _background_rebuild_document_task(
+        self,
+        task_id: str,
+        kb_helper,
+        doc_id: str,
+        chunk_size: int | None,
+        chunk_overlap: int | None,
+        batch_size: int,
+        tasks_limit: int,
+        max_retries: int,
+    ) -> None:
+        """Run a single document rebuild in the background."""
+        try:
+            self._init_task(task_id, status="processing")
+            self.upload_progress[task_id] = {
+                "status": "processing",
+                "file_index": 0,
+                "file_total": 1,
+                "file_name": doc_id,
+                "stage": "rebuilding",
+                "current": 0,
+                "total": 100,
+            }
+            await self._persist_progress(task_id)
+
+            progress_callback = self._make_progress_callback(task_id, 0, doc_id)
+            doc = await kb_helper.rebuild_document(
+                doc_id,
+                chunk_size=chunk_size,
+                chunk_overlap=chunk_overlap,
+                batch_size=batch_size,
+                tasks_limit=tasks_limit,
+                max_retries=max_retries,
+                progress_callback=progress_callback,
+            )
+
+            result = {
+                "task_id": task_id,
+                "rebuilt": [doc.model_dump()],
+                "failed": [],
+                "total": 1,
+                "success_count": 1,
+                "failed_count": 0,
+            }
+            self._update_progress(
+                task_id,
+                status="completed",
+                file_index=0,
+                file_name=doc_id,
+                stage="completed",
+                current=100,
+                total=100,
+            )
+            self._set_task_result(task_id, "completed", result=result)
+            await self._update_persistent_task(
+                task_id,
+                status="completed",
+                result=result,
+                error=None,
+                **self._get_persistent_progress_updates(task_id),
+            )
+
+        except Exception as e:
+            logger.error(f"后台重建文档任务 {task_id} 失败: {e}")
+            logger.error(traceback.format_exc())
+            self._set_task_result(task_id, "failed", error=str(e))
+            await self._update_persistent_task(
+                task_id,
+                status="failed",
+                error=str(e),
+                **self._get_persistent_progress_updates(task_id),
+            )
+        finally:
+            asyncio.create_task(self._schedule_delayed_cleanup(task_id))
+
+    async def _background_rebuild_kb_task(
+        self,
+        task_id: str,
+        kb_helper,
+        chunk_size: int | None,
+        chunk_overlap: int | None,
+        batch_size: int,
+        tasks_limit: int,
+        max_retries: int,
+    ) -> None:
+        """Run a full knowledge base rebuild in the background."""
+        kb_name = getattr(getattr(kb_helper, "kb", None), "kb_name", "knowledge base")
+        try:
+            self._init_task(task_id, status="processing")
+            self.upload_progress[task_id] = {
+                "status": "processing",
+                "file_index": 0,
+                "file_total": 1,
+                "file_name": kb_name,
+                "stage": "rebuilding",
+                "current": 0,
+                "total": 100,
+            }
+            await self._persist_progress(task_id)
+
+            progress_callback = self._make_progress_callback(
+                task_id,
+                0,
+                kb_name,
+            )
+            result = await kb_helper.rebuild_all_documents(
+                chunk_size=chunk_size,
+                chunk_overlap=chunk_overlap,
+                batch_size=batch_size,
+                tasks_limit=tasks_limit,
+                max_retries=max_retries,
+                progress_callback=progress_callback,
+            )
+            result = {
+                "task_id": task_id,
+                **result,
+            }
+            task_status = self._resolve_batch_task_status(
+                int(result.get("success_count") or 0),
+                int(result.get("failed_count") or 0),
+            )
+            task_error = self._build_batch_failure_error(
+                result.get("failed") or [],
+                success_count=int(result.get("success_count") or 0),
+                action="重建",
+            )
+            completed_total = max(int(result.get("total") or 0), 1)
+            self._update_progress(
+                task_id,
+                status=task_status,
+                file_index=0,
+                file_name=kb_name,
+                stage="completed",
+                current=completed_total,
+                total=completed_total,
+            )
+            self._set_task_result(
+                task_id,
+                task_status,
+                result=result,
+                error=task_error,
+            )
+            await self._update_persistent_task(
+                task_id,
+                status=task_status,
+                result=result,
+                error=task_error,
+                **self._get_persistent_progress_updates(task_id),
+            )
+
+        except Exception as e:
+            logger.error(f"后台重建知识库任务 {task_id} 失败: {e}")
+            logger.error(traceback.format_exc())
+            self._set_task_result(task_id, "failed", error=str(e))
+            await self._update_persistent_task(
+                task_id,
+                status="failed",
+                error=str(e),
+                **self._get_persistent_progress_updates(task_id),
+            )
+        finally:
+            asyncio.create_task(self._schedule_delayed_cleanup(task_id))
+
+    async def _background_rebuild_documents_task(
+        self,
+        task_id: str,
+        kb_helper,
+        doc_ids: list[str],
+        chunk_size: int | None,
+        chunk_overlap: int | None,
+        batch_size: int,
+        tasks_limit: int,
+        max_retries: int,
+    ) -> None:
+        """Run selected document rebuilds in the background."""
+        total = max(len(doc_ids), 1)
+        task_name = f"{len(doc_ids)} selected documents"
+        try:
+            self._init_task(task_id, status="processing")
+            self.upload_progress[task_id] = {
+                "status": "processing",
+                "file_index": 0,
+                "file_total": total,
+                "file_name": task_name,
+                "stage": "rebuilding",
+                "current": 0,
+                "total": total,
+            }
+            await self._persist_progress(task_id)
+
+            progress_callback = self._make_progress_callback(
+                task_id,
+                0,
+                task_name,
+            )
+            result = await kb_helper.rebuild_documents(
+                doc_ids,
+                chunk_size=chunk_size,
+                chunk_overlap=chunk_overlap,
+                batch_size=batch_size,
+                tasks_limit=tasks_limit,
+                max_retries=max_retries,
+                progress_callback=progress_callback,
+            )
+            result = {
+                "task_id": task_id,
+                **result,
+            }
+            task_status = self._resolve_batch_task_status(
+                int(result.get("success_count") or 0),
+                int(result.get("failed_count") or 0),
+            )
+            task_error = self._build_batch_failure_error(
+                result.get("failed") or [],
+                success_count=int(result.get("success_count") or 0),
+                action="重建",
+            )
+            completed_total = max(int(result.get("total") or 0), 1)
+            self._update_progress(
+                task_id,
+                status=task_status,
+                file_index=0,
+                file_name=task_name,
+                stage="completed",
+                current=completed_total,
+                total=completed_total,
+            )
+            self._set_task_result(
+                task_id,
+                task_status,
+                result=result,
+                error=task_error,
+            )
+            await self._update_persistent_task(
+                task_id,
+                status=task_status,
+                result=result,
+                error=task_error,
+                **self._get_persistent_progress_updates(task_id),
+            )
+
+        except Exception as e:
+            logger.error(f"后台批量重建文档任务 {task_id} 失败: {e}")
+            logger.error(traceback.format_exc())
+            self._set_task_result(task_id, "failed", error=str(e))
+            await self._update_persistent_task(
+                task_id,
+                status="failed",
+                error=str(e),
+                **self._get_persistent_progress_updates(task_id),
+            )
+        finally:
+            asyncio.create_task(self._schedule_delayed_cleanup(task_id))
 
     async def list_kbs(self):
         """获取知识库列表
 
         Query 参数:
         - page: 页码 (默认 1)
-        - page_size: 每页数量 (默认 20)
+        - page_size: 每页数量
         - refresh_stats: 是否刷新统计信息 (默认 false，首次加载时可设为 true)
         """
         try:
             kb_manager = self._get_kb_manager()
-            page = request.args.get("page", 1, type=int)
-            page_size = request.args.get("page_size", 20, type=int)
+            page = self._get_positive_query_int("page", 1)
+            page_size = self._get_positive_query_int(
+                "page_size",
+                DEFAULT_KB_PAGE_SIZE,
+            )
+            refresh_stats = request.args.get("refresh_stats") == "true"
+            kb_db = self._get_kb_db()
 
             kbs = await kb_manager.list_kbs()
+            total = len(kbs)
+            start = (page - 1) * page_size
+            paged_kbs = kbs[start : start + page_size]
 
             # 转换为字典列表
             kb_list = []
-            for kb in kbs:
+            for kb in paged_kbs:
                 kb_dict = kb.model_dump()
+                if refresh_stats and kb_db and hasattr(kb_db, "get_kb_stats"):
+                    stats = await kb_db.get_kb_stats(kb.kb_id)
+                    if stats:
+                        kb_dict.update(stats)
                 # include init_error from KBHelper if present
                 kb_helper = await kb_manager.get_kb(kb.kb_id)
                 if kb_helper and kb_helper.init_error:
@@ -338,7 +922,14 @@ async def list_kbs(self):
 
             return (
                 Response()
-                .ok({"items": kb_list, "page": page, "page_size": page_size})
+                .ok(
+                    {
+                        "items": kb_list,
+                        "page": page,
+                        "page_size": page_size,
+                        "total": total,
+                    },
+                )
                 .__dict__
             )
         except ValueError as e:
@@ -374,11 +965,40 @@ async def create_kb(self):
             emoji = data.get("emoji")
             embedding_provider_id = data.get("embedding_provider_id")
             rerank_provider_id = data.get("rerank_provider_id")
-            chunk_size = data.get("chunk_size")
-            chunk_overlap = data.get("chunk_overlap")
-            top_k_dense = data.get("top_k_dense")
-            top_k_sparse = data.get("top_k_sparse")
-            top_m_final = data.get("top_m_final")
+            chunk_size = self._coerce_optional_int(data.get("chunk_size"), "chunk_size")
+            chunk_overlap = self._coerce_optional_int(
+                data.get("chunk_overlap"),
+                "chunk_overlap",
+            )
+            top_k_dense = self._coerce_optional_int(
+                data.get("top_k_dense"),
+                "top_k_dense",
+            )
+            top_k_sparse = self._coerce_optional_int(
+                data.get("top_k_sparse"),
+                "top_k_sparse",
+            )
+            top_m_final = self._coerce_optional_int(
+                data.get("top_m_final"),
+                "top_m_final",
+            )
+            index_type = data.get("index_type")
+            self._validate_kb_options(
+                chunk_size=chunk_size if chunk_size is not None else DEFAULT_CHUNK_SIZE,
+                chunk_overlap=chunk_overlap
+                if chunk_overlap is not None
+                else DEFAULT_CHUNK_OVERLAP,
+                top_k_dense=top_k_dense
+                if top_k_dense is not None
+                else DEFAULT_TOP_K_DENSE,
+                top_k_sparse=top_k_sparse
+                if top_k_sparse is not None
+                else DEFAULT_TOP_K_SPARSE,
+                top_m_final=top_m_final
+                if top_m_final is not None
+                else DEFAULT_TOP_M_FINAL,
+                index_type=index_type if index_type is not None else DEFAULT_INDEX_TYPE,
+            )
 
             # pre-check embedding dim
             if not embedding_provider_id:
@@ -433,6 +1053,7 @@ async def create_kb(self):
                 top_k_dense=top_k_dense,
                 top_k_sparse=top_k_sparse,
                 top_m_final=top_m_final,
+                index_type=index_type,
             )
             kb = kb_helper.kb
 
@@ -495,34 +1116,72 @@ async def update_kb(self):
             if not kb_id:
                 return Response().error("缺少参数 kb_id").__dict__
 
+            update_fields = [
+                "kb_name",
+                "description",
+                "emoji",
+                "embedding_provider_id",
+                "rerank_provider_id",
+                "chunk_size",
+                "chunk_overlap",
+                "top_k_dense",
+                "top_k_sparse",
+                "top_m_final",
+                "index_type",
+            ]
+            if not any(field in data for field in update_fields):
+                return Response().error("至少需要提供一个更新字段").__dict__
+
             kb_name = data.get("kb_name")
             description = data.get("description")
             emoji = data.get("emoji")
             embedding_provider_id = data.get("embedding_provider_id")
-            rerank_provider_id = data.get("rerank_provider_id")
-            chunk_size = data.get("chunk_size")
-            chunk_overlap = data.get("chunk_overlap")
-            top_k_dense = data.get("top_k_dense")
-            top_k_sparse = data.get("top_k_sparse")
-            top_m_final = data.get("top_m_final")
-
-            # 检查是否至少提供了一个更新字段
-            if all(
-                v is None
-                for v in [
-                    kb_name,
-                    description,
-                    emoji,
-                    embedding_provider_id,
-                    rerank_provider_id,
-                    chunk_size,
-                    chunk_overlap,
-                    top_k_dense,
-                    top_k_sparse,
-                    top_m_final,
-                ]
-            ):
-                return Response().error("至少需要提供一个更新字段").__dict__
+            rerank_provider_provided = "rerank_provider_id" in data
+            rerank_provider_id = (
+                data.get("rerank_provider_id") if rerank_provider_provided else None
+            )
+            chunk_size = self._coerce_optional_int(data.get("chunk_size"), "chunk_size")
+            chunk_overlap = self._coerce_optional_int(
+                data.get("chunk_overlap"),
+                "chunk_overlap",
+            )
+            top_k_dense = self._coerce_optional_int(
+                data.get("top_k_dense"),
+                "top_k_dense",
+            )
+            top_k_sparse = self._coerce_optional_int(
+                data.get("top_k_sparse"),
+                "top_k_sparse",
+            )
+            top_m_final = self._coerce_optional_int(
+                data.get("top_m_final"),
+                "top_m_final",
+            )
+            index_type = data.get("index_type")
+            kb_helper = await kb_manager.get_kb(kb_id)
+            if not kb_helper:
+                return Response().error("知识库不存在").__dict__
+            current_kb = kb_helper.kb
+            self._validate_kb_options(
+                chunk_size=chunk_size
+                if chunk_size is not None
+                else current_kb.chunk_size,
+                chunk_overlap=chunk_overlap
+                if chunk_overlap is not None
+                else current_kb.chunk_overlap,
+                top_k_dense=top_k_dense
+                if top_k_dense is not None
+                else current_kb.top_k_dense,
+                top_k_sparse=top_k_sparse
+                if top_k_sparse is not None
+                else current_kb.top_k_sparse,
+                top_m_final=top_m_final
+                if top_m_final is not None
+                else current_kb.top_m_final,
+                index_type=index_type
+                if index_type is not None
+                else current_kb.index_type,
+            )
 
             kb_helper = await kb_manager.update_kb(
                 kb_id=kb_id,
@@ -530,12 +1189,17 @@ async def update_kb(self):
                 description=description,
                 emoji=emoji,
                 embedding_provider_id=embedding_provider_id,
-                rerank_provider_id=rerank_provider_id,
+                **(
+                    {"rerank_provider_id": rerank_provider_id}
+                    if rerank_provider_provided
+                    else {}
+                ),
                 chunk_size=chunk_size,
                 chunk_overlap=chunk_overlap,
                 top_k_dense=top_k_dense,
                 top_k_sparse=top_k_sparse,
                 top_m_final=top_m_final,
+                index_type=index_type,
             )
 
             if not kb_helper:
@@ -594,12 +1258,28 @@ async def get_kb_stats(self):
             if not kb_helper:
                 return Response().error("知识库不存在").__dict__
             kb = kb_helper.kb
+            kb_db = self._get_kb_db()
+            if kb_db and hasattr(kb_db, "get_kb_stats"):
+                stats = await kb_db.get_kb_stats(kb_id)
+                if stats is not None:
+                    return Response().ok(stats).__dict__
 
             stats = {
                 "kb_id": kb.kb_id,
                 "kb_name": kb.kb_name,
                 "doc_count": kb.doc_count,
                 "chunk_count": kb.chunk_count,
+                "document_count": kb.doc_count,
+                "ready_document_count": kb.doc_count,
+                "failed_document_count": 0,
+                "pending_document_count": 0,
+                "processing_document_count": 0,
+                "indexed_chunk_count": kb.chunk_count,
+                "document_chunk_count": kb.chunk_count,
+                "media_count": 0,
+                "source_file_count": 0,
+                "storage_bytes": 0,
+                "status_counts": {"ready": kb.doc_count},
                 "created_at": kb.created_at.isoformat(),
                 "updated_at": kb.updated_at.isoformat(),
             }
@@ -613,38 +1293,121 @@ async def get_kb_stats(self):
             logger.error(traceback.format_exc())
             return Response().error(f"获取知识库统计失败: {e!s}").__dict__
 
-    # ===== 文档管理 API =====
-
-    async def list_documents(self):
-        """获取文档列表
-
-        Query 参数:
-        - kb_id: 知识库 ID (必填)
-        - page: 页码 (默认 1)
-        - page_size: 每页数量 (默认 20)
-        """
+    async def check_kb_consistency(self):
+        """Check consistency across metadata, source files, and indexed chunks."""
         try:
             kb_manager = self._get_kb_manager()
             kb_id = request.args.get("kb_id")
             if not kb_id:
                 return Response().error("缺少参数 kb_id").__dict__
+
             kb_helper = await kb_manager.get_kb(kb_id)
             if not kb_helper:
                 return Response().error("知识库不存在").__dict__
 
-            page = request.args.get("page", 1, type=int)
-            page_size = request.args.get("page_size", 100, type=int)
+            report = await kb_helper.check_consistency()
+            return Response().ok(report).__dict__
 
-            offset = (page - 1) * page_size
-            limit = page_size
+        except ValueError as e:
+            return Response().error(str(e)).__dict__
+        except Exception as e:
+            logger.error(f"检查知识库一致性失败: {e}")
+            logger.error(traceback.format_exc())
+            return Response().error(f"检查知识库一致性失败: {e!s}").__dict__
 
-            doc_list = await kb_helper.list_documents(offset=offset, limit=limit)
+    async def repair_kb_consistency(self):
+        """Repair low-risk consistency issues for a knowledge base."""
+        try:
+            kb_manager = self._get_kb_manager()
+            data = await request.json
+
+            kb_id = data.get("kb_id")
+            if not kb_id:
+                return Response().error("缺少参数 kb_id").__dict__
+
+            repair_types = data.get("repair_types")
+            if repair_types is not None and not isinstance(repair_types, list):
+                return Response().error("repair_types 格式错误").__dict__
+
+            kb_helper = await kb_manager.get_kb(kb_id)
+            if not kb_helper:
+                return Response().error("知识库不存在").__dict__
+
+            report = await kb_helper.repair_consistency(repair_types=repair_types)
+            return Response().ok(report).__dict__
+
+        except ValueError as e:
+            return Response().error(str(e)).__dict__
+        except Exception as e:
+            logger.error(f"修复知识库一致性失败: {e}")
+            logger.error(traceback.format_exc())
+            return Response().error(f"修复知识库一致性失败: {e!s}").__dict__
+
+    # ===== 文档管理 API =====
+
+    async def list_documents(self):
+        """获取文档列表
+
+        Query 参数:
+        - kb_id: 知识库 ID (必填)
+        - page: 页码 (默认 1)
+        - page_size: 每页数量
+        """
+        try:
+            kb_manager = self._get_kb_manager()
+            kb_id = request.args.get("kb_id")
+            if not kb_id:
+                return Response().error("缺少参数 kb_id").__dict__
+            kb_helper = await kb_manager.get_kb(kb_id)
+            if not kb_helper:
+                return Response().error("知识库不存在").__dict__
+
+            page = self._get_positive_query_int("page", 1)
+            page_size = self._get_positive_query_int(
+                "page_size",
+                DEFAULT_DOCUMENT_PAGE_SIZE,
+            )
+            search = (request.args.get("search") or "").strip() or None
+            status = (request.args.get("status") or "").strip() or None
+            source_type = (request.args.get("source_type") or "").strip() or None
+            if status and status not in DOCUMENT_FILTER_STATUSES:
+                return Response().error("status 参数无效").__dict__
+            if source_type and source_type not in DOCUMENT_FILTER_SOURCE_TYPES:
+                return Response().error("source_type 参数无效").__dict__
+
+            offset = (page - 1) * page_size
+            limit = page_size
+
+            doc_list = await kb_helper.list_documents(
+                offset=offset,
+                limit=limit,
+                search=search,
+                status=status,
+                source_type=source_type,
+            )
+            total = await kb_helper.count_documents(
+                search=search,
+                status=status,
+                source_type=source_type,
+            )
+            document_count = total
+            if search is not None or status is not None or source_type is not None:
+                document_count = await kb_helper.count_documents()
 
             doc_list = [doc.model_dump() for doc in doc_list]
 
             return (
                 Response()
-                .ok({"items": doc_list, "page": page, "page_size": page_size})
+                .ok(
+                    {
+                        "items": doc_list,
+                        "page": page,
+                        "page_size": page_size,
+                        "total": total,
+                        "filtered_total": total,
+                        "document_count": document_count,
+                    },
+                )
                 .__dict__
             )
 
@@ -683,9 +1446,9 @@ async def upload_document(self):
             kb_id = None
             chunk_size = None
             chunk_overlap = None
-            batch_size = 32
-            tasks_limit = 3
-            max_retries = 3
+            batch_size = None
+            tasks_limit = None
+            max_retries = None
             files_to_upload = []  # 存储待上传的文件信息列表
 
             if content_type and "multipart/form-data" not in content_type:
@@ -696,11 +1459,46 @@ async def upload_document(self):
             files = await request.files
 
             kb_id = form_data.get("kb_id")
-            chunk_size = int(form_data.get("chunk_size", 512))
-            chunk_overlap = int(form_data.get("chunk_overlap", 50))
-            batch_size = int(form_data.get("batch_size", 32))
-            tasks_limit = int(form_data.get("tasks_limit", 3))
-            max_retries = int(form_data.get("max_retries", 3))
+            chunk_size = self._coerce_optional_int(
+                form_data.get("chunk_size"),
+                "chunk_size",
+            )
+            chunk_overlap = self._coerce_optional_int(
+                form_data.get("chunk_overlap"),
+                "chunk_overlap",
+            )
+            batch_size = self._coerce_optional_int(
+                form_data.get("batch_size"),
+                "batch_size",
+            )
+            tasks_limit = self._coerce_optional_int(
+                form_data.get("tasks_limit"),
+                "tasks_limit",
+            )
+            max_retries = self._coerce_optional_int(
+                form_data.get("max_retries"),
+                "max_retries",
+            )
+            chunk_size = chunk_size if chunk_size is not None else DEFAULT_CHUNK_SIZE
+            chunk_overlap = (
+                chunk_overlap if chunk_overlap is not None else DEFAULT_CHUNK_OVERLAP
+            )
+            batch_size = (
+                batch_size if batch_size is not None else DEFAULT_UPLOAD_BATCH_SIZE
+            )
+            tasks_limit = (
+                tasks_limit if tasks_limit is not None else DEFAULT_UPLOAD_TASKS_LIMIT
+            )
+            max_retries = (
+                max_retries if max_retries is not None else DEFAULT_UPLOAD_MAX_RETRIES
+            )
+            self._validate_upload_options(
+                chunk_size=chunk_size,
+                chunk_overlap=chunk_overlap,
+                batch_size=batch_size,
+                tasks_limit=tasks_limit,
+                max_retries=max_retries,
+            )
             if not kb_id:
                 return Response().error("缺少参数 kb_id").__dict__
 
@@ -716,8 +1514,10 @@ async def upload_document(self):
                 return Response().error("缺少文件").__dict__
 
             # 限制文件数量
-            if len(file_list) > 10:
-                return Response().error("最多只能上传10个文件").__dict__
+            if len(file_list) > MAX_UPLOAD_FILES:
+                return (
+                    Response().error(f"最多只能上传{MAX_UPLOAD_FILES}个文件").__dict__
+                )
 
             # 处理每个文件
             for file in file_list:
@@ -739,6 +1539,7 @@ async def upload_document(self):
                     file_type = (
                         file_name.rsplit(".", 1)[-1].lower() if "." in file_name else ""
                     )
+                    self._validate_upload_file(file_name, len(file_content))
 
                     files_to_upload.append(
                         {
@@ -762,6 +1563,20 @@ async def upload_document(self):
 
             # 初始化任务状态
             self._init_task(task_id, status="pending")
+            await self._create_persistent_task(
+                task_id=task_id,
+                kb_id=kb_id,
+                task_type="upload",
+                status="pending",
+                progress={
+                    "status": "pending",
+                    "file_index": 0,
+                    "file_total": len(files_to_upload),
+                    "stage": "waiting",
+                    "current": 0,
+                    "total": 100,
+                },
+            )
 
             # 启动后台任务
             asyncio.create_task(
@@ -815,9 +1630,20 @@ def _validate_import_request(self, data: dict):
             ):
                 raise ValueError("chunks 必须是非空字符串列表")
 
-        batch_size = data.get("batch_size", 32)
-        tasks_limit = data.get("tasks_limit", 3)
-        max_retries = data.get("max_retries", 3)
+        batch_size = self._coerce_optional_int(data.get("batch_size"), "batch_size")
+        tasks_limit = self._coerce_optional_int(data.get("tasks_limit"), "tasks_limit")
+        max_retries = self._coerce_optional_int(data.get("max_retries"), "max_retries")
+        batch_size = batch_size if batch_size is not None else DEFAULT_UPLOAD_BATCH_SIZE
+        tasks_limit = (
+            tasks_limit if tasks_limit is not None else DEFAULT_UPLOAD_TASKS_LIMIT
+        )
+        max_retries = (
+            max_retries if max_retries is not None else DEFAULT_UPLOAD_MAX_RETRIES
+        )
+        self._validate_positive_int(batch_size, "batch_size")
+        self._validate_positive_int(tasks_limit, "tasks_limit")
+        if max_retries < 0:
+            raise ValueError("max_retries 不能为负数")
         return kb_id, documents, batch_size, tasks_limit, max_retries
 
     async def import_documents(self):
@@ -851,6 +1677,20 @@ async def import_documents(self):
 
             # 初始化任务状态
             self._init_task(task_id, status="pending")
+            await self._create_persistent_task(
+                task_id=task_id,
+                kb_id=kb_id,
+                task_type="import",
+                status="pending",
+                progress={
+                    "status": "pending",
+                    "file_index": 0,
+                    "file_total": len(documents),
+                    "stage": "waiting",
+                    "current": 0,
+                    "total": 100,
+                },
+            )
 
             # 启动后台任务
             asyncio.create_task(
@@ -893,6 +1733,7 @@ async def get_upload_progress(self):
         - pending: 任务待处理
         - processing: 任务处理中
         - completed: 任务完成
+        - partial_failed: 任务部分失败
         - failed: 任务失败
         """
         try:
@@ -902,7 +1743,27 @@ async def get_upload_progress(self):
 
             # 检查任务是否存在
             if task_id not in self.upload_tasks:
-                return Response().error("找不到该任务").__dict__
+                persistent_task = await self._get_persistent_task(task_id)
+                if persistent_task is None:
+                    return Response().error("找不到该任务").__dict__
+                response_data = {
+                    "task_id": task_id,
+                    "status": persistent_task["status"],
+                    "progress_stage": persistent_task.get("progress_stage"),
+                    "progress_current": persistent_task.get("progress_current", 0),
+                    "progress_total": persistent_task.get("progress_total", 100),
+                }
+                if persistent_task.get("progress") is not None:
+                    response_data["progress"] = persistent_task["progress"]
+                if persistent_task["status"] in (
+                    "completed",
+                    "partial_failed",
+                    "failed",
+                ):
+                    response_data["result"] = persistent_task.get("result")
+                if persistent_task["status"] in ("partial_failed", "failed"):
+                    response_data["error"] = persistent_task.get("error")
+                return Response().ok(response_data).__dict__
 
             task_info = self.upload_tasks[task_id]
             status = task_info["status"]
@@ -918,17 +1779,17 @@ async def get_upload_progress(self):
                 response_data["progress"] = self.upload_progress[task_id]
 
             # 如果任务完成，返回结果
-            if status == "completed":
+            if status in ("completed", "partial_failed", "failed"):
                 response_data["result"] = task_info["result"]
-                # 清理已完成的任务
-                # del self.upload_tasks[task_id]
-                # if task_id in self.upload_progress:
-                #     del self.upload_progress[task_id]
 
-            # 如果任务失败，返回错误信息
-            if status == "failed":
+            # 如果任务存在失败项，返回错误信息
+            if status in ("partial_failed", "failed"):
                 response_data["error"] = task_info["error"]
 
+            # 清理已结束的任务，释放内存
+            if status in ("completed", "partial_failed", "failed"):
+                self._cleanup_task(task_id)
+
             return Response().ok(response_data).__dict__
 
         except Exception as e:
@@ -936,6 +1797,69 @@ async def get_upload_progress(self):
             logger.error(traceback.format_exc())
             return Response().error(f"获取上传进度失败: {e!s}").__dict__
 
+    async def get_task(self):
+        """获取知识库持久任务详情"""
+        try:
+            task_id = request.args.get("task_id")
+            if not task_id:
+                return Response().error("缺少参数 task_id").__dict__
+
+            task = await self._get_persistent_task(task_id)
+            if not task:
+                return Response().error("任务不存在").__dict__
+            return Response().ok(task).__dict__
+
+        except Exception as e:
+            logger.error(f"获取知识库任务失败: {e}")
+            logger.error(traceback.format_exc())
+            return Response().error(f"获取知识库任务失败: {e!s}").__dict__
+
+    async def list_tasks(self):
+        """列出知识库持久任务"""
+        try:
+            kb_db = self._get_kb_db()
+            if not kb_db:
+                return Response().error("知识库数据库未初始化").__dict__
+
+            page = self._get_positive_query_int("page", 1)
+            page_size = self._get_positive_query_int(
+                "page_size",
+                DEFAULT_DOCUMENT_PAGE_SIZE,
+            )
+            kb_id = (request.args.get("kb_id") or "").strip() or None
+            status = (request.args.get("status") or "").strip() or None
+            task_type = (request.args.get("task_type") or "").strip() or None
+
+            tasks = await kb_db.list_ingestion_tasks(
+                kb_id=kb_id,
+                status=status,
+                task_type=task_type,
+                offset=(page - 1) * page_size,
+                limit=page_size,
+            )
+            total = await kb_db.count_ingestion_tasks(
+                kb_id=kb_id,
+                status=status,
+                task_type=task_type,
+            )
+            return (
+                Response()
+                .ok(
+                    {
+                        "items": tasks,
+                        "total": total,
+                        "page": page,
+                        "page_size": page_size,
+                    },
+                )
+                .__dict__
+            )
+
+        except Exception as e:
+            logger.error(f"获取知识库任务列表失败: {e}")
+            logger.error(traceback.format_exc())
+            return Response().error(f"获取知识库任务列表失败: {e!s}").__dict__
+
     async def get_document(self):
         """获取文档详情
 
@@ -999,6 +1923,425 @@ async def delete_document(self):
             logger.error(traceback.format_exc())
             return Response().error(f"删除文档失败: {e!s}").__dict__
 
+    async def rebuild_document(self):
+        """重建单个文档"""
+        try:
+            kb_manager = self._get_kb_manager()
+            data = await request.json
+
+            kb_id = data.get("kb_id")
+            if not kb_id:
+                return Response().error("缺少参数 kb_id").__dict__
+            doc_id = data.get("doc_id")
+            if not doc_id:
+                return Response().error("缺少参数 doc_id").__dict__
+
+            chunk_size = self._coerce_optional_int(data.get("chunk_size"), "chunk_size")
+            chunk_overlap = self._coerce_optional_int(
+                data.get("chunk_overlap"),
+                "chunk_overlap",
+            )
+            batch_size = self._coerce_optional_int(data.get("batch_size"), "batch_size")
+            tasks_limit = self._coerce_optional_int(
+                data.get("tasks_limit"),
+                "tasks_limit",
+            )
+            max_retries = self._coerce_optional_int(
+                data.get("max_retries"),
+                "max_retries",
+            )
+            effective_chunk_size = (
+                chunk_size if chunk_size is not None else DEFAULT_CHUNK_SIZE
+            )
+            effective_chunk_overlap = (
+                chunk_overlap if chunk_overlap is not None else DEFAULT_CHUNK_OVERLAP
+            )
+            effective_batch_size = (
+                batch_size if batch_size is not None else DEFAULT_UPLOAD_BATCH_SIZE
+            )
+            effective_tasks_limit = (
+                tasks_limit if tasks_limit is not None else DEFAULT_UPLOAD_TASKS_LIMIT
+            )
+            effective_max_retries = (
+                max_retries if max_retries is not None else DEFAULT_UPLOAD_MAX_RETRIES
+            )
+            self._validate_upload_options(
+                chunk_size=effective_chunk_size,
+                chunk_overlap=effective_chunk_overlap,
+                batch_size=effective_batch_size,
+                tasks_limit=effective_tasks_limit,
+                max_retries=effective_max_retries,
+            )
+            background = self._coerce_optional_bool(
+                data.get("background"),
+                "background",
+            )
+
+            kb_helper = await kb_manager.get_kb(kb_id)
+            if not kb_helper:
+                return Response().error("知识库不存在").__dict__
+
+            if background:
+                task_id = str(uuid.uuid4())
+                self._init_task(task_id, status="pending")
+                await self._create_persistent_task(
+                    task_id=task_id,
+                    kb_id=kb_id,
+                    task_type="document_rebuild",
+                    status="pending",
+                    progress={
+                        "status": "pending",
+                        "file_index": 0,
+                        "file_total": 1,
+                        "file_name": doc_id,
+                        "stage": "waiting",
+                        "current": 0,
+                        "total": 100,
+                    },
+                )
+                asyncio.create_task(
+                    self._background_rebuild_document_task(
+                        task_id=task_id,
+                        kb_helper=kb_helper,
+                        doc_id=doc_id,
+                        chunk_size=chunk_size,
+                        chunk_overlap=chunk_overlap,
+                        batch_size=effective_batch_size,
+                        tasks_limit=effective_tasks_limit,
+                        max_retries=effective_max_retries,
+                    ),
+                )
+                return (
+                    Response()
+                    .ok(
+                        {
+                            "task_id": task_id,
+                            "doc_id": doc_id,
+                            "message": (
+                                "document rebuild task created, "
+                                "processing in background"
+                            ),
+                        },
+                    )
+                    .__dict__
+                )
+
+            doc = await kb_helper.rebuild_document(
+                doc_id,
+                chunk_size=chunk_size,
+                chunk_overlap=chunk_overlap,
+                batch_size=effective_batch_size,
+                tasks_limit=effective_tasks_limit,
+                max_retries=effective_max_retries,
+            )
+            return Response().ok(doc.model_dump(), "重建文档成功").__dict__
+
+        except ValueError as e:
+            return Response().error(str(e)).__dict__
+        except Exception as e:
+            logger.error(f"重建文档失败: {e}")
+            logger.error(traceback.format_exc())
+            return Response().error(f"重建文档失败: {e!s}").__dict__
+
+    async def rebuild_kb(self):
+        """重建整个知识库"""
+        try:
+            kb_manager = self._get_kb_manager()
+            data = await request.json
+
+            kb_id = data.get("kb_id")
+            if not kb_id:
+                return Response().error("缺少参数 kb_id").__dict__
+
+            chunk_size = self._coerce_optional_int(data.get("chunk_size"), "chunk_size")
+            chunk_overlap = self._coerce_optional_int(
+                data.get("chunk_overlap"),
+                "chunk_overlap",
+            )
+            batch_size = self._coerce_optional_int(data.get("batch_size"), "batch_size")
+            tasks_limit = self._coerce_optional_int(
+                data.get("tasks_limit"),
+                "tasks_limit",
+            )
+            max_retries = self._coerce_optional_int(
+                data.get("max_retries"),
+                "max_retries",
+            )
+            effective_chunk_size = (
+                chunk_size if chunk_size is not None else DEFAULT_CHUNK_SIZE
+            )
+            effective_chunk_overlap = (
+                chunk_overlap if chunk_overlap is not None else DEFAULT_CHUNK_OVERLAP
+            )
+            effective_batch_size = (
+                batch_size if batch_size is not None else DEFAULT_UPLOAD_BATCH_SIZE
+            )
+            effective_tasks_limit = (
+                tasks_limit if tasks_limit is not None else DEFAULT_UPLOAD_TASKS_LIMIT
+            )
+            effective_max_retries = (
+                max_retries if max_retries is not None else DEFAULT_UPLOAD_MAX_RETRIES
+            )
+            self._validate_upload_options(
+                chunk_size=effective_chunk_size,
+                chunk_overlap=effective_chunk_overlap,
+                batch_size=effective_batch_size,
+                tasks_limit=effective_tasks_limit,
+                max_retries=effective_max_retries,
+            )
+            background = self._coerce_optional_bool(
+                data.get("background"),
+                "background",
+            )
+
+            kb_helper = await kb_manager.get_kb(kb_id)
+            if not kb_helper:
+                return Response().error("知识库不存在").__dict__
+
+            if background:
+                kb_name = getattr(
+                    getattr(kb_helper, "kb", None),
+                    "kb_name",
+                    "knowledge base",
+                )
+                task_id = str(uuid.uuid4())
+                self._init_task(task_id, status="pending")
+                await self._create_persistent_task(
+                    task_id=task_id,
+                    kb_id=kb_id,
+                    task_type="kb_rebuild",
+                    status="pending",
+                    progress={
+                        "status": "pending",
+                        "file_index": 0,
+                        "file_total": 1,
+                        "file_name": kb_name,
+                        "stage": "waiting",
+                        "current": 0,
+                        "total": 100,
+                    },
+                )
+                asyncio.create_task(
+                    self._background_rebuild_kb_task(
+                        task_id=task_id,
+                        kb_helper=kb_helper,
+                        chunk_size=chunk_size,
+                        chunk_overlap=chunk_overlap,
+                        batch_size=effective_batch_size,
+                        tasks_limit=effective_tasks_limit,
+                        max_retries=effective_max_retries,
+                    ),
+                )
+                return (
+                    Response()
+                    .ok(
+                        {
+                            "task_id": task_id,
+                            "kb_id": kb_id,
+                            "message": (
+                                "knowledge base rebuild task created, "
+                                "processing in background"
+                            ),
+                        },
+                    )
+                    .__dict__
+                )
+
+            result = await kb_helper.rebuild_all_documents(
+                chunk_size=chunk_size,
+                chunk_overlap=chunk_overlap,
+                batch_size=effective_batch_size,
+                tasks_limit=effective_tasks_limit,
+                max_retries=effective_max_retries,
+            )
+            return Response().ok(result, "重建知识库完成").__dict__
+
+        except ValueError as e:
+            return Response().error(str(e)).__dict__
+        except Exception as e:
+            logger.error(f"重建知识库失败: {e}")
+            logger.error(traceback.format_exc())
+            return Response().error(f"重建知识库失败: {e!s}").__dict__
+
+    async def batch_rebuild_documents(self):
+        """Start a background task to rebuild selected documents.
+
+        Body:
+        - kb_id: knowledge base ID (required)
+        - doc_ids: document ID list (required)
+        """
+        try:
+            kb_manager = self._get_kb_manager()
+            data = await request.json
+
+            kb_id = data.get("kb_id")
+            if not kb_id:
+                return Response().error("缺少参数 kb_id").__dict__
+            doc_ids = data.get("doc_ids")
+            if not doc_ids or not isinstance(doc_ids, list):
+                return Response().error("缺少参数 doc_ids 或格式错误").__dict__
+            normalized_doc_ids = list(
+                dict.fromkeys(
+                    doc_id.strip()
+                    for doc_id in doc_ids
+                    if isinstance(doc_id, str) and doc_id.strip()
+                )
+            )
+            if not normalized_doc_ids:
+                return Response().error("缺少参数 doc_ids 或格式错误").__dict__
+            if len(normalized_doc_ids) > MAX_BATCH_REBUILD_DOCUMENTS:
+                return (
+                    Response()
+                    .error(f"最多只能批量重建 {MAX_BATCH_REBUILD_DOCUMENTS} 个文档")
+                    .__dict__
+                )
+
+            chunk_size = self._coerce_optional_int(data.get("chunk_size"), "chunk_size")
+            chunk_overlap = self._coerce_optional_int(
+                data.get("chunk_overlap"),
+                "chunk_overlap",
+            )
+            batch_size = self._coerce_optional_int(data.get("batch_size"), "batch_size")
+            tasks_limit = self._coerce_optional_int(
+                data.get("tasks_limit"),
+                "tasks_limit",
+            )
+            max_retries = self._coerce_optional_int(
+                data.get("max_retries"),
+                "max_retries",
+            )
+            effective_chunk_size = (
+                chunk_size if chunk_size is not None else DEFAULT_CHUNK_SIZE
+            )
+            effective_chunk_overlap = (
+                chunk_overlap if chunk_overlap is not None else DEFAULT_CHUNK_OVERLAP
+            )
+            effective_batch_size = (
+                batch_size if batch_size is not None else DEFAULT_UPLOAD_BATCH_SIZE
+            )
+            effective_tasks_limit = (
+                tasks_limit if tasks_limit is not None else DEFAULT_UPLOAD_TASKS_LIMIT
+            )
+            effective_max_retries = (
+                max_retries if max_retries is not None else DEFAULT_UPLOAD_MAX_RETRIES
+            )
+            self._validate_upload_options(
+                chunk_size=effective_chunk_size,
+                chunk_overlap=effective_chunk_overlap,
+                batch_size=effective_batch_size,
+                tasks_limit=effective_tasks_limit,
+                max_retries=effective_max_retries,
+            )
+
+            kb_helper = await kb_manager.get_kb(kb_id)
+            if not kb_helper:
+                return Response().error("知识库不存在").__dict__
+
+            task_id = str(uuid.uuid4())
+            self._init_task(task_id, status="pending")
+            await self._create_persistent_task(
+                task_id=task_id,
+                kb_id=kb_id,
+                task_type="document_batch_rebuild",
+                status="pending",
+                progress={
+                    "status": "pending",
+                    "file_index": 0,
+                    "file_total": len(normalized_doc_ids),
+                    "file_name": f"{len(normalized_doc_ids)} selected documents",
+                    "stage": "waiting",
+                    "current": 0,
+                    "total": len(normalized_doc_ids),
+                },
+            )
+            asyncio.create_task(
+                self._background_rebuild_documents_task(
+                    task_id=task_id,
+                    kb_helper=kb_helper,
+                    doc_ids=normalized_doc_ids,
+                    chunk_size=chunk_size,
+                    chunk_overlap=chunk_overlap,
+                    batch_size=effective_batch_size,
+                    tasks_limit=effective_tasks_limit,
+                    max_retries=effective_max_retries,
+                ),
+            )
+            return (
+                Response()
+                .ok(
+                    {
+                        "task_id": task_id,
+                        "doc_ids": normalized_doc_ids,
+                        "message": (
+                            "document batch rebuild task created, "
+                            "processing in background"
+                        ),
+                    },
+                )
+                .__dict__
+            )
+
+        except ValueError as e:
+            return Response().error(str(e)).__dict__
+        except Exception as e:
+            logger.error(f"批量重建文档失败: {e}")
+            logger.error(traceback.format_exc())
+            return Response().error(f"批量重建文档失败: {e!s}").__dict__
+
+    async def batch_delete_documents(self):
+        """批量删除文档
+
+        Body:
+        - kb_id: 知识库 ID (必填)
+        - doc_ids: 文档 ID 列表 (必填, 最多 100 个)
+        """
+        try:
+            kb_manager = self._get_kb_manager()
+            data = await request.json
+
+            kb_id = data.get("kb_id")
+            if not kb_id:
+                return Response().error("缺少参数 kb_id").__dict__
+            doc_ids = data.get("doc_ids")
+            if not doc_ids or not isinstance(doc_ids, list):
+                return Response().error("缺少参数 doc_ids 或格式错误").__dict__
+            if len(doc_ids) > MAX_BATCH_DELETE_DOCUMENTS:
+                return (
+                    Response()
+                    .error(f"最多只能批量删除 {MAX_BATCH_DELETE_DOCUMENTS} 个文档")
+                    .__dict__
+                )
+
+            kb_helper = await kb_manager.get_kb(kb_id)
+            if not kb_helper:
+                return Response().error("知识库不存在").__dict__
+
+            results = await kb_helper.delete_documents(doc_ids)
+
+            success_count = sum(1 for v in results.values() if v)
+            failed_count = len(doc_ids) - success_count
+
+            return (
+                Response()
+                .ok(
+                    {
+                        "results": results,
+                        "total": len(doc_ids),
+                        "success_count": success_count,
+                        "failed_count": failed_count,
+                    },
+                    "批量删除完成",
+                )
+                .__dict__
+            )
+
+        except ValueError as e:
+            return Response().error(str(e)).__dict__
+        except Exception as e:
+            logger.error(f"批量删除文档失败: {e}")
+            logger.error(traceback.format_exc())
+            return Response().error(f"批量删除文档失败: {e!s}").__dict__
+
     async def delete_chunk(self):
         """删除文本块
 
@@ -1040,14 +2383,18 @@ async def list_chunks(self):
         Query 参数:
         - kb_id: 知识库 ID (必填)
         - page: 页码 (默认 1)
-        - page_size: 每页数量 (默认 20)
+        - page_size: 每页数量
         """
         try:
             kb_manager = self._get_kb_manager()
             kb_id = request.args.get("kb_id")
             doc_id = request.args.get("doc_id")
-            page = request.args.get("page", 1, type=int)
-            page_size = request.args.get("page_size", 100, type=int)
+            page = self._get_positive_query_int("page", 1)
+            page_size = self._get_positive_query_int(
+                "page_size",
+                DEFAULT_CHUNK_PAGE_SIZE,
+            )
+            search = (request.args.get("search") or "").strip() or None
             if not kb_id:
                 return Response().error("缺少参数 kb_id").__dict__
             if not doc_id:
@@ -1057,11 +2404,15 @@ async def list_chunks(self):
             limit = page_size
             if not kb_helper:
                 return Response().error("知识库不存在").__dict__
-            chunk_list = await kb_helper.get_chunks_by_doc_id(
+            chunk_list, total = await kb_helper.search_chunks_by_doc_id(
                 doc_id=doc_id,
+                search=search,
                 offset=offset,
                 limit=limit,
             )
+            document_chunk_count = total
+            if search is not None:
+                document_chunk_count = await kb_helper.get_chunk_count_by_doc_id(doc_id)
             return (
                 Response()
                 .ok(
@@ -1069,7 +2420,9 @@ async def list_chunks(self):
                         "items": chunk_list,
                         "page": page,
                         "page_size": page_size,
-                        "total": await kb_helper.get_chunk_count_by_doc_id(doc_id),
+                        "total": total,
+                        "filtered_total": total,
+                        "document_chunk_count": document_chunk_count,
                     },
                 )
                 .__dict__
@@ -1081,6 +2434,41 @@ async def list_chunks(self):
             logger.error(traceback.format_exc())
             return Response().error(f"获取块列表失败: {e!s}").__dict__
 
+    async def get_chunk_context(self):
+        """获取文本块和相邻上下文块
+
+        Query 参数:
+        - kb_id: 知识库 ID (必填)
+        - doc_id: 文档 ID (必填)
+        - chunk_id: 文本块 ID (必填)
+        """
+        try:
+            kb_manager = self._get_kb_manager()
+            kb_id = request.args.get("kb_id")
+            doc_id = request.args.get("doc_id")
+            chunk_id = request.args.get("chunk_id")
+            if not kb_id:
+                return Response().error("缺少参数 kb_id").__dict__
+            if not doc_id:
+                return Response().error("缺少参数 doc_id").__dict__
+            if not chunk_id:
+                return Response().error("缺少参数 chunk_id").__dict__
+
+            kb_helper = await kb_manager.get_kb(kb_id)
+            if not kb_helper:
+                return Response().error("知识库不存在").__dict__
+            context = await kb_helper.get_chunk_context(
+                chunk_id=chunk_id,
+                doc_id=doc_id,
+            )
+            return Response().ok(data=context).__dict__
+        except ValueError as e:
+            return Response().error(str(e)).__dict__
+        except Exception as e:
+            logger.error(f"获取文本块上下文失败: {e}")
+            logger.error(traceback.format_exc())
+            return Response().error(f"获取文本块上下文失败: {e!s}").__dict__
+
     # ===== 检索 API =====
 
     async def retrieve(self):
@@ -1097,20 +2485,35 @@ async def retrieve(self):
             data = await request.json
 
             query = data.get("query")
+            kb_ids = data.get("kb_ids")
             kb_names = data.get("kb_names")
-            debug = data.get("debug", False)
+            debug = self._coerce_optional_bool(data.get("debug", False), "debug")
+            trace = self._coerce_optional_bool(data.get("trace", False), "trace")
 
             if not query:
                 return Response().error("缺少参数 query").__dict__
-            if not kb_names or not isinstance(kb_names, list):
-                return Response().error("缺少参数 kb_names 或格式错误").__dict__
-
-            top_k = data.get("top_k", 5)
+            if kb_ids is not None and not isinstance(kb_ids, list):
+                return Response().error("参数 kb_ids 格式错误").__dict__
+            if kb_names is not None and not isinstance(kb_names, list):
+                return Response().error("参数 kb_names 格式错误").__dict__
+            if not kb_ids and not kb_names:
+                return Response().error("缺少参数 kb_ids 或 kb_names").__dict__
+
+            top_k = self._coerce_optional_int(
+                data.get("top_k", DEFAULT_TOP_M_FINAL),
+                "top_k",
+            )
+            top_k = top_k if top_k is not None else DEFAULT_TOP_M_FINAL
+            self._validate_positive_int(top_k, "top_k")
+            if top_k > MAX_RETRIEVE_TOP_K:
+                return Response().error(f"top_k 不能大于 {MAX_RETRIEVE_TOP_K}").__dict__
 
             results = await kb_manager.retrieve(
                 query=query,
                 kb_names=kb_names,
+                kb_ids=kb_ids,
                 top_m_final=top_k,
+                include_trace=trace or debug,
             )
             result_list = []
             if results:
@@ -1121,13 +2524,21 @@ async def retrieve(self):
                 "total": len(result_list),
                 "query": query,
             }
+            if results and "trace" in results:
+                response_data["trace"] = results["trace"]
 
             # Debug 模式：生成 t-SNE 可视化
             if debug:
                 try:
+                    visualization_kb_names = kb_names
+                    if not visualization_kb_names and kb_ids:
+                        visualization_kb_names = []
+                        for kb_id in kb_ids:
+                            if kb_helper := await kb_manager.get_kb(kb_id):
+                                visualization_kb_names.append(kb_helper.kb.kb_name)
                     img_base64 = await generate_tsne_visualization(
                         query,
-                        kb_names,
+                        visualization_kb_names or [],
                         kb_manager,
                     )
                     if img_base64:
@@ -1173,11 +2584,40 @@ async def upload_document_from_url(self):
             if not url:
                 return Response().error("缺少参数 url").__dict__
 
-            chunk_size = data.get("chunk_size", 512)
-            chunk_overlap = data.get("chunk_overlap", 50)
-            batch_size = data.get("batch_size", 32)
-            tasks_limit = data.get("tasks_limit", 3)
-            max_retries = data.get("max_retries", 3)
+            chunk_size = self._coerce_optional_int(data.get("chunk_size"), "chunk_size")
+            chunk_overlap = self._coerce_optional_int(
+                data.get("chunk_overlap"),
+                "chunk_overlap",
+            )
+            batch_size = self._coerce_optional_int(data.get("batch_size"), "batch_size")
+            tasks_limit = self._coerce_optional_int(
+                data.get("tasks_limit"),
+                "tasks_limit",
+            )
+            max_retries = self._coerce_optional_int(
+                data.get("max_retries"),
+                "max_retries",
+            )
+            chunk_size = chunk_size if chunk_size is not None else DEFAULT_CHUNK_SIZE
+            chunk_overlap = (
+                chunk_overlap if chunk_overlap is not None else DEFAULT_CHUNK_OVERLAP
+            )
+            batch_size = (
+                batch_size if batch_size is not None else DEFAULT_UPLOAD_BATCH_SIZE
+            )
+            tasks_limit = (
+                tasks_limit if tasks_limit is not None else DEFAULT_UPLOAD_TASKS_LIMIT
+            )
+            max_retries = (
+                max_retries if max_retries is not None else DEFAULT_UPLOAD_MAX_RETRIES
+            )
+            self._validate_upload_options(
+                chunk_size=chunk_size,
+                chunk_overlap=chunk_overlap,
+                batch_size=batch_size,
+                tasks_limit=tasks_limit,
+                max_retries=max_retries,
+            )
             enable_cleaning = data.get("enable_cleaning", False)
             cleaning_provider_id = data.get("cleaning_provider_id")
 
@@ -1191,6 +2631,21 @@ async def upload_document_from_url(self):
 
             # 初始化任务状态
             self._init_task(task_id, status="pending")
+            await self._create_persistent_task(
+                task_id=task_id,
+                kb_id=kb_id,
+                task_type="url",
+                status="pending",
+                progress={
+                    "status": "pending",
+                    "file_index": 0,
+                    "file_total": 1,
+                    "file_name": f"URL: {url}",
+                    "stage": "waiting",
+                    "current": 0,
+                    "total": 100,
+                },
+            )
 
             # 启动后台任务
             asyncio.create_task(
@@ -1253,6 +2708,7 @@ async def _background_upload_from_url_task(
                 "current": 0,
                 "total": 100,
             }
+            await self._persist_progress(task_id)
 
             # 创建进度回调函数
             progress_callback = self._make_progress_callback(task_id, 0, f"URL: {url}")
@@ -1281,8 +2737,23 @@ async def _background_upload_from_url_task(
             }
 
             self._set_task_result(task_id, "completed", result=result)
+            await self._update_persistent_task(
+                task_id,
+                status="completed",
+                result=result,
+                error=None,
+                **self._get_persistent_progress_updates(task_id),
+            )
 
         except Exception as e:
             logger.error(f"后台上传URL任务 {task_id} 失败: {e}")
             logger.error(traceback.format_exc())
             self._set_task_result(task_id, "failed", error=str(e))
+            await self._update_persistent_task(
+                task_id,
+                status="failed",
+                error=str(e),
+                **self._get_persistent_progress_updates(task_id),
+            )
+        finally:
+            asyncio.create_task(self._schedule_delayed_cleanup(task_id))
diff --git a/dashboard/src/i18n/locales/en-US/features/knowledge-base/detail.json b/dashboard/src/i18n/locales/en-US/features/knowledge-base/detail.json
index 78a00669e3..d8df20cc68 100644
--- a/dashboard/src/i18n/locales/en-US/features/knowledge-base/detail.json
+++ b/dashboard/src/i18n/locales/en-US/features/knowledge-base/detail.json
@@ -21,36 +21,183 @@
     "stats": "Statistics",
     "docCount": "Documents",
     "chunkCount": "Chunks",
+    "readyDocCount": "Ready Documents",
+    "failedDocCount": "Failed Documents",
+    "sourceFiles": "Source Files",
+    "storageUsed": "Storage Used",
     "embeddingModel": "Embedding Model",
     "rerankModel": "Rerank Model",
     "notSet": "Not Set"
   },
+  "consistency": {
+    "title": "Index Consistency",
+    "run": "Run Check",
+    "repair": "Repair Fixable Issues",
+    "notRun": "No consistency check has been run yet. Run a check to compare document metadata, source files, and indexed chunks.",
+    "notRunHint": "A full check reads index metadata and lists fixable issues.",
+    "notRunChunkMismatch": "Current snapshot has {metadata} document chunks but {indexed} indexed chunks. Run a check.",
+    "notRunFailedDocs": "{count} documents are failed. Review the document list or run a consistency check.",
+    "healthy": "No consistency issues found",
+    "unhealthy": "{count} consistency issues found",
+    "checkedAt": "Checked at: {time}",
+    "sqliteDocuments": "Metadata Documents",
+    "indexedChunks": "Indexed Chunks",
+    "documentChunks": "Document Chunks",
+    "sourceFiles": "Source Files",
+    "expectedChunks": "{count} expected chunks",
+    "actualChunks": "{count} actual chunks",
+    "checkSuccessHealthy": "Consistency check completed with no issues",
+    "checkSuccessUnhealthy": "Consistency check completed with {count} issues",
+    "checkFailed": "Consistency check failed",
+    "repairSuccess": "Consistency repair completed: {repaired} repaired, {skipped} skipped",
+    "repairPartialSuccess": "Consistency repair partially completed: {repaired} repaired, {skipped} skipped, {failed} failed",
+    "repairFailed": "Consistency repair failed",
+    "issues": {
+      "missingVectors": "Documents Missing Indexed Chunks",
+      "orphanVectors": "Orphan Indexed Chunks",
+      "missingSourceFiles": "Missing Source Files",
+      "chunkCountMismatches": "Chunk Count Mismatches",
+      "invalidVectorMetadata": "Invalid Index Metadata",
+      "unsafeSourcePaths": "Unsafe Source Paths"
+    },
+    "reasons": {
+      "empty_file_path": "Source file path is empty",
+      "outside_kb_files_dir": "Source file path is outside the knowledge base directory",
+      "not_found": "Source file does not exist"
+    }
+  },
+  "maintenance": {
+    "rebuild": "Rebuild Index",
+    "rebuildStarted": "Knowledge base rebuild started",
+    "rebuildSuccess": "Knowledge base rebuild completed",
+    "rebuildFailed": "Failed to rebuild knowledge base",
+    "rebuildFailedWithReason": "Failed to rebuild knowledge base: {reason}",
+    "rebuildPartialSuccess": "Knowledge base rebuild partially completed: {success} succeeded, {failed} failed",
+    "unknownError": "Unknown error",
+    "stages": {
+      "waiting": "Waiting...",
+      "rebuilding": "Rebuilding knowledge base...",
+      "parsing": "Parsing document...",
+      "chunking": "Chunking text...",
+      "embedding": "Generating embeddings...",
+      "completed": "Completed"
+    }
+  },
+  "tasks": {
+    "title": "Recent Tasks",
+    "refresh": "Refresh tasks",
+    "empty": "No task records yet",
+    "loadFailed": "Failed to load recent tasks",
+    "recentFailures": "Recent failures",
+    "noErrorMessage": "No error message",
+    "resultSummary": "{total} total, {success} succeeded, {failed} failed",
+    "progressDetail": "Progress {progress}",
+    "types": {
+      "upload": "Document Upload",
+      "import": "Document Import",
+      "url": "URL Import",
+      "document_rebuild": "Document Rebuild",
+      "document_batch_rebuild": "Batch Document Rebuild",
+      "kb_rebuild": "Knowledge Base Rebuild"
+    },
+    "statuses": {
+      "pending": "Pending",
+      "processing": "Processing",
+      "completed": "Completed",
+      "partial_failed": "Partially failed",
+      "failed": "Failed"
+    }
+  },
   "documents": {
     "title": "Documents",
     "upload": "Upload Document",
     "empty": "No documents",
+    "searchPlaceholder": "Search documents...",
+    "statusFilter": "Status",
+    "sourceFilter": "Source",
+    "allStatuses": "All Statuses",
+    "allSources": "All Sources",
+    "filteredCount": "Showing {filtered} / {total} documents",
     "name": "Name",
     "type": "Type",
+    "status": "Status",
     "size": "Size",
     "chunks": "Chunks",
     "createdAt": "Uploaded At",
     "actions": "Actions",
     "view": "View",
+    "copyFailure": "Copy Failure Diagnostics",
+    "rebuild": "Retry Rebuild",
     "delete": "Delete",
+    "rebuildTitle": "Rebuild Document Index",
+    "rebuildConfirm": "Rebuild the index for document '{name}'?",
+    "rebuildWarning": "Rebuild will parse and write the index again. The previous index may still be used until the task finishes.",
+    "batchRebuild": "Rebuild Selected ({count})",
+    "batchRebuildTitle": "Rebuild Selected Documents",
+    "batchRebuildConfirm": "Rebuild the index for the {count} selected documents?",
+    "batchRebuildMore": "{count} more",
+    "batchRebuildWarning": "Batch rebuild will parse and write indexes for the selected documents again. Previous indexes may still be used until the task finishes.",
+    "batchDelete": "Delete Selected ({count})",
+    "batchDeleteTitle": "Delete Selected Documents",
+    "batchDeleteConfirm": "Delete the {count} selected documents?",
+    "batchDeleteMore": "{count} more",
+    "cancel": "Cancel",
     "deleteConfirm": "Are you sure you want to delete document '{name}'?",
     "deleteWarning": "This will delete the document and all its chunks. This action cannot be undone.",
     "uploading": "Uploading...",
     "uploadSuccess": "Document uploaded successfully",
     "uploadFailed": "Failed to upload document",
+    "loadFailed": "Failed to load documents",
     "deleteSuccess": "Document deleted successfully",
-    "deleteFailed": "Failed to delete document"
+    "deleteFailed": "Failed to delete document",
+    "batchDeleteSuccess": "{count} documents deleted",
+    "batchDeletePartialSuccess": "Batch delete partially completed: {success} succeeded, {failed} failed",
+    "batchDeleteFailed": "Failed to batch delete documents",
+    "batchDeleteLimitExceeded": "You can delete up to {limit} documents at once",
+    "batchRebuildStarted": "Started rebuilding {count} documents",
+    "batchRebuildFailed": "Failed to batch rebuild documents",
+    "batchRebuildLimitExceeded": "You can rebuild up to {limit} documents at once",
+    "failureDocument": "Document",
+    "failureDocumentId": "Document ID",
+    "failureStage": "Failure Stage",
+    "failureMessage": "Error Message",
+    "unknownFailureStage": "Unknown Stage",
+    "noFailureMessage": "No error message",
+    "copyFailureSuccess": "Failure diagnostics copied",
+    "copyFailureFailed": "Failed to copy failure diagnostics",
+    "rebuildStarted": "Document rebuild started",
+    "rebuildSuccess": "Document rebuilt successfully",
+    "rebuildFailed": "Failed to rebuild document",
+    "rebuildFailedWithReason": "Failed to rebuild document: {reason}",
+    "rebuildPartialSuccess": "Document rebuild partially completed: {success} succeeded, {failed} failed",
+    "statuses": {
+      "pending": "Pending",
+      "parsing": "Parsing",
+      "chunking": "Chunking",
+      "embedding": "Indexing",
+      "ready": "Ready",
+      "failed": "Failed"
+    },
+    "sourceTypes": {
+      "file": "File",
+      "url": "URL",
+      "import": "Import"
+    }
   },
   "upload": {
     "title": "Upload Document",
     "selectFile": "Select File",
     "dropzone": "Drop files here or click to select",
-    "supportedFormats": "Supported formats: .txt, .md, .markdown, .rst, .adoc, .pdf, .docx, .epub, .xls, .xlsx",
-    "maxSize": "Max file size: 128MB",
+    "supportedFormats": "Supported formats: {formats}",
+    "maxSize": "Max file size: {size}",
+    "maxFiles": "Upload up to {count} files",
+    "maxFilesWarning": "You can select up to {count} files",
+    "selectedFiles": "{count} files selected",
+    "clear": "Clear",
+    "someFilesRejected": "Some files were not added",
+    "unsupportedFile": "{name}: unsupported file type",
+    "fileTooLarge": "{name}: file exceeds {size}",
+    "invalidSettings": "Please check the upload settings",
     "chunkSettings": "Chunk Settings",
     "batchSettings": "Batch Settings",
     "cleaningSettings": "Cleaning Settings",
@@ -58,15 +205,15 @@
     "cleaningProvider": "Cleaning Service Provider",
     "cleaningProviderHint": "Select an LLM provider to clean and summarize the extracted web page content",
     "chunkSize": "Chunk Size",
-    "chunkSizeHint": "Number of characters per chunk (default: 512)",
+    "chunkSizeHint": "Number of characters per chunk (default: {value})",
     "chunkOverlap": "Chunk Overlap",
-    "chunkOverlapHint": "Overlapping characters between chunks (default: 50)",
+    "chunkOverlapHint": "Overlapping characters between chunks (default: {value})",
     "batchSize": "Batch Size",
-    "batchSizeHint": "Number of chunks to process in each batch (default: 32)",
+    "batchSizeHint": "Number of chunks to process in each batch (default: {value})",
     "tasksLimit": "Concurrent Tasks Limit",
-    "tasksLimitHint": "Maximum number of concurrent upload tasks (default: 3)",
+    "tasksLimitHint": "Maximum number of concurrent upload tasks (default: {value})",
     "maxRetries": "Max Retries",
-    "maxRetriesHint": "Number of times to retry a failed upload task (default: 3)",
+    "maxRetriesHint": "Number of times to retry a failed upload task (default: {value})",
     "cancel": "Cancel",
     "submit": "Upload",
     "fileRequired": "Please select a file to upload",
@@ -75,6 +222,27 @@
     "urlPlaceholder": "Enter the URL of the web page to extract content from",
     "urlRequired": "Please enter a URL",
     "urlHint": "The main content will be automatically extracted from the target URL as a document. Currently supports {supported} pages. Before use, please ensure that the target web page allows crawler access.",
+    "unsupportedUrlImport": "URL import is not enabled by the backend",
+    "tavilyCheckFailed": "Failed to check web search configuration",
+    "tavilyRequired": "Tavily Key is required for this feature",
+    "configure": "Configure",
+    "tavilyConfigured": "Tavily API Key configured",
+    "backgroundUploading": "Uploading {count} files in the background...",
+    "backgroundUrlUploading": "Extracting URL content in the background...",
+    "successCount": "Successfully uploaded {count} documents",
+    "partialSuccess": "Upload finished: {success} succeeded, {failed} failed",
+    "failedWithReason": "Upload failed: {reason}",
+    "unknownError": "Unknown error",
+    "stages": {
+      "waiting": "Waiting...",
+      "extracting": "Extracting content...",
+      "cleaning": "Cleaning content...",
+      "parsing": "Parsing document...",
+      "chunking": "Chunking text...",
+      "embedding": "Generating embeddings...",
+      "rebuilding": "Rebuilding document...",
+      "completed": "Completed"
+    },
     "beta": "Beta"
   },
   "retrieval": {
@@ -88,6 +256,14 @@
     "noResults": "No results found",
     "tryDifferentQuery": "Try a different query",
     "settings": "Retrieval Settings",
+    "debugMode": "Debug Mode",
+    "debugModeTsne": "Debug Mode (t-SNE)",
+    "traceMode": "Retrieval Trace",
+    "cancel": "Cancel",
+    "caseNotesPlaceholder": "Example: sparse retrieval ranked too low",
+    "caseTags": "Tags",
+    "caseTagsPlaceholder": "Example: manual, retrieval-ui, bad-case",
+    "tsneVisualization": "t-SNE Visualization",
     "topK": "Number of Results",
     "topKHint": "Maximum number of results to return",
     "enableRerank": "Enable Rerank",
@@ -97,9 +273,40 @@
     "chunk": "Chunk #{index}",
     "content": "Content",
     "charCount": "{count} characters",
+    "traceTitle": "Retrieval Trace",
+    "traceStageCount": "{count} stages",
+    "traceHits": "{count} hits",
+    "traceDenseRank": "Dense rank #{rank}",
+    "traceSparseRank": "Sparse rank #{rank}",
+    "traceDenseScore": "Dense score",
+    "traceSparseScore": "Sparse score",
+    "traceRrfScore": "RRF score",
+    "traceRerankScore": "Rerank score",
+    "traceDuplicateOf": "Duplicate of {chunk}",
+    "traceDedupSimilarity": "Duplicate similarity {value}",
+    "sourcePage": "Page {page}",
+    "sourceSection": "Section {index}",
+    "sourceParentChunk": "Parent chunk {id}",
+    "tracePreviewEmpty": "No content preview",
+    "traceEmpty": "No candidates in this stage",
+    "unknownDocument": "Unknown document",
+    "traceStages": {
+      "dense": "Dense Recall",
+      "sparse": "Sparse Recall",
+      "fusion": "RRF Fusion",
+      "dedup": "Near-Duplicate Removal",
+      "dedup_removed": "Removed Duplicates",
+      "rerank": "Rerank",
+      "final": "Final Context"
+    },
     "searchSuccess": "Search completed, found {count} results",
     "searchFailed": "Search failed",
-    "queryRequired": "Please enter a query"
+    "queryRequired": "Please enter a query",
+    "latestRunResults": "Latest Results",
+    "metricRecall": "Recall",
+    "metricNdcg": "nDCG",
+    "metricPrecision": "Precision",
+    "metricFirstHit": "First Hit"
   },
   "settings": {
     "title": "Knowledge Base Settings",
@@ -113,9 +320,43 @@
     "enableRerank": "Enable Rerank",
     "embeddingProvider": "Embedding Provider",
     "rerankProvider": "Rerank Provider",
+    "embeddingProviderHint": "The embedding model is bound to the current vector index. Create a new knowledge base to change it.",
+    "indexType": "Index Type",
+    "indexTypeHint": "Flat is exact; HNSW is better for larger knowledge bases.",
+    "indexTypes": {
+      "flat": "Flat exact index",
+      "hnsw": "HNSW approximate index"
+    },
     "save": "Save Settings",
     "saveSuccess": "Settings saved successfully",
     "saveFailed": "Failed to save settings",
+    "providersLoadFailed": "Failed to load model providers",
     "tips": "Tip: Modifying retrieval settings will affect subsequent knowledge base queries."
+  },
+  "validation": {
+    "integer": "Enter an integer",
+    "positiveInteger": "Enter an integer greater than 0",
+    "nonNegativeInteger": "Enter an integer no less than 0",
+    "overlapLessThanSize": "Chunk overlap must be less than chunk size",
+    "topKRange": "Number of results must be an integer from 1 to {max}"
+  },
+  "actions": {
+    "retry": "Retry"
+  },
+  "messages": {
+    "loadFailed": "Failed to load knowledge base details"
+  },
+  "tavily": {
+    "title": "Configure Tavily API Key",
+    "description": "A Tavily API Key is required to use web-based knowledge base features. You can get one from",
+    "officialSite": "Tavily",
+    "apiKeyLabel": "Tavily API Key",
+    "apiKeyPlaceholder": "tvly-...",
+    "cancel": "Cancel",
+    "save": "Save",
+    "keyRequired": "API Key is required",
+    "loadConfigFailed": "Failed to load current configuration",
+    "saveFailed": "Failed to save. Please check the key.",
+    "unknownSaveFailed": "Failed to save due to an unknown error"
   }
 }
diff --git a/dashboard/src/i18n/locales/en-US/features/knowledge-base/document.json b/dashboard/src/i18n/locales/en-US/features/knowledge-base/document.json
index d3a3b65c9a..dbdca2bf67 100644
--- a/dashboard/src/i18n/locales/en-US/features/knowledge-base/document.json
+++ b/dashboard/src/i18n/locales/en-US/features/knowledge-base/document.json
@@ -9,12 +9,48 @@
     "chunkCount": "Chunk Count",
     "createdAt": "Uploaded At"
   },
+  "processing": {
+    "title": "Processing Information",
+    "status": "Status",
+    "sourceType": "Source Type",
+    "sourceUri": "Source URI",
+    "contentHash": "Content Hash",
+    "parser": "Parser",
+    "chunker": "Chunker",
+    "version": "Version",
+    "parentDocId": "Parent Document ID",
+    "indexedAt": "Indexed At",
+    "unknownStage": "Unknown Stage",
+    "noErrorMessage": "No error message",
+    "statuses": {
+      "pending": "Pending",
+      "parsing": "Parsing",
+      "chunking": "Chunking",
+      "embedding": "Indexing",
+      "ready": "Ready",
+      "failed": "Failed"
+    },
+    "sourceTypes": {
+      "file": "File",
+      "url": "URL",
+      "import": "Import",
+      "api": "API"
+    }
+  },
   "chunks": {
     "title": "Chunks",
+    "total": "{count} chunks",
+    "filteredTotal": "{filtered} / {total} matching chunks",
     "empty": "No chunks",
     "index": "Index",
     "content": "Content",
+    "titlePath": "Title Path",
     "charCount": "Characters",
+    "charCountValue": "{count} characters",
+    "tokenEstimate": "Estimated Tokens",
+    "tokenEstimateValue": "About {count} tokens",
+    "offset": "Offset",
+    "contentHash": "Content Hash",
     "actions": "Actions",
     "view": "View",
     "edit": "Edit",
@@ -23,6 +59,7 @@
     "search": "Search Chunks",
     "searchPlaceholder": "Enter keywords to search chunks...",
     "showing": "Showing",
+    "showingRange": "Showing {start} - {end} / {total} chunks",
     "deleteConfirm": "Are you sure you want to delete this chunk?",
     "deleteSuccess": "Chunk deleted successfully",
     "deleteFailed": "Failed to delete chunk"
@@ -49,7 +86,39 @@
     "index": "Index",
     "content": "Content",
     "charCount": "Characters",
+    "tokenEstimate": "Estimated Tokens",
+    "titlePath": "Title Path",
+    "section": "Section",
+    "pageNumber": "Page",
+    "offset": "Offset",
+    "contentHash": "Content Hash",
+    "adjacentChunks": "Adjacent Chunks",
+    "previousChunk": "Previous: {id}",
+    "nextChunk": "Next: {id}",
+    "parentChunk": "Parent Chunk",
     "vecDocId": "Vector ID",
+    "context": "Adjacent Context",
+    "previous": "Previous",
+    "current": "Current",
+    "next": "Next",
+    "contextMissing": "No adjacent chunk",
     "close": "Close"
+  },
+  "actions": {
+    "retry": "Retry",
+    "retryRebuild": "Retry Rebuild",
+    "retryRebuildConfirm": "Rebuild the index for this document?"
+  },
+  "messages": {
+    "loadDocumentFailed": "Failed to load document details",
+    "loadChunksFailed": "Failed to load chunks",
+    "loadChunkContextFailed": "Failed to load adjacent context",
+    "rebuildStarted": "Document rebuild started",
+    "rebuildCompleted": "Document rebuild completed",
+    "rebuildFailed": "Failed to rebuild document",
+    "rebuildFailedWithReason": "Failed to rebuild document: {reason}",
+    "focusChunkLoaded": "Opened the retrieved chunk",
+    "focusChunkFailed": "Failed to open the retrieved chunk",
+    "focusChunkNotFound": "Retrieved chunk not found"
   }
 }
diff --git a/dashboard/src/i18n/locales/en-US/features/knowledge-base/index.json b/dashboard/src/i18n/locales/en-US/features/knowledge-base/index.json
index 67bb4d5717..960edf067c 100644
--- a/dashboard/src/i18n/locales/en-US/features/knowledge-base/index.json
+++ b/dashboard/src/i18n/locales/en-US/features/knowledge-base/index.json
@@ -11,7 +11,9 @@
     "documents": "Documents",
     "chunks": "Chunks",
     "sessionConfig": "Session Config",
-    "initError": "Initialization Failed"
+    "initError": "Initialization Failed",
+    "noDescription": "No description",
+    "switchToLegacy": "Switch to legacy knowledge base"
   },
   "card": {
     "edit": "Edit",
@@ -31,9 +33,12 @@
     "rerankModelLabel": "Rerank Model (Optional)",
     "providerInfo": "Provider: {id} | Dimensions: {dimensions}",
     "rerankProviderInfo": "Provider: {id}",
+    "nameHint": "If you rename this knowledge base later, update any configuration that still references names.",
+    "embeddingModelHint": "The embedding model cannot be changed after creation. Create a new knowledge base to use another model.",
     "cancel": "Cancel",
     "submit": "Create",
-    "nameRequired": "Please enter knowledge base name"
+    "nameRequired": "Please enter knowledge base name",
+    "embeddingRequired": "Please select an embedding model"
   },
   "edit": {
     "title": "Edit Knowledge Base",
@@ -63,6 +68,7 @@
     "updateFailed": "Failed to update",
     "deleteSuccess": "Knowledge base deleted successfully",
     "deleteFailed": "Failed to delete",
-    "loadError": "Failed to load knowledge base list"
+    "loadError": "Failed to load knowledge base list",
+    "providersLoadError": "Failed to load model providers"
   }
 }
diff --git a/dashboard/src/i18n/locales/ru-RU/features/knowledge-base/detail.json b/dashboard/src/i18n/locales/ru-RU/features/knowledge-base/detail.json
index 5145d5c285..d42d2a3034 100644
--- a/dashboard/src/i18n/locales/ru-RU/features/knowledge-base/detail.json
+++ b/dashboard/src/i18n/locales/ru-RU/features/knowledge-base/detail.json
@@ -1,121 +1,362 @@
-﻿{
-    "title": "Детали базы знаний",
-    "backToList": "К списку",
-    "breadcrumb": {
-        "list": "Базы знаний"
+{
+  "title": "Детали базы знаний",
+  "backToList": "К списку",
+  "breadcrumb": {
+    "list": "Базы знаний"
+  },
+  "tabs": {
+    "overview": "Обзор",
+    "documents": "Документы",
+    "retrieval": "Поиск",
+    "sessions": "Сессии",
+    "settings": "Настройки"
+  },
+  "overview": {
+    "title": "Информация",
+    "name": "Название",
+    "description": "Описание",
+    "emoji": "Иконка",
+    "createdAt": "Создана",
+    "updatedAt": "Обновлена",
+    "stats": "Статистика",
+    "docCount": "Количество документов",
+    "chunkCount": "Количество фрагментов",
+    "readyDocCount": "Готовые документы",
+    "failedDocCount": "Ошибки документов",
+    "sourceFiles": "Исходные файлы",
+    "storageUsed": "Занято места",
+    "embeddingModel": "Embedding модель",
+    "rerankModel": "Rerank модель",
+    "notSet": "не выбрано"
+  },
+  "consistency": {
+    "title": "Согласованность индекса",
+    "run": "Проверить",
+    "repair": "Исправить доступное",
+    "notRun": "Проверка еще не запускалась. Запустите ее, чтобы сравнить метаданные документов, исходные файлы и индексированные фрагменты.",
+    "notRunHint": "Полная проверка читает метаданные индекса и показывает проблемы, которые можно исправить.",
+    "notRunChunkMismatch": "В текущем снимке {metadata} фрагментов документов, а в индексе {indexed} фрагментов. Запустите проверку.",
+    "notRunFailedDocs": "Документов с ошибками: {count}. Проверьте список документов или запустите проверку согласованности.",
+    "healthy": "Проблем согласованности не найдено",
+    "unhealthy": "Найдено проблем: {count}",
+    "checkedAt": "Проверено: {time}",
+    "sqliteDocuments": "Документы в метаданных",
+    "indexedChunks": "Фрагменты в индексе",
+    "documentChunks": "Фрагменты документов",
+    "sourceFiles": "Исходные файлы",
+    "expectedChunks": "Ожидалось фрагментов: {count}",
+    "actualChunks": "Фактически фрагментов: {count}",
+    "checkSuccessHealthy": "Проверка завершена, проблем не найдено",
+    "checkSuccessUnhealthy": "Проверка завершена, найдено проблем: {count}",
+    "checkFailed": "Не удалось выполнить проверку",
+    "repairSuccess": "Исправление завершено: исправлено {repaired}, пропущено {skipped}",
+    "repairPartialSuccess": "Исправление частично завершено: исправлено {repaired}, пропущено {skipped}, ошибок {failed}",
+    "repairFailed": "Не удалось исправить согласованность",
+    "issues": {
+      "missingVectors": "У документов нет фрагментов в индексе",
+      "orphanVectors": "Фрагменты без документа",
+      "missingSourceFiles": "Нет исходных файлов",
+      "chunkCountMismatches": "Не совпадает число фрагментов",
+      "invalidVectorMetadata": "Ошибки метаданных индекса",
+      "unsafeSourcePaths": "Некорректные пути исходных файлов"
     },
-    "tabs": {
-        "overview": "Обзор",
-        "documents": "Документы",
-        "retrieval": "Поиск",
-        "sessions": "Сессии",
-        "settings": "Настройки"
+    "reasons": {
+      "empty_file_path": "Путь к исходному файлу пуст",
+      "outside_kb_files_dir": "Путь к исходному файлу вне каталога базы знаний",
+      "not_found": "Исходный файл не найден"
+    }
+  },
+  "maintenance": {
+    "rebuild": "Переиндексировать",
+    "rebuildStarted": "Переиндексация базы знаний запущена",
+    "rebuildSuccess": "Переиндексация базы знаний завершена",
+    "rebuildFailed": "Не удалось переиндексировать базу знаний",
+    "rebuildFailedWithReason": "Не удалось переиндексировать базу знаний: {reason}",
+    "rebuildPartialSuccess": "Переиндексация частично завершена: успешно {success}, ошибок {failed}",
+    "unknownError": "Неизвестная ошибка",
+    "stages": {
+      "waiting": "Ожидание...",
+      "rebuilding": "Переиндексация базы знаний...",
+      "parsing": "Разбор документа...",
+      "chunking": "Разбиение текста...",
+      "embedding": "Генерация векторов...",
+      "completed": "Завершено"
+    }
+  },
+  "tasks": {
+    "title": "Последние задачи",
+    "refresh": "Обновить задачи",
+    "empty": "Задач пока нет",
+    "loadFailed": "Не удалось загрузить последние задачи",
+    "recentFailures": "Последние ошибки",
+    "noErrorMessage": "Нет сообщения об ошибке",
+    "resultSummary": "Всего {total}, успешно {success}, ошибок {failed}",
+    "progressDetail": "Прогресс {progress}",
+    "types": {
+      "upload": "Загрузка документа",
+      "import": "Импорт документа",
+      "url": "Импорт URL",
+      "document_rebuild": "Переиндексация документа",
+      "document_batch_rebuild": "Пакетная переиндексация документов",
+      "kb_rebuild": "Переиндексация базы знаний"
     },
-    "overview": {
-        "title": "Информация",
-        "name": "Название",
-        "description": "Описание",
-        "emoji": "Иконка",
-        "createdAt": "Создана",
-        "updatedAt": "Обновлена",
-        "stats": "Статистика",
-        "docCount": "Количество документов",
-        "chunkCount": "Количество фрагментов",
-        "embeddingModel": "Embedding модель",
-        "rerankModel": "Rerank модель",
-        "notSet": "не выбрано"
+    "statuses": {
+      "pending": "Ожидание",
+      "processing": "В обработке",
+      "completed": "Завершено",
+      "partial_failed": "Частичная ошибка",
+      "failed": "Ошибка"
+    }
+  },
+  "documents": {
+    "title": "Список документов",
+    "upload": "Загрузить",
+    "empty": "Документов нет",
+    "searchPlaceholder": "Поиск документов...",
+    "statusFilter": "Статус",
+    "sourceFilter": "Источник",
+    "allStatuses": "Все статусы",
+    "allSources": "Все источники",
+    "filteredCount": "Показано {filtered} / {total} документов",
+    "name": "Имя файла",
+    "type": "Тип",
+    "status": "Статус",
+    "size": "Размер",
+    "chunks": "Фрагменты",
+    "createdAt": "Дата загрузки",
+    "actions": "Действия",
+    "view": "Смотреть",
+    "copyFailure": "Копировать диагностику",
+    "rebuild": "Повторить индексацию",
+    "delete": "Удалить",
+    "rebuildTitle": "Переиндексировать документ",
+    "rebuildConfirm": "Переиндексировать документ «{name}»?",
+    "rebuildWarning": "Переиндексация повторно разберет документ и запишет индекс. До завершения задачи может использоваться прежний индекс.",
+    "batchRebuild": "Переиндексировать выбранные ({count})",
+    "batchRebuildTitle": "Переиндексировать выбранные документы",
+    "batchRebuildConfirm": "Переиндексировать выбранные документы: {count}?",
+    "batchRebuildMore": "Еще {count}",
+    "batchRebuildWarning": "Пакетная переиндексация повторно разберет выбранные документы и запишет индексы. До завершения задачи могут использоваться прежние индексы.",
+    "batchDelete": "Удалить выбранные ({count})",
+    "batchDeleteTitle": "Удалить выбранные документы",
+    "batchDeleteConfirm": "Удалить выбранные документы: {count}?",
+    "batchDeleteMore": "Еще {count}",
+    "cancel": "Отмена",
+    "deleteConfirm": "Вы уверены, что хотите удалить «{name}»?",
+    "deleteWarning": "Это удалит файл и все его фрагменты из индекса.",
+    "uploading": "Загрузка...",
+    "uploadSuccess": "Файл успешно загружен",
+    "uploadFailed": "Ошибка загрузки",
+    "loadFailed": "Не удалось загрузить документы",
+    "deleteSuccess": "Файл удален",
+    "deleteFailed": "Ошибка удаления",
+    "batchDeleteSuccess": "Удалено документов: {count}",
+    "batchDeletePartialSuccess": "Пакетное удаление частично завершено: успешно {success}, ошибок {failed}",
+    "batchDeleteFailed": "Не удалось удалить документы пакетом",
+    "batchDeleteLimitExceeded": "За один раз можно удалить не более {limit} документов",
+    "batchRebuildStarted": "Запущена переиндексация документов: {count}",
+    "batchRebuildFailed": "Не удалось переиндексировать документы пакетом",
+    "batchRebuildLimitExceeded": "За один раз можно переиндексировать не более {limit} документов",
+    "failureDocument": "Документ",
+    "failureDocumentId": "ID документа",
+    "failureStage": "Этап ошибки",
+    "failureMessage": "Сообщение ошибки",
+    "unknownFailureStage": "Неизвестный этап",
+    "noFailureMessage": "Нет сообщения об ошибке",
+    "copyFailureSuccess": "Диагностика ошибки скопирована",
+    "copyFailureFailed": "Не удалось скопировать диагностику ошибки",
+    "rebuildStarted": "Переиндексация документа запущена",
+    "rebuildSuccess": "Документ переиндексирован",
+    "rebuildFailed": "Не удалось переиндексировать документ",
+    "rebuildFailedWithReason": "Не удалось переиндексировать документ: {reason}",
+    "rebuildPartialSuccess": "Переиндексация частично завершена: успешно {success}, ошибок {failed}",
+    "statuses": {
+      "pending": "Ожидание",
+      "parsing": "Разбор",
+      "chunking": "Фрагментация",
+      "embedding": "Индексация",
+      "ready": "Готово",
+      "failed": "Ошибка"
     },
-    "documents": {
-        "title": "Список документов",
-        "upload": "Загрузить",
-        "empty": "Документов нет",
-        "name": "Имя файла",
-        "type": "Тип",
-        "size": "Размер",
-        "chunks": "Фрагменты",
-        "createdAt": "Дата загрузки",
-        "actions": "Действия",
-        "view": "Смотреть",
-        "delete": "Удалить",
-        "deleteConfirm": "Вы уверены, что хотите удалить «{name}»?",
-        "deleteWarning": "Это удалит файл и все его фрагменты из индекса.",
-        "uploading": "Загрузка...",
-        "uploadSuccess": "Файл успешно загружен",
-        "uploadFailed": "Ошибка загрузки",
-        "deleteSuccess": "Файл удален",
-        "deleteFailed": "Ошибка удаления"
+    "sourceTypes": {
+      "file": "Файл",
+      "url": "URL",
+      "import": "Импорт"
+    }
+  },
+  "upload": {
+    "title": "Добавление контента",
+    "selectFile": "Файл",
+    "dropzone": "Нажмите или перетащите файл сюда",
+    "supportedFormats": "Форматы: {formats}",
+    "maxSize": "Максимум: {size}",
+    "maxFiles": "Можно загрузить до {count} файлов",
+    "maxFilesWarning": "Можно выбрать не более {count} файлов",
+    "selectedFiles": "Выбрано файлов: {count}",
+    "clear": "Очистить",
+    "someFilesRejected": "Некоторые файлы не добавлены",
+    "unsupportedFile": "{name}: неподдерживаемый тип файла",
+    "fileTooLarge": "{name}: файл больше {size}",
+    "invalidSettings": "Проверьте параметры загрузки",
+    "chunkSettings": "Фрагментация",
+    "batchSettings": "Пакетная обработка",
+    "cleaningSettings": "Очистка данных",
+    "enableCleaning": "Включить очистку контента",
+    "cleaningProvider": "Сервис для очистки",
+    "cleaningProviderHint": "LLM провайдер для суммаризации и извлечения смыслов из веб-страниц",
+    "chunkSize": "Размер чанка",
+    "chunkSizeHint": "Символов в блоке (по умолчанию: {value})",
+    "chunkOverlap": "Перекрытие",
+    "chunkOverlapHint": "Перекрытие между блоками (по умолчанию: {value})",
+    "batchSize": "Размер пакета",
+    "batchSizeHint": "Блоков за один запрос (по умолчанию: {value})",
+    "tasksLimit": "Лимит задач",
+    "tasksLimitHint": "Макс. параллельных потоков (по умолчанию: {value})",
+    "maxRetries": "Попытки",
+    "maxRetriesHint": "Повторов при сбое (по умолчанию: {value})",
+    "cancel": "Отмена",
+    "submit": "Загрузить",
+    "fileRequired": "Пожалуйста, выберите файл",
+    "fileUpload": "Загрузка файла",
+    "fromUrl": "Из URL",
+    "urlPlaceholder": "Ссылка на веб-страницу",
+    "urlRequired": "Введите URL",
+    "urlHint": "Контент будет автоматически извлечен со страницы. Убедитесь, что сайт разрешает доступ роботам.",
+    "unsupportedUrlImport": "Импорт из URL не включен на сервере",
+    "tavilyCheckFailed": "Не удалось проверить настройки веб-поиска",
+    "tavilyRequired": "Для этой функции нужен Tavily Key",
+    "configure": "Настроить",
+    "tavilyConfigured": "Tavily API Key сохранен",
+    "backgroundUploading": "Фоновая загрузка файлов: {count}...",
+    "backgroundUrlUploading": "Фоновое извлечение контента из URL...",
+    "successCount": "Успешно загружено документов: {count}",
+    "partialSuccess": "Загрузка завершена: успешно {success}, ошибок {failed}",
+    "failedWithReason": "Ошибка загрузки: {reason}",
+    "unknownError": "Неизвестная ошибка",
+    "stages": {
+      "waiting": "Ожидание...",
+      "extracting": "Извлечение контента...",
+      "cleaning": "Очистка контента...",
+      "parsing": "Разбор документа...",
+      "chunking": "Разбиение текста...",
+      "embedding": "Генерация векторов...",
+      "rebuilding": "Переиндексация документа...",
+      "completed": "Завершено"
     },
-    "upload": {
-        "title": "Добавление контента",
-        "selectFile": "Файл",
-        "dropzone": "Нажмите или перетащите файл сюда",
-        "supportedFormats": "Форматы: .txt, .md, .markdown, .rst, .adoc, .pdf, .docx, .epub, .xls, .xlsx",
-        "maxSize": "Максимум: 128MB",
-        "chunkSettings": "Фрагментация",
-        "batchSettings": "Пакетная обработка",
-        "cleaningSettings": "Очистка данных",
-        "enableCleaning": "Включить очистку контента",
-        "cleaningProvider": "Сервис для очистки",
-        "cleaningProviderHint": "LLM провайдер для суммаризации и извлечения смыслов из веб-страниц",
-        "chunkSize": "Размер чанка",
-        "chunkSizeHint": "Символов в блоке (по умолчанию: 512)",
-        "chunkOverlap": "Перекрытие",
-        "chunkOverlapHint": "Перекрытие между блоками (по умолчанию: 50)",
-        "batchSize": "Размер пакета",
-        "batchSizeHint": "Блоков за один запрос (по умолчанию: 32)",
-        "tasksLimit": "Лимит задач",
-        "tasksLimitHint": "Макс. параллельных потоков (по умолчанию: 3)",
-        "maxRetries": "Попытки",
-        "maxRetriesHint": "Повторов при сбое (по умолчанию: 3)",
-        "cancel": "Отмена",
-        "submit": "Загрузить",
-        "fileRequired": "Пожалуйста, выберите файл",
-        "fileUpload": "Загрузка файла",
-        "fromUrl": "Из URL",
-        "urlPlaceholder": "Ссылка на веб-страницу",
-        "urlRequired": "Введите URL",
-        "urlHint": "Контент будет автоматически извлечен со страницы. Убедитесь, что сайт разрешает доступ роботам.",
-        "beta": "Бета-версия"
+    "beta": "Бета-версия"
+  },
+  "retrieval": {
+    "title": "Поиск и проверка",
+    "subtitle": "Проверьте качество поиска (Dense & Sparse) по вашей базе знаний",
+    "query": "Тестовый запрос",
+    "queryPlaceholder": "Что вы хотите найти?",
+    "search": "Найти",
+    "searching": "Ищем...",
+    "results": "Результаты поиска",
+    "noResults": "Релевантный контент не найден",
+    "tryDifferentQuery": "Попробуйте изменить формулировку запроса",
+    "settings": "Параметры поиска",
+    "debugMode": "Режим отладки",
+    "debugModeTsne": "Режим отладки (t-SNE)",
+    "traceMode": "Трассировка поиска",
+    "cancel": "Отмена",
+    "caseNotesPlaceholder": "Например: Sparse поиск дал низкий ранг",
+    "caseTags": "Теги",
+    "caseTagsPlaceholder": "Например: manual, retrieval-ui, bad-case",
+    "tsneVisualization": "t-SNE визуализация",
+    "topK": "Количество результатов",
+    "topKHint": "Сколько фрагментов возвращать",
+    "enableRerank": "Включить Rerank",
+    "enableRerankHint": "Применить переранжирование для повышения точности",
+    "score": "Вес (Score)",
+    "document": "Документ",
+    "chunk": "Фрагмент #{index}",
+    "content": "Текст",
+    "charCount": "{count} симв.",
+    "traceTitle": "Трассировка поиска",
+    "traceStageCount": "Этапов: {count}",
+    "traceHits": "Найдено: {count}",
+    "traceDenseRank": "Dense ранг #{rank}",
+    "traceSparseRank": "Sparse ранг #{rank}",
+    "traceDenseScore": "Оценка dense",
+    "traceSparseScore": "Оценка sparse",
+    "traceRrfScore": "Оценка RRF",
+    "traceRerankScore": "Оценка rerank",
+    "traceDuplicateOf": "Дубликат {chunk}",
+    "traceDedupSimilarity": "Сходство дубля {value}",
+    "sourcePage": "Стр. {page}",
+    "sourceSection": "Раздел {index}",
+    "sourceParentChunk": "Родительский фрагмент {id}",
+    "tracePreviewEmpty": "Нет предпросмотра",
+    "traceEmpty": "На этом этапе нет кандидатов",
+    "unknownDocument": "Неизвестный документ",
+    "traceStages": {
+      "dense": "Dense поиск",
+      "sparse": "Sparse поиск",
+      "fusion": "RRF объединение",
+      "dedup": "Удаление дублей",
+      "dedup_removed": "Удаленные дубли",
+      "rerank": "Rerank",
+      "final": "Итоговый контекст"
     },
-    "retrieval": {
-        "title": "Поиск и проверка",
-        "subtitle": "Проверьте качество поиска (Dense & Sparse) по вашей базе знаний",
-        "query": "Тестовый запрос",
-        "queryPlaceholder": "Что вы хотите найти?",
-        "search": "Найти",
-        "searching": "Ищем...",
-        "results": "Результаты поиска",
-        "noResults": "Релевантный контент не найден",
-        "tryDifferentQuery": "Попробуйте изменить формулировку запроса",
-        "settings": "Параметры поиска",
-        "topK": "Количество результатов",
-        "topKHint": "Сколько фрагментов возвращать",
-        "enableRerank": "Включить Rerank",
-        "enableRerankHint": "Применить переранжирование для повышения точности",
-        "score": "Вес (Score)",
-        "document": "Документ",
-        "chunk": "Фрагмент #{index}",
-        "content": "Текст",
-        "charCount": "{count} симв.",
-        "searchSuccess": "Поиск завершен, найдено: {count}",
-        "searchFailed": "Ошибка выполнения поиска",
-        "queryRequired": "Введите поисковый запрос"
+    "searchSuccess": "Поиск завершен, найдено: {count}",
+    "searchFailed": "Ошибка выполнения поиска",
+    "queryRequired": "Введите поисковый запрос",
+    "latestRunResults": "Последние результаты",
+    "metricRecall": "Recall",
+    "metricNdcg": "nDCG",
+    "metricPrecision": "Precision",
+    "metricFirstHit": "Первое попадание"
+  },
+  "settings": {
+    "title": "Общие настройки базы",
+    "basic": "Основные",
+    "retrieval": "Поиск",
+    "chunkSize": "Размер чанка",
+    "chunkOverlap": "Перекрытие",
+    "topKDense": "Вернуть (Dense)",
+    "topKSparse": "Вернуть (Sparse)",
+    "topMFinal": "Итоговый результат",
+    "enableRerank": "Включить Rerank",
+    "embeddingProvider": "Провайдер Embedding",
+    "rerankProvider": "Провайдер Rerank",
+    "embeddingProviderHint": "Embedding модель связана с текущим векторным индексом. Для смены создайте новую базу знаний.",
+    "indexType": "Тип индекса",
+    "indexTypeHint": "Flat точнее, HNSW лучше для больших баз знаний.",
+    "indexTypes": {
+      "flat": "Flat точный индекс",
+      "hnsw": "HNSW приближенный индекс"
     },
-    "settings": {
-        "title": "Общие настройки базы",
-        "basic": "Основные",
-        "retrieval": "Поиск",
-        "chunkSize": "Размер чанка",
-        "chunkOverlap": "Перекрытие",
-        "topKDense": "Вернуть (Dense)",
-        "topKSparse": "Вернуть (Sparse)",
-        "topMFinal": "Итоговый результат",
-        "enableRerank": "Включить Rerank",
-        "embeddingProvider": "Провайдер Embedding",
-        "rerankProvider": "Провайдер Rerank",
-        "save": "Сохранить",
-        "saveSuccess": "Настройки сохранены",
-        "saveFailed": "Ошибка сохранения",
-        "tips": "Внимание! Изменение этих параметров повлияет на будущую выдачу базы знаний."
-    }
+    "save": "Сохранить",
+    "saveSuccess": "Настройки сохранены",
+    "saveFailed": "Ошибка сохранения",
+    "providersLoadFailed": "Не удалось загрузить провайдеры моделей",
+    "tips": "Внимание! Изменение этих параметров повлияет на будущую выдачу базы знаний."
+  },
+  "validation": {
+    "integer": "Введите целое число",
+    "positiveInteger": "Введите целое число больше 0",
+    "nonNegativeInteger": "Введите целое число не меньше 0",
+    "overlapLessThanSize": "Перекрытие должно быть меньше размера чанка",
+    "topKRange": "Количество результатов должно быть целым числом от 1 до {max}"
+  },
+  "actions": {
+    "retry": "Повторить"
+  },
+  "messages": {
+    "loadFailed": "Не удалось загрузить детали базы знаний"
+  },
+  "tavily": {
+    "title": "Настройка Tavily API Key",
+    "description": "Для веб-функций базы знаний нужен Tavily API Key. Получить его можно на",
+    "officialSite": "сайте Tavily",
+    "apiKeyLabel": "Tavily API Key",
+    "apiKeyPlaceholder": "tvly-...",
+    "cancel": "Отмена",
+    "save": "Сохранить",
+    "keyRequired": "API Key обязателен",
+    "loadConfigFailed": "Не удалось загрузить текущую конфигурацию",
+    "saveFailed": "Не удалось сохранить. Проверьте ключ.",
+    "unknownSaveFailed": "Не удалось сохранить из-за неизвестной ошибки"
+  }
 }
diff --git a/dashboard/src/i18n/locales/ru-RU/features/knowledge-base/document.json b/dashboard/src/i18n/locales/ru-RU/features/knowledge-base/document.json
index 7fcb30ee9f..4f391e4e93 100644
--- a/dashboard/src/i18n/locales/ru-RU/features/knowledge-base/document.json
+++ b/dashboard/src/i18n/locales/ru-RU/features/knowledge-base/document.json
@@ -1,55 +1,124 @@
 ﻿{
-    "title": "Просмотр документа",
-    "backToKB": "К базе знаний",
-    "info": {
-        "title": "Информация о документе",
-        "name": "Имя файла",
-        "type": "Формат",
-        "size": "Размер",
-        "chunkCount": "Количество фрагментов",
-        "createdAt": "Загружен"
+  "title": "Просмотр документа",
+  "backToKB": "К базе знаний",
+  "info": {
+    "title": "Информация о документе",
+    "name": "Имя файла",
+    "type": "Формат",
+    "size": "Размер",
+    "chunkCount": "Количество фрагментов",
+    "createdAt": "Загружен"
+  },
+  "processing": {
+    "title": "Информация обработки",
+    "status": "Статус",
+    "sourceType": "Тип источника",
+    "sourceUri": "Источник",
+    "contentHash": "Хэш контента",
+    "parser": "Парсер",
+    "chunker": "Разбиение",
+    "version": "Версия",
+    "parentDocId": "ID родительского документа",
+    "indexedAt": "Индексирован",
+    "unknownStage": "Неизвестный этап",
+    "noErrorMessage": "Нет сообщения об ошибке",
+    "statuses": {
+      "pending": "Ожидание",
+      "parsing": "Разбор",
+      "chunking": "Фрагментация",
+      "embedding": "Индексация",
+      "ready": "Готово",
+      "failed": "Ошибка"
     },
-    "chunks": {
-        "title": "Фрагменты текста",
-        "empty": "Фрагменты не найдены",
-        "index": "Индекс",
-        "content": "Текст",
-        "charCount": "Символов",
-        "actions": "Действия",
-        "view": "Детали",
-        "edit": "Изменить",
-        "delete": "Удалить",
-        "preview": "Обзор",
-        "search": "Поиск по документу",
-        "searchPlaceholder": "Найти во фрагментах...",
-        "showing": "Показано",
-        "deleteConfirm": "Удалить этот фрагмент?",
-        "deleteSuccess": "Фрагмент удален",
-        "deleteFailed": "Ошибка удаления"
-    },
-    "edit": {
-        "title": "Редактирование фрагмента",
-        "content": "Текст",
-        "cancel": "Отмена",
-        "save": "Сохранить",
-        "saveSuccess": "Фрагмент обновлен",
-        "saveFailed": "Ошибка сохранения"
-    },
-    "delete": {
-        "title": "Удаление",
-        "confirmText": "Вы уверены?",
-        "warning": "Удаление фрагмента может ухудшить качество ответов AI по этой теме.",
-        "cancel": "Отмена",
-        "confirm": "Удалить",
-        "deleteSuccess": "Удаление выполнено",
-        "deleteFailed": "Ошибка удаления"
-    },
-    "view": {
-        "title": "Детальный просмотр",
-        "index": "Индекс",
-        "content": "Текст",
-        "charCount": "Символов",
-        "vecDocId": "ID вектора",
-        "close": "Закрыть"
+    "sourceTypes": {
+      "file": "Файл",
+      "url": "URL",
+      "import": "Импорт",
+      "api": "API"
     }
-}
\ No newline at end of file
+  },
+  "chunks": {
+    "title": "Фрагменты текста",
+    "total": "Фрагментов: {count}",
+    "filteredTotal": "Найдено {filtered} / {total} фрагм.",
+    "empty": "Фрагменты не найдены",
+    "index": "Индекс",
+    "content": "Текст",
+    "titlePath": "Путь заголовков",
+    "charCount": "Символов",
+    "charCountValue": "{count} симв.",
+    "tokenEstimate": "Оценка токенов",
+    "tokenEstimateValue": "Около {count} ток.",
+    "offset": "Позиция",
+    "contentHash": "Хэш контента",
+    "actions": "Действия",
+    "view": "Детали",
+    "edit": "Изменить",
+    "delete": "Удалить",
+    "preview": "Обзор",
+    "search": "Поиск по документу",
+    "searchPlaceholder": "Найти во фрагментах...",
+    "showing": "Показано",
+    "showingRange": "Показано {start} - {end} / {total} фрагм.",
+    "deleteConfirm": "Удалить этот фрагмент?",
+    "deleteSuccess": "Фрагмент удален",
+    "deleteFailed": "Ошибка удаления"
+  },
+  "edit": {
+    "title": "Редактирование фрагмента",
+    "content": "Текст",
+    "cancel": "Отмена",
+    "save": "Сохранить",
+    "saveSuccess": "Фрагмент обновлен",
+    "saveFailed": "Ошибка сохранения"
+  },
+  "delete": {
+    "title": "Удаление",
+    "confirmText": "Вы уверены?",
+    "warning": "Удаление фрагмента может ухудшить качество ответов AI по этой теме.",
+    "cancel": "Отмена",
+    "confirm": "Удалить",
+    "deleteSuccess": "Удаление выполнено",
+    "deleteFailed": "Ошибка удаления"
+  },
+  "view": {
+    "title": "Детальный просмотр",
+    "index": "Индекс",
+    "content": "Текст",
+    "charCount": "Символов",
+    "tokenEstimate": "Оценка токенов",
+    "titlePath": "Путь заголовков",
+    "section": "Раздел",
+    "pageNumber": "Страница",
+    "offset": "Позиция",
+    "contentHash": "Хэш контента",
+    "adjacentChunks": "Соседние фрагменты",
+    "previousChunk": "Предыдущий: {id}",
+    "nextChunk": "Следующий: {id}",
+    "parentChunk": "Родительский фрагмент",
+    "vecDocId": "ID вектора",
+    "context": "Соседний контекст",
+    "previous": "Предыдущий",
+    "current": "Текущий",
+    "next": "Следующий",
+    "contextMissing": "Соседний фрагмент отсутствует",
+    "close": "Закрыть"
+  },
+  "actions": {
+    "retry": "Повторить",
+    "retryRebuild": "Повторить индексацию",
+    "retryRebuildConfirm": "Переиндексировать этот документ?"
+  },
+  "messages": {
+    "loadDocumentFailed": "Не удалось загрузить документ",
+    "loadChunksFailed": "Не удалось загрузить фрагменты",
+    "loadChunkContextFailed": "Не удалось загрузить соседний контекст",
+    "rebuildStarted": "Переиндексация документа запущена",
+    "rebuildCompleted": "Переиндексация документа завершена",
+    "rebuildFailed": "Не удалось переиндексировать документ",
+    "rebuildFailedWithReason": "Не удалось переиндексировать документ: {reason}",
+    "focusChunkLoaded": "Открыт найденный фрагмент",
+    "focusChunkFailed": "Не удалось открыть найденный фрагмент",
+    "focusChunkNotFound": "Найденный фрагмент не найден"
+  }
+}
diff --git a/dashboard/src/i18n/locales/ru-RU/features/knowledge-base/index.json b/dashboard/src/i18n/locales/ru-RU/features/knowledge-base/index.json
index 4eb99d5f06..ca7f5e26ed 100644
--- a/dashboard/src/i18n/locales/ru-RU/features/knowledge-base/index.json
+++ b/dashboard/src/i18n/locales/ru-RU/features/knowledge-base/index.json
@@ -1,68 +1,74 @@
 ﻿{
-    "title": "Управление базами знаний",
-    "subtitle": "Централизованное управление всеми знаниями AstrBot",
-    "list": {
-        "title": "Базы знаний",
-        "subtitle": "Все доступные коллекции знаний",
-        "create": "Создать базу",
-        "refresh": "Обновить",
-        "empty": "Баз знаний пока нет",
-        "loading": "Загрузка...",
-        "documents": "док.",
-        "chunks": "фрагм.",
-        "sessionConfig": "Профиль",
-        "initError": "Ошибка инициализации"
-    },
-    "card": {
-        "edit": "Изменить",
-        "delete": "Удалить",
-        "open": "Открыть",
-        "docCount": "Документов: {count}",
-        "chunkCount": "Фрагментов: {count}"
-    },
-    "create": {
-        "title": "Создание базы знаний",
-        "nameLabel": "Название",
-        "namePlaceholder": "Придумайте имя для базы",
-        "descriptionLabel": "Описание",
-        "descriptionPlaceholder": "Для чего нужна эта база?",
-        "emojiLabel": "Иконка",
-        "embeddingModelLabel": "Embedding модель",
-        "rerankModelLabel": "Rerank модель (опционально)",
-        "providerInfo": "Провайдер: {id} | Размерность: {dimensions}",
-        "rerankProviderInfo": "Провайдер: {id}",
-        "cancel": "Отмена",
-        "submit": "Создать",
-        "nameRequired": "Введите название базы знаний"
-    },
-    "edit": {
-        "title": "Редактирование",
-        "submit": "Сохранить"
-    },
-    "delete": {
-        "title": "Удаление",
-        "confirmText": "Вы уверены, что хотите удалить базу знаний «{name}»?",
-        "warning": "Это действие необратимо. Все документы, фрагменты и настройки будут навсегда удалены.",
-        "cancel": "Отмена",
-        "confirm": "Удалить"
-    },
-    "emoji": {
-        "title": "Выберите иконку",
-        "close": "Закрыть",
-        "categories": {
-            "books": "Книги и документы",
-            "emotions": "Эмоции",
-            "objects": "Вещи",
-            "symbols": "Символы"
-        }
-    },
-    "messages": {
-        "createSuccess": "База знаний создана",
-        "createFailed": "Ошибка создания",
-        "updateSuccess": "Обновлено успешно",
-        "updateFailed": "Ошибка обновления",
-        "deleteSuccess": "Удалено успешно",
-        "deleteFailed": "Ошибка удаления",
-        "loadError": "Не удалось загрузить список"
+  "title": "Управление базами знаний",
+  "subtitle": "Централизованное управление всеми знаниями AstrBot",
+  "list": {
+    "title": "Базы знаний",
+    "subtitle": "Все доступные коллекции знаний",
+    "create": "Создать базу",
+    "refresh": "Обновить",
+    "empty": "Баз знаний пока нет",
+    "loading": "Загрузка...",
+    "documents": "док.",
+    "chunks": "фрагм.",
+    "sessionConfig": "Профиль",
+    "initError": "Ошибка инициализации",
+    "noDescription": "Нет описания",
+    "switchToLegacy": "Перейти к старой базе знаний"
+  },
+  "card": {
+    "edit": "Изменить",
+    "delete": "Удалить",
+    "open": "Открыть",
+    "docCount": "Документов: {count}",
+    "chunkCount": "Фрагментов: {count}"
+  },
+  "create": {
+    "title": "Создание базы знаний",
+    "nameLabel": "Название",
+    "namePlaceholder": "Придумайте имя для базы",
+    "descriptionLabel": "Описание",
+    "descriptionPlaceholder": "Для чего нужна эта база?",
+    "emojiLabel": "Иконка",
+    "embeddingModelLabel": "Embedding модель",
+    "rerankModelLabel": "Rerank модель (опционально)",
+    "providerInfo": "Провайдер: {id} | Размерность: {dimensions}",
+    "rerankProviderInfo": "Провайдер: {id}",
+    "nameHint": "Если позже переименуете базу, обновите конфигурации, где она указана по имени.",
+    "embeddingModelHint": "Embedding модель нельзя изменить после создания. Для другой модели создайте новую базу.",
+    "cancel": "Отмена",
+    "submit": "Создать",
+    "nameRequired": "Введите название базы знаний",
+    "embeddingRequired": "Выберите embedding модель"
+  },
+  "edit": {
+    "title": "Редактирование",
+    "submit": "Сохранить"
+  },
+  "delete": {
+    "title": "Удаление",
+    "confirmText": "Вы уверены, что хотите удалить базу знаний «{name}»?",
+    "warning": "Это действие необратимо. Все документы, фрагменты и настройки будут навсегда удалены.",
+    "cancel": "Отмена",
+    "confirm": "Удалить"
+  },
+  "emoji": {
+    "title": "Выберите иконку",
+    "close": "Закрыть",
+    "categories": {
+      "books": "Книги и документы",
+      "emotions": "Эмоции",
+      "objects": "Вещи",
+      "symbols": "Символы"
     }
+  },
+  "messages": {
+    "createSuccess": "База знаний создана",
+    "createFailed": "Ошибка создания",
+    "updateSuccess": "Обновлено успешно",
+    "updateFailed": "Ошибка обновления",
+    "deleteSuccess": "Удалено успешно",
+    "deleteFailed": "Ошибка удаления",
+    "loadError": "Не удалось загрузить список",
+    "providersLoadError": "Не удалось загрузить провайдеры моделей"
+  }
 }
diff --git a/dashboard/src/i18n/locales/zh-CN/features/knowledge-base/detail.json b/dashboard/src/i18n/locales/zh-CN/features/knowledge-base/detail.json
index 54bc60b7a7..987e91fa18 100644
--- a/dashboard/src/i18n/locales/zh-CN/features/knowledge-base/detail.json
+++ b/dashboard/src/i18n/locales/zh-CN/features/knowledge-base/detail.json
@@ -21,36 +21,183 @@
     "stats": "统计信息",
     "docCount": "文档数量",
     "chunkCount": "分块数量",
+    "readyDocCount": "已索引文档",
+    "failedDocCount": "失败文档",
+    "sourceFiles": "源文件",
+    "storageUsed": "存储占用",
     "embeddingModel": "嵌入模型",
     "rerankModel": "重排序模型",
     "notSet": "未设置"
   },
+  "consistency": {
+    "title": "索引一致性",
+    "run": "运行检查",
+    "repair": "修复可修复项",
+    "notRun": "尚未运行一致性检查。点击运行检查可诊断文档元数据、源文件和索引文本块是否一致。",
+    "notRunHint": "完整检查会读取索引元数据，并列出可修复项。",
+    "notRunChunkMismatch": "当前快照显示文档记录有 {metadata} 个分块，索引中有 {indexed} 个分块，建议运行检查。",
+    "notRunFailedDocs": "当前有 {count} 个失败文档，建议查看文档列表或运行一致性检查。",
+    "healthy": "未发现一致性问题",
+    "unhealthy": "发现 {count} 个一致性问题",
+    "checkedAt": "检查时间: {time}",
+    "sqliteDocuments": "元数据文档",
+    "indexedChunks": "索引分块",
+    "documentChunks": "文档分块",
+    "sourceFiles": "源文件",
+    "expectedChunks": "预期 {count} 个分块",
+    "actualChunks": "实际 {count} 个分块",
+    "checkSuccessHealthy": "一致性检查完成，未发现问题",
+    "checkSuccessUnhealthy": "一致性检查完成，发现 {count} 个问题",
+    "checkFailed": "一致性检查失败",
+    "repairSuccess": "一致性修复完成: 修复 {repaired} 项, 跳过 {skipped} 项",
+    "repairPartialSuccess": "一致性修复部分完成: 修复 {repaired} 项, 跳过 {skipped} 项, 失败 {failed} 项",
+    "repairFailed": "一致性修复失败",
+    "issues": {
+      "missingVectors": "文档缺失索引分块",
+      "orphanVectors": "孤儿索引分块",
+      "missingSourceFiles": "源文件缺失",
+      "chunkCountMismatches": "分块数量不一致",
+      "invalidVectorMetadata": "索引元数据异常",
+      "unsafeSourcePaths": "源文件路径异常"
+    },
+    "reasons": {
+      "empty_file_path": "源文件路径为空",
+      "outside_kb_files_dir": "源文件路径不在知识库目录内",
+      "not_found": "源文件不存在"
+    }
+  },
+  "maintenance": {
+    "rebuild": "重建索引",
+    "rebuildStarted": "知识库重建任务已开始",
+    "rebuildSuccess": "知识库重建完成",
+    "rebuildFailed": "知识库重建失败",
+    "rebuildFailedWithReason": "知识库重建失败: {reason}",
+    "rebuildPartialSuccess": "知识库重建部分完成: 成功 {success} 个, 失败 {failed} 个",
+    "unknownError": "未知错误",
+    "stages": {
+      "waiting": "等待中...",
+      "rebuilding": "重建知识库...",
+      "parsing": "解析文档...",
+      "chunking": "文本分块...",
+      "embedding": "生成向量...",
+      "completed": "已完成"
+    }
+  },
+  "tasks": {
+    "title": "最近任务",
+    "refresh": "刷新任务",
+    "empty": "暂无任务记录",
+    "loadFailed": "加载最近任务失败",
+    "recentFailures": "最近失败",
+    "noErrorMessage": "暂无错误信息",
+    "resultSummary": "共 {total} 个，成功 {success} 个，失败 {failed} 个",
+    "progressDetail": "进度 {progress}",
+    "types": {
+      "upload": "上传文档",
+      "import": "导入文档",
+      "url": "URL 导入",
+      "document_rebuild": "文档重建",
+      "document_batch_rebuild": "批量文档重建",
+      "kb_rebuild": "知识库重建"
+    },
+    "statuses": {
+      "pending": "等待中",
+      "processing": "处理中",
+      "completed": "已完成",
+      "partial_failed": "部分失败",
+      "failed": "失败"
+    }
+  },
   "documents": {
     "title": "文档列表",
     "upload": "上传文档",
     "empty": "暂无文档",
+    "searchPlaceholder": "搜索文档...",
+    "statusFilter": "状态",
+    "sourceFilter": "来源",
+    "allStatuses": "全部状态",
+    "allSources": "全部来源",
+    "filteredCount": "显示 {filtered} / {total} 个文档",
     "name": "文档名称",
     "type": "类型",
+    "status": "状态",
     "size": "大小",
     "chunks": "分块数",
     "createdAt": "上传时间",
     "actions": "操作",
     "view": "查看",
+    "copyFailure": "复制失败诊断",
+    "rebuild": "重试重建",
     "delete": "删除",
+    "rebuildTitle": "重建文档索引",
+    "rebuildConfirm": "确定要重新构建文档「{name}」的索引吗?",
+    "rebuildWarning": "重建会重新解析并写入索引。任务完成前,旧索引仍可能被检索到。",
+    "batchRebuild": "批量重建 ({count})",
+    "batchRebuildTitle": "批量重建文档索引",
+    "batchRebuildConfirm": "确定要重新构建选中的 {count} 个文档索引吗?",
+    "batchRebuildMore": "还有 {count} 个",
+    "batchRebuildWarning": "批量重建会为选中文档重新解析并写入索引。任务完成前,旧索引仍可能被检索到。",
+    "batchDelete": "批量删除 ({count})",
+    "batchDeleteTitle": "批量删除文档",
+    "batchDeleteConfirm": "确定要删除选中的 {count} 个文档吗?",
+    "batchDeleteMore": "还有 {count} 个",
+    "cancel": "取消",
     "deleteConfirm": "确定要删除文档「{name}」吗?",
     "deleteWarning": "此操作将删除文档及其所有分块,不可恢复。",
     "uploading": "正在上传...",
     "uploadSuccess": "文档上传成功",
     "uploadFailed": "文档上传失败",
+    "loadFailed": "加载文档列表失败",
     "deleteSuccess": "文档删除成功",
-    "deleteFailed": "文档删除失败"
+    "deleteFailed": "文档删除失败",
+    "batchDeleteSuccess": "已删除 {count} 个文档",
+    "batchDeletePartialSuccess": "批量删除部分完成: 成功 {success} 个, 失败 {failed} 个",
+    "batchDeleteFailed": "批量删除文档失败",
+    "batchDeleteLimitExceeded": "单次最多只能删除 {limit} 个文档",
+    "batchRebuildStarted": "已开始重建 {count} 个文档",
+    "batchRebuildFailed": "批量重建文档失败",
+    "batchRebuildLimitExceeded": "单次最多只能重建 {limit} 个文档",
+    "failureDocument": "文档",
+    "failureDocumentId": "文档 ID",
+    "failureStage": "失败阶段",
+    "failureMessage": "错误信息",
+    "unknownFailureStage": "未知阶段",
+    "noFailureMessage": "暂无错误信息",
+    "copyFailureSuccess": "已复制失败诊断信息",
+    "copyFailureFailed": "复制失败诊断信息失败",
+    "rebuildStarted": "文档重建任务已开始",
+    "rebuildSuccess": "文档重建成功",
+    "rebuildFailed": "文档重建失败",
+    "rebuildFailedWithReason": "文档重建失败: {reason}",
+    "rebuildPartialSuccess": "文档重建部分成功: 成功 {success} 个, 失败 {failed} 个",
+    "statuses": {
+      "pending": "等待中",
+      "parsing": "解析中",
+      "chunking": "分块中",
+      "embedding": "索引中",
+      "ready": "已索引",
+      "failed": "失败"
+    },
+    "sourceTypes": {
+      "file": "文件",
+      "url": "URL",
+      "import": "导入"
+    }
   },
   "upload": {
     "title": "上传文档",
     "selectFile": "选择文件",
     "dropzone": "拖放文件到这里或点击选择",
-    "supportedFormats": "支持的格式: .txt, .md, .markdown, .rst, .adoc, .pdf, .docx, .epub, .xls, .xlsx",
-    "maxSize": "最大文件大小: 128MB",
+    "supportedFormats": "支持的格式: {formats}",
+    "maxSize": "最大文件大小: {size}",
+    "maxFiles": "最多可上传 {count} 个文件",
+    "maxFilesWarning": "最多只能选择 {count} 个文件",
+    "selectedFiles": "已选择 {count} 个文件",
+    "clear": "清空",
+    "someFilesRejected": "部分文件未加入上传队列",
+    "unsupportedFile": "{name}: 不支持的文件类型",
+    "fileTooLarge": "{name}: 文件超过 {size}",
+    "invalidSettings": "请检查上传参数",
     "chunkSettings": "分块设置",
     "batchSettings": "批处理设置",
     "cleaningSettings": "清洗设置",
@@ -58,15 +205,15 @@
     "cleaningProvider": "清洗服务提供商",
     "cleaningProviderHint": "选择一个 LLM 服务商来对提取的网页内容进行清洗和总结",
     "chunkSize": "分块大小",
-    "chunkSizeHint": "每个文本块的字符数 (默认: 512)",
+    "chunkSizeHint": "每个文本块的字符数 (默认: {value})",
     "chunkOverlap": "分块重叠",
-    "chunkOverlapHint": "相邻文本块之间的重叠字符数 (默认: 50)",
+    "chunkOverlapHint": "相邻文本块之间的重叠字符数 (默认: {value})",
     "batchSize": "批处理大小",
-    "batchSizeHint": "每批处理的文本块数量 (默认: 32)",
+    "batchSizeHint": "每批处理的文本块数量 (默认: {value})",
     "tasksLimit": "并发任务限制",
-    "tasksLimitHint": "最大并发上传任务数 (默认: 3)",
+    "tasksLimitHint": "最大并发上传任务数 (默认: {value})",
     "maxRetries": "最大重试次数",
-    "maxRetriesHint": "上传失败任务的重试次数 (默认: 3)",
+    "maxRetriesHint": "上传失败任务的重试次数 (默认: {value})",
     "cancel": "取消",
     "submit": "上传",
     "fileRequired": "请选择要上传的文件",
@@ -75,6 +222,27 @@
     "urlPlaceholder": "请输入要提取内容的网页 URL",
     "urlRequired": "请输入 URL",
     "urlHint": "将自动从目标 URL 提取主要内容作为文档。目前支持 {supported} 页面，请确保目标网页允许爬虫访问。",
+    "unsupportedUrlImport": "当前后端未启用 URL 导入功能",
+    "tavilyCheckFailed": "检查网页搜索配置失败",
+    "tavilyRequired": "使用此功能需要配置 Tavily Key",
+    "configure": "配置",
+    "tavilyConfigured": "Tavily API Key 配置成功",
+    "backgroundUploading": "正在后台上传 {count} 个文件...",
+    "backgroundUrlUploading": "正在从 URL 后台提取内容...",
+    "successCount": "成功上传 {count} 个文档",
+    "partialSuccess": "上传完成: {success} 个成功, {failed} 个失败",
+    "failedWithReason": "上传失败: {reason}",
+    "unknownError": "未知错误",
+    "stages": {
+      "waiting": "等待中...",
+      "extracting": "提取内容...",
+      "cleaning": "清洗内容...",
+      "parsing": "解析文档...",
+      "chunking": "文本分块...",
+      "embedding": "生成向量...",
+      "rebuilding": "重建文档...",
+      "completed": "已完成"
+    },
     "beta": "测试版"
   },
   "retrieval": {
@@ -88,6 +256,14 @@
     "noResults": "没有找到相关内容",
     "tryDifferentQuery": "尝试使用不同的查询词",
     "settings": "检索设置",
+    "debugMode": "调试模式",
+    "debugModeTsne": "调试模式 (t-SNE)",
+    "traceMode": "检索链路追踪",
+    "cancel": "取消",
+    "caseNotesPlaceholder": "例如：稀疏检索排名偏低",
+    "caseTags": "标签",
+    "caseTagsPlaceholder": "例如：manual, retrieval-ui, bad-case",
+    "tsneVisualization": "t-SNE 可视化",
     "topK": "返回结果数量",
     "topKHint": "最多返回多少条检索结果",
     "enableRerank": "启用重排序",
@@ -97,9 +273,40 @@
     "chunk": "文本块 #{index}",
     "content": "内容",
     "charCount": "{count} 字符",
+    "traceTitle": "检索链路",
+    "traceStageCount": "{count} 个阶段",
+    "traceHits": "{count} 条",
+    "traceDenseRank": "稠密排名 #{rank}",
+    "traceSparseRank": "稀疏排名 #{rank}",
+    "traceDenseScore": "稠密分",
+    "traceSparseScore": "稀疏分",
+    "traceRrfScore": "RRF 分",
+    "traceRerankScore": "重排分",
+    "traceDuplicateOf": "重复于 {chunk}",
+    "traceDedupSimilarity": "重复相似度 {value}",
+    "sourcePage": "第 {page} 页",
+    "sourceSection": "章节 {index}",
+    "sourceParentChunk": "父文本块 {id}",
+    "tracePreviewEmpty": "暂无内容预览",
+    "traceEmpty": "该阶段没有候选结果",
+    "unknownDocument": "未知文档",
+    "traceStages": {
+      "dense": "稠密召回",
+      "sparse": "稀疏召回",
+      "fusion": "RRF 融合",
+      "dedup": "近重复去除",
+      "dedup_removed": "已移除重复项",
+      "rerank": "重排序",
+      "final": "最终上下文"
+    },
     "searchSuccess": "检索完成,找到 {count} 条结果",
     "searchFailed": "检索失败",
-    "queryRequired": "请输入检索查询"
+    "queryRequired": "请输入检索查询",
+    "latestRunResults": "最近结果",
+    "metricRecall": "召回率",
+    "metricNdcg": "归一化折损累计增益 (nDCG)",
+    "metricPrecision": "精确率",
+    "metricFirstHit": "首个命中"
   },
   "settings": {
     "title": "知识库设置",
@@ -113,9 +320,43 @@
     "enableRerank": "启用重排序",
     "embeddingProvider": "嵌入模型提供商",
     "rerankProvider": "重排序模型提供商",
+    "embeddingProviderHint": "嵌入模型与现有向量索引绑定，如需更换请创建新的知识库。",
+    "indexType": "索引类型",
+    "indexTypeHint": "Flat 更精确，HNSW 更适合大规模知识库。",
+    "indexTypes": {
+      "flat": "Flat 精确索引",
+      "hnsw": "HNSW 近似索引"
+    },
     "save": "保存设置",
     "saveSuccess": "设置保存成功",
     "saveFailed": "设置保存失败",
+    "providersLoadFailed": "加载模型提供商失败",
     "tips": "提示: 修改检索设置后,将影响后续的知识库查询效果。"
+  },
+  "validation": {
+    "integer": "请输入整数",
+    "positiveInteger": "请输入大于 0 的整数",
+    "nonNegativeInteger": "请输入不小于 0 的整数",
+    "overlapLessThanSize": "分块重叠必须小于分块大小",
+    "topKRange": "返回结果数量必须是 1 到 {max} 的整数"
+  },
+  "actions": {
+    "retry": "重试"
+  },
+  "messages": {
+    "loadFailed": "加载知识库详情失败"
+  },
+  "tavily": {
+    "title": "配置 Tavily API Key",
+    "description": "为了使用基于网页的知识库功能，需要提供 Tavily API Key。您可以从",
+    "officialSite": "Tavily 官网",
+    "apiKeyLabel": "Tavily API Key",
+    "apiKeyPlaceholder": "tvly-...",
+    "cancel": "取消",
+    "save": "保存",
+    "keyRequired": "API Key 不能为空",
+    "loadConfigFailed": "获取当前配置失败",
+    "saveFailed": "保存失败，请检查 Key 是否正确",
+    "unknownSaveFailed": "保存失败，发生未知错误"
   }
 }
diff --git a/dashboard/src/i18n/locales/zh-CN/features/knowledge-base/document.json b/dashboard/src/i18n/locales/zh-CN/features/knowledge-base/document.json
index c90c29cc29..6127213d92 100644
--- a/dashboard/src/i18n/locales/zh-CN/features/knowledge-base/document.json
+++ b/dashboard/src/i18n/locales/zh-CN/features/knowledge-base/document.json
@@ -9,12 +9,48 @@
     "chunkCount": "分块数量",
     "createdAt": "上传时间"
   },
+  "processing": {
+    "title": "处理信息",
+    "status": "状态",
+    "sourceType": "来源类型",
+    "sourceUri": "来源地址",
+    "contentHash": "内容哈希",
+    "parser": "解析器",
+    "chunker": "分块器",
+    "version": "版本",
+    "parentDocId": "父文档 ID",
+    "indexedAt": "索引时间",
+    "unknownStage": "未知阶段",
+    "noErrorMessage": "暂无错误信息",
+    "statuses": {
+      "pending": "等待中",
+      "parsing": "解析中",
+      "chunking": "分块中",
+      "embedding": "索引中",
+      "ready": "已索引",
+      "failed": "失败"
+    },
+    "sourceTypes": {
+      "file": "文件",
+      "url": "URL",
+      "import": "导入",
+      "api": "API"
+    }
+  },
   "chunks": {
     "title": "分块列表",
+    "total": "{count} 个分块",
+    "filteredTotal": "匹配 {filtered} / {total} 个分块",
     "empty": "暂无分块",
     "index": "序号",
     "content": "内容",
+    "titlePath": "标题路径",
     "charCount": "字符数",
+    "charCountValue": "{count} 字符",
+    "tokenEstimate": "估算 Token",
+    "tokenEstimateValue": "约 {count} token",
+    "offset": "位置",
+    "contentHash": "内容哈希",
     "actions": "操作",
     "view": "查看",
     "edit": "编辑",
@@ -23,6 +59,7 @@
     "search": "搜索分块",
     "searchPlaceholder": "输入关键词搜索分块内容...",
     "showing": "显示",
+    "showingRange": "显示 {start} - {end} / {total} 个分块",
     "deleteConfirm": "确定要删除该文本块吗?",
     "deleteSuccess": "文本块删除成功",
     "deleteFailed": "文本块删除失败"
@@ -49,7 +86,39 @@
     "index": "序号",
     "content": "内容",
     "charCount": "字符数",
+    "tokenEstimate": "估算 Token",
+    "titlePath": "标题路径",
+    "section": "章节",
+    "pageNumber": "页码",
+    "offset": "位置",
+    "contentHash": "内容哈希",
+    "adjacentChunks": "相邻分块",
+    "previousChunk": "上一块: {id}",
+    "nextChunk": "下一块: {id}",
+    "parentChunk": "父分块",
     "vecDocId": "向量ID",
+    "context": "相邻上下文",
+    "previous": "上一块",
+    "current": "当前块",
+    "next": "下一块",
+    "contextMissing": "暂无相邻分块",
     "close": "关闭"
+  },
+  "actions": {
+    "retry": "重试",
+    "retryRebuild": "重试重建",
+    "retryRebuildConfirm": "确定要重新构建该文档索引吗?"
+  },
+  "messages": {
+    "loadDocumentFailed": "加载文档详情失败",
+    "loadChunksFailed": "加载分块列表失败",
+    "loadChunkContextFailed": "加载相邻上下文失败",
+    "rebuildStarted": "文档重建任务已开始",
+    "rebuildCompleted": "文档重建完成",
+    "rebuildFailed": "文档重建失败",
+    "rebuildFailedWithReason": "文档重建失败: {reason}",
+    "focusChunkLoaded": "已打开检索命中的分块",
+    "focusChunkFailed": "打开检索命中的分块失败",
+    "focusChunkNotFound": "未找到检索命中的分块"
   }
 }
diff --git a/dashboard/src/i18n/locales/zh-CN/features/knowledge-base/index.json b/dashboard/src/i18n/locales/zh-CN/features/knowledge-base/index.json
index cac88bacd1..87d74926db 100644
--- a/dashboard/src/i18n/locales/zh-CN/features/knowledge-base/index.json
+++ b/dashboard/src/i18n/locales/zh-CN/features/knowledge-base/index.json
@@ -11,7 +11,9 @@
     "documents": "文档",
     "chunks": "分块",
     "sessionConfig": "会话配置",
-    "initError": "初始化失败"
+    "initError": "初始化失败",
+    "noDescription": "暂无描述",
+    "switchToLegacy": "切换到旧版知识库"
   },
   "card": {
     "edit": "编辑",
@@ -27,13 +29,16 @@
     "descriptionLabel": "描述",
     "descriptionPlaceholder": "简单描述这个知识库的用途...",
     "emojiLabel": "图标",
-    "embeddingModelLabel": "嵌入模型 (Embedding Model)",
-    "rerankModelLabel": "重排序模型 (Rerank Model, 可选)",
+    "embeddingModelLabel": "嵌入模型",
+    "rerankModelLabel": "重排序模型（可选）",
     "providerInfo": "提供商: {id} | 维度: {dimensions}",
     "rerankProviderInfo": "提供商: {id}",
+    "nameHint": "如果后续修改知识库名称，请同步更新仍按名称引用的配置。",
+    "embeddingModelHint": "嵌入模型选择后无法修改，如需更换请创建新的知识库。",
     "cancel": "取消",
     "submit": "创建",
-    "nameRequired": "请输入知识库名称"
+    "nameRequired": "请输入知识库名称",
+    "embeddingRequired": "请选择嵌入模型"
   },
   "edit": {
     "title": "编辑知识库",
@@ -63,6 +68,7 @@
     "updateFailed": "更新失败",
     "deleteSuccess": "知识库删除成功",
     "deleteFailed": "删除失败",
-    "loadError": "加载知识库列表失败"
+    "loadError": "加载知识库列表失败",
+    "providersLoadError": "加载模型提供商失败"
   }
 }
diff --git a/dashboard/src/main.ts b/dashboard/src/main.ts
index ce5514207c..eb2f15c205 100644
--- a/dashboard/src/main.ts
+++ b/dashboard/src/main.ts
@@ -2,7 +2,7 @@ import { createApp } from 'vue';
 import { createPinia } from 'pinia';
 import App from './App.vue';
 import { router } from './router';
-import vuetify from './plugins/vuetify';
+import vuetify, { getVuetifyLocale } from './plugins/vuetify';
 import confirmPlugin from './plugins/confirmPlugin';
 import { setupI18n } from './i18n/composables';
 import '@/scss/style.scss';
@@ -47,12 +47,18 @@ import { waitForRouterReadyInBackground } from './utils/routerReadiness.mjs';
   },
 };
 
+const syncVuetifyLocale = (event: Event) => {
+  const locale = (event as CustomEvent<{ locale?: string }>).detail?.locale;
+  vuetify.locale.current.value = getVuetifyLocale(locale);
+};
+
 // 初始化新的i18n系统，等待完成后再挂载应用
 setupI18n().then(async () => {
   console.log('🌍 新i18n系统初始化完成');
-  
+
   const app = createApp(App);
   const pinia = createPinia();
+  window.addEventListener('astrbot-locale-changed', syncVuetifyLocale);
   app.use(pinia);
   app.use(router);
   app.use(print);
@@ -86,6 +92,7 @@ setupI18n().then(async () => {
   // 即使i18n初始化失败，也要挂载应用（使用回退机制）
   const app = createApp(App);
   const pinia = createPinia();
+  window.addEventListener('astrbot-locale-changed', syncVuetifyLocale);
   app.use(pinia);
   app.use(router);
   app.use(print);
diff --git a/dashboard/src/plugins/vuetify.ts b/dashboard/src/plugins/vuetify.ts
index e38fd388e6..474f1ca02c 100644
--- a/dashboard/src/plugins/vuetify.ts
+++ b/dashboard/src/plugins/vuetify.ts
@@ -1,32 +1,91 @@
 import { createVuetify } from 'vuetify';
+import { en, ru, zhHans } from 'vuetify/locale';
 import '@/assets/mdi-subset/materialdesignicons-subset.css';
 import * as components from 'vuetify/components';
 import * as directives from 'vuetify/directives';
 import { PurpleTheme } from '@/theme/LightTheme';
-import { PurpleThemeDark } from "@/theme/DarkTheme";
+import { PurpleThemeDark } from '@/theme/DarkTheme';
+
+const zhHansMessages = {
+  ...zhHans,
+  open: '打开',
+  dismiss: '关闭',
+  dataFooter: {
+    ...zhHans.dataFooter,
+    itemsPerPageText: '每页条数：',
+    firstPage: '第一页',
+    lastPage: '最后一页',
+  },
+  input: {
+    ...zhHans.input,
+    clear: '清空 {0}',
+    prependAction: '{0} 前置操作',
+    appendAction: '{0} 后置操作',
+    otp: '请输入第 {0} 位验证码',
+  },
+  pagination: {
+    ...zhHans.pagination,
+    ariaLabel: {
+      ...zhHans.pagination.ariaLabel,
+      first: '第一页',
+      last: '最后一页',
+    },
+  },
+  stepper: {
+    next: '下一步',
+    prev: '上一步',
+  },
+  loading: '加载中...',
+};
+
+const vuetifyLocaleMap: Record<string, string> = {
+  'zh-CN': 'zhHans',
+  'en-US': 'en',
+  'ru-RU': 'ru',
+};
+
+export const getVuetifyLocale = (locale?: string | null) => {
+  if (!locale) {
+    return 'zhHans';
+  }
+  return vuetifyLocaleMap[locale] || 'zhHans';
+};
 
 export default createVuetify({
   components,
   directives,
+  locale: {
+    locale: getVuetifyLocale(
+      typeof localStorage === 'undefined'
+        ? null
+        : localStorage.getItem('astrbot-locale'),
+    ),
+    fallback: 'en',
+    messages: {
+      en,
+      ru,
+      zhHans: zhHansMessages,
+    },
+  },
 
   theme: {
     defaultTheme: 'PurpleTheme',
     themes: {
       PurpleTheme,
-      PurpleThemeDark
-    }
+      PurpleThemeDark,
+    },
   },
   defaults: {
     VBtn: {},
     VCard: {
-      rounded: 'lg'
+      rounded: 'lg',
     },
     VTextField: {
-      rounded: 'lg'
+      rounded: 'lg',
     },
     VTooltip: {
       // set v-tooltip default location to top
-      location: 'top'
-    }
-  }
+      location: 'top',
+    },
+  },
 });
diff --git a/dashboard/src/views/knowledge-base/DocumentDetail.vue b/dashboard/src/views/knowledge-base/DocumentDetail.vue
index 921315e627..212c848e09 100644
--- a/dashboard/src/views/knowledge-base/DocumentDetail.vue
+++ b/dashboard/src/views/knowledge-base/DocumentDetail.vue
@@ -9,7 +9,9 @@
       />
       <div class="header-content">
         <h1 class="text-h4">{{ document.doc_name }}</h1>
-        <p class="text-subtitle-1 text-medium-emphasis mt-2">{{ t('title') }}</p>
+        <p class="text-subtitle-1 text-medium-emphasis mt-2">
+          {{ t("title") }}
+        </p>
       </div>
     </div>
 
@@ -18,18 +20,29 @@
       <v-progress-circular indeterminate color="primary" size="64" />
     </div>
 
+    <v-alert v-else-if="loadError" type="error" variant="tonal" class="mb-4">
+      <div class="d-flex align-center justify-space-between gap-4">
+        <span>{{ loadError }}</span>
+        <v-btn variant="text" color="error" @click="loadAll">
+          {{ t("actions.retry") }}
+        </v-btn>
+      </div>
+    </v-alert>
+
     <!-- 主内容 -->
     <div v-else class="document-content">
       <!-- 文档信息卡片 -->
       <v-card variant="outlined" class="mb-6">
-        <v-card-title>{{ t('info.title') }}</v-card-title>
+        <v-card-title>{{ t("info.title") }}</v-card-title>
         <v-card-text>
           <v-row>
             <v-col cols="12" md="3">
               <div class="info-item">
                 <v-icon start>mdi-label</v-icon>
                 <div>
-                  <div class="text-caption text-medium-emphasis">{{ t('info.name') }}</div>
+                  <div class="text-caption text-medium-emphasis">
+                    {{ t("info.name") }}
+                  </div>
                   <div class="text-body-1">{{ document.doc_name }}</div>
                 </div>
               </div>
@@ -40,8 +53,10 @@
                   {{ getFileIcon(document.file_type) }}
                 </v-icon>
                 <div>
-                  <div class="text-caption text-medium-emphasis">{{ t('info.type') }}</div>
-                  <div class="text-body-1">{{ document.file_type || '-' }}</div>
+                  <div class="text-caption text-medium-emphasis">
+                    {{ t("info.type") }}
+                  </div>
+                  <div class="text-body-1">{{ document.file_type || "-" }}</div>
                 </div>
               </div>
             </v-col>
@@ -49,8 +64,12 @@
               <div class="info-item">
                 <v-icon start>mdi-file-chart</v-icon>
                 <div>
-                  <div class="text-caption text-medium-emphasis">{{ t('info.size') }}</div>
-                  <div class="text-body-1">{{ formatFileSize(document.file_size) }}</div>
+                  <div class="text-caption text-medium-emphasis">
+                    {{ t("info.size") }}
+                  </div>
+                  <div class="text-body-1">
+                    {{ formatFileSize(document.file_size) }}
+                  </div>
                 </div>
               </div>
             </v-col>
@@ -58,7 +77,9 @@
               <div class="info-item">
                 <v-icon start>mdi-text-box</v-icon>
                 <div>
-                  <div class="text-caption text-medium-emphasis">{{ t('info.chunkCount') }}</div>
+                  <div class="text-caption text-medium-emphasis">
+                    {{ t("info.chunkCount") }}
+                  </div>
                   <div class="text-body-1">{{ document.chunk_count || 0 }}</div>
                 </div>
               </div>
@@ -67,8 +88,12 @@
               <div class="info-item">
                 <v-icon start>mdi-calendar</v-icon>
                 <div>
-                  <div class="text-caption text-medium-emphasis">{{ t('info.createdAt') }}</div>
-                  <div class="text-body-1">{{ formatDate(document.created_at) }}</div>
+                  <div class="text-caption text-medium-emphasis">
+                    {{ t("info.createdAt") }}
+                  </div>
+                  <div class="text-body-1">
+                    {{ formatDate(document.created_at) }}
+                  </div>
                 </div>
               </div>
             </v-col>
@@ -76,88 +101,325 @@
         </v-card-text>
       </v-card>
 
+      <v-card variant="outlined" class="mb-6">
+        <v-card-title>{{ t("processing.title") }}</v-card-title>
+        <v-card-text>
+          <v-row>
+            <v-col cols="12" md="3">
+              <div class="info-item">
+                <v-icon start :color="getDocumentStatusColor(document.status)">
+                  {{ getDocumentStatusIcon(document.status) }}
+                </v-icon>
+                <div>
+                  <div class="text-caption text-medium-emphasis">
+                    {{ t("processing.status") }}
+                  </div>
+                  <v-chip
+                    size="small"
+                    variant="tonal"
+                    :color="getDocumentStatusColor(document.status)"
+                  >
+                    {{ getDocumentStatusText(document.status) }}
+                  </v-chip>
+                </div>
+              </div>
+            </v-col>
+            <v-col cols="12" md="3">
+              <div class="info-item">
+                <v-icon start>mdi-source-branch</v-icon>
+                <div>
+                  <div class="text-caption text-medium-emphasis">
+                    {{ t("processing.sourceType") }}
+                  </div>
+                  <div class="text-body-1">
+                    {{ getSourceTypeText(document.source_type) }}
+                  </div>
+                </div>
+              </div>
+            </v-col>
+            <v-col cols="12" md="3">
+              <div class="info-item">
+                <v-icon start>mdi-counter</v-icon>
+                <div>
+                  <div class="text-caption text-medium-emphasis">
+                    {{ t("processing.version") }}
+                  </div>
+                  <div class="text-body-1">
+                    {{ document.version || 1 }}
+                  </div>
+                </div>
+              </div>
+            </v-col>
+            <v-col cols="12" md="3">
+              <div class="info-item">
+                <v-icon start>mdi-calendar-check</v-icon>
+                <div>
+                  <div class="text-caption text-medium-emphasis">
+                    {{ t("processing.indexedAt") }}
+                  </div>
+                  <div class="text-body-1">
+                    {{ formatDate(document.indexed_at) }}
+                  </div>
+                </div>
+              </div>
+            </v-col>
+            <v-col cols="12" md="6">
+              <div class="info-item">
+                <v-icon start>mdi-link-variant</v-icon>
+                <div class="metadata-value">
+                  <div class="text-caption text-medium-emphasis">
+                    {{ t("processing.sourceUri") }}
+                  </div>
+                  <div class="text-body-2 metadata-text">
+                    {{ document.source_uri || "-" }}
+                  </div>
+                </div>
+              </div>
+            </v-col>
+            <v-col cols="12" md="6">
+              <div class="info-item">
+                <v-icon start>mdi-fingerprint</v-icon>
+                <div class="metadata-value">
+                  <div class="text-caption text-medium-emphasis">
+                    {{ t("processing.contentHash") }}
+                  </div>
+                  <div class="text-body-2 metadata-text">
+                    {{ document.content_hash || "-" }}
+                  </div>
+                </div>
+              </div>
+            </v-col>
+            <v-col cols="12" md="6">
+              <div class="info-item">
+                <v-icon start>mdi-file-cog-outline</v-icon>
+                <div class="metadata-value">
+                  <div class="text-caption text-medium-emphasis">
+                    {{ t("processing.parser") }}
+                  </div>
+                  <div class="text-body-2">
+                    {{
+                      formatProcessor(
+                        document.parser_name,
+                        document.parser_version,
+                      )
+                    }}
+                  </div>
+                </div>
+              </div>
+            </v-col>
+            <v-col cols="12" md="6">
+              <div class="info-item">
+                <v-icon start>mdi-text-box-check-outline</v-icon>
+                <div class="metadata-value">
+                  <div class="text-caption text-medium-emphasis">
+                    {{ t("processing.chunker") }}
+                  </div>
+                  <div class="text-body-2">
+                    {{
+                      formatProcessor(
+                        document.chunker_name,
+                        document.chunker_version,
+                      )
+                    }}
+                  </div>
+                </div>
+              </div>
+            </v-col>
+            <v-col v-if="document.parent_doc_id" cols="12" md="6">
+              <div class="info-item">
+                <v-icon start>mdi-file-replace-outline</v-icon>
+                <div class="metadata-value">
+                  <div class="text-caption text-medium-emphasis">
+                    {{ t("processing.parentDocId") }}
+                  </div>
+                  <div class="text-body-2 metadata-text">
+                    {{ document.parent_doc_id }}
+                  </div>
+                </div>
+              </div>
+            </v-col>
+          </v-row>
+          <v-alert
+            v-if="document.status === 'failed'"
+            type="error"
+            variant="tonal"
+            class="mt-4"
+          >
+            <div
+              class="d-flex align-center justify-space-between flex-wrap ga-4"
+            >
+              <div class="metadata-value">
+                <div class="text-subtitle-2">
+                  {{ document.error_stage || t("processing.unknownStage") }}
+                </div>
+                <div class="text-body-2 mt-1">
+                  {{ document.error_message || t("processing.noErrorMessage") }}
+                </div>
+                <v-progress-linear
+                  v-if="document.rebuilding"
+                  :model-value="getRebuildPercentage(document)"
+                  color="error"
+                  height="4"
+                  rounded
+                  striped
+                  class="mt-3"
+                />
+              </div>
+              <v-btn
+                v-if="supportsDocumentRebuild"
+                class="flex-shrink-0"
+                color="error"
+                variant="tonal"
+                prepend-icon="mdi-refresh"
+                :loading="isDocumentRebuildBusy"
+                :disabled="isDocumentRebuildBusy || !document.doc_id"
+                @click="retryDocumentRebuild"
+              >
+                {{ t("actions.retryRebuild") }}
+              </v-btn>
+            </div>
+          </v-alert>
+        </v-card-text>
+      </v-card>
+
       <!-- 分块列表 -->
       <v-card variant="outlined">
-        <v-card-title class="d-flex align-center pa-4">
-          <span>{{ t('chunks.title') }}</span>
-          <v-chip class="ml-2" size="small" variant="tonal">
-            {{ totalChunks }} {{ t('chunks.title') }}
-          </v-chip>
-          <v-spacer />
-          <!-- <v-text-field
+        <v-card-title class="chunk-card-title pa-4">
+          <div class="chunk-card-title-main">
+            <span>{{ t("chunks.title") }}</span>
+            <v-chip size="small" variant="tonal">
+              {{
+                hasChunkSearch
+                  ? t("chunks.filteredTotal", {
+                      filtered: totalChunks,
+                      total: displayDocumentChunkCount,
+                    })
+                  : t("chunks.total", { count: displayDocumentChunkCount })
+              }}
+            </v-chip>
+          </div>
+          <v-text-field
             v-model="searchQuery"
+            class="chunk-search"
             prepend-inner-icon="mdi-magnify"
             :placeholder="t('chunks.searchPlaceholder')"
             variant="outlined"
             density="compact"
             hide-details
             clearable
-            style="max-width: 300px"
-          /> -->
+          />
         </v-card-title>
 
         <v-card-text class="pa-0">
-          <v-data-table
-            :headers="headers"
-            :items="filteredChunks"
-            :loading="loadingChunks"
-            :items-per-page="pageSize"
-            hide-default-footer
-          >
-            <template #item.chunk_index="{ item }">
-              <v-chip size="small" variant="tonal" color="primary">
-                #{{ item.chunk_index + 1 }}
-              </v-chip>
-            </template>
-
-            <template #item.content="{ item }">
-              <div class="chunk-content-preview">
-                {{ item.content }}
-              </div>
-            </template>
+          <div class="chunks-table-scroller">
+            <v-data-table
+              class="chunks-table"
+              :headers="headers"
+              :items="chunks"
+              :loading="loadingChunks"
+              :items-per-page="pageSize"
+              hide-default-footer
+            >
+              <template #item.chunk_index="{ item }">
+                <v-chip
+                  class="chunk-index-chip"
+                  size="small"
+                  variant="tonal"
+                  color="primary"
+                >
+                  #{{ item.chunk_index + 1 }}
+                </v-chip>
+              </template>
 
-            <template #item.char_count="{ item }">
-              <v-chip size="small" variant="outlined">
-                {{ item.char_count }} 字符
-              </v-chip>
-            </template>
+              <template #item.content="{ item }">
+                <div class="chunk-content-preview" :title="item.content">
+                  {{ item.content }}
+                </div>
+              </template>
 
-            <template #item.actions="{ item }">
-              <v-btn
-                icon="mdi-eye"
-                variant="text"
-                size="small"
-                color="info"
-                @click="viewChunk(item)"
-              />
-              <!-- 删除 -->
-              <v-btn
-                icon="mdi-delete"
-                variant="text"
-                size="small"
-                color="error"
-                @click="deleteChunk(item)"
-              />
-            </template>
+              <template #item.title_path="{ item }">
+                <span class="chunk-title-path text-caption">
+                  {{ formatTitlePath(item.title_path) }}
+                </span>
+              </template>
 
-            <template #no-data>
-              <div class="text-center py-8">
-                <v-icon size="64" color="grey-lighten-2">mdi-text-box-outline</v-icon>
-                <p class="mt-4 text-medium-emphasis">{{ t('chunks.empty') }}</p>
-              </div>
-            </template>
-          </v-data-table>
-          
+              <template #item.char_count="{ item }">
+                <v-chip class="chunk-count-chip" size="small" variant="outlined">
+                  {{ t("chunks.charCountValue", { count: item.char_count }) }}
+                </v-chip>
+              </template>
+
+              <template #item.token_count_estimate="{ item }">
+                <v-chip class="chunk-count-chip" size="small" variant="outlined">
+                  {{ formatTokenEstimate(item.token_count_estimate) }}
+                </v-chip>
+              </template>
+
+              <template #item.offset="{ item }">
+                <span class="chunk-offset text-caption">
+                  {{ formatChunkOffset(item) }}
+                </span>
+              </template>
+
+              <template #item.content_hash="{ item }">
+                <span
+                  class="chunk-hash text-caption"
+                  :title="item.content_hash || '-'"
+                >
+                  {{ formatShortHash(item.content_hash) }}
+                </span>
+              </template>
+
+              <template #item.actions="{ item }">
+                <div class="chunk-actions">
+                  <v-btn
+                    icon="mdi-eye"
+                    variant="text"
+                    size="small"
+                    color="info"
+                    @click="viewChunk(item)"
+                  />
+                  <v-btn
+                    icon="mdi-delete"
+                    variant="text"
+                    size="small"
+                    color="error"
+                    @click="deleteChunk(item)"
+                  />
+                </div>
+              </template>
+
+              <template #no-data>
+                <div class="text-center py-8">
+                  <v-icon size="64" color="grey-lighten-2"
+                    >mdi-text-box-outline</v-icon
+                  >
+                  <p class="mt-4 text-medium-emphasis">
+                    {{ t("chunks.empty") }}
+                  </p>
+                </div>
+              </template>
+            </v-data-table>
+          </div>
 
           <!-- 自定义分页器 -->
-          <div v-if="!searchQuery && totalChunks > 0" class="pa-4 d-flex align-center justify-space-between">
+          <div
+            v-if="totalChunks > 0"
+            class="chunk-pagination-bar pa-4"
+          >
             <div class="text-caption text-medium-emphasis">
-              {{ t('chunks.showing') }} {{ (page - 1) * pageSize + 1 }} - {{ Math.min(page * pageSize, totalChunks) }} / {{ totalChunks }}
+              {{
+                t("chunks.showingRange", {
+                  start: (page - 1) * pageSize + 1,
+                  end: Math.min(page * pageSize, totalChunks),
+                  total: totalChunks,
+                })
+              }}
             </div>
-            <div class="d-flex align-center gap-2">
+            <div class="chunk-pagination-controls">
               <v-select
                 v-model="pageSize"
-                :items="[10, 25, 50, 100]"
+                :items="chunkPageSizeOptions"
                 density="compact"
                 variant="outlined"
                 hide-details
@@ -177,49 +439,93 @@
     </div>
 
     <!-- 查看分块对话框 -->
-    <v-dialog v-model="showViewDialog" max-width="800px" scrollable>
-      <v-card>
-        <v-card-title class="pa-4">
-          <span>{{ t('view.title') }}</span>
+    <v-dialog
+      v-model="showViewDialog"
+      max-width="960px"
+      width="calc(100vw - 32px)"
+      scrollable
+    >
+      <v-card class="chunk-dialog-card">
+        <v-card-title class="pa-4 d-flex align-center">
+          <span>{{ t("view.title") }}</span>
           <v-spacer />
-          <v-btn icon="mdi-close" variant="text" @click="showViewDialog = false" />
+          <v-btn
+            icon="mdi-close"
+            variant="text"
+            @click="showViewDialog = false"
+          />
         </v-card-title>
-        <v-card-text class="pa-6">
-          <v-list density="comfortable">
-            <v-list-item>
-              <template #prepend>
-                <v-icon>mdi-pound</v-icon>
-              </template>
-              <v-list-item-title>{{ t('view.index') }}</v-list-item-title>
-              <v-list-item-subtitle>#{{ (selectedChunk?.chunk_index || 0) + 1 }}</v-list-item-subtitle>
-            </v-list-item>
-
-            <v-list-item>
-              <template #prepend>
-                <v-icon>mdi-text</v-icon>
-              </template>
-              <v-list-item-title>{{ t('view.charCount') }}</v-list-item-title>
-              <v-list-item-subtitle>{{ selectedChunk?.char_count || 0 }} 字符</v-list-item-subtitle>
-            </v-list-item>
-
-            <v-list-item>
-              <template #prepend>
-                <v-icon>mdi-key</v-icon>
-              </template>
-              <v-list-item-title>{{ t('view.vecDocId') }}</v-list-item-title>
-              <v-list-item-subtitle>{{ selectedChunk?.chunk_id || '-' }}</v-list-item-subtitle>
-            </v-list-item>
-          </v-list>
+        <v-card-text class="pa-5 pa-md-6">
+          <div class="chunk-meta-grid">
+            <div
+              v-for="field in selectedChunkMetadata"
+              :key="field.key"
+              class="chunk-meta-item"
+              :class="{ 'chunk-meta-item--wide': field.wide }"
+            >
+              <v-icon class="chunk-meta-icon" size="20">
+                {{ field.icon }}
+              </v-icon>
+              <div class="chunk-meta-body">
+                <div class="chunk-meta-label">{{ field.label }}</div>
+                <div
+                  class="chunk-meta-value"
+                  :class="{ 'is-monospace': field.monospace }"
+                >
+                  {{ field.value }}
+                </div>
+              </div>
+            </div>
+          </div>
 
-          <div class="text-caption text-medium-emphasis mb-2">{{ t('view.content') }}</div>
+          <div class="text-caption text-medium-emphasis mb-2">
+            {{ t("view.content") }}
+          </div>
           <div class="chunk-content-view">
             {{ selectedChunk?.content }}
           </div>
+
+          <div class="d-flex align-center mt-6 mb-2">
+            <div class="text-caption text-medium-emphasis">
+              {{ t("view.context") }}
+            </div>
+            <v-spacer />
+            <v-progress-circular
+              v-if="loadingContext"
+              indeterminate
+              size="18"
+              width="2"
+            />
+          </div>
+          <div class="chunk-context-list">
+            <div
+              v-for="slot in contextSlots"
+              :key="slot.key"
+              class="chunk-context-item"
+              :class="{ active: slot.key === 'current' }"
+            >
+              <div class="chunk-context-header">
+                <v-chip
+                  size="x-small"
+                  variant="tonal"
+                  :color="slot.key === 'current' ? 'primary' : 'default'"
+                >
+                  {{ slot.label }}
+                </v-chip>
+                <span class="text-caption text-medium-emphasis">
+                  {{ formatContextMeta(slot.chunk) }}
+                </span>
+              </div>
+              <div class="chunk-context-content">
+                {{ slot.chunk?.content || t("view.contextMissing") }}
+              </div>
+            </div>
+          </div>
         </v-card-text>
         <v-card-actions class="pa-4">
           <v-spacer />
           <v-btn variant="text" @click="showViewDialog = false">
-            {{ t('view.close') }}
+            {{ t("view.close") }}
           </v-btn>
         </v-card-actions>
       </v-card>
@@ -233,197 +539,736 @@
 </template>
 
 <script setup lang="ts">
-import { ref, computed, onMounted } from 'vue'
-import { useRoute } from 'vue-router'
-import axios from 'axios'
-import { useModuleI18n } from '@/i18n/composables'
-import { askForConfirmation, useConfirmDialog } from '@/utils/confirmDialog'
+import { ref, computed, nextTick, onMounted, onUnmounted, watch } from "vue";
+import { useRoute, useRouter } from "vue-router";
+import axios from "axios";
+import { useI18n, useModuleI18n } from "@/i18n/composables";
+import { askForConfirmation, useConfirmDialog } from "@/utils/confirmDialog";
+import { useKnowledgeBaseCapabilities } from "./capabilities";
+import {
+  applyActiveRebuildState,
+  applyDocumentTaskProgress,
+  canRebuildDocument,
+  clearDocumentTaskState,
+  DEFAULT_CHUNK_PAGE_SIZE,
+  getFocusedChunkId,
+  getKnowledgeBasePaginationConfig,
+  isKnowledgeBaseFeatureEnabled,
+  markDocumentRebuildStarted,
+  removeFocusedChunkQuery,
+} from "./knowledgeBaseUi.mjs";
 
-const { tm: t } = useModuleI18n('features/knowledge-base/document')
-const route = useRoute()
+const { tm: t } = useModuleI18n("features/knowledge-base/document");
+const { locale } = useI18n();
+const route = useRoute();
+const router = useRouter();
+const { capabilities, loadCapabilities } = useKnowledgeBaseCapabilities();
 
-const confirmDialog = useConfirmDialog()
+const confirmDialog = useConfirmDialog();
 
-const kbId = ref(route.params.kbId as string)
-const docId = ref(route.params.docId as string)
+const kbId = computed(() => String(route.params.kbId || ""));
+const docId = computed(() => String(route.params.docId || ""));
 
 // 状态
-const loading = ref(true)
-const loadingChunks = ref(false)
-const document = ref<any>({})
-const chunks = ref<any[]>([])
-const searchQuery = ref('')
-const showViewDialog = ref(false)
-const selectedChunk = ref<any>(null)
+const loading = ref(true);
+const loadingChunks = ref(false);
+const rebuilding = ref(false);
+const document = ref<any>({});
+const chunks = ref<any[]>([]);
+const searchQuery = ref("");
+const showViewDialog = ref(false);
+const selectedChunk = ref<any>(null);
+const chunkContext = ref<any>(null);
+const loadingContext = ref(false);
+const loadError = ref("");
+const focusedChunkId = computed(() => getFocusedChunkId(route.query));
 
 // 分页状态
-const page = ref(1)
-const pageSize = ref(10)
-const totalChunks = ref(0)
+const page = ref(1);
+const pageSize = ref(DEFAULT_CHUNK_PAGE_SIZE);
+const totalChunks = ref(0);
+const documentChunkCount = ref<number | null>(null);
+let searchTimer: number | undefined;
+let rebuildPollingInterval: number | undefined;
+const paginationConfig = computed(() =>
+  getKnowledgeBasePaginationConfig(capabilities.value),
+);
+const chunkPageSizeOptions = computed(
+  () => paginationConfig.value.chunkPageSizeOptions,
+);
+const supportsDocumentRebuild = computed(() =>
+  isKnowledgeBaseFeatureEnabled(capabilities.value, "document_rebuild"),
+);
+const isDocumentRebuildBusy = computed(
+  () => rebuilding.value || Boolean(document.value?.rebuilding),
+);
 
 const snackbar = ref({
   show: false,
-  text: '',
-  color: 'success'
-})
+  text: "",
+  color: "success",
+});
 
-const showSnackbar = (text: string, color: string = 'success') => {
-  snackbar.value.text = text
-  snackbar.value.color = color
-  snackbar.value.show = true
-}
+const showSnackbar = (text: string, color: string = "success") => {
+  snackbar.value.text = text;
+  snackbar.value.color = color;
+  snackbar.value.show = true;
+};
 
 // 表格列
-const headers = [
-  { title: t('chunks.index'), key: 'chunk_index', width: 100 },
-  { title: t('chunks.content'), key: 'content', sortable: false },
-  { title: t('chunks.charCount'), key: 'char_count', width: 150 },
-  { title: t('chunks.actions'), key: 'actions', sortable: false, width: 150 }
-]
-
-// 过滤分块
-const filteredChunks = computed(() => {
-  if (!searchQuery.value) return chunks.value
-  const query = searchQuery.value.toLowerCase()
-  return chunks.value.filter(chunk =>
-    chunk.content.toLowerCase().includes(query)
-  )
-})
+const headers = computed(() => [
+  {
+    title: t("chunks.index"),
+    key: "chunk_index",
+    width: 88,
+    minWidth: "88px",
+  },
+  {
+    title: t("chunks.content"),
+    key: "content",
+    sortable: false,
+    width: 390,
+    minWidth: "320px",
+  },
+  {
+    title: t("chunks.titlePath"),
+    key: "title_path",
+    sortable: false,
+    width: 220,
+    minWidth: "180px",
+  },
+  { title: t("chunks.charCount"), key: "char_count", width: 120 },
+  {
+    title: t("chunks.tokenEstimate"),
+    key: "token_count_estimate",
+    width: 130,
+  },
+  { title: t("chunks.offset"), key: "offset", sortable: false, width: 112 },
+  {
+    title: t("chunks.contentHash"),
+    key: "content_hash",
+    sortable: false,
+    width: 140,
+  },
+  {
+    title: t("chunks.actions"),
+    key: "actions",
+    sortable: false,
+    align: "end" as const,
+    width: 96,
+  },
+]);
+
+const contextSlots = computed(() => [
+  {
+    key: "previous",
+    label: t("view.previous"),
+    chunk: chunkContext.value?.previous,
+  },
+  {
+    key: "current",
+    label: t("view.current"),
+    chunk: chunkContext.value?.current || selectedChunk.value,
+  },
+  {
+    key: "next",
+    label: t("view.next"),
+    chunk: chunkContext.value?.next,
+  },
+]);
+const hasChunkSearch = computed(() => searchQuery.value.trim().length > 0);
+const displayDocumentChunkCount = computed(
+  () =>
+    documentChunkCount.value ?? document.value.chunk_count ?? totalChunks.value,
+);
+const selectedChunkMetadata = computed(() => [
+  {
+    key: "index",
+    icon: "mdi-pound",
+    label: t("view.index"),
+    value: `#${Number(selectedChunk.value?.chunk_index ?? 0) + 1}`,
+  },
+  {
+    key: "char_count",
+    icon: "mdi-text",
+    label: t("view.charCount"),
+    value: t("chunks.charCountValue", {
+      count: selectedChunk.value?.char_count ?? 0,
+    }),
+  },
+  {
+    key: "token_count_estimate",
+    icon: "mdi-counter",
+    label: t("view.tokenEstimate"),
+    value: formatTokenEstimate(selectedChunk.value?.token_count_estimate),
+  },
+  {
+    key: "title_path",
+    icon: "mdi-format-title",
+    label: t("view.titlePath"),
+    value: formatTitlePath(selectedChunk.value?.title_path),
+    wide: true,
+  },
+  {
+    key: "section_index",
+    icon: "mdi-file-tree-outline",
+    label: t("view.section"),
+    value: formatOneBasedIndex(selectedChunk.value?.section_index),
+  },
+  {
+    key: "page_number",
+    icon: "mdi-file-document-outline",
+    label: t("view.pageNumber"),
+    value: formatNullableValue(selectedChunk.value?.page_number),
+  },
+  {
+    key: "offset",
+    icon: "mdi-map-marker-distance",
+    label: t("view.offset"),
+    value: formatChunkOffset(selectedChunk.value),
+    monospace: true,
+  },
+  {
+    key: "content_hash",
+    icon: "mdi-fingerprint",
+    label: t("view.contentHash"),
+    value: selectedChunk.value?.content_hash || "-",
+    monospace: true,
+    wide: true,
+  },
+  {
+    key: "adjacent_chunks",
+    icon: "mdi-arrow-left-right",
+    label: t("view.adjacentChunks"),
+    value: [
+      t("view.previousChunk", {
+        id: selectedChunk.value?.previous_chunk_id || "-",
+      }),
+      t("view.nextChunk", {
+        id: selectedChunk.value?.next_chunk_id || "-",
+      }),
+    ].join("\n"),
+    monospace: true,
+    wide: true,
+  },
+  {
+    key: "parent_chunk_id",
+    icon: "mdi-file-link-outline",
+    label: t("view.parentChunk"),
+    value: selectedChunk.value?.parent_chunk_id || "-",
+    monospace: true,
+    wide: true,
+  },
+  {
+    key: "chunk_id",
+    icon: "mdi-key",
+    label: t("view.vecDocId"),
+    value: selectedChunk.value?.chunk_id || "-",
+    monospace: true,
+    wide: true,
+  },
+]);
 
 // 加载文档详情
 const loadDocument = async () => {
-  loading.value = true
+  loading.value = true;
+  loadError.value = "";
   try {
-    const response = await axios.get('/api/kb/document/get', {
-      params: { doc_id: docId.value, kb_id: kbId.value }
-    })
-    if (response.data.status === 'ok') {
-      document.value = response.data.data
+    const response = await axios.get("/api/kb/document/get", {
+      params: { doc_id: docId.value, kb_id: kbId.value },
+    });
+    if (response.data.status === "ok") {
+      document.value = applyActiveRebuildState(
+        [response.data.data],
+        [document.value],
+      )[0];
+      documentChunkCount.value = response.data.data.chunk_count ?? null;
+    } else {
+      loadError.value =
+        response.data.message || t("messages.loadDocumentFailed");
+      showSnackbar(loadError.value, "error");
     }
   } catch (error) {
-    console.error('Failed to load document:', error)
-    showSnackbar('加载文档详情失败', 'error')
+    console.error("Failed to load document:", error);
+    loadError.value = t("messages.loadDocumentFailed");
+    showSnackbar(loadError.value, "error");
   } finally {
-    loading.value = false
+    loading.value = false;
   }
-}
+};
 
 // 加载分块列表
 const loadChunks = async () => {
-  loadingChunks.value = true
+  loadingChunks.value = true;
   try {
-    const response = await axios.get('/api/kb/chunk/list', {
-      params: { 
-        doc_id: docId.value, 
+    const response = await axios.get("/api/kb/chunk/list", {
+      params: {
+        doc_id: docId.value,
         kb_id: kbId.value,
         page: page.value,
-        page_size: pageSize.value
-      }
-    })
-    if (response.data.status === 'ok') {
-      chunks.value = response.data.data.items || []
-      totalChunks.value = response.data.data.total || 0
+        page_size: pageSize.value,
+        search: searchQuery.value || undefined,
+      },
+    });
+    if (response.data.status === "ok") {
+      chunks.value = response.data.data.items || [];
+      totalChunks.value =
+        response.data.data.filtered_total ?? response.data.data.total ?? 0;
+      documentChunkCount.value =
+        response.data.data.document_chunk_count ??
+        response.data.data.total ??
+        documentChunkCount.value;
+    } else {
+      showSnackbar(
+        response.data.message || t("messages.loadChunksFailed"),
+        "error",
+      );
     }
   } catch (error) {
-    console.error('Failed to load chunks:', error)
-    showSnackbar('加载分块列表失败', 'error')
+    console.error("Failed to load chunks:", error);
+    showSnackbar(t("messages.loadChunksFailed"), "error");
   } finally {
-    loadingChunks.value = false
+    loadingChunks.value = false;
   }
-}
+};
 
 // 处理分页变化
 const handlePageChange = (newPage: number) => {
-  page.value = newPage
-  loadChunks()
-}
+  page.value = newPage;
+  loadChunks();
+};
 
 const handlePageSizeChange = (newPageSize: number) => {
-  pageSize.value = newPageSize
-  page.value = 1
-  loadChunks()
-}
+  pageSize.value = newPageSize;
+  page.value = 1;
+  loadChunks();
+};
 
 // 查看分块
 const viewChunk = (chunk: any) => {
-  selectedChunk.value = chunk
-  showViewDialog.value = true
-}
+  selectedChunk.value = chunk;
+  chunkContext.value = null;
+  showViewDialog.value = true;
+  loadChunkContext(chunk);
+};
+
+const loadChunkContext = async (chunk: any) => {
+  if (!chunk?.chunk_id) return;
+  loadingContext.value = true;
+  try {
+    const response = await axios.get("/api/kb/chunk/context", {
+      params: {
+        chunk_id: chunk.chunk_id,
+        doc_id: docId.value,
+        kb_id: kbId.value,
+      },
+    });
+    if (response.data.status === "ok") {
+      chunkContext.value = response.data.data;
+    } else {
+      showSnackbar(
+        response.data.message || t("messages.loadChunkContextFailed"),
+        "error",
+      );
+    }
+  } catch (error) {
+    console.error("Failed to load chunk context:", error);
+    showSnackbar(t("messages.loadChunkContextFailed"), "error");
+  } finally {
+    loadingContext.value = false;
+  }
+};
+
+const getRebuildPercentage = (doc: any) => {
+  const current = Number(doc?.uploadProgress?.current ?? 0);
+  const total = Number(doc?.uploadProgress?.total ?? 100);
+  if (!Number.isFinite(total) || total <= 0) {
+    return 0;
+  }
+  return (current / total) * 100;
+};
+
+const stopRebuildProgressPolling = () => {
+  if (rebuildPollingInterval !== undefined) {
+    window.clearInterval(rebuildPollingInterval);
+    rebuildPollingInterval = undefined;
+  }
+};
+
+const refreshAfterRebuildTask = async (taskId: string) => {
+  document.value =
+    clearDocumentTaskState([document.value], taskId)[0] || document.value;
+  await loadDocument();
+  await loadChunks();
+};
+
+const startRebuildProgressPolling = (taskId: string) => {
+  stopRebuildProgressPolling();
+  rebuildPollingInterval = window.setInterval(async () => {
+    try {
+      const response = await axios.get("/api/kb/document/upload/progress", {
+        params: { task_id: taskId },
+      });
+      if (response.data.status !== "ok") {
+        stopRebuildProgressPolling();
+        await refreshAfterRebuildTask(taskId);
+        return;
+      }
+
+      const task = response.data.data;
+      if (task.status === "processing" && task.progress) {
+        document.value =
+          applyDocumentTaskProgress(
+            [document.value],
+            taskId,
+            task.progress,
+          )[0] || document.value;
+        return;
+      }
+
+      if (task.status === "completed") {
+        stopRebuildProgressPolling();
+        showSnackbar(t("messages.rebuildCompleted"));
+        await refreshAfterRebuildTask(taskId);
+        return;
+      }
+
+      if (task.status === "failed") {
+        stopRebuildProgressPolling();
+        const reason = task.error || t("messages.rebuildFailed");
+        showSnackbar(
+          t("messages.rebuildFailedWithReason", { reason }),
+          "error",
+        );
+        await refreshAfterRebuildTask(taskId);
+      }
+    } catch (error) {
+      console.error("Failed to poll document rebuild progress:", error);
+    }
+  }, 1000);
+};
+
+const retryDocumentRebuild = async () => {
+  if (
+    !canRebuildDocument(document.value, {
+      supportsDocumentRebuild: supportsDocumentRebuild.value,
+    })
+  ) {
+    return;
+  }
+  if (
+    !(await askForConfirmation(t("actions.retryRebuildConfirm"), confirmDialog))
+  ) {
+    return;
+  }
+
+  rebuilding.value = true;
+  try {
+    const response = await axios.post("/api/kb/document/rebuild", {
+      doc_id: document.value.doc_id,
+      kb_id: kbId.value,
+      background: true,
+    });
+    if (response.data.status === "ok") {
+      const taskId = response.data.data?.task_id;
+      if (taskId) {
+        document.value =
+          markDocumentRebuildStarted(
+            [document.value],
+            document.value.doc_id,
+            taskId,
+          )[0] || document.value;
+        showSnackbar(t("messages.rebuildStarted"), "info");
+        startRebuildProgressPolling(taskId);
+      } else {
+        showSnackbar(t("messages.rebuildCompleted"));
+        await loadDocument();
+        await loadChunks();
+      }
+    } else {
+      showSnackbar(
+        response.data.message || t("messages.rebuildFailed"),
+        "error",
+      );
+    }
+  } catch (error) {
+    console.error("Failed to retry document rebuild:", error);
+    showSnackbar(t("messages.rebuildFailed"), "error");
+  } finally {
+    rebuilding.value = false;
+  }
+};
+
+const clearFocusedChunk = () => {
+  if (!focusedChunkId.value) return;
+  router.replace({ query: removeFocusedChunkQuery(route.query) });
+};
+
+const focusChunkFromQuery = async () => {
+  if (!focusedChunkId.value || loading.value || loadError.value) return;
+
+  loadingContext.value = true;
+  try {
+    const response = await axios.get("/api/kb/chunk/context", {
+      params: {
+        chunk_id: focusedChunkId.value,
+        doc_id: docId.value,
+        kb_id: kbId.value,
+      },
+    });
+    if (response.data.status === "ok") {
+      chunkContext.value = response.data.data;
+      selectedChunk.value = response.data.data?.current || null;
+      if (!selectedChunk.value) {
+        showSnackbar(t("messages.focusChunkNotFound"), "warning");
+        clearFocusedChunk();
+        return;
+      }
+      showViewDialog.value = true;
+      await nextTick();
+      showSnackbar(t("messages.focusChunkLoaded"));
+    } else {
+      showSnackbar(
+        response.data.message || t("messages.focusChunkFailed"),
+        "error",
+      );
+      clearFocusedChunk();
+    }
+  } catch (error) {
+    console.error("Failed to focus chunk:", error);
+    showSnackbar(t("messages.focusChunkFailed"), "error");
+    clearFocusedChunk();
+  } finally {
+    loadingContext.value = false;
+  }
+};
 
 // 删除分块
 const deleteChunk = async (chunk: any) => {
-  if (!(await askForConfirmation(t('chunks.deleteConfirm'), confirmDialog))) return
+  if (!(await askForConfirmation(t("chunks.deleteConfirm"), confirmDialog)))
+    return;
   try {
-    const response = await axios.post('/api/kb/chunk/delete', {
+    const response = await axios.post("/api/kb/chunk/delete", {
       chunk_id: chunk.chunk_id,
       doc_id: docId.value,
-      kb_id: kbId.value
-    })
-    if (response.data.status === 'ok') {
-      showSnackbar(t('chunks.deleteSuccess'))
-      loadChunks()
+      kb_id: kbId.value,
+    });
+    if (response.data.status === "ok") {
+      showSnackbar(t("chunks.deleteSuccess"));
+      const nextTotal = Math.max(totalChunks.value - 1, 0);
+      const lastPage = Math.max(Math.ceil(nextTotal / pageSize.value), 1);
+      if (page.value > lastPage) {
+        page.value = lastPage;
+      }
+      await loadDocument();
+      await loadChunks();
     } else {
-      showSnackbar(t('chunks.deleteFailed'), 'error')
+      showSnackbar(response.data.message || t("chunks.deleteFailed"), "error");
     }
   } catch (error) {
-    console.error('Failed to delete chunk:', error)
-    showSnackbar(t('chunks.deleteFailed'), 'error')
+    console.error("Failed to delete chunk:", error);
+    showSnackbar(t("chunks.deleteFailed"), "error");
   }
-}
+};
 
 // 工具函数
 const getFileIcon = (fileType: string) => {
-  const type = fileType?.toLowerCase() || ''
-  if (type.includes('pdf')) return 'mdi-file-pdf-box'
-  if (type.includes('epub')) return 'mdi-book-open-page-variant'
-  if (type.includes('md')) return 'mdi-language-markdown'
-  if (type.includes('txt')) return 'mdi-file-document-outline'
-  return 'mdi-file'
-}
+  const type = fileType?.toLowerCase() || "";
+  if (type.includes("pdf")) return "mdi-file-pdf-box";
+  if (type.includes("epub")) return "mdi-book-open-page-variant";
+  if (type.includes("md")) return "mdi-language-markdown";
+  if (type.includes("txt")) return "mdi-file-document-outline";
+  return "mdi-file";
+};
 
 const getFileColor = (fileType: string) => {
-  const type = fileType?.toLowerCase() || ''
-  if (type.includes('pdf')) return 'error'
-  if (type.includes('epub')) return 'warning'
-  if (type.includes('md')) return 'info'
-  if (type.includes('txt')) return 'success'
-  return 'grey'
-}
+  const type = fileType?.toLowerCase() || "";
+  if (type.includes("pdf")) return "error";
+  if (type.includes("epub")) return "warning";
+  if (type.includes("md")) return "info";
+  if (type.includes("txt")) return "success";
+  return "grey";
+};
+
+const getDocumentStatusText = (status?: string) => {
+  const normalizedStatus = status || "ready";
+  const statusMap: Record<string, string> = {
+    pending: t("processing.statuses.pending"),
+    parsing: t("processing.statuses.parsing"),
+    chunking: t("processing.statuses.chunking"),
+    embedding: t("processing.statuses.embedding"),
+    ready: t("processing.statuses.ready"),
+    failed: t("processing.statuses.failed"),
+  };
+  return statusMap[normalizedStatus] || normalizedStatus;
+};
+
+const getDocumentStatusColor = (status?: string) => {
+  switch (status) {
+    case "failed":
+      return "error";
+    case "pending":
+      return "grey";
+    case "parsing":
+    case "chunking":
+    case "embedding":
+      return "warning";
+    case "ready":
+    default:
+      return "success";
+  }
+};
+
+const getDocumentStatusIcon = (status?: string) => {
+  switch (status) {
+    case "failed":
+      return "mdi-alert-circle-outline";
+    case "pending":
+      return "mdi-clock-outline";
+    case "parsing":
+    case "chunking":
+    case "embedding":
+      return "mdi-progress-clock";
+    case "ready":
+    default:
+      return "mdi-check-circle-outline";
+  }
+};
+
+const getSourceTypeText = (sourceType?: string) => {
+  const normalizedSourceType = sourceType || "file";
+  const sourceTypeMap: Record<string, string> = {
+    file: t("processing.sourceTypes.file"),
+    url: t("processing.sourceTypes.url"),
+    import: t("processing.sourceTypes.import"),
+    api: t("processing.sourceTypes.api"),
+  };
+  return sourceTypeMap[normalizedSourceType] || normalizedSourceType;
+};
+
+const formatProcessor = (name?: string, version?: string) => {
+  if (!name) return "-";
+  return version ? `${name} v${version}` : name;
+};
+
+const formatChunkOffset = (chunk?: any) => {
+  if (
+    chunk?.start_offset === undefined ||
+    chunk?.start_offset === null ||
+    chunk?.end_offset === undefined ||
+    chunk?.end_offset === null
+  ) {
+    return "-";
+  }
+  return `${chunk.start_offset} - ${chunk.end_offset}`;
+};
+
+const formatContextMeta = (chunk?: any) => {
+  if (!chunk) return "-";
+  return `#${(chunk.chunk_index || 0) + 1} | ${formatTitlePath(
+    chunk.title_path,
+  )} | ${formatChunkOffset(chunk)}`;
+};
+
+const formatTitlePath = (titlePath?: string[] | null) => {
+  if (!Array.isArray(titlePath) || titlePath.length === 0) return "-";
+  return titlePath.filter(Boolean).join(" / ") || "-";
+};
+
+const formatNullableValue = (value?: number | null) => {
+  if (value === undefined || value === null) return "-";
+  return String(value);
+};
+
+const formatOneBasedIndex = (value?: number | null) => {
+  if (value === undefined || value === null) return "-";
+  return String(value + 1);
+};
+
+const formatTokenEstimate = (value?: number | null) => {
+  if (value === undefined || value === null) return "-";
+  return t("chunks.tokenEstimateValue", { count: value });
+};
+
+const formatShortHash = (hash?: string) => {
+  if (!hash) return "-";
+  return hash.length > 12 ? `${hash.slice(0, 12)}...` : hash;
+};
 
 const formatFileSize = (bytes: number) => {
-  if (!bytes) return '-'
-  const units = ['B', 'KB', 'MB', 'GB']
-  let size = bytes
-  let unitIndex = 0
+  if (!bytes) return "-";
+  const units = ["B", "KB", "MB", "GB"];
+  let size = bytes;
+  let unitIndex = 0;
   while (size >= 1024 && unitIndex < units.length - 1) {
-    size /= 1024
-    unitIndex++
+    size /= 1024;
+    unitIndex++;
   }
-  return `${size.toFixed(2)} ${units[unitIndex]}`
-}
+  return `${size.toFixed(2)} ${units[unitIndex]}`;
+};
 
 const formatDate = (dateStr: string) => {
-  if (!dateStr) return '-'
-  return new Date(dateStr).toLocaleString('zh-CN', {
-    year: 'numeric',
-    month: '2-digit',
-    day: '2-digit',
-    hour: '2-digit',
-    minute: '2-digit'
-  })
-}
+  if (!dateStr) return "-";
+  return new Date(dateStr).toLocaleString(locale.value, {
+    year: "numeric",
+    month: "2-digit",
+    day: "2-digit",
+    hour: "2-digit",
+    minute: "2-digit",
+  });
+};
 
 onMounted(() => {
-  loadDocument()
-  loadChunks()
-})
+  loadCapabilities().then((loadedCapabilities) => {
+    pageSize.value =
+      getKnowledgeBasePaginationConfig(loadedCapabilities).defaultChunkPageSize;
+    loadAll();
+  });
+});
+
+watch(focusedChunkId, () => {
+  focusChunkFromQuery();
+});
+
+watch([kbId, docId], () => {
+  stopRebuildProgressPolling();
+  showViewDialog.value = false;
+  selectedChunk.value = null;
+  chunkContext.value = null;
+  page.value = 1;
+  loadAll();
+});
+
+watch(searchQuery, () => {
+  page.value = 1;
+  if (searchTimer !== undefined) {
+    window.clearTimeout(searchTimer);
+  }
+  searchTimer = window.setTimeout(() => {
+    loadChunks();
+  }, 250);
+});
+
+onUnmounted(() => {
+  if (searchTimer !== undefined) {
+    window.clearTimeout(searchTimer);
+  }
+  stopRebuildProgressPolling();
+});
+
+const loadAll = async () => {
+  await loadDocument();
+  if (!loadError.value) {
+    await loadChunks();
+    await focusChunkFromQuery();
+  }
+};
 </script>
 
 <style scoped>
 .document-detail-page {
-  padding: 24px;
-  max-width: 1040px;
-  margin: 0 auto;
+  padding: 0;
+  width: 100%;
   animation: fadeIn 0.3s ease;
 }
 
@@ -446,7 +1291,7 @@ onMounted(() => {
   display: flex;
   align-items: flex-start;
   gap: 16px;
-  margin-bottom: 32px;
+  margin-bottom: 24px;
 }
 
 .header-content {
@@ -482,23 +1327,214 @@ onMounted(() => {
   align-items: flex-start;
 }
 
+.metadata-value {
+  min-width: 0;
+  flex: 1;
+}
+
+.metadata-text {
+  overflow-wrap: anywhere;
+}
+
+.chunk-card-title {
+  align-items: center;
+  display: flex;
+  gap: 16px;
+  justify-content: space-between;
+}
+
+.chunk-card-title-main {
+  align-items: center;
+  display: flex;
+  flex-wrap: wrap;
+  gap: 8px;
+  min-width: 0;
+}
+
+.chunk-search {
+  flex: 0 1 320px;
+  max-width: 320px;
+}
+
+.chunks-table-scroller {
+  overflow-x: auto;
+  width: 100%;
+}
+
+.chunks-table {
+  min-width: 1180px;
+}
+
+.chunks-table :deep(table) {
+  min-width: 1180px;
+  table-layout: fixed;
+}
+
+.chunks-table :deep(th) {
+  line-height: 1.25;
+  white-space: normal;
+}
+
+.chunks-table :deep(td) {
+  vertical-align: middle;
+}
+
+.chunk-index-chip,
+.chunk-count-chip {
+  white-space: nowrap;
+}
+
 .chunk-content-preview {
-  max-width: 400px;
+  display: -webkit-box;
+  font-size: 0.875rem;
+  line-height: 1.5;
+  overflow: hidden;
+  text-overflow: ellipsis;
+  white-space: normal;
+  -webkit-box-orient: vertical;
+  -webkit-line-clamp: 2;
+}
+
+.chunk-title-path {
+  color: rgba(var(--v-theme-on-surface), 0.7);
+  display: -webkit-box;
+  line-height: 1.4;
+  overflow: hidden;
+  overflow-wrap: anywhere;
+  -webkit-box-orient: vertical;
+  -webkit-line-clamp: 2;
+}
+
+.chunk-offset,
+.chunk-hash {
+  display: block;
+  font-family: "Consolas", "Monaco", monospace;
   white-space: nowrap;
+}
+
+.chunk-hash {
+  max-width: 100%;
   overflow: hidden;
   text-overflow: ellipsis;
+}
+
+.chunk-actions {
+  align-items: center;
+  display: flex;
+  gap: 2px;
+  justify-content: flex-end;
+}
+
+.chunk-pagination-bar {
+  align-items: center;
+  display: flex;
+  gap: 16px;
+  justify-content: space-between;
+}
+
+.chunk-pagination-controls {
+  align-items: center;
+  display: flex;
+  gap: 8px;
+}
+
+.chunk-dialog-card {
+  max-height: calc(100vh - 64px);
+}
+
+.chunk-meta-grid {
+  display: grid;
+  gap: 12px;
+  grid-template-columns: repeat(2, minmax(0, 1fr));
+  margin-bottom: 24px;
+}
+
+.chunk-meta-item {
+  align-items: flex-start;
+  border: 1px solid rgba(var(--v-border-color), var(--v-border-opacity));
+  border-radius: 8px;
+  display: flex;
+  gap: 12px;
+  min-width: 0;
+  padding: 12px;
+}
+
+.chunk-meta-item--wide {
+  grid-column: 1 / -1;
+}
+
+.chunk-meta-icon {
+  color: rgba(var(--v-theme-on-surface), 0.62);
+  flex: 0 0 auto;
+  margin-top: 2px;
+}
+
+.chunk-meta-body {
+  flex: 1;
+  min-width: 0;
+}
+
+.chunk-meta-label {
+  color: rgba(var(--v-theme-on-surface), 0.68);
+  font-size: 0.75rem;
+  line-height: 1.35;
+}
+
+.chunk-meta-value {
   font-size: 0.875rem;
-  line-height: 1.5;
+  line-height: 1.45;
+  margin-top: 2px;
+  overflow-wrap: anywhere;
+  white-space: pre-line;
+}
+
+.chunk-meta-value.is-monospace {
+  font-family: "Consolas", "Monaco", monospace;
 }
 
 .chunk-content-view {
   padding: 16px;
   background: rgba(var(--v-theme-surface-variant), 0.3);
   border-radius: 8px;
+  max-height: 300px;
+  overflow: auto;
   white-space: pre-wrap;
   word-break: break-word;
   line-height: 1.6;
-  font-family: 'Consolas', 'Monaco', monospace;
+  font-family: "Consolas", "Monaco", monospace;
+}
+
+.chunk-context-list {
+  display: grid;
+  gap: 12px;
+}
+
+.chunk-context-item {
+  padding: 12px;
+  border: 1px solid rgba(var(--v-border-color), var(--v-border-opacity));
+  border-radius: 8px;
+  background: rgb(var(--v-theme-surface));
+}
+
+.chunk-context-item.active {
+  border-color: rgb(var(--v-theme-primary));
+  background: rgba(var(--v-theme-primary), 0.04);
+}
+
+.chunk-context-header {
+  display: flex;
+  align-items: center;
+  gap: 8px;
+  margin-bottom: 8px;
+}
+
+.chunk-context-content {
+  max-height: 180px;
+  overflow: auto;
+  white-space: pre-wrap;
+  word-break: break-word;
+  font-size: 0.875rem;
+  line-height: 1.6;
 }
 
 .gap-2 {
@@ -507,8 +1543,21 @@ onMounted(() => {
 
 /* 响应式设计 */
 @media (max-width: 768px) {
-  .document-detail-page {
-    padding: 16px;
+  .chunk-card-title,
+  .chunk-pagination-bar,
+  .chunk-pagination-controls {
+    align-items: stretch;
+    flex-direction: column;
+  }
+
+  .chunk-search {
+    flex-basis: auto;
+    max-width: none;
+    width: 100%;
+  }
+
+  .chunk-meta-grid {
+    grid-template-columns: 1fr;
   }
 }
 </style>
diff --git a/dashboard/src/views/knowledge-base/KBDetail.vue b/dashboard/src/views/knowledge-base/KBDetail.vue
index b1570bad48..2bd1834b84 100644
--- a/dashboard/src/views/knowledge-base/KBDetail.vue
+++ b/dashboard/src/views/knowledge-base/KBDetail.vue
@@ -5,129 +5,528 @@
       <v-progress-circular indeterminate color="primary" size="64" />
     </div>
 
+    <v-alert v-else-if="loadError" type="error" variant="tonal" class="mb-4">
+      <div class="d-flex align-center justify-space-between gap-4">
+        <span>{{ loadError }}</span>
+        <v-btn variant="text" color="error" @click="loadKB">
+          {{ t("actions.retry") }}
+        </v-btn>
+      </div>
+    </v-alert>
+
     <!-- 主内容 -->
     <div v-else class="kb-content">
       <!-- 标签页 -->
       <v-tabs v-model="activeTab" class="mb-6" color="primary">
         <v-tab value="overview">
           <v-icon start>mdi-information-outline</v-icon>
-          {{ t('tabs.overview') }}
+          {{ t("tabs.overview") }}
         </v-tab>
         <v-tab value="documents">
           <v-icon start>mdi-file-document-multiple</v-icon>
-          {{ t('tabs.documents') }}
-          <v-chip class="ml-2" size="small" variant="tonal">{{ kb.doc_count || 0 }}</v-chip>
+          {{ t("tabs.documents") }}
+          <v-chip class="ml-2" size="small" variant="tonal">{{
+            documentCount
+          }}</v-chip>
         </v-tab>
         <v-tab value="retrieval">
           <v-icon start>mdi-magnify</v-icon>
-          {{ t('tabs.retrieval') }}
+          {{ t("tabs.retrieval") }}
         </v-tab>
         <v-tab value="settings">
           <v-icon start>mdi-cog</v-icon>
-          {{ t('tabs.settings') }}
+          {{ t("tabs.settings") }}
         </v-tab>
       </v-tabs>
 
       <!-- 标签页内容 -->
-      <v-window v-model="activeTab" style="padding: 8px;">
+      <v-window v-model="activeTab" style="padding: 8px">
         <!-- 概览 -->
         <v-window-item value="overview">
-          <v-row>
-            <v-col cols="12" md="6">
-              <v-card variant="outlined">
-                <v-card-title>{{ t('overview.title') }}</v-card-title>
+          <v-row class="overview-layout">
+            <v-col cols="12" lg="4">
+              <v-card
+                variant="outlined"
+                class="overview-card overview-card--fill"
+              >
+                <v-card-title>{{ t("overview.title") }}</v-card-title>
                 <v-card-text>
                   <v-list density="comfortable">
                     <v-list-item>
                       <template #prepend>
                         <v-icon>mdi-label</v-icon>
                       </template>
-                      <v-list-item-title>{{ t('overview.name') }}</v-list-item-title>
-                      <v-list-item-subtitle>{{ kb.kb_name }}</v-list-item-subtitle>
+                      <v-list-item-title>{{
+                        t("overview.name")
+                      }}</v-list-item-title>
+                      <v-list-item-subtitle>{{
+                        kb.kb_name
+                      }}</v-list-item-subtitle>
                     </v-list-item>
 
                     <v-list-item v-if="kb.description">
                       <template #prepend>
                         <v-icon>mdi-text</v-icon>
                       </template>
-                      <v-list-item-title>{{ t('overview.description') }}</v-list-item-title>
-                      <v-list-item-subtitle>{{ kb.description }}</v-list-item-subtitle>
+                      <v-list-item-title>{{
+                        t("overview.description")
+                      }}</v-list-item-title>
+                      <v-list-item-subtitle>{{
+                        kb.description
+                      }}</v-list-item-subtitle>
                     </v-list-item>
 
                     <v-list-item>
                       <template #prepend>
                         <v-icon>mdi-emoticon</v-icon>
                       </template>
-                      <v-list-item-title>{{ t('overview.emoji') }}</v-list-item-title>
-                      <v-list-item-subtitle>{{ kb.emoji || '📚' }}</v-list-item-subtitle>
+                      <v-list-item-title>{{
+                        t("overview.emoji")
+                      }}</v-list-item-title>
+                      <v-list-item-subtitle>{{
+                        kb.emoji || "📚"
+                      }}</v-list-item-subtitle>
                     </v-list-item>
 
                     <v-list-item>
                       <template #prepend>
                         <v-icon>mdi-calendar-plus</v-icon>
                       </template>
-                      <v-list-item-title>{{ t('overview.createdAt') }}</v-list-item-title>
-                      <v-list-item-subtitle>{{ formatDate(kb.created_at) }}</v-list-item-subtitle>
+                      <v-list-item-title>{{
+                        t("overview.createdAt")
+                      }}</v-list-item-title>
+                      <v-list-item-subtitle>{{
+                        formatDate(kb.created_at)
+                      }}</v-list-item-subtitle>
                     </v-list-item>
 
                     <v-list-item>
                       <template #prepend>
                         <v-icon>mdi-calendar-edit</v-icon>
                       </template>
-                      <v-list-item-title>{{ t('overview.updatedAt') }}</v-list-item-title>
-                      <v-list-item-subtitle>{{ formatDate(kb.updated_at) }}</v-list-item-subtitle>
+                      <v-list-item-title>{{
+                        t("overview.updatedAt")
+                      }}</v-list-item-title>
+                      <v-list-item-subtitle>{{
+                        formatDate(kb.updated_at)
+                      }}</v-list-item-subtitle>
+                    </v-list-item>
+
+                    <v-list-item>
+                      <template #prepend>
+                        <v-icon>mdi-vector-point</v-icon>
+                      </template>
+                      <v-list-item-title>{{
+                        t("overview.embeddingModel")
+                      }}</v-list-item-title>
+                      <v-list-item-subtitle>{{
+                        kb.embedding_provider_id || t("overview.notSet")
+                      }}</v-list-item-subtitle>
+                    </v-list-item>
+
+                    <v-list-item>
+                      <template #prepend>
+                        <v-icon>mdi-sort-ascending</v-icon>
+                      </template>
+                      <v-list-item-title>{{
+                        t("overview.rerankModel")
+                      }}</v-list-item-title>
+                      <v-list-item-subtitle>{{
+                        kb.rerank_provider_id || t("overview.notSet")
+                      }}</v-list-item-subtitle>
                     </v-list-item>
                   </v-list>
                 </v-card-text>
               </v-card>
             </v-col>
 
-            <v-col cols="12" md="6">
-              <v-card variant="outlined" class="mb-4">
-                <v-card-title>{{ t('overview.stats') }}</v-card-title>
+            <v-col cols="12" lg="8">
+              <v-card
+                variant="outlined"
+                class="overview-card overview-card--fill"
+              >
+                <v-card-title>{{ t("overview.stats") }}</v-card-title>
                 <v-card-text>
-                  <v-row>
-                    <v-col cols="6">
+                  <v-row dense class="stats-grid">
+                    <v-col cols="12" sm="6" md="4">
+                      <div class="stat-box">
+                        <v-icon size="36" color="primary"
+                          >mdi-file-document</v-icon
+                        >
+                        <div class="stat-value">{{ documentCount }}</div>
+                        <div class="stat-label">
+                          {{ t("overview.docCount") }}
+                        </div>
+                      </div>
+                    </v-col>
+                    <v-col cols="12" sm="6" md="4">
                       <div class="stat-box">
-                        <v-icon size="48" color="primary">mdi-file-document</v-icon>
-                        <div class="stat-value">{{ kb.doc_count || 0 }}</div>
-                        <div class="stat-label">{{ t('overview.docCount') }}</div>
+                        <v-icon size="36" color="secondary"
+                          >mdi-text-box</v-icon
+                        >
+                        <div class="stat-value">{{ indexedChunkCount }}</div>
+                        <div class="stat-label">
+                          {{ t("overview.chunkCount") }}
+                        </div>
                       </div>
                     </v-col>
-                    <v-col cols="6">
+                    <v-col cols="12" sm="6" md="4">
                       <div class="stat-box">
-                        <v-icon size="48" color="secondary">mdi-text-box</v-icon>
-                        <div class="stat-value">{{ kb.chunk_count || 0 }}</div>
-                        <div class="stat-label">{{ t('overview.chunkCount') }}</div>
+                        <v-icon size="36" color="success"
+                          >mdi-check-circle-outline</v-icon
+                        >
+                        <div class="stat-value">{{ readyDocumentCount }}</div>
+                        <div class="stat-label">
+                          {{ t("overview.readyDocCount") }}
+                        </div>
+                      </div>
+                    </v-col>
+                    <v-col cols="12" sm="6" md="4">
+                      <div class="stat-box">
+                        <v-icon size="36" color="error"
+                          >mdi-alert-circle-outline</v-icon
+                        >
+                        <div class="stat-value">{{ failedDocumentCount }}</div>
+                        <div class="stat-label">
+                          {{ t("overview.failedDocCount") }}
+                        </div>
+                      </div>
+                    </v-col>
+                    <v-col cols="12" sm="6" md="4">
+                      <div class="stat-box">
+                        <v-icon size="36" color="info">mdi-folder</v-icon>
+                        <div class="stat-value">{{ sourceFileCount }}</div>
+                        <div class="stat-label">
+                          {{ t("overview.sourceFiles") }}
+                        </div>
+                      </div>
+                    </v-col>
+                    <v-col cols="12" sm="6" md="4">
+                      <div class="stat-box">
+                        <v-icon size="36" color="warning">mdi-database</v-icon>
+                        <div class="stat-value">
+                          {{ formatFileSize(storageBytes) }}
+                        </div>
+                        <div class="stat-label">
+                          {{ t("overview.storageUsed") }}
+                        </div>
                       </div>
                     </v-col>
                   </v-row>
                 </v-card-text>
               </v-card>
+            </v-col>
 
-              <v-card variant="outlined">
-                <v-card-title>{{ t('overview.embeddingModel') }}</v-card-title>
+            <v-col cols="12" lg="7">
+              <v-card variant="outlined" class="overview-card">
+                <v-card-title
+                  class="d-flex align-center justify-space-between flex-wrap ga-2"
+                >
+                  <span>{{ t("consistency.title") }}</span>
+                  <div class="d-flex align-center flex-wrap ga-2">
+                    <v-btn
+                      v-if="canRepairConsistency"
+                      color="warning"
+                      variant="tonal"
+                      size="small"
+                      prepend-icon="mdi-wrench"
+                      :loading="consistencyRepairing"
+                      :disabled="
+                        consistencyLoading ||
+                        kbRebuilding
+                      "
+                      @click="repairConsistency"
+                    >
+                      {{ t("consistency.repair") }}
+                    </v-btn>
+                    <v-btn
+                      v-if="supportsKbRebuild"
+                      color="primary"
+                      variant="tonal"
+                      size="small"
+                      prepend-icon="mdi-database-sync"
+                      :loading="kbRebuilding"
+                      :disabled="
+                        consistencyLoading ||
+                        consistencyRepairing
+                      "
+                      @click="startKbRebuild"
+                    >
+                      {{ t("maintenance.rebuild") }}
+                    </v-btn>
+                    <v-btn
+                      v-if="supportsConsistencyCheck"
+                      color="primary"
+                      variant="tonal"
+                      size="small"
+                      prepend-icon="mdi-refresh"
+                      :loading="consistencyLoading"
+                      :disabled="consistencyRepairing"
+                      @click="runConsistencyCheck"
+                    >
+                      {{ t("consistency.run") }}
+                    </v-btn>
+                  </div>
+                </v-card-title>
                 <v-card-text>
-                  <v-list density="comfortable">
-                    <v-list-item>
-                      <template #prepend>
-                        <v-icon>mdi-vector-point</v-icon>
-                      </template>
-                      <v-list-item-title>{{ t('overview.embeddingModel') }}</v-list-item-title>
-                      <v-list-item-subtitle>{{ kb.embedding_provider_id || t('overview.notSet') }}</v-list-item-subtitle>
-                    </v-list-item>
+                  <v-alert
+                    v-if="kbRebuilding"
+                    type="info"
+                    variant="tonal"
+                    density="compact"
+                    class="mb-4"
+                  >
+                    <div class="d-flex align-center justify-space-between ga-4">
+                      <span>{{
+                        getMaintenanceStageText(kbRebuildProgress.stage)
+                      }}</span>
+                      <span class="text-caption">
+                        {{ kbRebuildProgress.current }} /
+                        {{ kbRebuildProgress.total }}
+                      </span>
+                    </div>
+                    <v-progress-linear
+                      class="mt-2"
+                      color="primary"
+                      height="4"
+                      rounded
+                      striped
+                      :model-value="getProgressPercentage(kbRebuildProgress)"
+                    />
+                  </v-alert>
 
-                    <v-list-item>
-                      <template #prepend>
-                        <v-icon>mdi-sort-ascending</v-icon>
-                      </template>
-                      <v-list-item-title>{{ t('overview.rerankModel') }}</v-list-item-title>
-                      <v-list-item-subtitle>{{ kb.rerank_provider_id || t('overview.notSet') }}</v-list-item-subtitle>
-                    </v-list-item>
-                  </v-list>
+                  <v-alert
+                    v-if="consistencyReport"
+                    :type="
+                      consistencyReport.summary.healthy ? 'success' : 'warning'
+                    "
+                    variant="tonal"
+                    density="compact"
+                    class="mb-4"
+                  >
+                    <div
+                      class="d-flex align-center justify-space-between flex-wrap ga-2"
+                    >
+                      <span>
+                        {{
+                          consistencyReport.summary.healthy
+                            ? t("consistency.healthy")
+                            : t("consistency.unhealthy", {
+                                count: consistencyIssueCount,
+                              })
+                        }}
+                      </span>
+                      <span class="text-caption">
+                        {{
+                          t("consistency.checkedAt", {
+                            time: formatDate(consistencyReport.checked_at),
+                          })
+                        }}
+                      </span>
+                    </div>
+                  </v-alert>
+
+                  <v-alert
+                    v-else
+                    :type="consistencyPrecheckType"
+                    variant="tonal"
+                    density="compact"
+                    class="mb-0"
+                  >
+                    <div class="d-flex flex-column ga-1">
+                      <span>{{ consistencyPrecheckMessage }}</span>
+                      <span class="text-caption text-medium-emphasis">
+                        {{ t("consistency.notRunHint") }}
+                      </span>
+                    </div>
+                  </v-alert>
+
+                  <v-row v-if="consistencyReport" dense class="mb-2">
+                    <v-col cols="6" sm="3">
+                      <div class="consistency-metric">
+                        <div class="consistency-value">
+                          {{ consistencyReport.summary.sqlite_document_count }}
+                        </div>
+                        <div class="consistency-label">
+                          {{ t("consistency.sqliteDocuments") }}
+                        </div>
+                      </div>
+                    </v-col>
+                    <v-col cols="6" sm="3">
+                      <div class="consistency-metric">
+                        <div class="consistency-value">
+                          {{ consistencyReport.summary.indexed_chunk_count }}
+                        </div>
+                        <div class="consistency-label">
+                          {{ t("consistency.indexedChunks") }}
+                        </div>
+                      </div>
+                    </v-col>
+                    <v-col cols="6" sm="3">
+                      <div class="consistency-metric">
+                        <div class="consistency-value">
+                          {{ consistencyReport.summary.document_chunk_count }}
+                        </div>
+                        <div class="consistency-label">
+                          {{ t("consistency.documentChunks") }}
+                        </div>
+                      </div>
+                    </v-col>
+                    <v-col cols="6" sm="3">
+                      <div class="consistency-metric">
+                        <div class="consistency-value">
+                          {{ consistencyReport.summary.source_file_count }}
+                        </div>
+                        <div class="consistency-label">
+                          {{ t("consistency.sourceFiles") }}
+                        </div>
+                      </div>
+                    </v-col>
+                  </v-row>
+
+                  <v-expansion-panels
+                    v-if="consistencyReport && consistencyIssueCount > 0"
+                    variant="accordion"
+                  >
+                    <v-expansion-panel
+                      v-for="issueType in visibleConsistencyIssueTypes"
+                      :key="issueType.key"
+                    >
+                      <v-expansion-panel-title>
+                        <div class="d-flex align-center ga-2">
+                          <v-icon color="warning" size="small">
+                            mdi-alert-circle-outline
+                          </v-icon>
+                          <span>{{ t(issueType.labelKey) }}</span>
+                          <v-chip
+                            size="x-small"
+                            color="warning"
+                            variant="tonal"
+                          >
+                            {{ consistencyReport.summary[issueType.key] || 0 }}
+                          </v-chip>
+                        </div>
+                      </v-expansion-panel-title>
+                      <v-expansion-panel-text>
+                        <v-list density="compact">
+                          <v-list-item
+                            v-for="(issue, index) in consistencyReport.issues[
+                              issueType.key
+                            ]"
+                            :key="`${issueType.key}-${index}-${
+                              issue.doc_id || issue.chunk_id || issue.storage_id
+                            }`"
+                          >
+                            <template #prepend>
+                              <v-icon size="small" color="warning">
+                                mdi-alert-circle-outline
+                              </v-icon>
+                            </template>
+                            <v-list-item-title>
+                              {{ formatConsistencyIssueTitle(issue) }}
+                            </v-list-item-title>
+                            <v-list-item-subtitle>
+                              {{ formatConsistencyIssueDetail(issue) }}
+                            </v-list-item-subtitle>
+                          </v-list-item>
+                        </v-list>
+                      </v-expansion-panel-text>
+                    </v-expansion-panel>
+                  </v-expansion-panels>
                 </v-card-text>
               </v-card>
             </v-col>
+
+            <v-col cols="12" lg="5">
+              <div class="overview-side-stack">
+                <v-card variant="outlined" class="overview-card">
+                  <v-card-title
+                    class="d-flex align-center justify-space-between flex-wrap ga-2"
+                  >
+                    <span>{{ t("tasks.title") }}</span>
+                    <v-btn
+                      icon="mdi-refresh"
+                      variant="text"
+                      size="small"
+                      :loading="recentTasksLoading"
+                      :title="t('tasks.refresh')"
+                      @click="loadRecentTasks"
+                    />
+                  </v-card-title>
+                  <v-card-text>
+                    <v-skeleton-loader
+                      v-if="recentTasksLoading && recentTasks.length === 0"
+                      type="list-item-two-line@3"
+                    />
+                    <v-alert
+                      v-else-if="recentTasksLoadError"
+                      type="error"
+                      variant="tonal"
+                      density="compact"
+                    >
+                      {{ recentTasksLoadError }}
+                    </v-alert>
+                    <v-alert
+                      v-else-if="recentTasks.length === 0"
+                      type="info"
+                      variant="tonal"
+                      density="compact"
+                    >
+                      {{ t("tasks.empty") }}
+                    </v-alert>
+                    <template v-else>
+                      <v-list density="compact" class="task-list task-list--timeline">
+                      <v-list-item
+                        v-for="task in recentTasks"
+                        :key="task.task_id"
+                        class="px-0"
+                      >
+                        <template #prepend>
+                          <v-icon
+                            :color="getTaskStatusColor(task.status)"
+                            size="small"
+                          >
+                            {{ getTaskTypeIcon(task.task_type) }}
+                          </v-icon>
+                        </template>
+                        <v-list-item-title class="d-flex align-center ga-2">
+                          <span>{{ getTaskTypeText(task.task_type) }}</span>
+                          <v-chip
+                            size="x-small"
+                            variant="tonal"
+                            :color="getTaskStatusColor(task.status)"
+                          >
+                            {{ getTaskStatusText(task.status) }}
+                          </v-chip>
+                        </v-list-item-title>
+                        <v-list-item-subtitle>
+                          {{ formatTaskSubtitle(task) }}
+                          <span
+                            v-if="formatTaskDetail(task)"
+                            class="task-detail-line"
+                          >
+                            {{ formatTaskDetail(task) }}
+                          </span>
+                        </v-list-item-subtitle>
+                        <template #append>
+                          <span
+                            v-if="
+                              task.status === 'pending' ||
+                              task.status === 'processing'
+                            "
+                            class="text-caption text-medium-emphasis"
+                          >
+                            {{ formatTaskProgress(task) }}
+                          </span>
+                        </template>
+                      </v-list-item>
+                      </v-list>
+                    </template>
+
+                  </v-card-text>
+                </v-card>
+              </div>
+            </v-col>
           </v-row>
         </v-window-item>
 
@@ -138,7 +537,7 @@
 
         <!-- 知识库检索 -->
         <v-window-item value="retrieval">
-          <RetrievalTab :kb-id="kbId" :kb-name="kb.kb_name"/>
+          <RetrievalTab :kb-id="kbId" :kb-name="kb.kb_name" />
         </v-window-item>
 
         <!-- 设置 -->
@@ -152,86 +551,657 @@
     <v-snackbar v-model="snackbar.show" :color="snackbar.color">
       {{ snackbar.text }}
     </v-snackbar>
+
   </div>
 </template>
 
 <script setup lang="ts">
-import { ref, onMounted, watch } from 'vue'
-import { useRoute } from 'vue-router'
-import axios from 'axios'
-import { useModuleI18n } from '@/i18n/composables'
-import DocumentsTab from './components/DocumentsTab.vue'
-import RetrievalTab from './components/RetrievalTab.vue'
-import SettingsTab from './components/SettingsTab.vue'
+import { computed, ref, onMounted, onUnmounted, watch } from "vue";
+import { useRoute, useRouter } from "vue-router";
+import axios from "axios";
+import { useI18n, useModuleI18n } from "@/i18n/composables";
+import DocumentsTab from "./components/DocumentsTab.vue";
+import RetrievalTab from "./components/RetrievalTab.vue";
+import SettingsTab from "./components/SettingsTab.vue";
+import { useKnowledgeBaseCapabilities } from "./capabilities";
+import {
+  getRepairableConsistencyTypes,
+  hasRepairableConsistencyIssues,
+} from "./knowledgeBaseUi.mjs";
+import { isKnowledgeBaseFeatureEnabled } from "./knowledgeBaseUi.mjs";
+import {
+  getKnowledgeBaseTaskErrorText,
+  getKnowledgeBaseTaskProgress,
+  getKnowledgeBaseTaskStatusColor,
+  getKnowledgeBaseTaskTypeIcon,
+} from "./knowledgeBaseUi.mjs";
 
-const { tm: t } = useModuleI18n('features/knowledge-base/detail')
-const route = useRoute()
+const { tm: t } = useModuleI18n("features/knowledge-base/detail");
+const { locale } = useI18n();
+const route = useRoute();
+const router = useRouter();
+const { capabilities, loadCapabilities } = useKnowledgeBaseCapabilities();
 
 const emit = defineEmits<{
-  (event: 'title-change', title: string): void
-}>()
+  (event: "title-change", title: string): void;
+}>();
+
+const kbId = ref(route.params.kbId as string);
+const loading = ref(true);
+const tabValues = ["overview", "documents", "retrieval", "settings"];
+const getTabFromRoute = () => {
+  const tab = route.query.tab;
+  return typeof tab === "string" && tabValues.includes(tab) ? tab : "overview";
+};
+const activeTab = ref(getTabFromRoute());
+const kb = ref<any>({});
+const loadError = ref("");
+
+type ConsistencyIssueKey =
+  | "missing_vectors"
+  | "orphan_vectors"
+  | "missing_source_files"
+  | "chunk_count_mismatches"
+  | "invalid_vector_metadata"
+  | "unsafe_source_paths";
 
-const kbId = ref(route.params.kbId as string)
-const loading = ref(true)
-const activeTab = ref('overview')
-const kb = ref<any>({})
+interface ConsistencyIssue {
+  doc_id?: string;
+  doc_name?: string;
+  chunk_id?: string;
+  storage_id?: number | string;
+  status?: string;
+  source_type?: string;
+  file_path?: string;
+  expected_chunk_count?: number;
+  actual_chunk_count?: number;
+  metadata_error?: string;
+  reason?: string;
+}
+
+interface ConsistencySummary {
+  sqlite_document_count: number;
+  ready_document_count: number;
+  failed_document_count: number;
+  document_chunk_count: number;
+  indexed_chunk_count: number;
+  source_file_count: number;
+  status_counts: Record<string, number>;
+  missing_vectors: number;
+  orphan_vectors: number;
+  missing_source_files: number;
+  chunk_count_mismatches: number;
+  invalid_vector_metadata: number;
+  unsafe_source_paths: number;
+  healthy: boolean;
+}
 
+interface ConsistencyReport {
+  kb_id: string;
+  kb_name: string;
+  checked_at: string;
+  summary: ConsistencySummary;
+  issues: Record<ConsistencyIssueKey, ConsistencyIssue[]>;
+}
+
+interface ConsistencyRepairReport {
+  summary?: {
+    repaired_count?: number;
+    skipped_count?: number;
+    failed_count?: number;
+    healthy_after_repair?: boolean;
+  };
+  post_check?: ConsistencyReport;
+}
+
+interface KnowledgeBaseTask {
+  task_id: string;
+  kb_id: string;
+  task_type: string;
+  status: string;
+  progress_stage?: string | null;
+  progress_current?: number;
+  progress_total?: number;
+  progress?: Record<string, any> | null;
+  result?: Record<string, any> | null;
+  error?: any;
+  created_at?: string;
+  updated_at?: string;
+}
+
+const documentCount = computed(
+  () => kb.value.document_count ?? kb.value.doc_count ?? 0,
+);
+const readyDocumentCount = computed(
+  () =>
+    kb.value.ready_document_count ??
+    kb.value.status_counts?.ready ??
+    documentCount.value,
+);
+const failedDocumentCount = computed(
+  () => kb.value.failed_document_count ?? kb.value.status_counts?.failed ?? 0,
+);
+const indexedChunkCount = computed(
+  () => kb.value.indexed_chunk_count ?? kb.value.chunk_count ?? 0,
+);
+const documentChunkCount = computed(
+  () => kb.value.document_chunk_count ?? indexedChunkCount.value,
+);
+const sourceFileCount = computed(() => kb.value.source_file_count ?? 0);
+const storageBytes = computed(() => kb.value.storage_bytes ?? 0);
+const supportsConsistencyCheck = computed(() =>
+  isKnowledgeBaseFeatureEnabled(capabilities.value, "consistency_check"),
+);
+const supportsConsistencyRepair = computed(() =>
+  isKnowledgeBaseFeatureEnabled(capabilities.value, "consistency_repair"),
+);
+const supportsKbRebuild = computed(() =>
+  isKnowledgeBaseFeatureEnabled(capabilities.value, "kb_rebuild"),
+);
+const consistencyLoading = ref(false);
+const consistencyRepairing = ref(false);
+const consistencyReport = ref<ConsistencyReport | null>(null);
+const kbRebuilding = ref(false);
+const kbRebuildTaskId = ref("");
+const recentTasks = ref<KnowledgeBaseTask[]>([]);
+const recentTasksLoading = ref(false);
+const recentTasksLoadError = ref("");
+const kbRebuildProgress = ref({
+  stage: "waiting",
+  current: 0,
+  total: 100,
+});
+let kbRebuildPollingInterval: number | null = null;
+const consistencyIssueTypes: {
+  key: ConsistencyIssueKey;
+  labelKey: string;
+}[] = [
+  { key: "missing_vectors", labelKey: "consistency.issues.missingVectors" },
+  { key: "orphan_vectors", labelKey: "consistency.issues.orphanVectors" },
+  {
+    key: "missing_source_files",
+    labelKey: "consistency.issues.missingSourceFiles",
+  },
+  {
+    key: "chunk_count_mismatches",
+    labelKey: "consistency.issues.chunkCountMismatches",
+  },
+  {
+    key: "invalid_vector_metadata",
+    labelKey: "consistency.issues.invalidVectorMetadata",
+  },
+  {
+    key: "unsafe_source_paths",
+    labelKey: "consistency.issues.unsafeSourcePaths",
+  },
+];
+const consistencyIssueCount = computed(() => {
+  if (!consistencyReport.value) return 0;
+  return consistencyIssueTypes.reduce(
+    (total, issueType) =>
+      total + (consistencyReport.value?.summary[issueType.key] ?? 0),
+    0,
+  );
+});
+const visibleConsistencyIssueTypes = computed(() => {
+  if (!consistencyReport.value) return [];
+  return consistencyIssueTypes.filter(
+    (issueType) => (consistencyReport.value?.summary[issueType.key] ?? 0) > 0,
+  );
+});
+const hasChunkCountDrift = computed(
+  () => documentChunkCount.value !== indexedChunkCount.value,
+);
+const consistencyPrecheckType = computed(() =>
+  failedDocumentCount.value > 0 || hasChunkCountDrift.value ? "warning" : "info",
+);
+const consistencyPrecheckMessage = computed(() => {
+  if (hasChunkCountDrift.value) {
+    return t("consistency.notRunChunkMismatch", {
+      metadata: documentChunkCount.value,
+      indexed: indexedChunkCount.value,
+    });
+  }
+  if (failedDocumentCount.value > 0) {
+    return t("consistency.notRunFailedDocs", {
+      count: failedDocumentCount.value,
+    });
+  }
+  return t("consistency.notRun");
+});
+const repairableConsistencyTypes = computed(() =>
+  getRepairableConsistencyTypes(consistencyReport.value),
+);
+const canRepairConsistency = computed(
+  () =>
+    supportsConsistencyRepair.value &&
+    hasRepairableConsistencyIssues(consistencyReport.value),
+);
 const snackbar = ref({
   show: false,
-  text: '',
-  color: 'success'
-})
-
-const showSnackbar = (text: string, color: string = 'success') => {
-  snackbar.value.text = text
-  snackbar.value.color = color
-  snackbar.value.show = true
-}
+  text: "",
+  color: "success",
+});
+
+const showSnackbar = (text: string, color: string = "success") => {
+  snackbar.value.text = text;
+  snackbar.value.color = color;
+  snackbar.value.show = true;
+};
+
+const getProgressPercentage = (progress: {
+  current: number;
+  total: number;
+}) => {
+  if (!progress.total) return 0;
+  return Math.min((progress.current / progress.total) * 100, 100);
+};
+
+const getMaintenanceStageText = (stage?: string) => {
+  const stageMap: Record<string, string> = {
+    waiting: t("maintenance.stages.waiting"),
+    rebuilding: t("maintenance.stages.rebuilding"),
+    parsing: t("maintenance.stages.parsing"),
+    chunking: t("maintenance.stages.chunking"),
+    embedding: t("maintenance.stages.embedding"),
+    completed: t("maintenance.stages.completed"),
+  };
+  return stageMap[stage || "waiting"] || stage || "";
+};
+
+const loadKBStats = async () => {
+  try {
+    const response = await axios.get("/api/kb/stats", {
+      params: { kb_id: kbId.value },
+    });
+    if (response.data.status === "ok") {
+      kb.value = {
+        ...kb.value,
+        ...response.data.data,
+      };
+    }
+  } catch (error) {
+    console.warn("Failed to load knowledge base stats:", error);
+  }
+};
+
+const loadRecentTasks = async () => {
+  recentTasksLoading.value = true;
+  recentTasksLoadError.value = "";
+  try {
+    const tasksResponse = await axios.get("/api/kb/task/list", {
+      params: {
+        kb_id: kbId.value,
+        page: 1,
+        page_size: 5,
+      },
+    });
+    if (tasksResponse.data.status !== "ok") {
+      recentTasksLoadError.value =
+        tasksResponse.data.message || t("tasks.loadFailed");
+      return;
+    }
+    recentTasks.value = tasksResponse.data.data.items || [];
+  } catch (error) {
+    console.error("Failed to load recent knowledge base tasks:", error);
+    recentTasksLoadError.value = t("tasks.loadFailed");
+  } finally {
+    recentTasksLoading.value = false;
+  }
+};
+
+const stopKbRebuildPolling = () => {
+  if (kbRebuildPollingInterval !== null) {
+    clearInterval(kbRebuildPollingInterval);
+    kbRebuildPollingInterval = null;
+  }
+};
+
+const finishKbRebuildTask = async () => {
+  stopKbRebuildPolling();
+  kbRebuilding.value = false;
+  kbRebuildTaskId.value = "";
+  await loadKB();
+};
+
+const pollKbRebuildProgress = (taskId: string) => {
+  stopKbRebuildPolling();
+  kbRebuildPollingInterval = window.setInterval(async () => {
+    try {
+      const response = await axios.get("/api/kb/document/upload/progress", {
+        params: { task_id: taskId },
+      });
+      if (response.data.status !== "ok") {
+        await finishKbRebuildTask();
+        return;
+      }
+
+      const data = response.data.data;
+      if (data.progress) {
+        kbRebuildProgress.value = {
+          stage: data.progress.stage || "waiting",
+          current: Number(data.progress.current ?? 0),
+          total: Number(data.progress.total ?? 100) || 100,
+        };
+      }
+
+      if (data.status === "completed" || data.status === "partial_failed") {
+        const result = data.result || {};
+        await finishKbRebuildTask();
+        const failedCount = result.failed_count || 0;
+        if (failedCount > 0) {
+          showSnackbar(
+            t("maintenance.rebuildPartialSuccess", {
+              success: result.success_count || 0,
+              failed: failedCount,
+            }),
+            "warning",
+          );
+        } else {
+          showSnackbar(t("maintenance.rebuildSuccess"), "success");
+        }
+      } else if (data.status === "failed") {
+        const reason = data.error || t("maintenance.unknownError");
+        await finishKbRebuildTask();
+        showSnackbar(
+          t("maintenance.rebuildFailedWithReason", { reason }),
+          "error",
+        );
+      }
+    } catch (error) {
+      console.error("Failed to poll knowledge base rebuild progress:", error);
+    }
+  }, 1000);
+};
+
+const startKbRebuild = async () => {
+  if (!supportsKbRebuild.value || kbRebuilding.value) return;
+  kbRebuilding.value = true;
+  kbRebuildProgress.value = {
+    stage: "waiting",
+    current: 0,
+    total: 100,
+  };
+  try {
+    const response = await axios.post("/api/kb/rebuild", {
+      kb_id: kbId.value,
+      background: true,
+    });
+    if (response.data.status === "ok") {
+      const taskId = response.data.data?.task_id;
+      if (taskId) {
+        kbRebuildTaskId.value = taskId;
+        consistencyReport.value = null;
+        showSnackbar(t("maintenance.rebuildStarted"), "info");
+        pollKbRebuildProgress(taskId);
+      } else {
+        await finishKbRebuildTask();
+        showSnackbar(t("maintenance.rebuildSuccess"), "success");
+      }
+    } else {
+      kbRebuilding.value = false;
+      showSnackbar(
+        response.data.message || t("maintenance.rebuildFailed"),
+        "error",
+      );
+    }
+  } catch (error) {
+    console.error("Knowledge base rebuild failed:", error);
+    kbRebuilding.value = false;
+    showSnackbar(t("maintenance.rebuildFailed"), "error");
+  }
+};
+
+const runConsistencyCheck = async () => {
+  if (!supportsConsistencyCheck.value || consistencyRepairing.value) return;
+  consistencyLoading.value = true;
+  try {
+    const response = await axios.get("/api/kb/consistency/check", {
+      params: { kb_id: kbId.value },
+    });
+    if (response.data.status === "ok") {
+      consistencyReport.value = response.data.data as ConsistencyReport;
+      showSnackbar(
+        consistencyReport.value.summary.healthy
+          ? t("consistency.checkSuccessHealthy")
+          : t("consistency.checkSuccessUnhealthy", {
+              count: consistencyIssueCount.value,
+            }),
+        consistencyReport.value.summary.healthy ? "success" : "warning",
+      );
+    } else {
+      showSnackbar(
+        response.data.message || t("consistency.checkFailed"),
+        "error",
+      );
+    }
+  } catch (error) {
+    console.error("Knowledge base consistency check failed:", error);
+    showSnackbar(t("consistency.checkFailed"), "error");
+  } finally {
+    consistencyLoading.value = false;
+  }
+};
+
+const repairConsistency = async () => {
+  if (!canRepairConsistency.value || consistencyRepairing.value) return;
+  consistencyRepairing.value = true;
+  try {
+    const response = await axios.post("/api/kb/consistency/repair", {
+      kb_id: kbId.value,
+      repair_types: repairableConsistencyTypes.value,
+    });
+    if (response.data.status === "ok") {
+      const repairReport = response.data.data as ConsistencyRepairReport;
+      await loadKB();
+      if (repairReport.post_check) {
+        consistencyReport.value = repairReport.post_check;
+      }
+      const failedCount = repairReport.summary?.failed_count ?? 0;
+      showSnackbar(
+        failedCount > 0
+          ? t("consistency.repairPartialSuccess", {
+              repaired: repairReport.summary?.repaired_count ?? 0,
+              skipped: repairReport.summary?.skipped_count ?? 0,
+              failed: failedCount,
+            })
+          : t("consistency.repairSuccess", {
+              repaired: repairReport.summary?.repaired_count ?? 0,
+              skipped: repairReport.summary?.skipped_count ?? 0,
+            }),
+        failedCount > 0 ? "warning" : "success",
+      );
+    } else {
+      showSnackbar(
+        response.data.message || t("consistency.repairFailed"),
+        "error",
+      );
+    }
+  } catch (error) {
+    console.error("Knowledge base consistency repair failed:", error);
+    showSnackbar(t("consistency.repairFailed"), "error");
+  } finally {
+    consistencyRepairing.value = false;
+  }
+};
 
 // 加载知识库详情
 const loadKB = async () => {
-  loading.value = true
+  loading.value = true;
+  loadError.value = "";
   try {
-    const response = await axios.get('/api/kb/get', {
-      params: { kb_id: kbId.value }
-    })
-    if (response.data.status === 'ok') {
-      kb.value = response.data.data
-      emit('title-change', kb.value.kb_name || '')
+    const response = await axios.get("/api/kb/get", {
+      params: { kb_id: kbId.value },
+    });
+    if (response.data.status === "ok") {
+      kb.value = response.data.data;
+      await loadKBStats();
+      await loadRecentTasks();
+      emit("title-change", kb.value.kb_name || "");
     } else {
-      showSnackbar(response.data.message || '加载失败', 'error')
+      loadError.value = response.data.message || t("messages.loadFailed");
+      showSnackbar(loadError.value, "error");
     }
   } catch (error) {
-    console.error('Failed to load knowledge base:', error)
-    showSnackbar('加载知识库详情失败', 'error')
+    console.error("Failed to load knowledge base:", error);
+    loadError.value = t("messages.loadFailed");
+    showSnackbar(loadError.value, "error");
   } finally {
-    loading.value = false
+    loading.value = false;
   }
-}
+};
 
 // 格式化日期
 const formatDate = (dateStr: string) => {
-  if (!dateStr) return '-'
-  const date = new Date(dateStr)
-  return date.toLocaleString('zh-CN', {
-    year: 'numeric',
-    month: '2-digit',
-    day: '2-digit',
-    hour: '2-digit',
-    minute: '2-digit'
-  })
-}
+  if (!dateStr) return "-";
+  const date = new Date(dateStr);
+  return date.toLocaleString(locale.value, {
+    year: "numeric",
+    month: "2-digit",
+    day: "2-digit",
+    hour: "2-digit",
+    minute: "2-digit",
+  });
+};
+
+const formatFileSize = (bytes?: number | null) => {
+  if (!bytes) return "-";
+  const units = ["B", "KB", "MB", "GB"];
+  let size = bytes;
+  let unitIndex = 0;
+  while (size >= 1024 && unitIndex < units.length - 1) {
+    size /= 1024;
+    unitIndex++;
+  }
+  return `${size.toFixed(2)} ${units[unitIndex]}`;
+};
+
+const getTaskStatusColor = (status: string) =>
+  getKnowledgeBaseTaskStatusColor(status);
+
+const getTaskTypeIcon = (taskType: string) =>
+  getKnowledgeBaseTaskTypeIcon(taskType);
+
+const getTaskTypeText = (taskType: string) =>
+  t(`tasks.types.${taskType}`) || taskType;
+
+const getTaskStatusText = (status: string) =>
+  t(`tasks.statuses.${status}`) || status;
+
+const toTaskCount = (value: unknown) => {
+  const numberValue = Number(value);
+  return Number.isFinite(numberValue) ? numberValue : 0;
+};
+
+const getTaskResultCounts = (task: KnowledgeBaseTask) => {
+  const result = task.result || {};
+  const success = toTaskCount(result.success_count);
+  const failed = toTaskCount(result.failed_count);
+  const total = toTaskCount(result.total) || success + failed;
+  return { success, failed, total };
+};
+
+const formatTaskProgress = (task: KnowledgeBaseTask) => {
+  const progress = getKnowledgeBaseTaskProgress(task);
+  return `${progress.current} / ${progress.total}`;
+};
+
+const formatTaskError = (task: KnowledgeBaseTask) =>
+  getKnowledgeBaseTaskErrorText(task.error, t("tasks.noErrorMessage"));
+
+const formatTaskSubtitle = (task: KnowledgeBaseTask) =>
+  formatDate(task.updated_at || task.created_at || "");
+
+const formatTaskDetail = (task: KnowledgeBaseTask) => {
+  if (task.status === "pending" || task.status === "processing") {
+    return t("tasks.progressDetail", {
+      progress: formatTaskProgress(task),
+    });
+  }
+  if (task.status === "failed") {
+    return formatTaskError(task);
+  }
+
+  const { success, failed, total } = getTaskResultCounts(task);
+  if (total > 0) {
+    return t("tasks.resultSummary", {
+      success,
+      failed,
+      total,
+    });
+  }
+  return "";
+};
+
+const formatConsistencyIssueTitle = (issue: ConsistencyIssue) => {
+  return (
+    issue.doc_name || issue.doc_id || issue.chunk_id || String(issue.storage_id)
+  );
+};
+
+const formatConsistencyIssueDetail = (issue: ConsistencyIssue) => {
+  const parts = [];
+  if (issue.expected_chunk_count !== undefined) {
+    parts.push(
+      t("consistency.expectedChunks", {
+        count: issue.expected_chunk_count,
+      }),
+    );
+  }
+  if (issue.actual_chunk_count !== undefined) {
+    parts.push(
+      t("consistency.actualChunks", {
+        count: issue.actual_chunk_count,
+      }),
+    );
+  }
+  if (issue.metadata_error) {
+    parts.push(issue.metadata_error);
+  }
+  if (issue.reason) {
+    parts.push(t(`consistency.reasons.${issue.reason}`));
+  }
+  if (issue.file_path) {
+    parts.push(issue.file_path);
+  }
+  return parts.join(" · ") || "-";
+};
 
 onMounted(() => {
-  loadKB()
-})
+  loadCapabilities();
+  loadKB();
+});
+
+onUnmounted(() => {
+  stopKbRebuildPolling();
+});
 
 watch(
   () => kb.value?.kb_name,
   (name) => {
-    emit('title-change', name || '')
+    emit("title-change", name || "");
   },
-)
+);
+
+watch(activeTab, (tab) => {
+  if (tab === route.query.tab || (tab === "overview" && !route.query.tab)) {
+    return;
+  }
+  router.replace({
+    query: {
+      ...route.query,
+      tab: tab === "overview" ? undefined : tab,
+    },
+  });
+});
+
+watch(
+  () => route.query.tab,
+  () => {
+    activeTab.value = getTabFromRoute();
+  },
+);
+
 </script>
 
 <style scoped>
@@ -251,13 +1221,42 @@ watch(
   min-height: 400px;
 }
 
+.overview-layout {
+  align-items: stretch;
+}
+
+.overview-layout > .v-col {
+  display: flex;
+}
+
+.overview-card {
+  width: 100%;
+}
+
+.overview-card--fill {
+  height: 100%;
+}
+
+.overview-side-stack {
+  display: grid;
+  gap: 16px;
+  width: 100%;
+}
+
+.stats-grid > .v-col {
+  display: flex;
+}
+
 .stat-box {
+  min-height: 118px;
+  width: 100%;
   display: flex;
   flex-direction: column;
   align-items: center;
-  padding: 24px;
+  justify-content: center;
+  padding: 18px 14px;
   text-align: center;
-  border-radius: 12px;
+  border-radius: 8px;
   background: rgba(var(--v-theme-surface-variant), 0.1);
   transition: all 0.3s ease;
 }
@@ -267,14 +1266,56 @@ watch(
 }
 
 .stat-value {
-  font-size: 2rem;
+  font-size: 1.75rem;
   font-weight: 600;
+  line-height: 1.2;
   margin-top: 8px;
+  max-width: 100%;
+  overflow-wrap: anywhere;
 }
 
 .stat-label {
+  color: rgba(var(--v-theme-on-surface), 0.72);
   font-size: 0.875rem;
+  line-height: 1.35;
   margin-top: 4px;
+  max-width: 100%;
+  overflow-wrap: anywhere;
+}
+
+.consistency-metric {
+  min-height: 72px;
+  padding: 12px;
+  border-radius: 8px;
+  background: rgba(var(--v-theme-surface-variant), 0.12);
+}
+
+.consistency-value {
+  font-size: 1.25rem;
+  font-weight: 600;
+  line-height: 1.4;
+}
+
+.consistency-label {
+  margin-top: 2px;
+  color: rgba(var(--v-theme-on-surface), 0.7);
+  font-size: 0.75rem;
+  line-height: 1.3;
+  overflow-wrap: anywhere;
+}
+
+.task-detail-line {
+  display: block;
+  margin-top: 2px;
+  color: rgba(var(--v-theme-on-surface), 0.68);
+  font-size: 0.75rem;
+  line-height: 1.35;
+  overflow-wrap: anywhere;
+}
+
+.task-list--timeline :deep(.v-list-item) {
+  border-left: 2px solid rgba(var(--v-theme-outline), 0.16);
+  padding-left: 12px !important;
 }
 
 /* 响应式设计 */
@@ -282,5 +1323,14 @@ watch(
   .kb-title {
     font-size: 1.25rem;
   }
+
+  .stat-box {
+    min-height: 108px;
+    padding: 16px 10px;
+  }
+
+  .stat-value {
+    font-size: 1.45rem;
+  }
 }
 </style>
diff --git a/dashboard/src/views/knowledge-base/KBList.vue b/dashboard/src/views/knowledge-base/KBList.vue
index c8abb57cab..1462ff05f4 100644
--- a/dashboard/src/views/knowledge-base/KBList.vue
+++ b/dashboard/src/views/knowledge-base/KBList.vue
@@ -2,7 +2,7 @@
   <div class="kb-list-page">
     <div v-if="loading && kbList.length === 0" class="loading-container">
       <v-progress-circular indeterminate color="primary" size="64" />
-      <p class="mt-4 text-medium-emphasis">{{ t('list.loading') }}</p>
+      <p class="mt-4 text-medium-emphasis">{{ t("list.loading") }}</p>
     </div>
 
     <div v-else-if="kbList.length > 0" class="kb-list">
@@ -14,7 +14,7 @@
         @click="navigateToDetail(kb.kb_id)"
       >
         <template #title-prepend>
-          <span class="kb-list-emoji">{{ kb.emoji || '📚' }}</span>
+          <span class="kb-list-emoji">{{ kb.emoji || "📚" }}</span>
         </template>
 
         <template #title-extra>
@@ -24,35 +24,48 @@
             size="x-small"
             variant="tonal"
           >
-            {{ t('list.initError') }}
+            {{ t("list.initError") }}
           </v-chip>
         </template>
 
-        <div v-if="!kb.init_error" class="kb-description text-body-2 text-medium-emphasis">
-          {{ kb.description || '暂无描述' }}
+        <div
+          v-if="!kb.init_error"
+          class="kb-description text-body-2 text-medium-emphasis"
+        >
+          {{ kb.description || t("list.noDescription") }}
         </div>
 
         <div v-if="kb.init_error" class="kb-error-panel">
-            <div class="kb-error-title">
-              <v-icon size="16" color="error">mdi-close-circle</v-icon>
-              <span>{{ t('list.initError') }}</span>
-            </div>
-            <div class="kb-error-detail" :title="kb.init_error">{{ kb.init_error }}</div>
+          <div class="kb-error-title">
+            <v-icon size="16" color="error">mdi-close-circle</v-icon>
+            <span>{{ t("list.initError") }}</span>
+          </div>
+          <div class="kb-error-detail" :title="kb.init_error">
+            {{ kb.init_error }}
+          </div>
         </div>
 
         <div class="kb-stats" v-if="!kb.init_error">
-            <div class="stat-item">
-              <v-icon size="small">mdi-file-document</v-icon>
-              <span>{{ kb.doc_count || 0 }} {{ t('list.documents') }}</span>
-            </div>
-            <div class="stat-item">
-              <v-icon size="small">mdi-text-box</v-icon>
-              <span>{{ kb.chunk_count || 0 }} {{ t('list.chunks') }}</span>
-            </div>
+          <div class="stat-item">
+            <v-icon size="small">mdi-file-document</v-icon>
+            <span>
+              {{ getListStats(kb).documentCount }} {{ t("list.documents") }}
+            </span>
+          </div>
+          <div class="stat-item">
+            <v-icon size="small">mdi-text-box</v-icon>
+            <span>
+              {{ getListStats(kb).chunkCount }} {{ t("list.chunks") }}
+            </span>
+          </div>
         </div>
 
         <template #actions>
-          <v-tooltip v-if="!kb.init_error" :text="t('card.edit')" location="top">
+          <v-tooltip
+            v-if="!kb.init_error"
+            :text="t('card.edit')"
+            location="top"
+          >
             <template #activator="{ props }">
               <v-btn
                 v-bind="props"
@@ -84,10 +97,16 @@
     <!-- 空状态 -->
     <div v-else class="empty-state">
       <v-icon size="100" color="grey-lighten-2">mdi-book-open-variant</v-icon>
-      <h2 class="mt-4">{{ t('list.empty') }}</h2>
-      <v-btn class="mt-6" prepend-icon="mdi-plus" color="primary" variant="elevated" size="large"
-        @click="showCreateDialog = true">
-        {{ t('list.create') }}
+      <h2 class="mt-4">{{ t("list.empty") }}</h2>
+      <v-btn
+        class="mt-6"
+        prepend-icon="mdi-plus"
+        color="primary"
+        variant="elevated"
+        size="large"
+        @click="showCreateDialog = true"
+      >
+        {{ t("list.create") }}
       </v-btn>
     </div>
 
@@ -102,7 +121,7 @@
             variant="elevated"
             class="kb-fab"
             :loading="loading"
-            @click="loadKnowledgeBases()"
+            @click="loadKnowledgeBases(true)"
           />
         </template>
       </v-tooltip>
@@ -125,7 +144,9 @@
     <v-dialog v-model="showCreateDialog" max-width="600px" persistent>
       <v-card>
         <v-card-title class="d-flex align-center">
-          <span class="text-h5">{{ editingKB ? t('edit.title') : t('create.title') }}</span>
+          <span class="text-h5">{{
+            editingKB ? t("edit.title") : t("create.title")
+          }}</span>
           <v-spacer />
           <v-btn icon="mdi-close" variant="text" @click="closeCreateDialog" />
         </v-card-title>
@@ -138,40 +159,76 @@
             <div class="emoji-display" @click="showEmojiPicker = true">
               {{ formData.emoji }}
             </div>
-            <p class="text-caption text-medium-emphasis mt-2">{{ t('create.emojiLabel') }}</p>
+            <p class="text-caption text-medium-emphasis mt-2">
+              {{ t("create.emojiLabel") }}
+            </p>
           </div>
 
           <!-- 表单 -->
           <v-form ref="formRef" @submit.prevent="submitForm">
-            <v-text-field v-model="formData.kb_name" :label="t('create.nameLabel')"
-              :placeholder="t('create.namePlaceholder')" variant="outlined"
-              :rules="[v => !!v || t('create.nameRequired')]" required class="mb-4" hint="后续如修改知识库名称，需重新在配置文件更新。" persistent-hint />
-
-            <v-textarea v-model="formData.description" :label="t('create.descriptionLabel')"
-              :placeholder="t('create.descriptionPlaceholder')" variant="outlined" rows="3" class="mb-4" />
-
-            <v-select v-model="formData.embedding_provider_id" :items="embeddingProviders"
-              :item-title="item => item.embedding_model || item.id" :item-value="'id'"
-              :label="t('create.embeddingModelLabel')" variant="outlined" class="mb-4" :disabled="editingKB !== null" hint="嵌入模型选择后无法修改，如需更换请创建新的知识库。" persistent-hint>
+            <v-text-field
+              v-model="formData.kb_name"
+              :label="t('create.nameLabel')"
+              :placeholder="t('create.namePlaceholder')"
+              variant="outlined"
+              :rules="nameRules"
+              required
+              class="mb-4"
+              :hint="t('create.nameHint')"
+              persistent-hint
+            />
+
+            <v-textarea
+              v-model="formData.description"
+              :label="t('create.descriptionLabel')"
+              :placeholder="t('create.descriptionPlaceholder')"
+              variant="outlined"
+              rows="3"
+              class="mb-4"
+            />
+
+            <v-select
+              v-model="formData.embedding_provider_id"
+              :items="embeddingProviders"
+              :item-title="(item) => item.embedding_model || item.id"
+              :item-value="'id'"
+              :label="t('create.embeddingModelLabel')"
+              variant="outlined"
+              class="mb-4"
+              :disabled="editingKB !== null"
+              :hint="t('create.embeddingModelHint')"
+              :rules="embeddingRules"
+              persistent-hint
+              required
+            >
               <template #item="{ props, item }">
                 <v-list-item v-bind="props">
                   <template #subtitle>
-                    {{ t('create.providerInfo', {
-                      id: item.raw.id,
-                      dimensions: item.raw.embedding_dimensions || 'N/A'
-                    }) }}
+                    {{
+                      t("create.providerInfo", {
+                        id: item.raw.id,
+                        dimensions: item.raw.embedding_dimensions || "N/A",
+                      })
+                    }}
                   </template>
                 </v-list-item>
               </template>
             </v-select>
 
-            <v-select v-model="formData.rerank_provider_id" :items="rerankProviders"
-              :item-title="item => item.rerank_model || item.id" :item-value="'id'"
-              :label="t('create.rerankModelLabel')" variant="outlined" clearable class="mb-2">
+            <v-select
+              v-model="formData.rerank_provider_id"
+              :items="rerankProviders"
+              :item-title="(item) => item.rerank_model || item.id"
+              :item-value="'id'"
+              :label="t('create.rerankModelLabel')"
+              variant="outlined"
+              clearable
+              class="mb-2"
+            >
               <template #item="{ props, item }">
                 <v-list-item v-bind="props">
                   <template #subtitle>
-                    {{ t('create.rerankProviderInfo', { id: item.raw.id }) }}
+                    {{ t("create.rerankProviderInfo", { id: item.raw.id }) }}
                   </template>
                 </v-list-item>
               </template>
@@ -184,10 +241,16 @@
         <v-card-actions class="pa-4">
           <v-spacer />
           <v-btn variant="text" @click="closeCreateDialog">
-            {{ t('create.cancel') }}
+            {{ t("create.cancel") }}
           </v-btn>
-          <v-btn color="primary" variant="elevated" @click="submitForm" :loading="saving">
-            {{ editingKB ? t('edit.submit') : t('create.submit') }}
+          <v-btn
+            color="primary"
+            variant="elevated"
+            @click="submitForm"
+            :loading="saving"
+            :disabled="saving"
+          >
+            {{ editingKB ? t("edit.submit") : t("create.submit") }}
           </v-btn>
         </v-card-actions>
       </v-card>
@@ -196,13 +259,24 @@
     <!-- Emoji 选择器对话框 -->
     <v-dialog v-model="showEmojiPicker" max-width="500px">
       <v-card>
-        <v-card-title class="pa-4">{{ t('emoji.title') }}</v-card-title>
+        <v-card-title class="pa-4">{{ t("emoji.title") }}</v-card-title>
         <v-divider />
         <v-card-text class="pa-4">
-          <div v-for="category in emojiCategories" :key="category.key" class="mb-4">
-            <p class="text-subtitle-2 mb-2">{{ t(`emoji.categories.${category.key}`) }}</p>
+          <div
+            v-for="category in emojiCategories"
+            :key="category.key"
+            class="mb-4"
+          >
+            <p class="text-subtitle-2 mb-2">
+              {{ t(`emoji.categories.${category.key}`) }}
+            </p>
             <div class="emoji-grid">
-              <div v-for="emoji in category.emojis" :key="emoji" class="emoji-item" @click="selectEmoji(emoji)">
+              <div
+                v-for="emoji in category.emojis"
+                :key="emoji"
+                class="emoji-item"
+                @click="selectEmoji(emoji)"
+              >
                 {{ emoji }}
               </div>
             </div>
@@ -212,7 +286,7 @@
         <v-card-actions class="pa-4">
           <v-spacer />
           <v-btn variant="text" @click="showEmojiPicker = false">
-            {{ t('emoji.close') }}
+            {{ t("emoji.close") }}
           </v-btn>
         </v-card-actions>
       </v-card>
@@ -221,22 +295,31 @@
     <!-- 删除确认对话框 -->
     <v-dialog v-model="showDeleteDialog" max-width="450px" persistent>
       <v-card>
-        <v-card-title class="pa-4 text-h6">{{ t('delete.title') }}</v-card-title>
+        <v-card-title class="pa-4 text-h6">{{
+          t("delete.title")
+        }}</v-card-title>
         <v-divider />
         <v-card-text class="pa-6">
-          <p>{{ t('delete.confirmText', { name: deleteTarget?.kb_name || '' }) }}</p>
+          <p>
+            {{ t("delete.confirmText", { name: deleteTarget?.kb_name || "" }) }}
+          </p>
           <v-alert type="error" variant="tonal" density="compact" class="mt-4">
-            {{ t('delete.warning') }}
+            {{ t("delete.warning") }}
           </v-alert>
         </v-card-text>
         <v-divider />
         <v-card-actions class="pa-4">
           <v-spacer />
           <v-btn variant="text" @click="cancelDelete">
-            {{ t('delete.cancel') }}
+            {{ t("delete.cancel") }}
           </v-btn>
-          <v-btn color="error" variant="elevated" @click="deleteKB" :loading="deleting">
-            {{ t('delete.confirm') }}
+          <v-btn
+            color="error"
+            variant="elevated"
+            @click="deleteKB"
+            :loading="deleting"
+          >
+            {{ t("delete.confirm") }}
           </v-btn>
         </v-card-actions>
       </v-card>
@@ -247,255 +330,348 @@
       {{ snackbar.text }}
     </v-snackbar>
 
-    <div class="position-absolute" style="bottom: 0px; right: 16px;">
-      <small @click="router.push('/alkaid/knowledge-base')"><a style="text-decoration: underline; cursor: pointer;">切换到旧版知识库</a></small>
+    <div class="position-absolute" style="bottom: 0px; right: 16px">
+      <small @click="router.push('/alkaid/knowledge-base')"
+        ><a style="text-decoration: underline; cursor: pointer">{{
+          t("list.switchToLegacy")
+        }}</a></small
+      >
     </div>
-
   </div>
 </template>
 
 <script setup lang="ts">
-import { ref, onMounted } from 'vue'
-import { useRouter } from 'vue-router'
-import axios from 'axios'
-import { useModuleI18n } from '@/i18n/composables'
-import OutlinedActionListItem from '@/components/shared/OutlinedActionListItem.vue'
-
-const { tm: t } = useModuleI18n('features/knowledge-base/index')
-const router = useRouter()
+import { ref, onMounted } from "vue";
+import { useRouter } from "vue-router";
+import axios from "axios";
+import { useModuleI18n } from "@/i18n/composables";
+import OutlinedActionListItem from "@/components/shared/OutlinedActionListItem.vue";
+import { useKnowledgeBaseCapabilities } from "./capabilities";
+import { loadKnowledgeBaseListPages } from "./knowledgeBaseUi.mjs";
+import { getKnowledgeBaseListStats } from "./knowledgeBaseUi.mjs";
+import { getKnowledgeBasePaginationConfig } from "./knowledgeBaseUi.mjs";
+
+const { tm: t } = useModuleI18n("features/knowledge-base/index");
+const router = useRouter();
+const { loadCapabilities } = useKnowledgeBaseCapabilities();
 
 // 状态
-const loading = ref(false)
-const saving = ref(false)
-const deleting = ref(false)
-const kbList = ref<any[]>([])
-const embeddingProviders = ref<any[]>([])
-const rerankProviders = ref<any[]>([])
-const originalEmbeddingProvider = ref<string | null>(null)
-const showEmbeddingWarning = ref(false)
-const embeddingChangeDialog = ref(false)
-const pendingEmbeddingProvider = ref<string | null>(null)
+const loading = ref(false);
+const saving = ref(false);
+const deleting = ref(false);
+const kbList = ref<any[]>([]);
+const embeddingProviders = ref<any[]>([]);
+const rerankProviders = ref<any[]>([]);
 
 // 对话框
-const showCreateDialog = ref(false)
-const showEmojiPicker = ref(false)
-const showDeleteDialog = ref(false)
+const showCreateDialog = ref(false);
+const showEmojiPicker = ref(false);
+const showDeleteDialog = ref(false);
 
 // Snackbar 通知
 const snackbar = ref({
   show: false,
-  text: '',
-  color: 'success'
-})
+  text: "",
+  color: "success",
+});
 
 // 表单
-const formRef = ref()
-const editingKB = ref<any>(null)
-const deleteTarget = ref<any>(null)
+const formRef = ref();
+const editingKB = ref<any>(null);
+const deleteTarget = ref<any>(null);
 const formData = ref({
-  kb_name: '',
-  description: '',
-  emoji: '📚',
+  kb_name: "",
+  description: "",
+  emoji: "📚",
   embedding_provider_id: null,
-  rerank_provider_id: null
-})
+  rerank_provider_id: null,
+});
+
+const nameRules = [(v: string) => !!v?.trim() || t("create.nameRequired")];
+const embeddingRules = [
+  (v: string | null) => !!v || t("create.embeddingRequired"),
+];
+
+const getListStats = (kb: any) => getKnowledgeBaseListStats(kb);
 
 // Emoji 分类
 const emojiCategories = [
   {
-    key: 'books',
-    emojis: ['📚', '📖', '📕', '📗', '📘', '📙', '📓', '📔', '📒', '📑', '🗂️', '📂', '📁', '🗃️', '🗄️']
+    key: "books",
+    emojis: [
+      "📚",
+      "📖",
+      "📕",
+      "📗",
+      "📘",
+      "📙",
+      "📓",
+      "📔",
+      "📒",
+      "📑",
+      "🗂️",
+      "📂",
+      "📁",
+      "🗃️",
+      "🗄️",
+    ],
   },
   {
-    key: 'emotions',
-    emojis: ['😀', '😃', '😄', '😁', '😆', '😅', '🤣', '😂', '🙂', '🙃', '😉', '😊', '😇', '🥰', '😍']
+    key: "emotions",
+    emojis: [
+      "😀",
+      "😃",
+      "😄",
+      "😁",
+      "😆",
+      "😅",
+      "🤣",
+      "😂",
+      "🙂",
+      "🙃",
+      "😉",
+      "😊",
+      "😇",
+      "🥰",
+      "😍",
+    ],
   },
   {
-    key: 'objects',
-    emojis: ['💡', '🔬', '🔭', '🗿', '🏆', '🎯', '🎓', '🔑', '🔒', '🔓', '🔔', '🔕', '🔨', '🛠️', '⚙️']
+    key: "objects",
+    emojis: [
+      "💡",
+      "🔬",
+      "🔭",
+      "🗿",
+      "🏆",
+      "🎯",
+      "🎓",
+      "🔑",
+      "🔒",
+      "🔓",
+      "🔔",
+      "🔕",
+      "🔨",
+      "🛠️",
+      "⚙️",
+    ],
   },
   {
-    key: 'symbols',
-    emojis: ['❤️', '🧡', '💛', '💚', '💙', '💜', '🖤', '🤍', '🤎', '⭐', '🌟', '✨', '💫', '⚡', '🔥']
-  }
-]
+    key: "symbols",
+    emojis: [
+      "❤️",
+      "🧡",
+      "💛",
+      "💚",
+      "💙",
+      "💜",
+      "🖤",
+      "🤍",
+      "🤎",
+      "⭐",
+      "🌟",
+      "✨",
+      "💫",
+      "⚡",
+      "🔥",
+    ],
+  },
+];
 
 // 加载知识库列表
 const loadKnowledgeBases = async (refreshStats = false) => {
-  loading.value = true
+  loading.value = true;
   try {
-    const params: any = {}
-    if (refreshStats) {
-      params.refresh_stats = 'true'
-    }
-
-    const response = await axios.get('/api/kb/list', { params })
-    if (response.data.status === 'ok') {
-      kbList.value = response.data.data.items || []
-    } else {
-      showSnackbar(response.data.message || t('messages.loadError'), 'error')
-    }
+    const loadedCapabilities = await loadCapabilities();
+    const pageSize =
+      getKnowledgeBasePaginationConfig(loadedCapabilities).defaultKbPageSize;
+    kbList.value = await loadKnowledgeBaseListPages({
+      fetchPage: async (params: any) => {
+        const response = await axios.get("/api/kb/list", { params });
+        return response.data;
+      },
+      pageSize,
+      refreshStats,
+    });
   } catch (error) {
-    console.error('Failed to load knowledge bases:', error)
-    showSnackbar(t('messages.loadError'), 'error')
+    console.error("Failed to load knowledge bases:", error);
+    const message =
+      error instanceof Error && error.message
+        ? error.message
+        : t("messages.loadError");
+    showSnackbar(message, "error");
   } finally {
-    loading.value = false
+    loading.value = false;
   }
-}
+};
 
 // 加载提供商配置
 const loadProviders = async () => {
   try {
-    const response = await axios.get('/api/config/provider/list', {
-      params: { provider_type: 'embedding,rerank' }
-    })
-    if (response.data.status === 'ok') {
+    const response = await axios.get("/api/config/provider/list", {
+      params: { provider_type: "embedding,rerank" },
+    });
+    if (response.data.status === "ok") {
       embeddingProviders.value = response.data.data.filter(
-        (p: any) => p.provider_type === 'embedding'
-      )
+        (p: any) => p.provider_type === "embedding",
+      );
       rerankProviders.value = response.data.data.filter(
-        (p: any) => p.provider_type === 'rerank'
-      )
+        (p: any) => p.provider_type === "rerank",
+      );
     }
   } catch (error) {
-    console.error('Failed to load providers:', error)
+    console.error("Failed to load providers:", error);
+    showSnackbar(t("messages.providersLoadError"), "error");
   }
-}
+};
 
 // 导航到详情页
 const navigateToDetail = (kbId: string) => {
-  router.push({ name: 'NativeKBDetail', params: { kbId } })
-}
+  router.push({ name: "NativeKBDetail", params: { kbId } });
+};
 
 // 编辑知识库
 const editKB = (kb: any) => {
-  editingKB.value = kb
-  originalEmbeddingProvider.value = kb.embedding_provider_id
+  editingKB.value = kb;
   formData.value = {
     kb_name: kb.kb_name,
-    description: kb.description || '',
-    emoji: kb.emoji || '📚',
+    description: kb.description || "",
+    emoji: kb.emoji || "📚",
     embedding_provider_id: kb.embedding_provider_id,
-    rerank_provider_id: kb.rerank_provider_id
-  }
-  showCreateDialog.value = true
-}
+    rerank_provider_id: kb.rerank_provider_id,
+  };
+  showCreateDialog.value = true;
+};
 
 // 确认删除
 const confirmDelete = (kb: any) => {
-  deleteTarget.value = kb
-  showDeleteDialog.value = true
-}
+  deleteTarget.value = kb;
+  showDeleteDialog.value = true;
+};
 
 // 取消删除
 const cancelDelete = () => {
-  showDeleteDialog.value = false
-  deleteTarget.value = null
-}
+  showDeleteDialog.value = false;
+  deleteTarget.value = null;
+};
 
 // 删除知识库
 const deleteKB = async () => {
-  if (!deleteTarget.value) return
+  if (!deleteTarget.value) return;
 
-  deleting.value = true
+  deleting.value = true;
   try {
-    const response = await axios.post('/api/kb/delete', {
-      kb_id: deleteTarget.value.kb_id
-    })
+    const response = await axios.post("/api/kb/delete", {
+      kb_id: deleteTarget.value.kb_id,
+    });
 
-    console.log('Delete response:', response.data) // 调试日志
-
-    if (response.data.status === 'ok') {
-      showSnackbar(t('messages.deleteSuccess'))
+    if (response.data.status === "ok") {
+      showSnackbar(t("messages.deleteSuccess"));
       // 先刷新列表，再关闭对话框
-      await loadKnowledgeBases()
-      showDeleteDialog.value = false
-      deleteTarget.value = null
+      await loadKnowledgeBases();
+      showDeleteDialog.value = false;
+      deleteTarget.value = null;
     } else {
-      showSnackbar(response.data.message || t('messages.deleteFailed'), 'error')
+      showSnackbar(
+        response.data.message || t("messages.deleteFailed"),
+        "error",
+      );
     }
   } catch (error) {
-    console.error('Failed to delete knowledge base:', error)
-    showSnackbar(t('messages.deleteFailed'), 'error')
+    console.error("Failed to delete knowledge base:", error);
+    showSnackbar(t("messages.deleteFailed"), "error");
   } finally {
-    deleting.value = false
+    deleting.value = false;
   }
-}
+};
 
 // 提交表单
 const submitForm = async () => {
-  const { valid } = await formRef.value.validate()
-  if (!valid) return
+  const { valid } = await formRef.value.validate();
+  if (!valid) return;
 
-  saving.value = true
+  saving.value = true;
   try {
     const payload = {
       kb_name: formData.value.kb_name,
       description: formData.value.description,
       emoji: formData.value.emoji,
+      rerank_provider_id: formData.value.rerank_provider_id,
+    };
+    const createPayload = {
+      ...payload,
       embedding_provider_id: formData.value.embedding_provider_id,
-      rerank_provider_id: formData.value.rerank_provider_id
-    }
+    };
 
-    let response
+    let response;
     if (editingKB.value) {
-      response = await axios.post('/api/kb/update', {
+      response = await axios.post("/api/kb/update", {
         kb_id: editingKB.value.kb_id,
-        ...payload
-      })
+        ...payload,
+      });
     } else {
-      response = await axios.post('/api/kb/create', payload)
+      response = await axios.post("/api/kb/create", createPayload);
     }
 
-    if (response.data.status === 'ok') {
-      showSnackbar(editingKB.value ? t('messages.updateSuccess') : t('messages.createSuccess'))
-      closeCreateDialog()
-      await loadKnowledgeBases()
+    if (response.data.status === "ok") {
+      showSnackbar(
+        editingKB.value
+          ? t("messages.updateSuccess")
+          : t("messages.createSuccess"),
+      );
+      closeCreateDialog();
+      await loadKnowledgeBases();
     } else {
-      showSnackbar(response.data.message || (editingKB.value ? t('messages.updateFailed') : t('messages.createFailed')), 'error')
+      showSnackbar(
+        response.data.message ||
+          (editingKB.value
+            ? t("messages.updateFailed")
+            : t("messages.createFailed")),
+        "error",
+      );
     }
   } catch (error) {
-    console.error('Failed to save knowledge base:', error)
-    showSnackbar(editingKB.value ? t('messages.updateFailed') : t('messages.createFailed'), 'error')
+    console.error("Failed to save knowledge base:", error);
+    showSnackbar(
+      editingKB.value ? t("messages.updateFailed") : t("messages.createFailed"),
+      "error",
+    );
   } finally {
-    saving.value = false
+    saving.value = false;
   }
-}
+};
 
 // 关闭创建对话框
 const closeCreateDialog = () => {
-  showCreateDialog.value = false
-  editingKB.value = null
-  originalEmbeddingProvider.value = null
-  showEmbeddingWarning.value = false
-  pendingEmbeddingProvider.value = null
+  showCreateDialog.value = false;
+  editingKB.value = null;
   formData.value = {
-    kb_name: '',
-    description: '',
-    emoji: '📚',
+    kb_name: "",
+    description: "",
+    emoji: "📚",
     embedding_provider_id: null,
-    rerank_provider_id: null
-  }
-  formRef.value?.reset()
-}
+    rerank_provider_id: null,
+  };
+  formRef.value?.reset();
+};
 
 // 选择 emoji
 const selectEmoji = (emoji: string) => {
-  formData.value.emoji = emoji
-  showEmojiPicker.value = false
-}
+  formData.value.emoji = emoji;
+  showEmojiPicker.value = false;
+};
 
 // 显示通知
-const showSnackbar = (text: string, color: string = 'success') => {
-  snackbar.value.text = text
-  snackbar.value.color = color
-  snackbar.value.show = true
-}
+const showSnackbar = (text: string, color: string = "success") => {
+  snackbar.value.text = text;
+  snackbar.value.color = color;
+  snackbar.value.show = true;
+};
 
 onMounted(() => {
-  loadKnowledgeBases(true)  // 首次加载时刷新统计信息
-  loadProviders()
-})
+  loadKnowledgeBases(true); // 首次加载时刷新统计信息
+  loadProviders();
+});
 </script>
 
 <style scoped>
diff --git a/dashboard/src/views/knowledge-base/capabilities.ts b/dashboard/src/views/knowledge-base/capabilities.ts
new file mode 100644
index 0000000000..a5eeccc5d4
--- /dev/null
+++ b/dashboard/src/views/knowledge-base/capabilities.ts
@@ -0,0 +1,95 @@
+import { ref } from "vue";
+import axios from "axios";
+
+export interface KnowledgeBaseCapabilities {
+  upload: {
+    allowed_extensions: string[];
+    max_file_size_bytes: number;
+    max_files_per_upload: number;
+  };
+  defaults: {
+    chunk_size: number;
+    chunk_overlap: number;
+    batch_size: number;
+    tasks_limit: number;
+    max_retries: number;
+    top_k_dense: number;
+    top_k_sparse: number;
+    top_m_final: number;
+    index_type: string;
+  };
+  limits: {
+    max_retrieve_top_k: number;
+    max_batch_delete_documents: number;
+    max_batch_rebuild_documents: number;
+  };
+  pagination: {
+    document_page_size_options: number[];
+    chunk_page_size_options: number[];
+    default_kb_page_size: number;
+    default_document_page_size: number;
+    default_chunk_page_size: number;
+    bulk_page_size: number;
+  };
+  document_filters: {
+    statuses: string[];
+    source_types: string[];
+  };
+  features: {
+    sparse_retrieval: boolean;
+    rerank: boolean;
+    url_import: boolean;
+    document_rebuild: boolean;
+    kb_rebuild: boolean;
+    consistency_check: boolean;
+    consistency_repair: boolean;
+    batch_delete: boolean;
+    batch_rebuild: boolean;
+  };
+}
+
+const capabilities = ref<KnowledgeBaseCapabilities | null>(null);
+const loading = ref(false);
+let pendingRequest: Promise<KnowledgeBaseCapabilities | null> | null = null;
+
+export const useKnowledgeBaseCapabilities = () => {
+  const loadCapabilities = async () => {
+    if (capabilities.value) {
+      return capabilities.value;
+    }
+    if (pendingRequest) {
+      return pendingRequest;
+    }
+
+    loading.value = true;
+    pendingRequest = axios
+      .get("/api/kb/capabilities")
+      .then((response) => {
+        if (response.data.status === "ok") {
+          capabilities.value = response.data.data;
+          return capabilities.value;
+        }
+        console.warn(
+          "Failed to load knowledge base capabilities:",
+          response.data,
+        );
+        return null;
+      })
+      .catch((error) => {
+        console.warn("Failed to load knowledge base capabilities:", error);
+        return null;
+      })
+      .finally(() => {
+        loading.value = false;
+        pendingRequest = null;
+      });
+
+    return pendingRequest;
+  };
+
+  return {
+    capabilities,
+    capabilitiesLoading: loading,
+    loadCapabilities,
+  };
+};
diff --git a/dashboard/src/views/knowledge-base/components/DocumentsTab.vue b/dashboard/src/views/knowledge-base/components/DocumentsTab.vue
index 5bff7cd713..3f0ce13259 100644
--- a/dashboard/src/views/knowledge-base/components/DocumentsTab.vue
+++ b/dashboard/src/views/knowledge-base/components/DocumentsTab.vue
@@ -2,38 +2,154 @@
   <div class="documents-tab">
     <!-- 操作栏 -->
     <div class="action-bar mb-4">
-      <v-btn prepend-icon="mdi-upload" color="primary" variant="outlined" @click="showUploadDialog = true">
-        {{ t('documents.upload') }}
+      <v-btn
+        prepend-icon="mdi-upload"
+        color="primary"
+        variant="outlined"
+        @click="showUploadDialog = true"
+      >
+        {{ t("documents.upload") }}
       </v-btn>
-      <v-text-field v-model="searchQuery" prepend-inner-icon="mdi-magnify" :placeholder="'搜索文档...'" variant="outlined"
-        density="compact" hide-details clearable style="max-width: 300px" />
+      <v-btn
+        v-if="supportsBatchDelete"
+        prepend-icon="mdi-delete-sweep"
+        color="error"
+        variant="tonal"
+        :disabled="!batchDeleteState.hasSelection || batchDeleting"
+        :loading="batchDeleting"
+        @click="confirmBatchDelete"
+      >
+        {{
+          t("documents.batchDelete", { count: batchDeleteState.selectedCount })
+        }}
+      </v-btn>
+      <v-btn
+        v-if="supportsBatchRebuild"
+        prepend-icon="mdi-refresh"
+        color="primary"
+        variant="tonal"
+        :disabled="!batchRebuildState.hasSelection || batchRebuilding"
+        :loading="batchRebuilding"
+        @click="confirmBatchRebuild"
+      >
+        {{
+          t("documents.batchRebuild", {
+            count: batchRebuildState.selectedCount,
+          })
+        }}
+      </v-btn>
+      <v-text-field
+        v-model="searchQuery"
+        prepend-inner-icon="mdi-magnify"
+        :placeholder="t('documents.searchPlaceholder')"
+        variant="outlined"
+        density="compact"
+        hide-details
+        clearable
+        style="max-width: 300px"
+      />
+      <v-select
+        v-model="selectedStatus"
+        :items="statusFilterOptions"
+        :label="t('documents.statusFilter')"
+        class="document-filter-select"
+        variant="outlined"
+        density="compact"
+        hide-details
+      />
+      <v-select
+        v-model="selectedSourceType"
+        :items="sourceTypeFilterOptions"
+        :label="t('documents.sourceFilter')"
+        class="document-filter-select"
+        variant="outlined"
+        density="compact"
+        hide-details
+      />
+      <span
+        v-if="hasActiveDocumentFilters"
+        class="text-caption text-medium-emphasis documents-filter-count"
+      >
+        {{
+          t("documents.filteredCount", {
+            filtered: totalDocuments,
+            total: documentCount,
+          })
+        }}
+      </span>
     </div>
 
     <!-- 文档列表 -->
     <v-card variant="outlined">
-      <v-data-table :headers="headers" :items="documents" :loading="loading" :search="searchQuery" :items-per-page="10">
+      <v-data-table-server
+        :headers="headers"
+        :items="documents"
+        :loading="loading"
+        :items-length="totalDocuments"
+        :items-per-page-options="pageSizeOptions"
+        v-model="selectedDocumentRows"
+        v-model:items-per-page="pageSize"
+        v-model:page="page"
+        item-value="doc_id"
+        item-selectable="selectable"
+        :show-select="supportsBatchDelete || supportsBatchRebuild"
+        return-object
+        @update:options="loadDocuments"
+      >
         <template #item.doc_name="{ item }">
           <div class="d-flex align-center gap-2">
             <v-icon :color="getFileColor(item.file_type)" class="mr-2">
               {{ getFileIcon(item.file_type) }}
             </v-icon>
-            <div class="flex-grow-1" style="padding: 4px 0px;">
-              <span class="font-weight-medium">{{ item.doc_name }}</span>
+            <div class="flex-grow-1" style="padding: 4px 0px">
+              <span
+                class="font-weight-medium doc-name"
+                :title="item.doc_name"
+                >{{ item.doc_name }}</span
+              >
               <!-- 上传进度 -->
-              <div v-if="item.uploading" class="mt-1">
+              <div v-if="item.uploading || item.rebuilding" class="mt-1">
                 <div class="text-caption text-medium-emphasis mb-1">
-                  {{ getStageText(item.uploadProgress?.stage || 'waiting') }}
-                  <span v-if="item.uploadProgress?.current">
-                    ({{ item.uploadProgress.current }} / {{ item.uploadProgress.total }})
+                  {{ getStageText(item.uploadProgress?.stage || "waiting") }}
+                  <span
+                    v-if="
+                      item.uploadProgress &&
+                      item.uploadProgress.current !== undefined
+                    "
+                  >
+                    ({{ item.uploadProgress.current }} /
+                    {{ item.uploadProgress.total }})
                   </span>
                 </div>
-                <v-progress-linear :model-value="getUploadPercentage(item)" color="primary" height="4" rounded
-                  striped />
+                <v-progress-linear
+                  :model-value="getUploadPercentage(item)"
+                  color="primary"
+                  height="4"
+                  rounded
+                  striped
+                />
+              </div>
+              <div
+                v-else-if="item.status === 'failed'"
+                class="doc-error text-caption mt-1"
+                :title="getFailureSummary(item)"
+              >
+                {{ getFailureSummary(item) }}
               </div>
             </div>
           </div>
         </template>
 
+        <template #item.status="{ item }">
+          <v-chip
+            size="small"
+            variant="tonal"
+            :color="getDocumentStatusColor(item.status)"
+          >
+            {{ getDocumentStatusText(item.status) }}
+          </v-chip>
+        </template>
+
         <template #item.file_size="{ item }">
           {{ formatFileSize(item.file_size) }}
         </template>
@@ -43,33 +159,89 @@
         </template>
 
         <template #item.actions="{ item }">
-          <v-btn icon="mdi-eye" variant="text" size="small" color="info" @click="viewDocument(item)" />
-          <v-btn icon="mdi-delete" variant="text" size="small" color="error" @click="confirmDelete(item)" />
+          <v-btn
+            v-if="item.status === 'failed'"
+            icon="mdi-content-copy"
+            variant="text"
+            size="small"
+            color="warning"
+            :disabled="
+              item.uploading ||
+              item.rebuilding ||
+              rebuildingDocIds.has(item.doc_id)
+            "
+            :title="t('documents.copyFailure')"
+            @click="copyFailureDetails(item)"
+          />
+          <v-btn
+            v-if="item.status === 'failed' && supportsDocumentRebuild"
+            icon="mdi-refresh"
+            variant="text"
+            size="small"
+            color="primary"
+            :loading="rebuildingDocIds.has(item.doc_id) || item.rebuilding"
+            :disabled="!canRebuild(item)"
+            :title="t('documents.rebuild')"
+            @click="confirmRebuild(item)"
+          />
+          <v-btn
+            icon="mdi-eye"
+            variant="text"
+            size="small"
+            color="info"
+            :disabled="item.uploading || item.rebuilding"
+            @click="viewDocument(item)"
+          />
+          <v-btn
+            icon="mdi-delete"
+            variant="text"
+            size="small"
+            color="error"
+            :disabled="item.uploading || item.rebuilding"
+            @click="confirmDelete(item)"
+          />
         </template>
 
         <template #no-data>
           <div class="text-center py-8">
-            <v-icon size="64" color="grey-lighten-2">mdi-file-document-outline</v-icon>
-            <p class="mt-4 text-medium-emphasis">{{ t('documents.empty') }}</p>
+            <v-icon size="64" color="grey-lighten-2"
+              >mdi-file-document-outline</v-icon
+            >
+            <p class="mt-4 text-medium-emphasis">{{ t("documents.empty") }}</p>
           </div>
         </template>
-      </v-data-table>
+      </v-data-table-server>
     </v-card>
 
     <!-- 上传对话框 -->
-    <v-dialog v-model="showUploadDialog" max-width="650px" persistent @after-enter="initUploadSettings">
+    <v-dialog
+      v-model="showUploadDialog"
+      max-width="650px"
+      persistent
+      @after-enter="initUploadSettings"
+    >
       <v-card>
         <v-card-title class="pa-4 d-flex align-center">
-          <span class="text-h5">{{ t('upload.title') }}</span>
+          <span class="text-h5">{{ t("upload.title") }}</span>
           <v-spacer />
-          <v-btn icon="mdi-close" variant="text" @click="closeUploadDialog" />
+          <v-btn
+            icon="mdi-close"
+            variant="text"
+            :disabled="uploading"
+            @click="closeUploadDialog()"
+          />
         </v-card-title>
 
         <v-tabs v-model="uploadMode" grow class="mb-4">
-          <v-tab value="file">{{ t('upload.fileUpload') }}</v-tab>
-          <v-tab value="url">
-            {{ t('upload.fromUrl') }}
-            <v-badge color="warning" :content="t('upload.beta')" inline class="ml-2" />
+          <v-tab value="file">{{ t("upload.fileUpload") }}</v-tab>
+          <v-tab v-if="supportsUrlImport" value="url">
+            {{ t("upload.fromUrl") }}
+            <v-badge
+              color="warning"
+              :content="t('upload.beta')"
+              inline
+              class="ml-2"
+            />
           </v-tab>
         </v-tabs>
 
@@ -78,34 +250,76 @@
             <!-- 文件上传 -->
             <v-window-item value="file">
               <!-- 文件选择 -->
-              <div class="upload-dropzone" :class="{ 'dragover': isDragging }" @drop.prevent="handleDrop"
-                @dragover.prevent="isDragging = true" @dragleave="isDragging = false" @click="fileInput?.click()">
+              <div
+                class="upload-dropzone"
+                :class="{ dragover: isDragging, disabled: uploading }"
+                @drop.prevent="handleDrop"
+                @dragover.prevent="isDragging = true"
+                @dragleave="isDragging = false"
+                @click="openFilePicker"
+              >
                 <v-icon size="64" color="primary">mdi-cloud-upload</v-icon>
-                <p class="mt-4 text-h6">{{ t('upload.dropzone') }}</p>
-                <p class="text-caption text-medium-emphasis mt-2">{{ t('upload.supportedFormats') }}</p>
-                <p class="text-caption text-medium-emphasis">{{ t('upload.maxSize') }}</p>
-                <p class="text-caption text-medium-emphasis">最多可上传 10 个文件</p>
-                <input ref="fileInput" type="file" multiple hidden accept=".txt,.md,.markdown,.rst,.adoc,.pdf,.docx,.epub,.xls,.xlsx"
-                  @change="handleFileSelect" />
+                <p class="mt-4 text-h6">{{ t("upload.dropzone") }}</p>
+                <p class="text-caption text-medium-emphasis mt-2">
+                  {{
+                    t("upload.supportedFormats", {
+                      formats: supportedFormatsText,
+                    })
+                  }}
+                </p>
+                <p class="text-caption text-medium-emphasis">
+                  {{ t("upload.maxSize", { size: maxFileSizeText }) }}
+                </p>
+                <p class="text-caption text-medium-emphasis">
+                  {{ t("upload.maxFiles", { count: maxFilesPerUploadText }) }}
+                </p>
+                <input
+                  ref="fileInput"
+                  type="file"
+                  multiple
+                  hidden
+                  :disabled="uploading"
+                  :accept="fileAccept"
+                  @change="handleFileSelect"
+                />
               </div>
 
               <div v-if="selectedFiles.length > 0" class="mt-4">
                 <div class="d-flex align-center justify-space-between mb-2">
-                  <span class="text-subtitle-2">已选择 {{ selectedFiles.length }} 个文件</span>
-                  <v-btn variant="text" size="small" @click="selectedFiles = []">清空</v-btn>
+                  <span class="text-subtitle-2">{{
+                    t("upload.selectedFiles", { count: selectedFiles.length })
+                  }}</span>
+                  <v-btn
+                    variant="text"
+                    size="small"
+                    :disabled="uploading"
+                    @click="selectedFiles = []"
+                    >{{ t("upload.clear") }}</v-btn
+                  >
                 </div>
                 <div class="files-list">
-                  <div v-for="(file, index) in selectedFiles" :key="index"
-                    class="file-item pa-3 mb-2 rounded bg-surface-variant">
+                  <div
+                    v-for="(file, index) in selectedFiles"
+                    :key="index"
+                    class="file-item pa-3 mb-2 rounded bg-surface-variant"
+                  >
                     <div class="d-flex align-center justify-space-between">
                       <div class="d-flex align-center gap-2">
                         <v-icon>{{ getFileIcon(file.name) }}</v-icon>
                         <div>
                           <div class="font-weight-medium">{{ file.name }}</div>
-                          <div class="text-caption">{{ formatFileSize(file.size) }}</div>
+                          <div class="text-caption">
+                            {{ formatFileSize(file.size) }}
+                          </div>
                         </div>
                       </div>
-                      <v-btn icon="mdi-close" variant="text" size="small" @click="removeFile(index)" />
+                      <v-btn
+                        icon="mdi-close"
+                        variant="text"
+                        size="small"
+                        :disabled="uploading"
+                        @click="removeFile(index)"
+                      />
                     </div>
                   </div>
                 </div>
@@ -115,37 +329,76 @@
             <!-- URL上传 -->
             <v-window-item value="url" class="pt-2">
               <!-- Tavily Key 快速配置 -->
-              <div v-if="tavilyConfigStatus === 'not_configured' || tavilyConfigStatus === 'error'" class="mb-4">
-                <v-alert :type="tavilyConfigStatus === 'error' ? 'error' : 'info'" variant="tonal" density="compact">
+              <div
+                v-if="
+                  tavilyConfigStatus === 'not_configured' ||
+                  tavilyConfigStatus === 'error'
+                "
+                class="mb-4"
+              >
+                <v-alert
+                  :type="tavilyConfigStatus === 'error' ? 'error' : 'info'"
+                  variant="tonal"
+                  density="compact"
+                >
                   <div class="d-flex align-center justify-space-between">
                     <span>
-                      {{ tavilyConfigStatus === 'error' ? '检查网页搜索配置失败' : '使用此功能需要配置 Tavily Key' }}
+                      {{
+                        tavilyConfigStatus === "error"
+                          ? t("upload.tavilyCheckFailed")
+                          : t("upload.tavilyRequired")
+                      }}
                     </span>
-                    <v-btn size="small" variant="flat" @click="showTavilyDialog = true">
-                      配置
+                    <v-btn
+                      size="small"
+                      variant="flat"
+                      @click="showTavilyDialog = true"
+                    >
+                      {{ t("upload.configure") }}
                     </v-btn>
                   </div>
                 </v-alert>
               </div>
 
-              <v-text-field v-model="uploadUrl" :label="t('upload.urlPlaceholder')" variant="outlined" clearable :disabled="tavilyConfigStatus === 'not_configured'"
-                autofocus :hint="t('upload.urlHint', { supported: 'HTML' })" persistent-hint />
+              <v-text-field
+                v-model="uploadUrl"
+                :label="t('upload.urlPlaceholder')"
+                variant="outlined"
+                clearable
+                :disabled="tavilyConfigStatus !== 'configured'"
+                autofocus
+                :hint="t('upload.urlHint', { supported: 'HTML' })"
+                persistent-hint
+              />
             </v-window-item>
           </v-window>
 
           <!-- 清洗设置 (仅在URL模式下显示) -->
-          <div v-if="uploadMode === 'url'" class="mt-6">
+          <div v-if="uploadMode === 'url' && supportsUrlImport" class="mt-6">
             <div class="d-flex align-center mb-4">
-              <h3 class="text-h6">{{ t('upload.cleaningSettings') }}</h3>
+              <h3 class="text-h6">{{ t("upload.cleaningSettings") }}</h3>
             </div>
             <v-row>
               <v-col cols="12" sm="4">
-                <v-switch v-model="uploadSettings.enable_cleaning" :label="t('upload.enableCleaning')" color="primary" />
+                <v-switch
+                  v-model="uploadSettings.enable_cleaning"
+                  :label="t('upload.enableCleaning')"
+                  color="primary"
+                />
               </v-col>
               <v-col cols="12" sm="8">
-                <v-select v-model="uploadSettings.cleaning_provider_id" :items="llmProviders" item-title="id"
-                  item-value="id" :label="t('upload.cleaningProvider')" :hint="t('upload.cleaningProviderHint')"
-                  persistent-hint variant="outlined" density="compact" :disabled="!uploadSettings.enable_cleaning" />
+                <v-select
+                  v-model="uploadSettings.cleaning_provider_id"
+                  :items="llmProviders"
+                  item-title="id"
+                  item-value="id"
+                  :label="t('upload.cleaningProvider')"
+                  :hint="t('upload.cleaningProviderHint')"
+                  persistent-hint
+                  variant="outlined"
+                  density="compact"
+                  :disabled="!uploadSettings.enable_cleaning"
+                />
               </v-col>
             </v-row>
           </div>
@@ -153,52 +406,118 @@
           <!-- 分块设置 -->
           <div class="mt-6">
             <div class="d-flex align-center mb-4">
-              <h3 class="text-h6">{{ t('upload.chunkSettings') }}</h3>
+              <h3 class="text-h6">{{ t("upload.chunkSettings") }}</h3>
             </div>
             <v-row>
               <v-col cols="12" sm="6">
-                <v-text-field v-model.number="uploadSettings.chunk_size" :label="t('upload.chunkSize')"
-                  :hint="t('upload.chunkSizeHint')" persistent-hint type="number" variant="outlined" density="compact"
-                  :placeholder="props.kb?.chunk_size?.toString() || '512'" />
+                <v-text-field
+                  v-model.number="uploadSettings.chunk_size"
+                  :label="t('upload.chunkSize')"
+                  :hint="
+                    t('upload.chunkSizeHint', {
+                      value: capabilities?.defaults.chunk_size ?? '-',
+                    })
+                  "
+                  persistent-hint
+                  type="number"
+                  variant="outlined"
+                  density="compact"
+                  :placeholder="chunkSizePlaceholder"
+                  :rules="chunkSizeRules"
+                />
               </v-col>
               <v-col cols="12" sm="6">
-                <v-text-field v-model.number="uploadSettings.chunk_overlap" :label="t('upload.chunkOverlap')"
-                  :hint="t('upload.chunkOverlapHint')" persistent-hint type="number" variant="outlined"
-                  density="compact" :placeholder="props.kb?.chunk_overlap?.toString() || '50'" />
+                <v-text-field
+                  v-model.number="uploadSettings.chunk_overlap"
+                  :label="t('upload.chunkOverlap')"
+                  :hint="
+                    t('upload.chunkOverlapHint', {
+                      value: capabilities?.defaults.chunk_overlap ?? '-',
+                    })
+                  "
+                  persistent-hint
+                  type="number"
+                  variant="outlined"
+                  density="compact"
+                  :placeholder="chunkOverlapPlaceholder"
+                  :rules="chunkOverlapRules"
+                />
               </v-col>
             </v-row>
           </div>
 
           <div class="mt-2">
-            <h3 class="text-h6 mb-4">{{ t('upload.batchSettings') }}</h3>
+            <h3 class="text-h6 mb-4">{{ t("upload.batchSettings") }}</h3>
             <v-row>
               <v-col cols="12" sm="4">
-                <v-text-field v-model.number="uploadSettings.batch_size" :label="t('upload.batchSize')" hint="每批处理的文本数量"
-                  persistent-hint type="number" variant="outlined" density="compact" />
+                <v-text-field
+                  v-model.number="uploadSettings.batch_size"
+                  :label="t('upload.batchSize')"
+                  :hint="
+                    t('upload.batchSizeHint', {
+                      value: capabilities?.defaults.batch_size ?? '-',
+                    })
+                  "
+                  persistent-hint
+                  type="number"
+                  variant="outlined"
+                  density="compact"
+                  :rules="positiveIntegerRules"
+                />
               </v-col>
               <v-col cols="12" sm="4">
-                <v-text-field v-model.number="uploadSettings.tasks_limit" :label="t('upload.tasksLimit')"
-                  hint="并发任务数量限制" persistent-hint type="number" variant="outlined" density="compact" />
+                <v-text-field
+                  v-model.number="uploadSettings.tasks_limit"
+                  :label="t('upload.tasksLimit')"
+                  :hint="
+                    t('upload.tasksLimitHint', {
+                      value: capabilities?.defaults.tasks_limit ?? '-',
+                    })
+                  "
+                  persistent-hint
+                  type="number"
+                  variant="outlined"
+                  density="compact"
+                  :rules="positiveIntegerRules"
+                />
               </v-col>
               <v-col cols="12" sm="4">
-                <v-text-field v-model.number="uploadSettings.max_retries" :label="t('upload.maxRetries')"
-                  hint="失败时的最大重试次数" persistent-hint type="number" variant="outlined" density="compact" />
+                <v-text-field
+                  v-model.number="uploadSettings.max_retries"
+                  :label="t('upload.maxRetries')"
+                  :hint="
+                    t('upload.maxRetriesHint', {
+                      value: capabilities?.defaults.max_retries ?? '-',
+                    })
+                  "
+                  persistent-hint
+                  type="number"
+                  variant="outlined"
+                  density="compact"
+                  :rules="nonNegativeIntegerRules"
+                />
               </v-col>
             </v-row>
           </div>
-
-
-
         </v-card-text>
 
         <v-card-actions class="pa-4">
           <v-spacer />
-          <v-btn variant="text" @click="closeUploadDialog" :disabled="uploading">
-            {{ t('upload.cancel') }}
+          <v-btn
+            variant="text"
+            @click="closeUploadDialog()"
+            :disabled="uploading"
+          >
+            {{ t("upload.cancel") }}
           </v-btn>
-          <v-btn color="primary" variant="elevated" @click="startUpload" :loading="uploading"
-            :disabled="isUploadDisabled">
-            {{ t('upload.submit') }}
+          <v-btn
+            color="primary"
+            variant="elevated"
+            @click="startUpload"
+            :loading="uploading"
+            :disabled="isUploadDisabled"
+          >
+            {{ t("upload.submit") }}
           </v-btn>
         </v-card-actions>
       </v-card>
@@ -207,18 +526,209 @@
     <!-- 删除确认对话框 -->
     <v-dialog v-model="showDeleteDialog" max-width="450px">
       <v-card>
-        <v-card-title class="pa-4 text-h6">{{ t('documents.delete') }}</v-card-title>
+        <v-card-title class="pa-4 text-h6">{{
+          t("documents.delete")
+        }}</v-card-title>
         <v-card-text class="pa-6">
-          <p>{{ t('documents.deleteConfirm', { name: deleteTarget?.doc_name || '' }) }}</p>
+          <p>
+            {{
+              t("documents.deleteConfirm", {
+                name: deleteTarget?.doc_name || "",
+              })
+            }}
+          </p>
           <v-alert type="error" variant="tonal" density="compact" class="mt-4">
-            {{ t('documents.deleteWarning') }}
+            {{ t("documents.deleteWarning") }}
+          </v-alert>
+        </v-card-text>
+        <v-card-actions class="pa-4">
+          <v-spacer />
+          <v-btn
+            variant="text"
+            @click="showDeleteDialog = false"
+            :disabled="deleting"
+            >{{ t("documents.cancel") }}</v-btn
+          >
+          <v-btn
+            color="error"
+            variant="elevated"
+            @click="deleteDocument"
+            :loading="deleting"
+          >
+            {{ t("documents.delete") }}
+          </v-btn>
+        </v-card-actions>
+      </v-card>
+    </v-dialog>
+
+    <!-- 批量删除确认对话框 -->
+    <v-dialog v-model="showBatchDeleteDialog" max-width="500px">
+      <v-card>
+        <v-card-title class="pa-4 text-h6">{{
+          t("documents.batchDeleteTitle")
+        }}</v-card-title>
+        <v-card-text class="pa-6">
+          <p>
+            {{
+              t("documents.batchDeleteConfirm", {
+                count: batchDeleteState.selectedCount,
+              })
+            }}
+          </p>
+          <div v-if="selectedBatchDeletePreview.length" class="mt-4">
+            <v-chip
+              v-for="doc in selectedBatchDeletePreview"
+              :key="doc.doc_id"
+              size="small"
+              variant="tonal"
+              class="mr-1 mb-1"
+            >
+              {{ doc.doc_name || doc.doc_id }}
+            </v-chip>
+            <v-chip
+              v-if="batchDeleteRemainingCount > 0"
+              size="small"
+              variant="outlined"
+              class="mr-1 mb-1"
+            >
+              {{
+                t("documents.batchDeleteMore", {
+                  count: batchDeleteRemainingCount,
+                })
+              }}
+            </v-chip>
+          </div>
+          <v-alert type="error" variant="tonal" density="compact" class="mt-4">
+            {{ t("documents.deleteWarning") }}
+          </v-alert>
+        </v-card-text>
+        <v-card-actions class="pa-4">
+          <v-spacer />
+          <v-btn
+            variant="text"
+            @click="showBatchDeleteDialog = false"
+            :disabled="batchDeleting"
+            >{{ t("documents.cancel") }}</v-btn
+          >
+          <v-btn
+            color="error"
+            variant="elevated"
+            @click="batchDeleteDocuments"
+            :loading="batchDeleting"
+            :disabled="!batchDeleteState.canDelete"
+          >
+            {{ t("documents.delete") }}
+          </v-btn>
+        </v-card-actions>
+      </v-card>
+    </v-dialog>
+
+    <!-- Batch rebuild confirmation dialog -->
+    <v-dialog v-model="showBatchRebuildDialog" max-width="500px">
+      <v-card>
+        <v-card-title class="pa-4 text-h6">{{
+          t("documents.batchRebuildTitle")
+        }}</v-card-title>
+        <v-card-text class="pa-6">
+          <p>
+            {{
+              t("documents.batchRebuildConfirm", {
+                count: batchRebuildState.selectedCount,
+              })
+            }}
+          </p>
+          <div v-if="selectedBatchRebuildPreview.length" class="mt-4">
+            <v-chip
+              v-for="doc in selectedBatchRebuildPreview"
+              :key="doc.doc_id"
+              size="small"
+              variant="tonal"
+              class="mr-1 mb-1"
+            >
+              {{ doc.doc_name || doc.doc_id }}
+            </v-chip>
+            <v-chip
+              v-if="batchRebuildRemainingCount > 0"
+              size="small"
+              variant="outlined"
+              class="mr-1 mb-1"
+            >
+              {{
+                t("documents.batchRebuildMore", {
+                  count: batchRebuildRemainingCount,
+                })
+              }}
+            </v-chip>
+          </div>
+          <v-alert
+            type="warning"
+            variant="tonal"
+            density="compact"
+            class="mt-4"
+          >
+            {{ t("documents.batchRebuildWarning") }}
+          </v-alert>
+        </v-card-text>
+        <v-card-actions class="pa-4">
+          <v-spacer />
+          <v-btn
+            variant="text"
+            @click="showBatchRebuildDialog = false"
+            :disabled="batchRebuilding"
+            >{{ t("documents.cancel") }}</v-btn
+          >
+          <v-btn
+            color="primary"
+            variant="elevated"
+            @click="batchRebuildDocuments"
+            :loading="batchRebuilding"
+            :disabled="!batchRebuildState.canRebuild"
+          >
+            {{ t("documents.rebuild") }}
+          </v-btn>
+        </v-card-actions>
+      </v-card>
+    </v-dialog>
+
+    <!-- Rebuild confirmation dialog -->
+    <v-dialog v-model="showRebuildDialog" max-width="450px">
+      <v-card>
+        <v-card-title class="pa-4 text-h6">{{
+          t("documents.rebuildTitle")
+        }}</v-card-title>
+        <v-card-text class="pa-6">
+          <p>
+            {{
+              t("documents.rebuildConfirm", {
+                name: rebuildTarget?.doc_name || "",
+              })
+            }}
+          </p>
+          <v-alert
+            type="warning"
+            variant="tonal"
+            density="compact"
+            class="mt-4"
+          >
+            {{ t("documents.rebuildWarning") }}
           </v-alert>
         </v-card-text>
         <v-card-actions class="pa-4">
           <v-spacer />
-          <v-btn variant="text" @click="showDeleteDialog = false">取消</v-btn>
-          <v-btn color="error" variant="elevated" @click="deleteDocument" :loading="deleting">
-            删除
+          <v-btn
+            variant="text"
+            @click="showRebuildDialog = false"
+            :disabled="isRebuildTargetBusy"
+            >{{ t("documents.cancel") }}</v-btn
+          >
+          <v-btn
+            color="primary"
+            variant="elevated"
+            @click="rebuildDocument"
+            :loading="isRebuildTargetBusy"
+            :disabled="!canRebuildTarget"
+          >
+            {{ t("documents.rebuild") }}
           </v-btn>
         </v-card-actions>
       </v-card>
@@ -226,7 +736,10 @@
 
     <!-- 消息提示 -->
     <v-snackbar v-model="snackbar.show" :color="snackbar.color">
-      {{ snackbar.text }}
+      <div>{{ snackbar.text }}</div>
+      <div v-if="snackbar.details.length" class="mt-2 text-caption">
+        <div v-for="detail in snackbar.details" :key="detail">{{ detail }}</div>
+      </div>
     </v-snackbar>
 
     <!-- Tavily Key 配置对话框 -->
@@ -235,573 +748,1330 @@
 </template>
 
 <script setup lang="ts">
-import TavilyKeyDialog from './TavilyKeyDialog.vue'
-import { ref, onMounted, onUnmounted, computed } from 'vue'
-import { useRouter } from 'vue-router'
-import axios from 'axios'
-import { useModuleI18n } from '@/i18n/composables'
-
-const { tm: t } = useModuleI18n('features/knowledge-base/detail')
-const router = useRouter()
+import TavilyKeyDialog from "./TavilyKeyDialog.vue";
+import { ref, onMounted, onUnmounted, computed, watch } from "vue";
+import { useRouter } from "vue-router";
+import axios from "axios";
+import { useI18n, useModuleI18n } from "@/i18n/composables";
+import { copyToClipboard } from "@/utils/clipboard";
+import { useKnowledgeBaseCapabilities } from "../capabilities";
+import {
+  applyActiveRebuildState,
+  applyDocumentTaskProgress,
+  buildDocumentDisplayTotals,
+  buildDocumentFailureText,
+  buildDocumentListParams,
+  canRebuildDocument,
+  clearDocumentTaskState,
+  countUploadingDocuments,
+  DEFAULT_DOCUMENT_PAGE_SIZE,
+  getBatchDeleteState,
+  getBatchRebuildState,
+  getDocumentFailureSummary,
+  getKnowledgeBasePaginationConfig,
+  isKnowledgeBaseFeatureEnabled,
+  markDocumentRebuildStarted,
+  markDocumentsRebuildStarted,
+} from "../knowledgeBaseUi.mjs";
+
+const { tm: t } = useModuleI18n("features/knowledge-base/detail");
+const { locale } = useI18n();
+const router = useRouter();
 
 const props = defineProps<{
-  kbId: string
-  kb: any
-}>()
+  kbId: string;
+  kb: any;
+}>();
 
-const emit = defineEmits(['refresh'])
+const emit = defineEmits(["refresh"]);
+const { capabilities, loadCapabilities } = useKnowledgeBaseCapabilities();
 
 // 状态
-const loading = ref(false)
-const uploading = ref(false)
-const deleting = ref(false)
-const documents = ref<any[]>([])
-const searchQuery = ref('')
-const showUploadDialog = ref(false)
-const showDeleteDialog = ref(false)
-const selectedFiles = ref<File[]>([])
-const deleteTarget = ref<any>(null)
-const isDragging = ref(false)
-const fileInput = ref<HTMLInputElement | null>(null)
-const uploadMode = ref('file') // 'file' or 'url'
-const uploadUrl = ref('')
-const llmProviders = ref<any[]>([])
-const uploadingTasks = ref<Map<string, any>>(new Map())
-const progressPollingInterval = ref<number | null>(null)
-const tavilyConfigStatus = ref('loading') // 'loading', 'configured', 'not_configured', 'error'
-const showTavilyDialog = ref(false)
+const loading = ref(false);
+const uploading = ref(false);
+const deleting = ref(false);
+const batchDeleting = ref(false);
+const batchRebuilding = ref(false);
+const rebuildingDocIds = ref(new Set<string>());
+const documents = ref<any[]>([]);
+const selectedDocumentRows = ref<any[]>([]);
+const backendMatchedDocuments = ref(0);
+const backendDocumentCount = ref(0);
+const page = ref(1);
+const pageSize = ref(DEFAULT_DOCUMENT_PAGE_SIZE);
+const searchQuery = ref("");
+const selectedStatus = ref<string | null>(null);
+const selectedSourceType = ref<string | null>(null);
+const showUploadDialog = ref(false);
+const showDeleteDialog = ref(false);
+const showBatchDeleteDialog = ref(false);
+const showBatchRebuildDialog = ref(false);
+const showRebuildDialog = ref(false);
+const selectedFiles = ref<File[]>([]);
+const deleteTarget = ref<any>(null);
+const rebuildTarget = ref<any>(null);
+const isDragging = ref(false);
+const fileInput = ref<HTMLInputElement | null>(null);
+const uploadMode = ref("file"); // 'file' or 'url'
+const uploadUrl = ref("");
+const llmProviders = ref<any[]>([]);
+const progressPollingIntervals = new Map<string, number>();
+const tavilyConfigStatus = ref("loading"); // 'loading', 'configured', 'not_configured', 'error'
+const showTavilyDialog = ref(false);
+const paginationConfig = computed(() =>
+  getKnowledgeBasePaginationConfig(capabilities.value),
+);
+const pageSizeOptions = computed(() =>
+  paginationConfig.value.documentPageSizeOptions.map((value) => ({
+    value,
+    title: value.toString(),
+  })),
+);
+
+const uploadingDocumentCount = computed(() =>
+  countUploadingDocuments(documents.value),
+);
+const documentDisplayTotals = computed(() =>
+  buildDocumentDisplayTotals({
+    matchedTotal: backendMatchedDocuments.value,
+    documentCount: backendDocumentCount.value,
+    uploadingCount: uploadingDocumentCount.value,
+  }),
+);
+const totalDocuments = computed(
+  () => documentDisplayTotals.value.filteredTotal,
+);
+const documentCount = computed(() => documentDisplayTotals.value.documentCount);
+const documentFilterStatuses = computed(
+  () => capabilities.value?.document_filters?.statuses ?? [],
+);
+const documentFilterSourceTypes = computed(
+  () => capabilities.value?.document_filters?.source_types ?? [],
+);
+const hasKnownDocumentFilterCapabilities = computed(
+  () =>
+    documentFilterStatuses.value.length > 0 ||
+    documentFilterSourceTypes.value.length > 0,
+);
+const statusFilterOptions = computed(() => [
+  { title: t("documents.allStatuses"), value: null },
+  ...documentFilterStatuses.value.map((status) => ({
+    title: getDocumentStatusText(status),
+    value: status,
+  })),
+]);
+const sourceTypeFilterOptions = computed(() => [
+  { title: t("documents.allSources"), value: null },
+  ...documentFilterSourceTypes.value.map((sourceType) => ({
+    title: getSourceTypeText(sourceType),
+    value: sourceType,
+  })),
+]);
+const hasActiveDocumentFilters = computed(
+  () =>
+    Boolean(
+      typeof searchQuery.value === "string" && searchQuery.value.trim(),
+    ) ||
+    Boolean(selectedStatus.value) ||
+    Boolean(selectedSourceType.value),
+);
 
 const snackbar = ref({
   show: false,
-  text: '',
-  color: 'success'
-})
-
-const showSnackbar = (text: string, color: string = 'success') => {
-  snackbar.value.text = text
-  snackbar.value.color = color
-  snackbar.value.show = true
-}
+  text: "",
+  color: "success",
+  details: [] as string[],
+});
+
+const showSnackbar = (
+  text: string,
+  color: string = "success",
+  details: string[] = [],
+) => {
+  snackbar.value.text = text;
+  snackbar.value.color = color;
+  snackbar.value.details = details;
+  snackbar.value.show = true;
+};
+
+const updateRebuildingDocIds = (docId: string, rebuilding: boolean) => {
+  const next = new Set(rebuildingDocIds.value);
+  if (rebuilding) {
+    next.add(docId);
+  } else {
+    next.delete(docId);
+  }
+  rebuildingDocIds.value = next;
+};
 
 // 上传设置
 const uploadSettings = ref({
   chunk_size: null as number | null,
   chunk_overlap: null as number | null,
-  batch_size: 32,
-  tasks_limit: 3,
-  max_retries: 3,
+  batch_size: null as number | null,
+  tasks_limit: null as number | null,
+  max_retries: null as number | null,
   enable_cleaning: false,
-  cleaning_provider_id: null as string | null
-})
+  cleaning_provider_id: null as string | null,
+});
 
 // 初始化上传设置
 const initUploadSettings = () => {
+  const defaults = capabilities.value?.defaults;
   uploadSettings.value = {
     chunk_size: props.kb?.chunk_size || null,
     chunk_overlap: props.kb?.chunk_overlap || null,
-    batch_size: 32,
-    tasks_limit: 3,
-    max_retries: 3,
+    batch_size: defaults?.batch_size ?? null,
+    tasks_limit: defaults?.tasks_limit ?? null,
+    max_retries: defaults?.max_retries ?? null,
     enable_cleaning: false,
-    cleaning_provider_id: null
+    cleaning_provider_id: null,
+  };
+};
+
+const allowedExtensions = computed(
+  () => new Set(capabilities.value?.upload.allowed_extensions ?? []),
+);
+const maxFilesPerUpload = computed(
+  () => capabilities.value?.upload.max_files_per_upload ?? null,
+);
+const maxFileSize = computed(
+  () => capabilities.value?.upload.max_file_size_bytes ?? null,
+);
+const supportedFormatsText = computed(() => {
+  const extensions = capabilities.value?.upload.allowed_extensions;
+  if (!extensions?.length) {
+    return "-";
   }
-}
+  return extensions.map((extension) => `.${extension}`).join(", ");
+});
+const maxFileSizeText = computed(() =>
+  maxFileSize.value === null ? "-" : formatFileSize(maxFileSize.value),
+);
+const maxFilesPerUploadText = computed(() => maxFilesPerUpload.value ?? "-");
+const supportsUrlImport = computed(() =>
+  isKnowledgeBaseFeatureEnabled(capabilities.value, "url_import"),
+);
+const supportsDocumentRebuild = computed(() =>
+  isKnowledgeBaseFeatureEnabled(capabilities.value, "document_rebuild"),
+);
+const supportsBatchDelete = computed(() =>
+  isKnowledgeBaseFeatureEnabled(capabilities.value, "batch_delete"),
+);
+const supportsBatchRebuild = computed(() =>
+  isKnowledgeBaseFeatureEnabled(capabilities.value, "batch_rebuild"),
+);
+const maxBatchDeleteDocuments = computed(
+  () => capabilities.value?.limits.max_batch_delete_documents ?? null,
+);
+const maxBatchRebuildDocuments = computed(
+  () => capabilities.value?.limits.max_batch_rebuild_documents ?? null,
+);
+const batchDeleteState = computed(() =>
+  getBatchDeleteState({
+    selected: selectedDocumentRows.value,
+    documents: documents.value,
+    maxDocuments: maxBatchDeleteDocuments.value,
+    enabled: supportsBatchDelete.value,
+    busy: batchDeleting.value,
+  }),
+);
+const batchRebuildState = computed(() =>
+  getBatchRebuildState({
+    selectedIds: batchDeleteState.value.selectedIds,
+    documents: documents.value,
+    maxDocuments: maxBatchRebuildDocuments.value,
+    enabled: supportsBatchRebuild.value,
+    busy: batchRebuilding.value,
+  }),
+);
+const selectedBatchDeletePreview = computed(() =>
+  documents.value
+    .filter((doc) => batchDeleteState.value.selectedIds.includes(doc.doc_id))
+    .slice(0, 5),
+);
+const batchDeleteRemainingCount = computed(() =>
+  Math.max(
+    batchDeleteState.value.selectedCount -
+      selectedBatchDeletePreview.value.length,
+    0,
+  ),
+);
+const selectedBatchRebuildPreview = computed(() =>
+  documents.value
+    .filter((doc) => batchRebuildState.value.selectedIds.includes(doc.doc_id))
+    .slice(0, 5),
+);
+const batchRebuildRemainingCount = computed(() =>
+  Math.max(
+    batchRebuildState.value.selectedCount -
+      selectedBatchRebuildPreview.value.length,
+    0,
+  ),
+);
+const canRebuild = (doc: any) =>
+  canRebuildDocument(doc, {
+    supportsDocumentRebuild: supportsDocumentRebuild.value,
+    rebuildingDocIds: rebuildingDocIds.value,
+  });
+const isRebuildTargetBusy = computed(() =>
+  Boolean(
+    rebuildTarget.value?.rebuilding ||
+      (rebuildTarget.value?.doc_id &&
+        rebuildingDocIds.value.has(rebuildTarget.value.doc_id)),
+  ),
+);
+const canRebuildTarget = computed(() => canRebuild(rebuildTarget.value));
+const fileAccept = computed(() => {
+  const extensions = capabilities.value?.upload.allowed_extensions;
+  return extensions?.length
+    ? extensions.map((extension) => `.${extension}`).join(",")
+    : undefined;
+});
+const chunkSizePlaceholder = computed(
+  () =>
+    props.kb?.chunk_size?.toString() ||
+    capabilities.value?.defaults.chunk_size.toString() ||
+    "",
+);
+const chunkOverlapPlaceholder = computed(
+  () =>
+    props.kb?.chunk_overlap?.toString() ||
+    capabilities.value?.defaults.chunk_overlap.toString() ||
+    "",
+);
+
+const isPositiveInteger = (value: number | null) =>
+  Number.isInteger(value) && Number(value) > 0;
+const isNonNegativeInteger = (value: number | null) =>
+  Number.isInteger(value) && Number(value) >= 0;
+const positiveIntegerRules = [
+  (value: number) =>
+    value === null ||
+    isPositiveInteger(value) ||
+    t("validation.positiveInteger"),
+];
+const nonNegativeIntegerRules = [
+  (value: number) =>
+    value === null ||
+    isNonNegativeInteger(value) ||
+    t("validation.nonNegativeInteger"),
+];
+const chunkSizeRules = [
+  (value: number | null) =>
+    value === null ||
+    isPositiveInteger(value) ||
+    t("validation.positiveInteger"),
+];
+const chunkOverlapRules = [
+  (value: number | null) =>
+    value === null || Number.isInteger(value) || t("validation.integer"),
+  (value: number | null) =>
+    value === null || value >= 0 || t("validation.nonNegativeInteger"),
+  (value: number | null) =>
+    value === null ||
+    uploadSettings.value.chunk_size === null ||
+    value < uploadSettings.value.chunk_size ||
+    t("validation.overlapLessThanSize"),
+];
+
+const isUploadSettingsValid = () => {
+  const settings = uploadSettings.value;
+  if (settings.chunk_size !== null && !isPositiveInteger(settings.chunk_size))
+    return false;
+  if (
+    settings.chunk_overlap !== null &&
+    !isNonNegativeInteger(settings.chunk_overlap)
+  )
+    return false;
+  if (
+    settings.chunk_size !== null &&
+    settings.chunk_overlap !== null &&
+    settings.chunk_overlap >= settings.chunk_size
+  ) {
+    return false;
+  }
+  return (
+    (settings.batch_size === null || isPositiveInteger(settings.batch_size)) &&
+    (settings.tasks_limit === null ||
+      isPositiveInteger(settings.tasks_limit)) &&
+    (settings.max_retries === null ||
+      isNonNegativeInteger(settings.max_retries))
+  );
+};
 
 const isUploadDisabled = computed(() => {
   if (uploading.value) {
-    return true
+    return true;
+  }
+  if (!isUploadSettingsValid()) {
+    return true;
   }
-  if (uploadMode.value === 'file') {
-    return selectedFiles.value.length === 0
+  if (uploadMode.value === "file") {
+    return selectedFiles.value.length === 0;
   }
-  if (uploadMode.value === 'url') {
+  if (uploadMode.value === "url") {
+    if (!supportsUrlImport.value) {
+      return true;
+    }
     if (!uploadUrl.value) {
-      return true
+      return true;
+    }
+    if (tavilyConfigStatus.value !== "configured") {
+      return true;
     }
-    if (uploadSettings.value.enable_cleaning && !uploadSettings.value.cleaning_provider_id) {
-      return true
+    if (
+      uploadSettings.value.enable_cleaning &&
+      !uploadSettings.value.cleaning_provider_id
+    ) {
+      return true;
     }
-    return false
+    return false;
   }
-  return true
-})
+  return true;
+});
 
 // 表格列
-const headers = [
-  { title: t('documents.name'), key: 'doc_name', sortable: true },
-  { title: t('documents.type'), key: 'file_type', sortable: true },
-  { title: t('documents.size'), key: 'file_size', sortable: true },
-  { title: t('documents.chunks'), key: 'chunk_count', sortable: true },
-  { title: t('documents.createdAt'), key: 'created_at', sortable: true },
-  { title: t('documents.actions'), key: 'actions', sortable: false, align: 'end' as const }
-]
+const headers = computed(() => [
+  { title: t("documents.name"), key: "doc_name", sortable: true },
+  { title: t("documents.type"), key: "file_type", sortable: true },
+  { title: t("documents.status"), key: "status", sortable: true },
+  { title: t("documents.size"), key: "file_size", sortable: true },
+  { title: t("documents.chunks"), key: "chunk_count", sortable: true },
+  { title: t("documents.createdAt"), key: "created_at", sortable: true },
+  {
+    title: t("documents.actions"),
+    key: "actions",
+    sortable: false,
+    align: "end" as const,
+  },
+]);
 
 // 加载文档列表
 const loadDocuments = async () => {
-  loading.value = true
+  loading.value = true;
   try {
-    const response = await axios.get('/api/kb/document/list', {
-      params: { kb_id: props.kbId }
-    })
-    if (response.data.status === 'ok') {
-      documents.value = response.data.data.items || []
+    const response = await axios.get("/api/kb/document/list", {
+      params: buildDocumentListParams({
+        kbId: props.kbId,
+        page: page.value,
+        pageSize: pageSize.value,
+        search: searchQuery.value || undefined,
+        status: selectedStatus.value,
+        sourceType: selectedSourceType.value,
+        allowedStatuses: documentFilterStatuses.value,
+        allowedSourceTypes: documentFilterSourceTypes.value,
+      }),
+    });
+    if (response.data.status === "ok") {
+      const uploadingDocs = documents.value.filter((doc) => doc.uploading);
+      const loadedDocs = applyActiveRebuildState(
+        response.data.data.items || [],
+        documents.value,
+      ).map((doc: any) => ({
+        ...doc,
+        selectable: !doc.uploading && !doc.rebuilding,
+      }));
+      const matchedTotal =
+        response.data.data.filtered_total ?? response.data.data.total ?? 0;
+      const unfilteredTotal =
+        response.data.data.document_count ?? response.data.data.total ?? 0;
+      documents.value = [...uploadingDocs, ...loadedDocs];
+      selectedDocumentRows.value = selectedDocumentRows.value.filter((doc) =>
+        loadedDocs.some((loadedDoc: any) => loadedDoc.doc_id === doc.doc_id),
+      );
+      backendMatchedDocuments.value = matchedTotal;
+      backendDocumentCount.value = unfilteredTotal;
+      const lastPage = Math.max(Math.ceil(matchedTotal / pageSize.value), 1);
+      if (loadedDocs.length === 0 && page.value > lastPage) {
+        page.value = lastPage;
+      }
+    } else {
+      showSnackbar(response.data.message || t("documents.loadFailed"), "error");
     }
   } catch (error) {
-    console.error('Failed to load documents:', error)
-    showSnackbar('加载文档列表失败', 'error')
+    console.error("Failed to load documents:", error);
+    showSnackbar(t("documents.loadFailed"), "error");
   } finally {
-    loading.value = false
+    loading.value = false;
   }
-}
+};
+
+watch([searchQuery, selectedStatus, selectedSourceType], () => {
+  page.value = 1;
+  loadDocuments();
+});
+
+watch(capabilities, () => {
+  if (!hasKnownDocumentFilterCapabilities.value) {
+    return;
+  }
+  let shouldReload = false;
+  if (
+    selectedStatus.value &&
+    !documentFilterStatuses.value.includes(selectedStatus.value)
+  ) {
+    selectedStatus.value = null;
+    shouldReload = true;
+  }
+  if (
+    selectedSourceType.value &&
+    !documentFilterSourceTypes.value.includes(selectedSourceType.value)
+  ) {
+    selectedSourceType.value = null;
+    shouldReload = true;
+  }
+  if (shouldReload) {
+    page.value = 1;
+    loadDocuments();
+  }
+});
+
+const openFilePicker = () => {
+  if (uploading.value) {
+    return;
+  }
+  fileInput.value?.click();
+};
 
 // 文件选择
 const handleFileSelect = (event: Event) => {
-  const target = event.target as HTMLInputElement
+  if (uploading.value) {
+    return;
+  }
+  const target = event.target as HTMLInputElement;
   if (target.files && target.files.length > 0) {
-    const newFiles = Array.from(target.files)
-    addFiles(newFiles)
+    const newFiles = Array.from(target.files);
+    addFiles(newFiles);
   }
-  target.value = ''
-}
+  target.value = "";
+};
 
 // 添加文件（检查数量限制）
 const addFiles = (files: File[]) => {
-  const totalFiles = selectedFiles.value.length + files.length
-  if (totalFiles > 10) {
-    showSnackbar('最多只能选择 10 个文件', 'warning')
-    return
+  const totalFiles = selectedFiles.value.length + files.length;
+  if (
+    maxFilesPerUpload.value !== null &&
+    totalFiles > maxFilesPerUpload.value
+  ) {
+    showSnackbar(
+      t("upload.maxFilesWarning", { count: maxFilesPerUpload.value }),
+      "warning",
+    );
+    return;
   }
-  selectedFiles.value.push(...files)
-}
+  const acceptedFiles: File[] = [];
+  const rejectedFiles: string[] = [];
+  files.forEach((file) => {
+    const extension = getFileExtension(file.name);
+    if (
+      allowedExtensions.value.size > 0 &&
+      !allowedExtensions.value.has(extension)
+    ) {
+      rejectedFiles.push(t("upload.unsupportedFile", { name: file.name }));
+      return;
+    }
+    if (maxFileSize.value !== null && file.size > maxFileSize.value) {
+      rejectedFiles.push(
+        t("upload.fileTooLarge", {
+          name: file.name,
+          size: formatFileSize(maxFileSize.value),
+        }),
+      );
+      return;
+    }
+    acceptedFiles.push(file);
+  });
+  if (rejectedFiles.length > 0) {
+    showSnackbar(t("upload.someFilesRejected"), "warning", rejectedFiles);
+  }
+  selectedFiles.value.push(...acceptedFiles);
+};
 
 // 移除文件
 const removeFile = (index: number) => {
-  selectedFiles.value.splice(index, 1)
-}
+  selectedFiles.value.splice(index, 1);
+};
 
 // 拖放上传
 const handleDrop = (event: DragEvent) => {
-  isDragging.value = false
+  isDragging.value = false;
+  if (uploading.value) {
+    return;
+  }
   if (event.dataTransfer?.files && event.dataTransfer.files.length > 0) {
-    const newFiles = Array.from(event.dataTransfer.files)
-    addFiles(newFiles)
+    const newFiles = Array.from(event.dataTransfer.files);
+    addFiles(newFiles);
   }
-}
+};
 
 // 上传调度器
 const startUpload = async () => {
-  if (uploadMode.value === 'file') {
-    await uploadFiles()
-  } else if (uploadMode.value === 'url') {
-    await uploadFromUrl()
+  if (!isUploadSettingsValid()) {
+    showSnackbar(t("upload.invalidSettings"), "warning");
+    return;
   }
-}
+  if (uploadMode.value === "file") {
+    await uploadFiles();
+  } else if (uploadMode.value === "url" && supportsUrlImport.value) {
+    await uploadFromUrl();
+  }
+};
 
 // 上传文件
 const uploadFiles = async () => {
   if (selectedFiles.value.length === 0) {
-    showSnackbar(t('upload.fileRequired'), 'warning')
-    return
+    showSnackbar(t("upload.fileRequired"), "warning");
+    return;
   }
 
-  uploading.value = true
+  uploading.value = true;
 
   try {
-    const formData = new FormData()
+    const formData = new FormData();
 
     // 添加所有文件
     selectedFiles.value.forEach((file, index) => {
-      formData.append(`file${index}`, file)
-    })
+      formData.append(`file${index}`, file);
+    });
 
-    formData.append('kb_id', props.kbId)
-    if (uploadSettings.value.chunk_size) {
-      formData.append('chunk_size', uploadSettings.value.chunk_size.toString())
+    formData.append("kb_id", props.kbId);
+    if (uploadSettings.value.chunk_size !== null) {
+      formData.append("chunk_size", uploadSettings.value.chunk_size.toString());
+    }
+    if (uploadSettings.value.chunk_overlap !== null) {
+      formData.append(
+        "chunk_overlap",
+        uploadSettings.value.chunk_overlap.toString(),
+      );
+    }
+    if (uploadSettings.value.batch_size !== null) {
+      formData.append("batch_size", uploadSettings.value.batch_size.toString());
     }
-    if (uploadSettings.value.chunk_overlap) {
-      formData.append('chunk_overlap', uploadSettings.value.chunk_overlap.toString())
+    if (uploadSettings.value.tasks_limit !== null) {
+      formData.append(
+        "tasks_limit",
+        uploadSettings.value.tasks_limit.toString(),
+      );
+    }
+    if (uploadSettings.value.max_retries !== null) {
+      formData.append(
+        "max_retries",
+        uploadSettings.value.max_retries.toString(),
+      );
     }
-    formData.append('batch_size', uploadSettings.value.batch_size.toString())
-    formData.append('tasks_limit', uploadSettings.value.tasks_limit.toString())
-    formData.append('max_retries', uploadSettings.value.max_retries.toString())
 
-    const response = await axios.post('/api/kb/document/upload', formData)
+    const response = await axios.post("/api/kb/document/upload", formData);
 
-    if (response.data.status === 'ok') {
-      const result = response.data.data
-      const taskId = result.task_id
+    if (response.data.status === "ok") {
+      const result = response.data.data;
+      const taskId = result.task_id;
 
-      showSnackbar(`正在后台上传 ${result.file_count} 个文件...`, 'info')
+      showSnackbar(
+        t("upload.backgroundUploading", { count: result.file_count }),
+        "info",
+      );
 
       // 为每个文件添加占位条目到文档列表
       const uploadingDocs = selectedFiles.value.map((file, index) => ({
         doc_id: `uploading_${taskId}_${index}`,
         doc_name: file.name,
-        file_type: file.name.split('.').pop() || '',
+        file_type: file.name.split(".").pop() || "",
         file_size: file.size,
         chunk_count: 0,
         created_at: new Date().toISOString(),
         uploading: true,
         taskId: taskId,
         uploadProgress: {
-          stage: 'waiting',
+          stage: "waiting",
           current: 0,
-          total: 100
-        }
-      }))
+          total: 100,
+        },
+        selectable: false,
+      }));
 
       // 添加到文档列表顶部
-      documents.value = [...uploadingDocs, ...documents.value]
+      page.value = 1;
+      documents.value = [...uploadingDocs, ...documents.value];
 
       // 关闭对话框
-      closeUploadDialog()
+      closeUploadDialog(true);
 
-      // 开始轮询进度
       if (taskId) {
-        startProgressPolling(taskId)
+        startProgressPolling(taskId, "upload");
       }
     } else {
-      showSnackbar(response.data.message || t('documents.uploadFailed'), 'error')
+      showSnackbar(
+        response.data.message || t("documents.uploadFailed"),
+        "error",
+      );
     }
-  } catch (error) {
-    console.error('Failed to upload document:', error)
-    showSnackbar(t('documents.uploadFailed'), 'error')
+  } catch (error: any) {
+    console.error("Failed to upload document:", error);
+    const message =
+      error.response?.data?.message || t("documents.uploadFailed");
+    showSnackbar(message, "error");
   } finally {
-    uploading.value = false
+    uploading.value = false;
   }
-}
+};
 
 // 从 URL 上传
 const uploadFromUrl = async () => {
+  if (!supportsUrlImport.value) {
+    showSnackbar(t("upload.unsupportedUrlImport"), "warning");
+    uploadMode.value = "file";
+    return;
+  }
   if (!uploadUrl.value) {
-    showSnackbar(t('upload.urlRequired'), 'warning')
-    return
+    showSnackbar(t("upload.urlRequired"), "warning");
+    return;
   }
 
-  uploading.value = true
+  uploading.value = true;
 
   try {
     const payload: any = {
       kb_id: props.kbId,
       url: uploadUrl.value,
-      batch_size: uploadSettings.value.batch_size,
-      tasks_limit: uploadSettings.value.tasks_limit,
-      max_retries: uploadSettings.value.max_retries
+    };
+    if (uploadSettings.value.batch_size !== null) {
+      payload.batch_size = uploadSettings.value.batch_size;
+    }
+    if (uploadSettings.value.tasks_limit !== null) {
+      payload.tasks_limit = uploadSettings.value.tasks_limit;
+    }
+    if (uploadSettings.value.max_retries !== null) {
+      payload.max_retries = uploadSettings.value.max_retries;
     }
-    if (uploadSettings.value.chunk_size) {
-      payload.chunk_size = uploadSettings.value.chunk_size
+    if (uploadSettings.value.chunk_size !== null) {
+      payload.chunk_size = uploadSettings.value.chunk_size;
     }
-    if (uploadSettings.value.chunk_overlap) {
-      payload.chunk_overlap = uploadSettings.value.chunk_overlap
+    if (uploadSettings.value.chunk_overlap !== null) {
+      payload.chunk_overlap = uploadSettings.value.chunk_overlap;
     }
     if (uploadSettings.value.enable_cleaning) {
-      payload.enable_cleaning = true
+      payload.enable_cleaning = true;
       if (uploadSettings.value.cleaning_provider_id) {
-        payload.cleaning_provider_id = uploadSettings.value.cleaning_provider_id
+        payload.cleaning_provider_id =
+          uploadSettings.value.cleaning_provider_id;
       }
     }
 
+    const response = await axios.post("/api/kb/document/upload/url", payload);
 
-    const response = await axios.post('/api/kb/document/upload/url', payload)
+    if (response.data.status === "ok") {
+      const result = response.data.data;
+      const taskId = result.task_id;
 
-    if (response.data.status === 'ok') {
-      const result = response.data.data
-      const taskId = result.task_id
-
-      showSnackbar(`正在从 URL 后台提取内容...`, 'info')
+      showSnackbar(t("upload.backgroundUrlUploading"), "info");
 
       // 添加占位条目
       const uploadingDoc = {
         doc_id: `uploading_${taskId}_0`,
         doc_name: result.url,
-        file_type: 'url',
+        file_type: "url",
         file_size: 0, // URL has no size
         chunk_count: 0,
         created_at: new Date().toISOString(),
         uploading: true,
         taskId: taskId,
         uploadProgress: {
-          stage: 'waiting',
+          stage: "waiting",
           current: 0,
-          total: 100
-        }
-      }
+          total: 100,
+        },
+        selectable: false,
+      };
 
-      documents.value = [uploadingDoc, ...documents.value]
-      closeUploadDialog()
+      page.value = 1;
+      documents.value = [uploadingDoc, ...documents.value];
+      closeUploadDialog(true);
 
       if (taskId) {
-        startProgressPolling(taskId)
+        startProgressPolling(taskId, "upload");
       }
     } else {
-      showSnackbar(response.data.message || t('documents.uploadFailed'), 'error')
+      showSnackbar(
+        response.data.message || t("documents.uploadFailed"),
+        "error",
+      );
     }
   } catch (error: any) {
-    console.error('Failed to upload from URL:', error)
-    const message = error.response?.data?.message || t('documents.uploadFailed')
-    showSnackbar(message, 'error')
+    console.error("Failed to upload from URL:", error);
+    const message =
+      error.response?.data?.message || t("documents.uploadFailed");
+    showSnackbar(message, "error");
   } finally {
-    uploading.value = false
+    uploading.value = false;
   }
-}
+};
 
 // 开始轮询进度
-const startProgressPolling = (taskId: string) => {
-  // 如果已经在轮询，先停止
-  if (progressPollingInterval.value) {
-    stopProgressPolling()
+const startProgressPolling = (
+  taskId: string,
+  mode: "upload" | "rebuild" = "upload",
+) => {
+  if (progressPollingIntervals.has(taskId)) {
+    return;
   }
 
-  progressPollingInterval.value = window.setInterval(async () => {
+  const interval = window.setInterval(async () => {
     try {
-      const response = await axios.get('/api/kb/document/upload/progress', {
-        params: { task_id: taskId }
-      })
-
-      if (response.data.status === 'ok') {
-        const data = response.data.data
-        const status = data.status
-
-        if (status === 'processing' && data.progress) {
-          // 更新进度
-          const progress = data.progress
-          const fileIndex = progress.file_index || 0
-
-          // 更新对应文件的进度
-          documents.value = documents.value.map(doc => {
-            if (doc.taskId === taskId) {
-              const docIndex = parseInt(doc.doc_id.split('_').pop() || '0')
-              if (docIndex === fileIndex) {
-                return {
-                  ...doc,
-                  uploadProgress: {
-                    stage: progress.stage || 'waiting',
-                    current: progress.current || 0,
-                    total: progress.total || 100
-                  }
-                }
-              }
+      const response = await axios.get("/api/kb/document/upload/progress", {
+        params: { task_id: taskId },
+      });
+
+      if (response.data.status === "ok") {
+        const data = response.data.data;
+        const status = data.status;
+
+        if (status === "processing" && data.progress) {
+          documents.value = applyDocumentTaskProgress(
+            documents.value,
+            taskId,
+            data.progress,
+          );
+        } else if (status === "completed" || status === "partial_failed") {
+          stopProgressPolling(taskId);
+
+          const result = data.result;
+          const successCount = result?.success_count || 0;
+          const failedCount = result?.failed_count || 0;
+          const failedDetails = (result?.failed || [])
+            .map((item: any) => item.error || item.file_name)
+            .filter(Boolean);
+          const failedReason =
+            data.error || failedDetails[0] || t("upload.unknownError");
+
+          documents.value = clearDocumentTaskState(documents.value, taskId);
+
+          await loadDocuments();
+          emit("refresh");
+
+          if (mode === "rebuild") {
+            if (failedCount === 0) {
+              showSnackbar(t("documents.rebuildSuccess"));
+            } else {
+              showSnackbar(
+                t("documents.rebuildPartialSuccess", {
+                  success: successCount,
+                  failed: failedCount,
+                }),
+                "warning",
+                failedDetails,
+              );
             }
-            return doc
-          })
-        } else if (status === 'completed') {
-          // 任务完成
-          stopProgressPolling()
-
-          const result = data.result
-          const successCount = result?.success_count || 0
-          const failedCount = result?.failed_count || 0
-
-          // 移除上传中的占位文档
-          documents.value = documents.value.filter(doc => doc.taskId !== taskId)
-
-          // 重新加载文档列表
-          await loadDocuments()
-          emit('refresh')
-
-          if (failedCount === 0) {
-            showSnackbar(`成功上传 ${successCount} 个文档`)
+          } else if (failedCount === 0) {
+            showSnackbar(t("upload.successCount", { count: successCount }));
+          } else if (successCount === 0) {
+            showSnackbar(
+              t("upload.failedWithReason", { reason: failedReason }),
+              "error",
+              failedDetails,
+            );
           } else {
-            showSnackbar(`上传完成: ${successCount} 个成功, ${failedCount} 个失败`, 'warning')
+            showSnackbar(
+              t("upload.partialSuccess", {
+                success: successCount,
+                failed: failedCount,
+              }),
+              "warning",
+              failedDetails,
+            );
           }
-        } else if (status === 'failed') {
-          // 任务失败
-          stopProgressPolling()
-
-          // 移除上传中的占位文档
-          documents.value = documents.value.filter(doc => doc.taskId !== taskId)
-
-          showSnackbar(`上传失败: ${data.error || '未知错误'}`, 'error')
+        } else if (status === "failed") {
+          stopProgressPolling(taskId);
+
+          documents.value = clearDocumentTaskState(documents.value, taskId);
+          await loadDocuments();
+          emit("refresh");
+
+          const failedDetails = (data.result?.failed || [])
+            .map((item: any) => item.error || item.file_name)
+            .filter(Boolean);
+          const reason =
+            data.error || failedDetails[0] || t("upload.unknownError");
+          showSnackbar(
+            mode === "rebuild"
+              ? t("documents.rebuildFailedWithReason", { reason })
+              : t("upload.failedWithReason", { reason }),
+            "error",
+            failedDetails,
+          );
         }
       } else {
-        // 任务不存在，停止轮询
-        stopProgressPolling()
-        documents.value = documents.value.filter(doc => doc.taskId !== taskId)
+        stopProgressPolling(taskId);
+        documents.value = clearDocumentTaskState(documents.value, taskId);
+        await loadDocuments();
+        emit("refresh");
       }
     } catch (error) {
-      console.error('Failed to fetch progress:', error)
+      console.error("Failed to fetch progress:", error);
       // 不立即停止，允许重试
     }
-  }, 500) // 每500ms轮询一次
-}
+  }, 1000);
+  progressPollingIntervals.set(taskId, interval);
+};
 
 // 停止轮询进度
-const stopProgressPolling = () => {
-  if (progressPollingInterval.value) {
-    clearInterval(progressPollingInterval.value)
-    progressPollingInterval.value = null
+const stopProgressPolling = (taskId: string) => {
+  const interval = progressPollingIntervals.get(taskId);
+  if (interval) {
+    clearInterval(interval);
+    progressPollingIntervals.delete(taskId);
   }
-}
+};
+
+const stopAllProgressPolling = () => {
+  progressPollingIntervals.forEach((interval) => clearInterval(interval));
+  progressPollingIntervals.clear();
+};
 
 // 获取上传百分比
 const getUploadPercentage = (item: any) => {
-  if (!item.uploadProgress) return 0
-  const { current, total } = item.uploadProgress
-  if (!total || total === 0) return 0
-  return (current / total) * 100
-}
+  if (!item.uploadProgress) return 0;
+  const { current, total } = item.uploadProgress;
+  if (!total || total === 0) return 0;
+  return (current / total) * 100;
+};
 
 // 获取阶段文本
 const getStageText = (stage: string) => {
   const stageMap: Record<string, string> = {
-    'waiting': '等待中...',
-    'extracting': '提取内容...',
-    'cleaning': '清洗内容...',
-    'parsing': '解析文档...',
-    'chunking': '文本分块...',
-    'embedding': '生成向量...'
-  }
-  return stageMap[stage] || stage
-}
+    waiting: t("upload.stages.waiting"),
+    extracting: t("upload.stages.extracting"),
+    cleaning: t("upload.stages.cleaning"),
+    parsing: t("upload.stages.parsing"),
+    chunking: t("upload.stages.chunking"),
+    embedding: t("upload.stages.embedding"),
+    rebuilding: t("upload.stages.rebuilding"),
+    completed: t("upload.stages.completed"),
+  };
+  return stageMap[stage] || stage;
+};
+
+const getDocumentStatusText = (status?: string) => {
+  const normalizedStatus = status || "ready";
+  const statusMap: Record<string, string> = {
+    pending: t("documents.statuses.pending"),
+    parsing: t("documents.statuses.parsing"),
+    chunking: t("documents.statuses.chunking"),
+    embedding: t("documents.statuses.embedding"),
+    ready: t("documents.statuses.ready"),
+    failed: t("documents.statuses.failed"),
+  };
+  return statusMap[normalizedStatus] || normalizedStatus;
+};
+
+const getDocumentStatusColor = (status?: string) => {
+  switch (status) {
+    case "failed":
+      return "error";
+    case "pending":
+      return "grey";
+    case "parsing":
+    case "chunking":
+    case "embedding":
+      return "warning";
+    case "ready":
+    default:
+      return "success";
+  }
+};
+
+const getSourceTypeText = (sourceType?: string) => {
+  const normalizedSourceType = sourceType || "file";
+  const sourceTypeMap: Record<string, string> = {
+    file: t("documents.sourceTypes.file"),
+    url: t("documents.sourceTypes.url"),
+    import: t("documents.sourceTypes.import"),
+  };
+  return sourceTypeMap[normalizedSourceType] || normalizedSourceType;
+};
+
+const getFailureLabels = () => ({
+  document: t("documents.failureDocument"),
+  documentId: t("documents.failureDocumentId"),
+  stage: t("documents.failureStage"),
+  message: t("documents.failureMessage"),
+  unknownStage: t("documents.unknownFailureStage"),
+  noErrorMessage: t("documents.noFailureMessage"),
+});
+
+const getFailureSummary = (doc: any) =>
+  getDocumentFailureSummary(doc, getFailureLabels());
+
+const copyFailureDetails = async (doc: any) => {
+  const copied = await copyToClipboard(
+    buildDocumentFailureText(doc, getFailureLabels()),
+  );
+  showSnackbar(
+    copied
+      ? t("documents.copyFailureSuccess")
+      : t("documents.copyFailureFailed"),
+    copied ? "success" : "error",
+  );
+};
+
+const confirmRebuild = (doc: any) => {
+  if (!canRebuild(doc)) {
+    return;
+  }
+  rebuildTarget.value = doc;
+  showRebuildDialog.value = true;
+};
+
+const rebuildDocument = async () => {
+  const doc = rebuildTarget.value;
+  if (!canRebuild(doc)) {
+    return;
+  }
+  updateRebuildingDocIds(doc.doc_id, true);
+  try {
+    const response = await axios.post("/api/kb/document/rebuild", {
+      doc_id: doc.doc_id,
+      kb_id: props.kbId,
+      background: true,
+    });
+    if (response.data.status === "ok") {
+      const taskId = response.data.data?.task_id;
+      if (taskId) {
+        documents.value = markDocumentRebuildStarted(
+          documents.value,
+          doc.doc_id,
+          taskId,
+        );
+        showSnackbar(t("documents.rebuildStarted"), "info");
+        startProgressPolling(taskId, "rebuild");
+        showRebuildDialog.value = false;
+        rebuildTarget.value = null;
+      } else {
+        showSnackbar(t("documents.rebuildSuccess"));
+        showRebuildDialog.value = false;
+        rebuildTarget.value = null;
+        await loadDocuments();
+        emit("refresh");
+      }
+    } else {
+      showSnackbar(
+        response.data.message || t("documents.rebuildFailed"),
+        "error",
+      );
+    }
+  } catch (error) {
+    console.error("Failed to rebuild document:", error);
+    showSnackbar(t("documents.rebuildFailed"), "error");
+  } finally {
+    updateRebuildingDocIds(doc.doc_id, false);
+  }
+};
 
 // 关闭上传对话框
-const closeUploadDialog = () => {
-  showUploadDialog.value = false
-  selectedFiles.value = []
-  uploadUrl.value = ''
-  uploadMode.value = 'file'
-  initUploadSettings()
-}
+const closeUploadDialog = (force = false) => {
+  if (uploading.value && !force) {
+    return;
+  }
+  showUploadDialog.value = false;
+  selectedFiles.value = [];
+  uploadUrl.value = "";
+  uploadMode.value = "file";
+  initUploadSettings();
+};
+
+watch(supportsUrlImport, (supported) => {
+  if (!supported && uploadMode.value === "url") {
+    uploadMode.value = "file";
+  }
+});
 
 // 查看文档
 const viewDocument = (doc: any) => {
+  if (doc.uploading) return;
   router.push({
-    name: 'NativeDocumentDetail',
-    params: { kbId: props.kbId, docId: doc.doc_id }
-  })
-}
+    name: "NativeDocumentDetail",
+    params: { kbId: props.kbId, docId: doc.doc_id },
+  });
+};
 
 // 确认删除
 const confirmDelete = (doc: any) => {
-  deleteTarget.value = doc
-  showDeleteDialog.value = true
-}
+  if (doc.uploading) return;
+  deleteTarget.value = doc;
+  showDeleteDialog.value = true;
+};
 
 // 删除文档
 const deleteDocument = async () => {
-  if (!deleteTarget.value) return
+  if (!deleteTarget.value) return;
 
-  deleting.value = true
+  deleting.value = true;
   try {
-    const response = await axios.post('/api/kb/document/delete', {
+    const response = await axios.post("/api/kb/document/delete", {
       doc_id: deleteTarget.value.doc_id,
-      kb_id: props.kbId
-    })
-
-    if (response.data.status === 'ok') {
-      showSnackbar(t('documents.deleteSuccess'))
-      showDeleteDialog.value = false
-      await loadDocuments()
-      emit('refresh')
+      kb_id: props.kbId,
+    });
+
+    if (response.data.status === "ok") {
+      showSnackbar(t("documents.deleteSuccess"));
+      showDeleteDialog.value = false;
+      await loadDocuments();
+      emit("refresh");
     } else {
-      showSnackbar(response.data.message || t('documents.deleteFailed'), 'error')
+      showSnackbar(
+        response.data.message || t("documents.deleteFailed"),
+        "error",
+      );
     }
   } catch (error) {
-    console.error('Failed to delete document:', error)
-    showSnackbar(t('documents.deleteFailed'), 'error')
+    console.error("Failed to delete document:", error);
+    showSnackbar(t("documents.deleteFailed"), "error");
   } finally {
-    deleting.value = false
+    deleting.value = false;
   }
-}
+};
+
+const confirmBatchDelete = () => {
+  if (!batchDeleteState.value.canDelete) {
+    if (batchDeleteState.value.exceedsLimit && batchDeleteState.value.limit) {
+      showSnackbar(
+        t("documents.batchDeleteLimitExceeded", {
+          limit: batchDeleteState.value.limit,
+        }),
+        "warning",
+      );
+    }
+    return;
+  }
+  showBatchDeleteDialog.value = true;
+};
+
+const batchDeleteDocuments = async () => {
+  if (!batchDeleteState.value.canDelete) return;
+
+  const deletingCount = batchDeleteState.value.selectedCount;
+  batchDeleting.value = true;
+  try {
+    const response = await axios.post("/api/kb/document/batch-delete", {
+      kb_id: props.kbId,
+      doc_ids: batchDeleteState.value.selectedIds,
+    });
+
+    if (response.data.status === "ok") {
+      const data = response.data.data || {};
+      showBatchDeleteDialog.value = false;
+      selectedDocumentRows.value = [];
+      if (data.failed_count > 0) {
+        showSnackbar(
+          t("documents.batchDeletePartialSuccess", {
+            success: data.success_count || 0,
+            failed: data.failed_count || 0,
+          }),
+          "warning",
+        );
+      } else {
+        showSnackbar(
+          t("documents.batchDeleteSuccess", {
+            count: data.success_count ?? deletingCount,
+          }),
+        );
+      }
+      await loadDocuments();
+      emit("refresh");
+    } else {
+      showSnackbar(
+        response.data.message || t("documents.batchDeleteFailed"),
+        "error",
+      );
+    }
+  } catch (error) {
+    console.error("Failed to batch delete documents:", error);
+    showSnackbar(t("documents.batchDeleteFailed"), "error");
+  } finally {
+    batchDeleting.value = false;
+  }
+};
+
+const confirmBatchRebuild = () => {
+  if (!batchRebuildState.value.canRebuild) {
+    if (batchRebuildState.value.exceedsLimit && batchRebuildState.value.limit) {
+      showSnackbar(
+        t("documents.batchRebuildLimitExceeded", {
+          limit: batchRebuildState.value.limit,
+        }),
+        "warning",
+      );
+    }
+    return;
+  }
+  showBatchRebuildDialog.value = true;
+};
+
+const batchRebuildDocuments = async () => {
+  if (!batchRebuildState.value.canRebuild) return;
+
+  const rebuildingIds = batchRebuildState.value.selectedIds.filter(
+    (docId): docId is string => typeof docId === "string" && docId.length > 0,
+  );
+  if (!rebuildingIds.length) {
+    return;
+  }
+  batchRebuilding.value = true;
+  rebuildingIds.forEach((docId) => updateRebuildingDocIds(docId, true));
+  try {
+    const response = await axios.post("/api/kb/document/batch-rebuild", {
+      kb_id: props.kbId,
+      doc_ids: rebuildingIds,
+    });
+
+    if (response.data.status === "ok") {
+      const taskId = response.data.data?.task_id;
+      showBatchRebuildDialog.value = false;
+      selectedDocumentRows.value = [];
+      if (taskId) {
+        documents.value = markDocumentsRebuildStarted(
+          documents.value,
+          rebuildingIds,
+          taskId,
+        );
+        showSnackbar(
+          t("documents.batchRebuildStarted", {
+            count: rebuildingIds.length,
+          }),
+          "info",
+        );
+        startProgressPolling(taskId, "rebuild");
+      } else {
+        showSnackbar(t("documents.rebuildStarted"), "info");
+        await loadDocuments();
+        emit("refresh");
+      }
+    } else {
+      showSnackbar(
+        response.data.message || t("documents.batchRebuildFailed"),
+        "error",
+      );
+    }
+  } catch (error) {
+    console.error("Failed to batch rebuild documents:", error);
+    showSnackbar(t("documents.batchRebuildFailed"), "error");
+  } finally {
+    rebuildingIds.forEach((docId) => updateRebuildingDocIds(docId, false));
+    batchRebuilding.value = false;
+  }
+};
 
 // 工具函数
 const getFileIcon = (fileType: string) => {
-  const type = fileType?.toLowerCase() || ''
-  if (type.includes('pdf')) return 'mdi-file-pdf-box'
-  if (type.includes('epub')) return 'mdi-book-open-page-variant'
-  if (type.includes('rst') || type.includes('adoc')) return 'mdi-file-document-outline'
-  if (type.includes('md') || type.includes('markdown')) return 'mdi-language-markdown'
-  if (type.includes('txt')) return 'mdi-file-document-outline'
-  if (type.includes('url')) return 'mdi-link-variant'
-  return 'mdi-file'
-}
+  const type = fileType?.toLowerCase() || "";
+  if (type.includes("pdf")) return "mdi-file-pdf-box";
+  if (type.includes("epub")) return "mdi-book-open-page-variant";
+  if (type.includes("rst") || type.includes("adoc"))
+    return "mdi-file-document-outline";
+  if (type.includes("md") || type.includes("markdown"))
+    return "mdi-language-markdown";
+  if (type.includes("txt")) return "mdi-file-document-outline";
+  if (type.includes("url")) return "mdi-link-variant";
+  return "mdi-file";
+};
+
+const getFileExtension = (fileName: string) =>
+  fileName.includes(".") ? fileName.split(".").pop()?.toLowerCase() || "" : "";
 
 const getFileColor = (fileType: string) => {
-  const type = fileType?.toLowerCase() || ''
-  if (type.includes('pdf')) return 'error'
-  if (type.includes('epub')) return 'warning'
-  if (type.includes('rst') || type.includes('adoc')) return 'success'
-  if (type.includes('md')) return 'info'
-  if (type.includes('txt')) return 'success'
-  if (type.includes('url')) return 'primary'
-  return 'grey'
-}
+  const type = fileType?.toLowerCase() || "";
+  if (type.includes("pdf")) return "error";
+  if (type.includes("epub")) return "warning";
+  if (type.includes("rst") || type.includes("adoc")) return "success";
+  if (type.includes("md")) return "info";
+  if (type.includes("txt")) return "success";
+  if (type.includes("url")) return "primary";
+  return "grey";
+};
 
 const formatFileSize = (bytes: number) => {
-  if (!bytes) return '-'
-  const units = ['B', 'KB', 'MB', 'GB']
-  let size = bytes
-  let unitIndex = 0
+  if (!bytes) return "-";
+  const units = ["B", "KB", "MB", "GB"];
+  let size = bytes;
+  let unitIndex = 0;
   while (size >= 1024 && unitIndex < units.length - 1) {
-    size /= 1024
-    unitIndex++
+    size /= 1024;
+    unitIndex++;
   }
-  return `${size.toFixed(2)} ${units[unitIndex]}`
-}
+  return `${size.toFixed(2)} ${units[unitIndex]}`;
+};
 
 const formatDate = (dateStr: string) => {
-  if (!dateStr) return '-'
-  return new Date(dateStr).toLocaleString('zh-CN', {
-    year: 'numeric',
-    month: '2-digit',
-    day: '2-digit',
-    hour: '2-digit',
-    minute: '2-digit'
-  })
-}
+  if (!dateStr) return "-";
+  return new Date(dateStr).toLocaleString(locale.value, {
+    year: "numeric",
+    month: "2-digit",
+    day: "2-digit",
+    hour: "2-digit",
+    minute: "2-digit",
+  });
+};
 
 // 加载LLM providers
 const loadLlmProviders = async () => {
   try {
-    const response = await axios.get('/api/config/provider/list', {
-      params: { provider_type: 'chat_completion' }
-    })
-    if (response.data.status === 'ok') {
-      llmProviders.value = response.data.data
+    const response = await axios.get("/api/config/provider/list", {
+      params: { provider_type: "chat_completion" },
+    });
+    if (response.data.status === "ok") {
+      llmProviders.value = response.data.data;
     }
   } catch (error) {
-    console.error('Failed to load LLM providers:', error)
+    console.error("Failed to load LLM providers:", error);
   }
-}
+};
 
 // 检查Tavily Key配置
 const checkTavilyConfig = async () => {
-  tavilyConfigStatus.value = 'loading'
+  tavilyConfigStatus.value = "loading";
   try {
-    const response = await axios.get('/api/config/abconf', {
-      params: { id: 'default' }
-    })
-    if (response.data.status === 'ok') {
-      const config = response.data.data.config
-      const tavilyKeys = config?.provider_settings?.websearch_tavily_key
-      if (Array.isArray(tavilyKeys) && tavilyKeys.length > 0 && tavilyKeys.some(key => key.trim() !== '')) {
-        tavilyConfigStatus.value = 'configured'
+    const response = await axios.get("/api/config/abconf", {
+      params: { id: "default" },
+    });
+    if (response.data.status === "ok") {
+      const config = response.data.data.config;
+      const tavilyKeys = config?.provider_settings?.websearch_tavily_key;
+      if (
+        Array.isArray(tavilyKeys) &&
+        tavilyKeys.length > 0 &&
+        tavilyKeys.some((key) => key.trim() !== "")
+      ) {
+        tavilyConfigStatus.value = "configured";
       } else {
-        tavilyConfigStatus.value = 'not_configured'
+        tavilyConfigStatus.value = "not_configured";
       }
     } else {
-      tavilyConfigStatus.value = 'error'
+      tavilyConfigStatus.value = "error";
     }
   } catch (error) {
-    console.warn('Failed to check Tavily key config:', error)
-    tavilyConfigStatus.value = 'error'
+    console.warn("Failed to check Tavily key config:", error);
+    tavilyConfigStatus.value = "error";
   }
-}
+};
 
 const onTavilyKeySet = () => {
-  showSnackbar('Tavily API Key 配置成功', 'success')
-  checkTavilyConfig()
-}
+  showSnackbar(t("upload.tavilyConfigured"), "success");
+  checkTavilyConfig();
+};
 
 onMounted(() => {
-  loadDocuments()
-  loadLlmProviders()
-  checkTavilyConfig()
-})
+  loadCapabilities().then(() => {
+    initUploadSettings();
+    pageSize.value = paginationConfig.value.defaultDocumentPageSize;
+    loadDocuments();
+  });
+  loadLlmProviders();
+  checkTavilyConfig();
+});
 
 onUnmounted(() => {
-  stopProgressPolling()
-})
+  stopAllProgressPolling();
+});
 </script>
 
 <style scoped>
@@ -821,12 +2091,37 @@ onUnmounted(() => {
 
 .action-bar {
   display: flex;
-  justify-content: space-between;
+  justify-content: flex-start;
   align-items: center;
   gap: 16px;
   flex-wrap: wrap;
 }
 
+.document-filter-select {
+  max-width: 180px;
+  min-width: 150px;
+}
+
+.documents-filter-count {
+  min-width: fit-content;
+}
+
+.doc-name {
+  display: block;
+  max-width: 300px;
+  overflow: hidden;
+  text-overflow: ellipsis;
+  white-space: nowrap;
+}
+
+.doc-error {
+  max-width: 320px;
+  color: rgb(var(--v-theme-error));
+  overflow: hidden;
+  text-overflow: ellipsis;
+  white-space: nowrap;
+}
+
 .upload-dropzone {
   border: 2px dashed rgba(var(--v-theme-primary), 0.3);
   border-radius: 12px;
@@ -844,6 +2139,12 @@ onUnmounted(() => {
   transform: scale(1.02);
 }
 
+.upload-dropzone.disabled {
+  cursor: not-allowed;
+  opacity: 0.7;
+  transform: none;
+}
+
 .files-list {
   max-height: 300px;
   overflow-y: auto;
@@ -863,7 +2164,7 @@ onUnmounted(() => {
     align-items: stretch;
   }
 
-  .action-bar>* {
+  .action-bar > * {
     width: 100%;
   }
 }
diff --git a/dashboard/src/views/knowledge-base/components/RetrievalTab.vue b/dashboard/src/views/knowledge-base/components/RetrievalTab.vue
index 351e4f3cd6..da60b69852 100644
--- a/dashboard/src/views/knowledge-base/components/RetrievalTab.vue
+++ b/dashboard/src/views/knowledge-base/components/RetrievalTab.vue
@@ -1,25 +1,39 @@
 <template>
   <div class="retrieval-tab">
     <v-card variant="outlined">
-      <v-card-title class="pa-4 pb-0">{{ t('retrieval.title') }}</v-card-title>
+      <v-card-title class="pa-4 pb-0">{{ t("retrieval.title") }}</v-card-title>
       <v-card-subtitle class="pb-4 pt-2">
-        {{ t('retrieval.subtitle') }}
+        {{ t("retrieval.subtitle") }}
       </v-card-subtitle>
 
-      <v-progress-linear v-if="loading" indeterminate color="primary" height="2" />
+      <v-progress-linear
+        v-if="loading"
+        indeterminate
+        color="primary"
+        height="2"
+      />
 
       <v-card-text class="pa-6">
-        <!-- 查询输入区域 -->
         <v-row class="mb-4">
           <v-col cols="12" md="8">
-            <v-textarea v-model="query" :label="t('retrieval.query')" :placeholder="t('retrieval.queryPlaceholder')"
-              variant="outlined" rows="3" auto-grow clearable />
+            <v-textarea
+              v-model="query"
+              :label="t('retrieval.query')"
+              :placeholder="t('retrieval.queryPlaceholder')"
+              variant="outlined"
+              rows="3"
+              auto-grow
+              clearable
+            />
 
-            <!-- debug -->
             <div v-if="debugVisualize" class="mt-2">
               <v-card variant="outlined">
-                <v-img :src="`data:image/png;base64,${debugVisualize}`" :alt="t('retrieval.tsneVisualization')" cover>
-                  <template v-slot:placeholder>
+                <v-img
+                  :src="`data:image/png;base64,${debugVisualize}`"
+                  :alt="t('retrieval.tsneVisualization')"
+                  contain
+                >
+                  <template #placeholder>
                     <div class="d-flex align-center justify-center fill-height">
                       <v-progress-circular indeterminate color="primary" />
                     </div>
@@ -28,19 +42,52 @@
               </v-card>
             </div>
           </v-col>
+
           <v-col cols="12" md="4">
             <v-card variant="outlined" class="pa-4">
-              <h4 class="text-subtitle-2 mb-3">{{ t('retrieval.settings') }}</h4>
+              <h4 class="text-subtitle-2 mb-3">
+                {{ t("retrieval.settings") }}
+              </h4>
 
-              <v-text-field v-model.number="topK" :label="t('retrieval.topK')" :hint="t('retrieval.topKHint')"
-                type="number" variant="outlined" density="compact" persistent-hint class="mb-3" />
+              <v-text-field
+                v-model.number="topK"
+                :label="t('retrieval.topK')"
+                :hint="t('retrieval.topKHint')"
+                type="number"
+                variant="outlined"
+                density="compact"
+                persistent-hint
+                class="mb-3"
+                :rules="topKRules"
+              />
 
-              <v-switch v-model="debugMode" :label="t('retrieval.debugMode')" color="primary" density="compact"
-                hide-details>
-                <template v-slot:label>
+              <v-switch
+                v-model="debugMode"
+                color="primary"
+                density="compact"
+                hide-details
+              >
+                <template #label>
                   <span class="text-caption">
                     <v-icon size="small" class="mr-1">mdi-bug</v-icon>
-                    Debug (t-SNE)
+                    {{ t("retrieval.debugModeTsne") }}
+                  </span>
+                </template>
+              </v-switch>
+
+              <v-switch
+                v-model="traceMode"
+                color="primary"
+                density="compact"
+                hide-details
+                class="mt-1"
+              >
+                <template #label>
+                  <span class="text-caption">
+                    <v-icon size="small" class="mr-1">
+                      mdi-chart-timeline-variant
+                    </v-icon>
+                    {{ t("retrieval.traceMode") }}
                   </span>
                 </template>
               </v-switch>
@@ -48,49 +95,215 @@
           </v-col>
         </v-row>
 
-        <div class="d-flex justify-end mb-4">
-          <v-btn prepend-icon="mdi-magnify" color="primary" variant="elevated" @click="performRetrieval"
-            :loading="loading" :disabled="!query || query.trim() === ''">
-            {{ loading ? t('retrieval.searching') : t('retrieval.search') }}
+        <div class="d-flex justify-end mb-4 ga-2 flex-wrap">
+          <v-btn
+            prepend-icon="mdi-magnify"
+            color="primary"
+            variant="elevated"
+            :loading="loading"
+            :disabled="!query || query.trim() === ''"
+            @click="performRetrieval"
+          >
+            {{ loading ? t("retrieval.searching") : t("retrieval.search") }}
           </v-btn>
         </div>
 
-        <!-- 检索结果 -->
         <div v-if="hasSearched" class="results-section">
           <div class="d-flex align-center mb-4">
-            <h3 class="text-h6">{{ t('retrieval.results') }}</h3>
+            <h3 class="text-h6">{{ t("retrieval.results") }}</h3>
             <v-chip class="ml-3" color="primary" variant="tonal" size="small">
-              {{ results.length }} {{ t('retrieval.results') }}
+              {{ results.length }} {{ t("retrieval.results") }}
             </v-chip>
           </div>
 
-          <!-- 结果列表 -->
+          <div v-if="hasTrace" class="trace-section mb-4">
+            <div class="d-flex align-center mb-3 flex-wrap ga-2">
+              <h4 class="text-subtitle-1">{{ t("retrieval.traceTitle") }}</h4>
+              <v-chip color="info" variant="tonal" size="small">
+                {{ t("retrieval.traceStageCount", { count: traceStages.length }) }}
+              </v-chip>
+            </div>
+
+            <v-expansion-panels
+              v-model="expandedTraceStages"
+              multiple
+              variant="accordion"
+              class="trace-panels"
+            >
+              <v-expansion-panel
+                v-for="stage in traceStages"
+                :key="stage.key"
+                :value="stage.key"
+              >
+                <v-expansion-panel-title>
+                  <div class="trace-stage-title">
+                    <v-icon size="small">{{ stage.icon }}</v-icon>
+                    <span>{{ stage.label }}</span>
+                    <v-chip size="x-small" variant="tonal">
+                      {{ t("retrieval.traceHits", { count: stage.items.length }) }}
+                    </v-chip>
+                  </div>
+                </v-expansion-panel-title>
+
+                <v-expansion-panel-text>
+                  <div v-if="stage.items.length > 0" class="trace-list">
+                    <div
+                      v-for="(item, index) in stage.items"
+                      :key="traceItemKey(stage.key, item, index)"
+                      class="trace-item"
+                    >
+                      <div class="trace-item-header">
+                        <v-chip size="x-small" color="primary" variant="tonal">
+                          #{{ item.rank ?? index + 1 }}
+                        </v-chip>
+                        <v-chip
+                          size="x-small"
+                          variant="tonal"
+                          :disabled="!item.doc_id"
+                          @click="openTraceDocument(item)"
+                        >
+                          <v-icon start size="small">mdi-file-document</v-icon>
+                          {{ item.doc_name || t("retrieval.unknownDocument") }}
+                        </v-chip>
+                        <v-chip size="x-small" variant="tonal">
+                          <v-icon start size="small">mdi-text</v-icon>
+                          {{
+                            t("retrieval.chunk", {
+                              index: item.chunk_index ?? 0,
+                            })
+                          }}
+                        </v-chip>
+                        <v-spacer />
+                        <v-chip size="x-small" :color="getScoreColor(item.score)">
+                          {{ t("retrieval.score") }}:
+                          {{ formatScore(item.score) }}
+                        </v-chip>
+                      </div>
+
+                      <div class="trace-metrics">
+                        <span v-if="item.dense_rank">
+                          {{
+                            t("retrieval.traceDenseRank", {
+                              rank: item.dense_rank,
+                            })
+                          }}
+                        </span>
+                        <span v-if="item.sparse_rank">
+                          {{
+                            t("retrieval.traceSparseRank", {
+                              rank: item.sparse_rank,
+                            })
+                          }}
+                        </span>
+                        <span v-if="item.duplicate_of_chunk_id">
+                          {{
+                            t("retrieval.traceDuplicateOf", {
+                              chunk: item.duplicate_of_chunk_id,
+                            })
+                          }}
+                        </span>
+                        <span v-if="item.dedup_similarity !== undefined">
+                          {{
+                            t("retrieval.traceDedupSimilarity", {
+                              value: formatPercent(item.dedup_similarity),
+                            })
+                          }}
+                        </span>
+                        <v-chip
+                          v-for="chip in traceScoreChips(item)"
+                          :key="chip.key"
+                          size="x-small"
+                          variant="tonal"
+                        >
+                          {{ t(chip.labelKey) }}:
+                          {{ formatScore(chip.value) }}
+                        </v-chip>
+                        <span v-if="item.chunk_id">{{ item.chunk_id }}</span>
+                      </div>
+
+                      <div
+                        v-if="traceSourceChips(item).length > 0"
+                        class="source-chip-row mt-2"
+                      >
+                        <v-chip
+                          v-for="chip in traceSourceChips(item)"
+                          :key="chip.key"
+                          size="x-small"
+                          variant="tonal"
+                        >
+                          <v-icon start size="small">{{ chip.icon }}</v-icon>
+                          {{ formatSourceChipLabel(chip) }}
+                        </v-chip>
+                      </div>
+
+                      <div class="trace-preview">
+                        {{
+                          item.content_preview ||
+                          t("retrieval.tracePreviewEmpty")
+                        }}
+                      </div>
+                    </div>
+                  </div>
+
+                  <div v-else class="trace-empty">
+                    {{ t("retrieval.traceEmpty") }}
+                  </div>
+                </v-expansion-panel-text>
+              </v-expansion-panel>
+            </v-expansion-panels>
+          </div>
+
           <div v-if="results.length > 0" class="results-list">
-            <v-card v-for="(result, index) in results" :key="result.chunk_id" variant="outlined" class="mb-4">
+            <v-card
+              v-for="(result, index) in results"
+              :key="result.chunk_id"
+              variant="outlined"
+              class="mb-4"
+            >
               <v-card-title class="d-flex align-center pa-2">
                 <v-chip size="x-small" color="primary" class="mr-2">
                   #{{ index + 1 }}
                 </v-chip>
                 <span class="text-subtitle-1">
-                  {{ t('retrieval.chunk', { index: result.chunk_index }) }}
+                  {{ t("retrieval.chunk", { index: result.chunk_index }) }}
                 </span>
-                <div class="ml-4">
-                  <v-chip size="x-small" variant="tonal" class="mr-2">
+                <div class="ml-4 result-meta">
+                  <v-chip
+                    size="x-small"
+                    variant="tonal"
+                    class="mr-2"
+                    @click="openDocument(result)"
+                  >
                     <v-icon start size="small">mdi-file-document</v-icon>
                     {{ result.doc_name }}
                   </v-chip>
                   <v-chip size="x-small" variant="tonal">
                     <v-icon start size="small">mdi-text</v-icon>
-                    {{ t('retrieval.charCount', { count: result.char_count }) }}
+                    {{ t("retrieval.charCount", { count: result.char_count }) }}
                   </v-chip>
                 </div>
                 <v-spacer />
                 <v-chip size="x-small" :color="getScoreColor(result.score)">
-                  {{ t('retrieval.score') }}: {{ result.score.toFixed(4) }}
+                  {{ t("retrieval.score") }}: {{ formatScore(result.score) }}
                 </v-chip>
               </v-card-title>
 
               <v-card-text class="pa-4">
+                <div
+                  v-if="sourceChips(result.source).length > 0"
+                  class="source-chip-row mb-3"
+                >
+                  <v-chip
+                    v-for="chip in sourceChips(result.source)"
+                    :key="chip.key"
+                    size="x-small"
+                    variant="tonal"
+                  >
+                    <v-icon start size="small">{{ chip.icon }}</v-icon>
+                    {{ formatSourceChipLabel(chip) }}
+                  </v-chip>
+                </div>
+
                 <div class="content-box">
                   {{ result.content }}
                 </div>
@@ -98,17 +311,21 @@
             </v-card>
           </div>
 
-          <!-- 空结果 -->
           <div v-else class="text-center py-12">
-            <v-icon size="80" color="grey-lighten-2">mdi-text-box-search-outline</v-icon>
-            <p class="text-h6 mt-4 text-medium-emphasis">{{ t('retrieval.noResults') }}</p>
-            <p class="text-body-2 text-medium-emphasis">{{ t('retrieval.tryDifferentQuery') }}</p>
+            <v-icon size="80" color="grey-lighten-2">
+              mdi-text-box-search-outline
+            </v-icon>
+            <p class="text-h6 mt-4 text-medium-emphasis">
+              {{ t("retrieval.noResults") }}
+            </p>
+            <p class="text-body-2 text-medium-emphasis">
+              {{ t("retrieval.tryDifferentQuery") }}
+            </p>
           </div>
         </div>
       </v-card-text>
     </v-card>
 
-    <!-- 消息提示 -->
     <v-snackbar v-model="snackbar.show" :color="snackbar.color">
       {{ snackbar.text }}
     </v-snackbar>
@@ -116,84 +333,297 @@
 </template>
 
 <script setup lang="ts">
-import { ref } from 'vue'
-import axios from 'axios'
-import { useModuleI18n } from '@/i18n/composables'
+import { computed, onMounted, ref } from "vue";
+import { useRouter } from "vue-router";
+import axios from "axios";
+import { useModuleI18n } from "@/i18n/composables";
+import { useKnowledgeBaseCapabilities } from "../capabilities";
+import {
+  buildRetrievalSourceChips,
+  buildTraceScoreChips,
+  createDocumentChunkRouteLocation,
+} from "../knowledgeBaseUi.mjs";
 
-const { tm: t } = useModuleI18n('features/knowledge-base/detail')
+const { tm: t } = useModuleI18n("features/knowledge-base/detail");
+const router = useRouter();
 
 const props = defineProps<{
-  kbId: string,
-  kbName: string,
-}>()
-
-// 状态
-const loading = ref(false)
-const query = ref('')
-const topK = ref(5)
-const debugMode = ref(false)
-const results = ref<any[]>([])
-const hasSearched = ref(false)
-const debugVisualize = ref<string | null>(null)
+  kbId: string;
+  kbName: string;
+}>();
+const { capabilities, loadCapabilities } = useKnowledgeBaseCapabilities();
+
+type TraceStageKey =
+  | "dense"
+  | "sparse"
+  | "fusion"
+  | "dedup"
+  | "dedup_removed"
+  | "rerank"
+  | "final";
+
+interface RetrievalResult {
+  chunk_id: string;
+  doc_id: string;
+  kb_id: string;
+  kb_name: string;
+  doc_name: string;
+  chunk_index: number;
+  content: string;
+  score: number;
+  char_count: number;
+  source?: RetrievalSource;
+}
+
+interface RetrievalTraceItem {
+  rank?: number;
+  chunk_id?: string | null;
+  doc_id?: string | null;
+  doc_name?: string | null;
+  kb_id?: string | null;
+  kb_name?: string | null;
+  chunk_index?: number | null;
+  score?: number | null;
+  dense_rank?: number | null;
+  sparse_rank?: number | null;
+  dense_score?: number | null;
+  sparse_score?: number | null;
+  rrf_score?: number | null;
+  rerank_score?: number | null;
+  duplicate_of_chunk_id?: string | null;
+  duplicate_of_doc_id?: string | null;
+  dedup_similarity?: number | null;
+  stage?: string;
+  content_preview?: string | null;
+  title_path?: string[] | null;
+  page_number?: number | null;
+  section_index?: number | null;
+  parent_chunk_id?: string | null;
+}
+
+type RetrievalTrace = Record<TraceStageKey, RetrievalTraceItem[]>;
+
+interface RetrievalSource {
+  kb_name?: string | null;
+  document_name?: string | null;
+  chunk_index?: number | null;
+  section_index?: number | null;
+  title_path?: string[] | null;
+  page_number?: number | null;
+  parent_chunk_id?: string | null;
+}
+
+interface RetrievalSourceChip {
+  key: string;
+  icon: string;
+  label?: string;
+  labelKey?: string;
+  params?: Record<string, string | number>;
+}
+
+const emptyTrace = (): RetrievalTrace => ({
+  dense: [],
+  sparse: [],
+  fusion: [],
+  dedup: [],
+  dedup_removed: [],
+  rerank: [],
+  final: [],
+});
+
+const loading = ref(false);
+const query = ref("");
+const topK = ref<number | null>(null);
+const debugMode = ref(false);
+const traceMode = ref(false);
+const results = ref<RetrievalResult[]>([]);
+const hasSearched = ref(false);
+const debugVisualize = ref<string | null>(null);
+const retrievalTrace = ref<RetrievalTrace | null>(null);
+const expandedTraceStages = ref<TraceStageKey[]>(["fusion", "final"]);
+const maxRetrieveTopK = computed(
+  () => capabilities.value?.limits.max_retrieve_top_k ?? null,
+);
+
+const isValidTopK = (value: number | null) =>
+  value === null ||
+  (Number.isInteger(value) &&
+    value > 0 &&
+    (maxRetrieveTopK.value === null || value <= maxRetrieveTopK.value));
+const topKRules = [
+  (value: number | null) =>
+    isValidTopK(value) ||
+    t("validation.topKRange", { max: maxRetrieveTopK.value ?? "-" }),
+];
 
 const snackbar = ref({
   show: false,
-  text: '',
-  color: 'success'
-})
+  text: "",
+  color: "success",
+});
 
-const showSnackbar = (text: string, color: string = 'success') => {
-  snackbar.value.text = text
-  snackbar.value.color = color
-  snackbar.value.show = true
-}
+const showSnackbar = (text: string, color: string = "success") => {
+  snackbar.value.text = text;
+  snackbar.value.color = color;
+  snackbar.value.show = true;
+};
+
+const traceStageDefinitions: Array<{
+  key: TraceStageKey;
+  icon: string;
+}> = [
+  { key: "dense", icon: "mdi-vector-point" },
+  { key: "sparse", icon: "mdi-format-list-bulleted" },
+  { key: "fusion", icon: "mdi-call-merge" },
+  { key: "dedup", icon: "mdi-filter-variant-remove" },
+  { key: "dedup_removed", icon: "mdi-close-circle-outline" },
+  { key: "rerank", icon: "mdi-sort-descending" },
+  { key: "final", icon: "mdi-check-circle-outline" },
+];
+
+const hasTrace = computed(() => retrievalTrace.value !== null);
+const traceStages = computed(() => {
+  const trace = retrievalTrace.value ?? emptyTrace();
+  return traceStageDefinitions.map((stage) => ({
+    ...stage,
+    label: t(`retrieval.traceStages.${stage.key}`),
+    items: trace[stage.key] ?? [],
+  }));
+});
+
+const formatScore = (score?: number | null) =>
+  typeof score === "number" && Number.isFinite(score) ? score.toFixed(4) : "-";
+
+const formatPercent = (value?: number | null) =>
+  typeof value === "number" && Number.isFinite(value)
+    ? `${(value * 100).toFixed(1)}%`
+    : "-";
+
+const traceItemKey = (
+  stage: TraceStageKey,
+  item: RetrievalTraceItem,
+  index: number,
+) => `${stage}-${item.chunk_id || "chunk"}-${item.rank ?? index}`;
+
+const sourceChips = (source?: RetrievalSource | null) => {
+  return buildRetrievalSourceChips(source ?? {}) as RetrievalSourceChip[];
+};
+
+const formatSourceChipLabel = (chip: RetrievalSourceChip) => {
+  if (chip.label) return chip.label;
+  if (chip.labelKey) return t(chip.labelKey, chip.params ?? {});
+  return "";
+};
+
+const traceSourceChips = (item: RetrievalTraceItem) =>
+  sourceChips({
+    title_path: item.title_path,
+    page_number: item.page_number,
+    section_index: item.section_index,
+    parent_chunk_id: item.parent_chunk_id,
+  });
+
+const traceScoreChips = (item: RetrievalTraceItem) =>
+  buildTraceScoreChips(item) as Array<{
+    key: string;
+    labelKey: string;
+    value: number;
+  }>;
 
-// 执行检索
 const performRetrieval = async () => {
-  if (!query.value || query.value.trim() === '') {
-    showSnackbar(t('retrieval.queryRequired'), 'warning')
-    return
+  if (!query.value || query.value.trim() === "") {
+    showSnackbar(t("retrieval.queryRequired"), "warning");
+    return;
+  }
+  if (!isValidTopK(topK.value)) {
+    showSnackbar(
+      t("validation.topKRange", { max: maxRetrieveTopK.value ?? "-" }),
+      "warning",
+    );
+    return;
   }
 
-  loading.value = true
-  hasSearched.value = false
-  debugVisualize.value = null
+  loading.value = true;
+  debugVisualize.value = null;
+  retrievalTrace.value = null;
 
   try {
-    const response = await axios.post('/api/kb/retrieve', {
+    const payload: Record<string, any> = {
       query: query.value,
-      kb_names: [props.kbName],
-      top_k: topK.value,
-      debug: debugMode.value
-    })
+      kb_ids: [props.kbId],
+      debug: debugMode.value,
+      trace: traceMode.value,
+    };
+    if (topK.value !== null) {
+      payload.top_k = topK.value;
+    }
+    const response = await axios.post("/api/kb/retrieve", payload);
 
-    if (response.data.status === 'ok') {
-      results.value = response.data.data.results || []
-      hasSearched.value = true
+    if (response.data.status === "ok") {
+      results.value = response.data.data.results || [];
+      retrievalTrace.value = response.data.data.trace || null;
+      hasSearched.value = true;
 
       if (debugMode.value && response.data.data.visualization) {
-        debugVisualize.value = response.data.data.visualization
+        debugVisualize.value = response.data.data.visualization;
       }
 
-      showSnackbar(t('retrieval.searchSuccess', { count: results.value.length }))
+      showSnackbar(
+        t("retrieval.searchSuccess", { count: results.value.length }),
+      );
     } else {
-      showSnackbar(response.data.message || t('retrieval.searchFailed'), 'error')
+      showSnackbar(
+        response.data.message || t("retrieval.searchFailed"),
+        "error",
+      );
     }
   } catch (error) {
-    console.error('Retrieval failed:', error)
-    showSnackbar(t('retrieval.searchFailed'), 'error')
+    console.error("Retrieval failed:", error);
+    showSnackbar(t("retrieval.searchFailed"), "error");
   } finally {
-    loading.value = false
+    loading.value = false;
   }
-}
+};
 
-// 根据分数获取颜色
-const getScoreColor = (score: number) => {
-  if (score >= 0.8) return 'success'
-  if (score >= 0.6) return 'info'
-  if (score >= 0.4) return 'warning'
-  return 'error'
-}
+const getScoreColor = (score?: number | null) => {
+  if (typeof score !== "number" || !Number.isFinite(score)) return "default";
+  if (score >= 0.8) return "success";
+  if (score >= 0.6) return "info";
+  if (score >= 0.4) return "warning";
+  return "error";
+};
+
+const openDocument = (
+  result: Pick<RetrievalResult, "doc_id" | "kb_id" | "chunk_id">,
+) => {
+  if (!result?.doc_id) return;
+  router.push(
+    createDocumentChunkRouteLocation({
+      kbId: result.kb_id || props.kbId,
+      docId: result.doc_id,
+      chunkId: result.chunk_id,
+    }),
+  );
+};
+
+const openTraceDocument = (item: RetrievalTraceItem) => {
+  if (!item?.doc_id) return;
+  router.push(
+    createDocumentChunkRouteLocation({
+      kbId: item.kb_id || props.kbId,
+      docId: item.doc_id,
+      chunkId: item.chunk_id || "",
+    }),
+  );
+};
+
+onMounted(() => {
+  loadCapabilities().then((loadedCapabilities) => {
+    if (topK.value === null) {
+      topK.value = loadedCapabilities?.defaults?.top_m_final ?? null;
+    }
+  });
+});
 </script>
 
 <style scoped>
@@ -233,11 +663,81 @@ const getScoreColor = (score: number) => {
   padding: 16px;
   white-space: pre-wrap;
   word-break: break-word;
-  font-family: 'Consolas', 'Monaco', 'Courier New', monospace;
-  font-size: 0.9rem;
+  font-family: "Consolas", "Monaco", "Courier New", monospace;
   line-height: 1.6;
   height: 120px;
   overflow-y: auto;
   font-size: 13px;
 }
+
+.trace-section {
+  border-top: 1px solid rgba(var(--v-border-color), var(--v-border-opacity));
+  padding-top: 16px;
+}
+
+.trace-stage-title {
+  align-items: center;
+  display: flex;
+  flex-wrap: wrap;
+  gap: 8px;
+  min-width: 0;
+  width: 100%;
+}
+
+.trace-list {
+  display: grid;
+  gap: 10px;
+}
+
+.trace-item {
+  border: 1px solid rgba(var(--v-border-color), var(--v-border-opacity));
+  border-radius: 8px;
+  padding: 12px;
+}
+
+.trace-item-header {
+  align-items: center;
+  display: flex;
+  flex-wrap: wrap;
+  gap: 8px;
+}
+
+.trace-metrics {
+  color: rgba(var(--v-theme-on-surface), 0.68);
+  display: flex;
+  flex-wrap: wrap;
+  font-size: 12px;
+  gap: 10px;
+  margin-top: 8px;
+  word-break: break-all;
+}
+
+.source-chip-row {
+  display: flex;
+  flex-wrap: wrap;
+  gap: 8px;
+}
+
+.trace-preview {
+  background: rgba(var(--v-theme-surface-variant), 0.1);
+  border-radius: 6px;
+  font-family: "Consolas", "Monaco", "Courier New", monospace;
+  font-size: 12px;
+  line-height: 1.5;
+  margin-top: 8px;
+  max-height: 96px;
+  overflow-y: auto;
+  padding: 10px;
+  white-space: pre-wrap;
+  word-break: break-word;
+}
+
+.trace-empty {
+  color: rgba(var(--v-theme-on-surface), 0.68);
+  padding: 12px 0;
+}
+
+.result-meta :deep(.v-chip) {
+  cursor: pointer;
+}
 </style>
diff --git a/dashboard/src/views/knowledge-base/components/SettingsTab.vue b/dashboard/src/views/knowledge-base/components/SettingsTab.vue
index 7d18c305a9..d26496da6b 100644
--- a/dashboard/src/views/knowledge-base/components/SettingsTab.vue
+++ b/dashboard/src/views/knowledge-base/components/SettingsTab.vue
@@ -1,12 +1,12 @@
 <template>
   <div class="settings-tab">
     <v-card variant="outlined">
-      <v-card-title class="pa-4">{{ t('settings.title') }}</v-card-title>
+      <v-card-title class="pa-4">{{ t("settings.title") }}</v-card-title>
 
       <v-card-text class="pa-6">
         <v-form ref="formRef">
           <!-- 基本设置 -->
-          <h3 class="text-h6 mb-4">{{ t('settings.basic') }}</h3>
+          <h3 class="text-h6 mb-4">{{ t("settings.basic") }}</h3>
 
           <v-row>
             <v-col cols="12" md="6">
@@ -16,6 +16,7 @@
                 type="number"
                 variant="outlined"
                 density="comfortable"
+                :rules="chunkSizeRules"
               />
             </v-col>
             <v-col cols="12" md="6">
@@ -25,65 +26,86 @@
                 type="number"
                 variant="outlined"
                 density="comfortable"
+                :rules="chunkOverlapRules"
               />
             </v-col>
           </v-row>
 
           <!-- 检索设置 -->
-          <h3 class="text-h6 mb-4 mt-6">{{ t('settings.retrieval') }}</h3>
+          <h3 class="text-h6 mb-4 mt-6">{{ t("settings.retrieval") }}</h3>
 
           <v-row>
-            <v-col cols="12" md="6">
+            <v-col cols="12" md="4">
               <v-text-field
                 v-model.number="formData.top_k_dense"
                 :label="t('settings.topKDense')"
                 type="number"
                 variant="outlined"
                 density="comfortable"
+                :rules="positiveIntegerRules"
               />
             </v-col>
-            <v-col cols="12" md="6">
+            <v-col cols="12" md="4">
               <v-text-field
                 v-model.number="formData.top_k_sparse"
                 :label="t('settings.topKSparse')"
                 type="number"
                 variant="outlined"
                 density="comfortable"
+                :rules="positiveIntegerRules"
               />
             </v-col>
-            <!-- <v-col cols="12" md="4">
+            <v-col cols="12" md="4">
               <v-text-field
                 v-model.number="formData.top_m_final"
                 :label="t('settings.topMFinal')"
                 type="number"
                 variant="outlined"
                 density="comfortable"
+                :rules="positiveIntegerRules"
+              />
+            </v-col>
+          </v-row>
+
+          <v-row>
+            <v-col cols="12" md="6">
+              <v-select
+                v-model="formData.index_type"
+                :items="indexTypeOptions"
+                :label="t('settings.indexType')"
+                variant="outlined"
+                density="comfortable"
+                :hint="t('settings.indexTypeHint')"
+                persistent-hint
               />
-            </v-col> -->
+            </v-col>
           </v-row>
 
           <!-- 模型设置 -->
-          <h3 class="text-h6 mb-4 mt-6">{{ t('settings.embeddingProvider') }}</h3>
+          <h3 class="text-h6 mb-4 mt-6">
+            {{ t("settings.embeddingProvider") }}
+          </h3>
 
           <v-row>
             <v-col cols="12" md="6">
               <v-select
                 v-model="formData.embedding_provider_id"
                 :items="embeddingProviders"
-                :item-title="item => item.embedding_model || item.id"
+                :item-title="(item) => item.embedding_model || item.id"
                 :item-value="'id'"
                 :label="t('settings.embeddingProvider')"
                 variant="outlined"
                 density="comfortable"
-                @update:model-value="handleEmbeddingProviderChange"
                 :disabled="true"
+                :hint="t('settings.embeddingProviderHint')"
+                persistent-hint
               />
             </v-col>
             <v-col cols="12" md="6">
               <v-select
                 v-model="formData.rerank_provider_id"
                 :items="rerankProviders"
-                :item-title="item => item.rerank_model || item.id"
+                :item-title="(item) => item.rerank_model || item.id"
                 :item-value="'id'"
                 :label="t('settings.rerankProvider')"
                 variant="outlined"
@@ -94,11 +116,7 @@
           </v-row>
 
           <v-alert type="info" variant="tonal" class="mt-4">
-            {{ t('settings.tips') }}
-          </v-alert>
-
-          <v-alert type="warning" variant="tonal" class="mt-4" v-if="showEmbeddingWarning">
-            <strong>注意:</strong> 修改嵌入模型会导致现有的向量数据失效,建议重新上传文档。不同的嵌入模型生成的向量不兼容,可能导致检索结果不准确。
+            {{ t("settings.tips") }}
           </v-alert>
         </v-form>
       </v-card-text>
@@ -112,7 +130,7 @@
           @click="saveSettings"
           :loading="saving"
         >
-          {{ t('settings.save') }}
+          {{ t("settings.save") }}
         </v-btn>
       </v-card-actions>
     </v-card>
@@ -121,184 +139,176 @@
     <v-snackbar v-model="snackbar.show" :color="snackbar.color">
       {{ snackbar.text }}
     </v-snackbar>
-
-    <!-- Embedding Provider修改确认对话框 -->
-    <v-dialog v-model="embeddingChangeDialog" max-width="500px" persistent>
-      <v-card>
-        <v-card-title class="bg-warning text-white">
-          <v-icon class="mr-2">mdi-alert</v-icon>
-          确认修改嵌入模型
-        </v-card-title>
-        <v-card-text class="pa-6">
-          <v-alert type="warning" variant="tonal" class="mb-4">
-            <strong>警告:</strong> 修改嵌入模型将导致以下影响:
-          </v-alert>
-          <ul class="text-body-2">
-            <li>现有的向量数据将失效</li>
-            <li>检索功能可能无法正常工作</li>
-            <li>建议删除现有文档后重新上传</li>
-            <li>不同嵌入模型生成的向量不兼容</li>
-          </ul>
-          <div class="mt-4 text-body-2">
-            您确定要将嵌入模型从 <strong>{{ originalEmbeddingProvider }}</strong> 修改为 <strong>{{ pendingEmbeddingProvider }}</strong> 吗?
-          </div>
-        </v-card-text>
-        <v-card-actions class="pa-4">
-          <v-spacer />
-          <v-btn variant="text" @click="cancelEmbeddingChange">
-            取消
-          </v-btn>
-          <v-btn color="warning" variant="elevated" @click="confirmEmbeddingChange">
-            确认修改
-          </v-btn>
-        </v-card-actions>
-      </v-card>
-    </v-dialog>
   </div>
 </template>
 
 <script setup lang="ts">
-import { ref, watch, onMounted } from 'vue'
-import axios from 'axios'
-import { useModuleI18n } from '@/i18n/composables'
+import { computed, ref, watch, onMounted } from "vue";
+import axios from "axios";
+import { useModuleI18n } from "@/i18n/composables";
+import { useKnowledgeBaseCapabilities } from "../capabilities";
 
-const { tm: t } = useModuleI18n('features/knowledge-base/detail')
+const { tm: t } = useModuleI18n("features/knowledge-base/detail");
 
 const props = defineProps<{
-  kb: any
-}>()
+  kb: any;
+}>();
 
-const emit = defineEmits(['updated'])
+const emit = defineEmits(["updated"]);
+const { capabilities, loadCapabilities } = useKnowledgeBaseCapabilities();
 
 // 状态
-const saving = ref(false)
-const formRef = ref()
-const embeddingProviders = ref<any[]>([])
-const rerankProviders = ref<any[]>([])
-const originalEmbeddingProvider = ref('')
-const showEmbeddingWarning = ref(false)
-const embeddingChangeDialog = ref(false)
-const pendingEmbeddingProvider = ref('')
+const saving = ref(false);
+const formRef = ref();
+const embeddingProviders = ref<any[]>([]);
+const rerankProviders = ref<any[]>([]);
 
 const snackbar = ref({
   show: false,
-  text: '',
-  color: 'success'
-})
+  text: "",
+  color: "success",
+});
 
-const showSnackbar = (text: string, color: string = 'success') => {
-  snackbar.value.text = text
-  snackbar.value.color = color
-  snackbar.value.show = true
-}
+const showSnackbar = (text: string, color: string = "success") => {
+  snackbar.value.text = text;
+  snackbar.value.color = color;
+  snackbar.value.show = true;
+};
 
 // 表单数据
 const formData = ref({
-  chunk_size: 512,
-  chunk_overlap: 50,
-  top_k_dense: 50,
-  top_k_sparse: 50,
-  embedding_provider_id: '',
-  rerank_provider_id: ''
-})
+  chunk_size: null as number | null,
+  chunk_overlap: null as number | null,
+  top_k_dense: null as number | null,
+  top_k_sparse: null as number | null,
+  top_m_final: null as number | null,
+  index_type: "",
+  embedding_provider_id: "",
+  rerank_provider_id: null as string | null,
+});
 
-// 监听 kb 变化,更新表单
-watch(() => props.kb, (kb) => {
-  if (kb) {
-    formData.value = {
-      chunk_size: kb.chunk_size || 512,
-      chunk_overlap: kb.chunk_overlap || 50,
-      top_k_dense: kb.top_k_dense || 50,
-      top_k_sparse: kb.top_k_sparse || 50,
-      // top_m_final: kb.top_m_final || 5,
-      embedding_provider_id: kb.embedding_provider_id || '',
-      rerank_provider_id: kb.rerank_provider_id || ''
-    }
-    // 保存原始的embedding provider
-    originalEmbeddingProvider.value = kb.embedding_provider_id || ''
+const indexTypeOptions = computed(() => [
+  { title: t("settings.indexTypes.flat"), value: "flat" },
+  { title: t("settings.indexTypes.hnsw"), value: "hnsw" },
+]);
+
+const isPositiveInteger = (value: number | null) =>
+  value !== null && Number.isInteger(value) && value > 0;
+const positiveIntegerRules = [
+  (value: number | null) =>
+    isPositiveInteger(value) || t("validation.positiveInteger"),
+];
+const chunkSizeRules = [
+  (value: number | null) =>
+    isPositiveInteger(value) || t("validation.positiveInteger"),
+];
+const chunkOverlapRules = [
+  (value: number | null) => Number.isInteger(value) || t("validation.integer"),
+  (value: number | null) =>
+    (value !== null && value >= 0) || t("validation.nonNegativeInteger"),
+  (value: number | null) =>
+    value === null ||
+    formData.value.chunk_size === null ||
+    value < formData.value.chunk_size ||
+    t("validation.overlapLessThanSize"),
+];
+
+const getDefaultSettings = () => {
+  const defaults = capabilities.value?.defaults;
+  return {
+    chunk_size: defaults?.chunk_size ?? null,
+    chunk_overlap: defaults?.chunk_overlap ?? null,
+    top_k_dense: defaults?.top_k_dense ?? null,
+    top_k_sparse: defaults?.top_k_sparse ?? null,
+    top_m_final: defaults?.top_m_final ?? null,
+    index_type: defaults?.index_type ?? "",
+  };
+};
+
+const syncFormData = (kb: any) => {
+  if (!kb) {
+    return;
   }
-}, { immediate: true })
+  const defaults = getDefaultSettings();
+  formData.value = {
+    chunk_size: kb.chunk_size ?? defaults.chunk_size,
+    chunk_overlap: kb.chunk_overlap ?? defaults.chunk_overlap,
+    top_k_dense: kb.top_k_dense ?? defaults.top_k_dense,
+    top_k_sparse: kb.top_k_sparse ?? defaults.top_k_sparse,
+    top_m_final: kb.top_m_final ?? defaults.top_m_final,
+    index_type: kb.index_type ?? defaults.index_type,
+    embedding_provider_id: kb.embedding_provider_id || "",
+    rerank_provider_id: kb.rerank_provider_id || null,
+  };
+};
+
+// 监听 kb 变化,更新表单
+watch(
+  () => props.kb,
+  (kb) => {
+    syncFormData(kb);
+  },
+  { immediate: true },
+);
 
 // 加载提供商列表
 const loadProviders = async () => {
   try {
-    const response = await axios.get('/api/config/provider/list', {
-      params: { provider_type: 'embedding,rerank' }
-    })
-    if (response.data.status === 'ok') {
+    const response = await axios.get("/api/config/provider/list", {
+      params: { provider_type: "embedding,rerank" },
+    });
+    if (response.data.status === "ok") {
       embeddingProviders.value = response.data.data.filter(
-        (p: any) => p.provider_type === 'embedding'
-      )
+        (p: any) => p.provider_type === "embedding",
+      );
       rerankProviders.value = response.data.data.filter(
-        (p: any) => p.provider_type === 'rerank'
-      )
+        (p: any) => p.provider_type === "rerank",
+      );
     }
   } catch (error) {
-    console.error('Failed to load providers:', error)
+    console.error("Failed to load providers:", error);
+    showSnackbar(t("settings.providersLoadFailed"), "error");
   }
-}
-
-// 处理embedding provider变更
-const handleEmbeddingProviderChange = (newValue: string) => {
-  if (newValue && newValue !== originalEmbeddingProvider.value) {
-    // 显示警告并需要确认
-    showEmbeddingWarning.value = true
-    pendingEmbeddingProvider.value = newValue
-    embeddingChangeDialog.value = true
-  } else {
-    showEmbeddingWarning.value = false
-  }
-}
-
-// 确认修改embedding provider
-const confirmEmbeddingChange = () => {
-  formData.value.embedding_provider_id = pendingEmbeddingProvider.value
-  embeddingChangeDialog.value = false
-  showEmbeddingWarning.value = true
-}
-
-// 取消修改embedding provider
-const cancelEmbeddingChange = () => {
-  formData.value.embedding_provider_id = originalEmbeddingProvider.value
-  embeddingChangeDialog.value = false
-  showEmbeddingWarning.value = false
-  pendingEmbeddingProvider.value = ''
-}
+};
 
 // 保存设置
 const saveSettings = async () => {
-  const { valid } = await formRef.value.validate()
-  if (!valid) return
+  const { valid } = await formRef.value.validate();
+  if (!valid) return;
 
-  saving.value = true
+  saving.value = true;
   try {
-    const response = await axios.post('/api/kb/update', {
+    const response = await axios.post("/api/kb/update", {
       kb_id: props.kb.kb_id,
       chunk_size: formData.value.chunk_size,
       chunk_overlap: formData.value.chunk_overlap,
       top_k_dense: formData.value.top_k_dense,
       top_k_sparse: formData.value.top_k_sparse,
-      // top_m_final: formData.value.top_m_final,
-      rerank_provider_id: formData.value.rerank_provider_id
-    })
+      top_m_final: formData.value.top_m_final,
+      index_type: formData.value.index_type,
+      rerank_provider_id: formData.value.rerank_provider_id,
+    });
 
-    if (response.data.status === 'ok') {
-      showSnackbar(t('settings.saveSuccess'))
-      emit('updated')
+    if (response.data.status === "ok") {
+      showSnackbar(t("settings.saveSuccess"));
+      emit("updated");
     } else {
-      showSnackbar(response.data.message || t('settings.saveFailed'), 'error')
+      showSnackbar(response.data.message || t("settings.saveFailed"), "error");
     }
   } catch (error) {
-    console.error('Failed to save settings:', error)
-    showSnackbar(t('settings.saveFailed'), 'error')
+    console.error("Failed to save settings:", error);
+    showSnackbar(t("settings.saveFailed"), "error");
   } finally {
-    saving.value = false
+    saving.value = false;
   }
-}
+};
 
 onMounted(() => {
-  loadProviders()
-})
+  loadCapabilities().then(() => {
+    syncFormData(props.kb);
+  });
+  loadProviders();
+});
 </script>
 
 <style scoped>
@@ -307,7 +317,11 @@ onMounted(() => {
 }
 
 @keyframes fadeIn {
-  from { opacity: 0; }
-  to { opacity: 1; }
+  from {
+    opacity: 0;
+  }
+  to {
+    opacity: 1;
+  }
 }
 </style>
diff --git a/dashboard/src/views/knowledge-base/components/TavilyKeyDialog.vue b/dashboard/src/views/knowledge-base/components/TavilyKeyDialog.vue
index 37cf9df8c9..f9ff255d43 100644
--- a/dashboard/src/views/knowledge-base/components/TavilyKeyDialog.vue
+++ b/dashboard/src/views/knowledge-base/components/TavilyKeyDialog.vue
@@ -2,30 +2,38 @@
   <v-dialog v-model="dialog" max-width="500px" persistent>
     <v-card>
       <v-card-title class="text-h5">
-        配置 Tavily API Key
+        {{ t("tavily.title") }}
       </v-card-title>
       <v-card-text>
         <p class="mb-4 text-body-2 text-medium-emphasis">
-          为了使用基于网页的知识库功能，需要提供 Tavily API Key。您可以从 <a href="https://tavily.com/" target="_blank">Tavily 官网</a> 获取。
+          {{ t("tavily.description") }}
+          <a href="https://tavily.com/" target="_blank">{{
+            t("tavily.officialSite")
+          }}</a>
         </p>
         <v-text-field
           v-model="apiKey"
-          label="Tavily API Key"
+          :label="t('tavily.apiKeyLabel')"
           variant="outlined"
           :loading="saving"
           :error-messages="errorMessage"
           autofocus
           clearable
-          placeholder="tvly-..."
+          :placeholder="t('tavily.apiKeyPlaceholder')"
         />
       </v-card-text>
       <v-card-actions>
         <v-spacer />
         <v-btn variant="text" @click="closeDialog" :disabled="saving">
-          取消
+          {{ t("tavily.cancel") }}
         </v-btn>
-        <v-btn color="primary" variant="elevated" @click="saveKey" :loading="saving">
-          保存
+        <v-btn
+          color="primary"
+          variant="elevated"
+          @click="saveKey"
+          :loading="saving"
+        >
+          {{ t("tavily.save") }}
         </v-btn>
       </v-card-actions>
     </v-card>
@@ -33,77 +41,86 @@
 </template>
 
 <script setup lang="ts">
-import { ref, watch } from 'vue'
-import axios from 'axios'
+import { ref, watch } from "vue";
+import axios from "axios";
+import { useModuleI18n } from "@/i18n/composables";
+
+const { tm: t } = useModuleI18n("features/knowledge-base/detail");
 
 const props = defineProps<{
-  modelValue: boolean
-}>()
+  modelValue: boolean;
+}>();
 
-const emit = defineEmits(['update:modelValue', 'success'])
+const emit = defineEmits(["update:modelValue", "success"]);
 
-const dialog = ref(props.modelValue)
-const apiKey = ref('')
-const saving = ref(false)
-const errorMessage = ref('')
+const dialog = ref(props.modelValue);
+const apiKey = ref("");
+const saving = ref(false);
+const errorMessage = ref("");
 
-watch(() => props.modelValue, (val) => {
-  dialog.value = val
-  if (val) {
-    // Reset state when dialog opens
-    apiKey.value = ''
-    errorMessage.value = ''
-    saving.value = false
-  }
-})
+watch(
+  () => props.modelValue,
+  (val) => {
+    dialog.value = val;
+    if (val) {
+      // Reset state when dialog opens
+      apiKey.value = "";
+      errorMessage.value = "";
+      saving.value = false;
+    }
+  },
+);
 
 const closeDialog = () => {
-  emit('update:modelValue', false)
-}
+  emit("update:modelValue", false);
+};
 
 const saveKey = async () => {
   if (!apiKey.value.trim()) {
-    errorMessage.value = 'API Key 不能为空'
-    return
+    errorMessage.value = t("tavily.keyRequired");
+    return;
   }
-  errorMessage.value = ''
-  saving.value = true
+  errorMessage.value = "";
+  saving.value = true;
   try {
     // 1. 获取当前配置
-    const configResponse = await axios.get('/api/config/abconf', {
-      params: { id: 'default' }
-    })
+    const configResponse = await axios.get("/api/config/abconf", {
+      params: { id: "default" },
+    });
 
-    if (configResponse.data.status !== 'ok') {
-      throw new Error('获取当前配置失败')
+    if (configResponse.data.status !== "ok") {
+      throw new Error(t("tavily.loadConfigFailed"));
     }
 
-    const currentConfig = configResponse.data.data.config
+    const currentConfig = configResponse.data.data.config;
 
     // 2. 更新配置
     if (!currentConfig.provider_settings) {
-      currentConfig.provider_settings = {}
+      currentConfig.provider_settings = {};
     }
-    currentConfig.provider_settings.websearch_tavily_key = [apiKey.value.trim()]
+    currentConfig.provider_settings.websearch_tavily_key = [
+      apiKey.value.trim(),
+    ];
     // 同时将搜索提供商设置为 tavily
-    currentConfig.provider_settings.websearch_provider = 'tavily'
+    currentConfig.provider_settings.websearch_provider = "tavily";
 
     // 3. 保存整个配置
-    const saveResponse = await axios.post('/api/config/astrbot/update', {
-      conf_id: 'default',
-      config: currentConfig
-    })
+    const saveResponse = await axios.post("/api/config/astrbot/update", {
+      conf_id: "default",
+      config: currentConfig,
+    });
 
-    if (saveResponse.data.status === 'ok') {
-      emit('success')
-      closeDialog()
+    if (saveResponse.data.status === "ok") {
+      emit("success");
+      closeDialog();
     } else {
-      errorMessage.value = saveResponse.data.message || '保存失败，请检查 Key 是否正确'
+      errorMessage.value = saveResponse.data.message || t("tavily.saveFailed");
     }
   } catch (error: any) {
-    errorMessage.value = error.response?.data?.message || '保存失败，发生未知错误'
+    errorMessage.value =
+      error.response?.data?.message || t("tavily.unknownSaveFailed");
   } finally {
-    saving.value = false
+    saving.value = false;
   }
-}
-</script>
\ No newline at end of file
+};
+</script>
diff --git a/dashboard/src/views/knowledge-base/index.vue b/dashboard/src/views/knowledge-base/index.vue
index 13df70e6fb..bada54f21d 100644
--- a/dashboard/src/views/knowledge-base/index.vue
+++ b/dashboard/src/views/knowledge-base/index.vue
@@ -56,7 +56,7 @@ const goToList = () => {
 <style scoped>
 .kb-container {
   margin: 0 auto;
-  max-width: 1040px;
+  max-width: 1360px;
   padding: 24px;
   width: 100%;
   height: 100%;
diff --git a/dashboard/src/views/knowledge-base/knowledgeBaseUi.mjs b/dashboard/src/views/knowledge-base/knowledgeBaseUi.mjs
new file mode 100644
index 0000000000..7217f416b4
--- /dev/null
+++ b/dashboard/src/views/knowledge-base/knowledgeBaseUi.mjs
@@ -0,0 +1,780 @@
+export const DEFAULT_KB_PAGE_SIZE = 20;
+export const DEFAULT_DOCUMENT_PAGE_SIZE = 10;
+export const DEFAULT_CHUNK_PAGE_SIZE = 10;
+export const DEFAULT_BULK_PAGE_SIZE = 100;
+export const DEFAULT_DOCUMENT_PAGE_SIZE_OPTIONS = [10, 20, 50, 100];
+export const DEFAULT_CHUNK_PAGE_SIZE_OPTIONS = [10, 25, 50, 100];
+
+/**
+ * @param {unknown} value
+ * @param {number} fallback
+ */
+const toPositiveInteger = (value, fallback) => {
+  const numericValue = Number(value);
+  return Number.isInteger(numericValue) && numericValue > 0
+    ? numericValue
+    : fallback;
+};
+
+const toNonNegativeInteger = (value, fallback = 0) => {
+  const numericValue = Number(value);
+  return Number.isInteger(numericValue) && numericValue >= 0
+    ? numericValue
+    : fallback;
+};
+
+/**
+ * @param {unknown} values
+ * @param {number[]} fallback
+ */
+const normalizePageSizeOptions = (values, fallback) => {
+  const normalized = Array.isArray(values)
+    ? values
+        .map((value) => Number(value))
+        .filter((value) => Number.isInteger(value) && value > 0)
+    : [];
+  return normalized.length > 0 ? [...new Set(normalized)] : fallback;
+};
+
+/**
+ * @param {{
+ *   pagination?: {
+ *     document_page_size_options?: unknown,
+ *     chunk_page_size_options?: unknown,
+ *     default_kb_page_size?: unknown,
+ *     default_document_page_size?: unknown,
+ *     default_chunk_page_size?: unknown,
+ *     bulk_page_size?: unknown,
+ *   },
+ * } | null | undefined} capabilities
+ */
+export const getKnowledgeBasePaginationConfig = (capabilities = null) => {
+  const pagination = capabilities?.pagination ?? {};
+  const documentPageSizeOptions = normalizePageSizeOptions(
+    pagination.document_page_size_options,
+    DEFAULT_DOCUMENT_PAGE_SIZE_OPTIONS,
+  );
+  const chunkPageSizeOptions = normalizePageSizeOptions(
+    pagination.chunk_page_size_options,
+    DEFAULT_CHUNK_PAGE_SIZE_OPTIONS,
+  );
+  const defaultKbPageSize = toPositiveInteger(
+    pagination.default_kb_page_size,
+    DEFAULT_KB_PAGE_SIZE,
+  );
+  const defaultDocumentPageSize = toPositiveInteger(
+    pagination.default_document_page_size,
+    documentPageSizeOptions[0] ?? DEFAULT_DOCUMENT_PAGE_SIZE,
+  );
+  const defaultChunkPageSize = toPositiveInteger(
+    pagination.default_chunk_page_size,
+    chunkPageSizeOptions[0] ?? DEFAULT_CHUNK_PAGE_SIZE,
+  );
+
+  return {
+    documentPageSizeOptions,
+    chunkPageSizeOptions,
+    defaultKbPageSize,
+    defaultDocumentPageSize: documentPageSizeOptions.includes(
+      defaultDocumentPageSize,
+    )
+      ? defaultDocumentPageSize
+      : documentPageSizeOptions[0],
+    defaultChunkPageSize: chunkPageSizeOptions.includes(defaultChunkPageSize)
+      ? defaultChunkPageSize
+      : chunkPageSizeOptions[0],
+    bulkPageSize: toPositiveInteger(
+      pagination.bulk_page_size,
+      DEFAULT_BULK_PAGE_SIZE,
+    ),
+  };
+};
+
+export const normalizePaginatedPayload = (
+  payload,
+  fallbackPage = 1,
+  fallbackPageSize = DEFAULT_BULK_PAGE_SIZE,
+) => {
+  const items = Array.isArray(payload?.items) ? payload.items : [];
+  return {
+    items,
+    page: toPositiveInteger(payload?.page, fallbackPage),
+    pageSize: toPositiveInteger(payload?.page_size, fallbackPageSize),
+    total: toNonNegativeInteger(payload?.total, items.length),
+  };
+};
+
+export const fetchAllPaginatedItems = async (fetchPage, options = {}) => {
+  if (typeof fetchPage !== "function") {
+    throw new TypeError("fetchPage must be a function");
+  }
+
+  const pageSize = toPositiveInteger(options.pageSize, DEFAULT_BULK_PAGE_SIZE);
+  const items = [];
+  let page = 1;
+
+  while (true) {
+    const payload = normalizePaginatedPayload(
+      await fetchPage({ page, pageSize }),
+      page,
+      pageSize,
+    );
+    items.push(...payload.items);
+
+    const total = Math.max(payload.total, items.length);
+    if (items.length >= total || payload.items.length === 0) {
+      return items;
+    }
+
+    const nextPage = payload.page + 1;
+    if (nextPage <= page) {
+      throw new Error("Pagination did not advance while loading all items");
+    }
+    page = nextPage;
+  }
+};
+
+export const buildKnowledgeBaseListParams = ({
+  page,
+  pageSize,
+  refreshStats = false,
+}) => {
+  const params = {
+    page,
+    page_size: pageSize,
+  };
+
+  if (refreshStats) {
+    params.refresh_stats = "true";
+  }
+
+  return params;
+};
+
+export const loadKnowledgeBaseListPages = async ({
+  fetchPage,
+  pageSize,
+  refreshStats = false,
+}) =>
+  fetchAllPaginatedItems(
+    async ({ page, pageSize: currentPageSize }) => {
+      const response = await fetchPage(
+        buildKnowledgeBaseListParams({
+          page,
+          pageSize: currentPageSize,
+          refreshStats,
+        }),
+      );
+
+      if (response?.status !== "ok") {
+        throw new Error(response?.message || "");
+      }
+
+      return response.data;
+    },
+    { pageSize },
+  );
+
+export function getKnowledgeBaseListStats(kb = {}) {
+  return {
+    documentCount: toNonNegativeInteger(
+      kb?.document_count,
+      toNonNegativeInteger(kb?.doc_count),
+    ),
+    chunkCount: toNonNegativeInteger(
+      kb?.indexed_chunk_count,
+      toNonNegativeInteger(kb?.chunk_count),
+    ),
+  };
+}
+
+const REPAIRABLE_CONSISTENCY_ISSUE_TYPES = [
+  "orphan_vectors",
+  "chunk_count_mismatches",
+];
+
+const isRepairableChunkCountMismatch = (issue = {}) => {
+  const expected = Number(issue.expected_chunk_count ?? 0);
+  const actual = Number(issue.actual_chunk_count ?? 0);
+  return (
+    Number.isFinite(expected) && Number.isFinite(actual) && actual > expected
+  );
+};
+
+export function getRepairableConsistencyTypes(report) {
+  if (!report?.issues || !report?.summary) {
+    return [];
+  }
+
+  const repairTypes = [];
+  const orphanCount = Number(report.summary.orphan_vectors ?? 0);
+  if (orphanCount > 0) {
+    repairTypes.push("orphan_vectors");
+  }
+
+  const mismatches = Array.isArray(report.issues.chunk_count_mismatches)
+    ? report.issues.chunk_count_mismatches
+    : [];
+  if (mismatches.some(isRepairableChunkCountMismatch)) {
+    repairTypes.push("chunk_count_mismatches");
+  }
+
+  return REPAIRABLE_CONSISTENCY_ISSUE_TYPES.filter((issueType) =>
+    repairTypes.includes(issueType),
+  );
+}
+
+export function hasRepairableConsistencyIssues(report) {
+  return getRepairableConsistencyTypes(report).length > 0;
+}
+
+export const isKnowledgeBaseFeatureEnabled = (capabilities, featureKey) =>
+  capabilities?.features?.[featureKey] ?? true;
+
+const TASK_TYPE_ICONS = {
+  upload: "mdi-upload",
+  import: "mdi-file-import",
+  url: "mdi-link-variant",
+  document_rebuild: "mdi-refresh",
+  document_batch_rebuild: "mdi-refresh",
+  kb_rebuild: "mdi-database-sync",
+};
+
+const TASK_STATUS_COLORS = {
+  pending: "grey",
+  processing: "warning",
+  completed: "success",
+  partial_failed: "warning",
+  failed: "error",
+};
+
+function toFiniteNumber(value, fallback) {
+  const numberValue = Number(value);
+  return Number.isFinite(numberValue) ? numberValue : fallback;
+}
+
+export function getKnowledgeBaseTaskTypeIcon(taskType) {
+  return TASK_TYPE_ICONS[taskType] || "mdi-progress-clock";
+}
+
+export function getKnowledgeBaseTaskStatusColor(status) {
+  return TASK_STATUS_COLORS[status] || "grey";
+}
+
+export function getKnowledgeBaseTaskProgress(task = {}) {
+  const progress =
+    task.progress && typeof task.progress === "object" ? task.progress : {};
+  const total = Math.max(
+    toFiniteNumber(progress.total ?? task.progress_total, 100),
+    1,
+  );
+  return {
+    stage: progress.stage || task.progress_stage || "waiting",
+    current: toFiniteNumber(progress.current ?? task.progress_current, 0),
+    total,
+  };
+}
+
+export function getKnowledgeBaseTaskErrorText(error, fallback = "") {
+  if (!error) {
+    return fallback;
+  }
+  if (typeof error === "string") {
+    return error;
+  }
+  if (typeof error.message === "string" && error.message.trim()) {
+    return error.message;
+  }
+  try {
+    return JSON.stringify(error);
+  } catch {
+    return String(error);
+  }
+}
+
+const hasDocumentId = (collection, docId) => {
+  if (!docId || !collection) {
+    return false;
+  }
+  if (typeof collection.has === "function") {
+    return collection.has(docId);
+  }
+  if (Array.isArray(collection)) {
+    return collection.includes(docId);
+  }
+  return false;
+};
+
+export const hasRebuildableSource = (document) => {
+  if (!document) {
+    return false;
+  }
+  const sourceType = document.source_type || "file";
+  if (sourceType === "file") {
+    return Boolean(document.file_path);
+  }
+  if (sourceType === "url") {
+    return Boolean(document.source_uri);
+  }
+  if (sourceType === "import") {
+    return Number(document.chunk_count || 0) > 0;
+  }
+  return false;
+};
+
+/**
+ * @param {{ doc_id?: string, uploading?: boolean, rebuilding?: boolean, source_type?: string, source_uri?: string, file_path?: string, chunk_count?: number }} document
+ * @param {{ supportsDocumentRebuild?: boolean, rebuildingDocIds?: Set<string> | string[] }} [options]
+ */
+export const canRebuildDocument = (
+  document,
+  { supportsDocumentRebuild = true, rebuildingDocIds = [] } = {},
+) =>
+  Boolean(
+    supportsDocumentRebuild &&
+      document?.doc_id &&
+      hasRebuildableSource(document) &&
+      !document.uploading &&
+      !document.rebuilding &&
+      !hasDocumentId(rebuildingDocIds, document.doc_id),
+  );
+
+/**
+ * @param {{
+ *   selectedIds?: Array<string | null | undefined>,
+ *   documents?: Array<{ doc_id?: string, source_type?: string, source_uri?: string, file_path?: string, chunk_count?: number } | null | undefined>,
+ *   maxDocuments?: unknown,
+ *   enabled?: boolean,
+ *   busy?: boolean,
+ * }} [options]
+ */
+export const getBatchRebuildState = ({
+  selectedIds = [],
+  documents = [],
+  maxDocuments = null,
+  enabled = true,
+  busy = false,
+} = {}) => {
+  const limitValue = Number(maxDocuments);
+  const limit =
+    Number.isInteger(limitValue) && limitValue > 0 ? limitValue : null;
+  const uniqueSelectedIds = [
+    ...new Set(
+      selectedIds.filter((docId) => typeof docId === "string" && docId.length),
+    ),
+  ];
+  const documentById = new Map(
+    documents
+      .filter((document) => document?.doc_id)
+      .map((document) => [document.doc_id, document]),
+  );
+  const rebuildableIds = uniqueSelectedIds.filter((docId) => {
+    if (!documentById.size) {
+      return true;
+    }
+    return hasRebuildableSource(documentById.get(docId));
+  });
+  const exceedsLimit = limit !== null && rebuildableIds.length > Number(limit);
+
+  return {
+    selectedIds: rebuildableIds,
+    selectedCount: rebuildableIds.length,
+    limit,
+    exceedsLimit,
+    hasSelection: rebuildableIds.length > 0,
+    canRebuild:
+      Boolean(enabled) && !busy && rebuildableIds.length > 0 && !exceedsLimit,
+  };
+};
+
+/**
+ * @param {unknown} value
+ */
+const normalizeLimit = (value) => {
+  const numericValue = Number(value);
+  return Number.isInteger(numericValue) && numericValue > 0
+    ? numericValue
+    : null;
+};
+
+/**
+ * @param {{ doc_id?: string, uploading?: boolean, rebuilding?: boolean, disabled?: boolean } | null | undefined} document
+ */
+export const isBatchSelectableDocument = (document) =>
+  Boolean(
+    document?.doc_id &&
+      !document.uploading &&
+      !document.rebuilding &&
+      !document.disabled,
+  );
+
+/**
+ * @param {Array<{ doc_id?: string, uploading?: boolean, rebuilding?: boolean, disabled?: boolean } | null | undefined>} documents
+ */
+export const getSelectableDocumentIds = (documents = []) =>
+  documents
+    .filter(isBatchSelectableDocument)
+    .map((document) => document.doc_id)
+    .filter(Boolean);
+
+/**
+ * @param {Array<string | { doc_id?: string } | null | undefined>} selected
+ * @param {Array<{ doc_id?: string, uploading?: boolean, rebuilding?: boolean, disabled?: boolean } | null | undefined>} documents
+ */
+export const normalizeSelectedDocumentIds = (selected = [], documents = []) => {
+  const selectableIds = new Set(getSelectableDocumentIds(documents));
+  return [
+    ...new Set(
+      selected
+        .map((item) => (typeof item === "string" ? item : item?.doc_id))
+        .filter((docId) => docId && selectableIds.has(docId)),
+    ),
+  ];
+};
+
+/**
+ * @param {{
+ *   selected?: Array<string | { doc_id?: string } | null | undefined>,
+ *   documents?: Array<{ doc_id?: string, uploading?: boolean, rebuilding?: boolean, disabled?: boolean } | null | undefined>,
+ *   maxDocuments?: unknown,
+ *   enabled?: boolean,
+ *   busy?: boolean,
+ * }} [options]
+ */
+export const getBatchDeleteState = ({
+  selected = [],
+  documents = [],
+  maxDocuments = null,
+  enabled = true,
+  busy = false,
+} = {}) => {
+  const selectedIds = normalizeSelectedDocumentIds(selected, documents);
+  const limit = normalizeLimit(maxDocuments);
+  const exceedsLimit = limit !== null && selectedIds.length > limit;
+
+  return {
+    selectedIds,
+    selectedCount: selectedIds.length,
+    limit,
+    exceedsLimit,
+    hasSelection: selectedIds.length > 0,
+    canDelete:
+      Boolean(enabled) && !busy && selectedIds.length > 0 && !exceedsLimit,
+  };
+};
+
+export const isFailedDocument = (doc) => doc?.status === "failed";
+
+export const getDocumentFailureSummary = (doc, labels = {}) => {
+  if (!isFailedDocument(doc)) return "";
+  const stage = String(doc.error_stage || "").trim();
+  const message = String(doc.error_message || "").trim();
+  const displayStage = stage || labels.unknownStage || "Unknown stage";
+  const displayMessage = message || labels.noErrorMessage || "No error message";
+  return `${displayStage}: ${displayMessage}`;
+};
+
+export const buildDocumentFailureText = (doc, labels = {}) => {
+  const lines = [];
+  const addLine = (label, value) => {
+    const normalizedValue = String(value || "").trim();
+    if (normalizedValue) {
+      lines.push(`${label}: ${normalizedValue}`);
+    }
+  };
+
+  addLine(labels.document || "Document", doc?.doc_name);
+  addLine(labels.documentId || "Document ID", doc?.doc_id);
+  addLine(labels.stage || "Stage", doc?.error_stage);
+  addLine(labels.message || "Message", doc?.error_message);
+
+  if (lines.length === 0) {
+    return labels.noErrorMessage || "No error message";
+  }
+  return lines.join("\n");
+};
+
+const normalizeOptionalText = (value) => {
+  if (typeof value !== "string") {
+    return undefined;
+  }
+  const normalized = value.trim();
+  return normalized || undefined;
+};
+
+const normalizeAllowedValue = (value, allowedValues = []) => {
+  const normalized = normalizeOptionalText(value);
+  if (!normalized) {
+    return undefined;
+  }
+  if (allowedValues.length > 0 && !allowedValues.includes(normalized)) {
+    return undefined;
+  }
+  return normalized;
+};
+
+export const buildDocumentListParams = ({
+  kbId,
+  page,
+  pageSize,
+  search,
+  status,
+  sourceType,
+  allowedStatuses = [],
+  allowedSourceTypes = [],
+} = {}) => ({
+  kb_id: kbId,
+  page,
+  page_size: pageSize,
+  search: normalizeOptionalText(search),
+  status: normalizeAllowedValue(status, allowedStatuses),
+  source_type: normalizeAllowedValue(sourceType, allowedSourceTypes),
+});
+
+export const createDocumentChunkRouteLocation = ({ kbId, docId, chunkId }) => {
+  const routeLocation = {
+    name: "NativeDocumentDetail",
+    params: { kbId, docId },
+  };
+  if (chunkId) {
+    routeLocation.query = { chunkId };
+  }
+  return routeLocation;
+};
+
+export const getFocusedChunkId = (query = {}) => {
+  const value = query.chunkId;
+  return typeof value === "string" && value.trim() ? value.trim() : "";
+};
+
+export const removeFocusedChunkQuery = (query = {}) => {
+  const nextQuery = { ...query };
+  delete nextQuery.chunkId;
+  return nextQuery;
+};
+
+/**
+ * @param {unknown} value
+ */
+const toDocumentCount = (value) => {
+  const numberValue = Number(value);
+  if (!Number.isFinite(numberValue) || numberValue <= 0) {
+    return 0;
+  }
+  return Math.floor(numberValue);
+};
+
+/**
+ * @param {Array<{ uploading?: boolean } | null | undefined>} documents
+ */
+export const countUploadingDocuments = (documents = []) =>
+  documents.reduce(
+    (count, document) => count + (document?.uploading ? 1 : 0),
+    0,
+  );
+
+/**
+ * @param {{
+ *   matchedTotal?: unknown,
+ *   documentCount?: unknown,
+ *   total?: unknown,
+ *   uploadingCount?: unknown,
+ * }} [options]
+ */
+export const buildDocumentDisplayTotals = (options = {}) => {
+  const { matchedTotal, documentCount, total, uploadingCount = 0 } = options;
+  const backendMatchedTotal = toDocumentCount(matchedTotal ?? total);
+  const backendDocumentCount = toDocumentCount(
+    documentCount ?? total ?? backendMatchedTotal,
+  );
+  const activeUploadingCount = toDocumentCount(uploadingCount);
+
+  return {
+    filteredTotal: backendMatchedTotal + activeUploadingCount,
+    documentCount: backendDocumentCount + activeUploadingCount,
+  };
+};
+
+const DEFAULT_PROGRESS = {
+  stage: "waiting",
+  current: 0,
+  total: 100,
+};
+
+function toNumber(value, fallback) {
+  const numberValue = Number(value);
+  return Number.isFinite(numberValue) ? numberValue : fallback;
+}
+
+function normalizeProgress(progress = {}) {
+  return {
+    stage: progress.stage || DEFAULT_PROGRESS.stage,
+    current: toNumber(progress.current, DEFAULT_PROGRESS.current),
+    total: toNumber(progress.total, DEFAULT_PROGRESS.total),
+  };
+}
+
+function getUploadPlaceholderIndex(doc) {
+  const parts = String(doc?.doc_id || "").split("_");
+  return toNumber(parts[parts.length - 1], 0);
+}
+
+export function markDocumentRebuildStarted(documents, docId, taskId) {
+  return documents.map((doc) => {
+    if (doc.doc_id !== docId) {
+      return doc;
+    }
+    return {
+      ...doc,
+      rebuilding: true,
+      taskId,
+      uploadProgress: { ...DEFAULT_PROGRESS },
+    };
+  });
+}
+
+export function markDocumentsRebuildStarted(documents, docIds, taskId) {
+  const rebuildIds = new Set(docIds);
+  return documents.map((doc) => {
+    if (!rebuildIds.has(doc.doc_id)) {
+      return doc;
+    }
+    return {
+      ...doc,
+      rebuilding: true,
+      selectable: false,
+      taskId,
+      uploadProgress: { ...DEFAULT_PROGRESS },
+    };
+  });
+}
+
+export function applyDocumentTaskProgress(documents, taskId, progress = {}) {
+  const normalizedProgress = normalizeProgress(progress);
+  const fileIndex = toNumber(progress.file_index, 0);
+
+  return documents.map((doc) => {
+    if (doc.taskId !== taskId) {
+      return doc;
+    }
+    if (doc.rebuilding) {
+      return {
+        ...doc,
+        uploadProgress: normalizedProgress,
+      };
+    }
+    if (!doc.uploading || getUploadPlaceholderIndex(doc) !== fileIndex) {
+      return doc;
+    }
+    return {
+      ...doc,
+      uploadProgress: normalizedProgress,
+    };
+  });
+}
+
+export function clearDocumentTaskState(documents, taskId) {
+  return documents.flatMap((doc) => {
+    if (doc.taskId !== taskId) {
+      return [doc];
+    }
+    if (doc.uploading) {
+      return [];
+    }
+    const nextDoc = { ...doc };
+    delete nextDoc.rebuilding;
+    delete nextDoc.taskId;
+    delete nextDoc.uploadProgress;
+    return [nextDoc];
+  });
+}
+
+export function applyActiveRebuildState(loadedDocuments, currentDocuments) {
+  const activeRebuilds = new Map(
+    currentDocuments
+      .filter((doc) => doc.rebuilding && doc.taskId)
+      .map((doc) => [
+        doc.doc_id,
+        {
+          taskId: doc.taskId,
+          uploadProgress: doc.uploadProgress || { ...DEFAULT_PROGRESS },
+        },
+      ]),
+  );
+
+  return loadedDocuments.map((doc) => {
+    const activeState = activeRebuilds.get(doc.doc_id);
+    if (!activeState) {
+      return doc;
+    }
+    return {
+      ...doc,
+      rebuilding: true,
+      taskId: activeState.taskId,
+      uploadProgress: activeState.uploadProgress,
+    };
+  });
+}
+
+export const formatTitlePath = (titlePath) =>
+  Array.isArray(titlePath) && titlePath.length > 0
+    ? titlePath.filter(Boolean).join(" > ")
+    : "";
+
+export function buildRetrievalSourceChips(source = {}) {
+  if (!source) return [];
+  const chips = [];
+  const titlePath = formatTitlePath(source.title_path);
+  if (titlePath) {
+    chips.push({
+      key: "title",
+      icon: "mdi-format-header-pound",
+      label: titlePath,
+    });
+  }
+  if (source.page_number !== null && source.page_number !== undefined) {
+    chips.push({
+      key: "page",
+      icon: "mdi-book-open-page-variant",
+      labelKey: "retrieval.sourcePage",
+      params: { page: source.page_number },
+    });
+  }
+  if (source.section_index !== null && source.section_index !== undefined) {
+    chips.push({
+      key: "section",
+      icon: "mdi-file-tree",
+      labelKey: "retrieval.sourceSection",
+      params: { index: source.section_index },
+    });
+  }
+  if (source.parent_chunk_id) {
+    chips.push({
+      key: "parent",
+      icon: "mdi-family-tree",
+      labelKey: "retrieval.sourceParentChunk",
+      params: { id: source.parent_chunk_id },
+    });
+  }
+  return chips;
+}
+
+const SCORE_FIELDS = [
+  { key: "dense_score", labelKey: "retrieval.traceDenseScore" },
+  { key: "sparse_score", labelKey: "retrieval.traceSparseScore" },
+  { key: "rrf_score", labelKey: "retrieval.traceRrfScore" },
+  { key: "rerank_score", labelKey: "retrieval.traceRerankScore" },
+];
+
+const isFiniteScore = (value) =>
+  typeof value === "number" && Number.isFinite(value);
+
+export function buildTraceScoreChips(item = {}) {
+  return SCORE_FIELDS.filter(({ key }) => isFiniteScore(item[key])).map(
+    ({ key, labelKey }) => ({
+      key,
+      labelKey,
+      value: item[key],
+    }),
+  );
+}
diff --git a/dashboard/tests/knowledgeBase.test.mjs b/dashboard/tests/knowledgeBase.test.mjs
new file mode 100644
index 0000000000..ffe781acac
--- /dev/null
+++ b/dashboard/tests/knowledgeBase.test.mjs
@@ -0,0 +1,1469 @@
+import test from "node:test";
+import assert from "node:assert/strict";
+import { readdirSync, readFileSync, statSync } from "node:fs";
+import { dirname, join } from "node:path";
+import { fileURLToPath } from "node:url";
+
+import {
+  applyActiveRebuildState,
+  applyDocumentTaskProgress,
+  buildDocumentDisplayTotals,
+  buildDocumentFailureText,
+  buildDocumentListParams,
+  canRebuildDocument,
+  clearDocumentTaskState,
+  countUploadingDocuments,
+  createDocumentChunkRouteLocation,
+  getBatchDeleteState,
+  getBatchRebuildState,
+  getDocumentFailureSummary,
+  getFocusedChunkId,
+  getSelectableDocumentIds,
+  hasRebuildableSource,
+  isBatchSelectableDocument,
+  isFailedDocument,
+  markDocumentRebuildStarted,
+  markDocumentsRebuildStarted,
+  normalizeSelectedDocumentIds,
+  removeFocusedChunkQuery,
+  DEFAULT_BULK_PAGE_SIZE,
+  DEFAULT_CHUNK_PAGE_SIZE_OPTIONS,
+  DEFAULT_DOCUMENT_PAGE_SIZE_OPTIONS,
+  DEFAULT_KB_PAGE_SIZE,
+  buildRetrievalSourceChips,
+  buildTraceScoreChips,
+  buildKnowledgeBaseListParams,
+  fetchAllPaginatedItems,
+  formatTitlePath,
+  getKnowledgeBaseListStats,
+  getKnowledgeBasePaginationConfig,
+  getKnowledgeBaseTaskErrorText,
+  getKnowledgeBaseTaskProgress,
+  getKnowledgeBaseTaskStatusColor,
+  getKnowledgeBaseTaskTypeIcon,
+  getRepairableConsistencyTypes,
+  hasRepairableConsistencyIssues,
+  isKnowledgeBaseFeatureEnabled,
+  loadKnowledgeBaseListPages,
+  normalizePaginatedPayload,
+} from "../src/views/knowledge-base/knowledgeBaseUi.mjs";
+
+test("canRebuildDocument accepts ready persistent documents", () => {
+  assert.equal(
+    canRebuildDocument({
+      doc_id: "doc-1",
+      source_type: "file",
+      file_path: "/kb/files/doc-1/source.md",
+    }),
+    true,
+  );
+});
+
+test("canRebuildDocument requires the rebuild capability", () => {
+  assert.equal(
+    canRebuildDocument(
+      {
+        doc_id: "doc-1",
+        source_type: "file",
+        file_path: "/kb/files/doc-1/source.md",
+      },
+      { supportsDocumentRebuild: false },
+    ),
+    false,
+  );
+});
+
+test("canRebuildDocument rejects transient document states", () => {
+  assert.equal(
+    canRebuildDocument({
+      doc_id: "uploading",
+      uploading: true,
+      source_type: "file",
+      file_path: "/kb/files/uploading/source.md",
+    }),
+    false,
+  );
+  assert.equal(
+    canRebuildDocument({
+      doc_id: "rebuilding",
+      rebuilding: true,
+      source_type: "url",
+      source_uri: "https://example.com",
+    }),
+    false,
+  );
+  assert.equal(canRebuildDocument({ doc_id: "" }), false);
+  assert.equal(canRebuildDocument(null), false);
+});
+
+test("canRebuildDocument rejects documents already tracked as rebuilding", () => {
+  assert.equal(
+    canRebuildDocument(
+      {
+        doc_id: "doc-1",
+        source_type: "file",
+        file_path: "/kb/files/doc-1/source.md",
+      },
+      { rebuildingDocIds: new Set(["doc-1"]) },
+    ),
+    false,
+  );
+  assert.equal(
+    canRebuildDocument(
+      {
+        doc_id: "doc-2",
+        source_type: "url",
+        source_uri: "https://example.com",
+      },
+      { rebuildingDocIds: ["doc-2"] },
+    ),
+    false,
+  );
+});
+
+test("canRebuildDocument requires a rebuildable source", () => {
+  assert.equal(
+    canRebuildDocument({
+      doc_id: "missing-file",
+      source_type: "file",
+      file_path: "",
+    }),
+    false,
+  );
+  assert.equal(
+    canRebuildDocument({
+      doc_id: "missing-url",
+      source_type: "url",
+      source_uri: "",
+    }),
+    false,
+  );
+  assert.equal(
+    canRebuildDocument({
+      doc_id: "empty-import",
+      source_type: "import",
+      chunk_count: 0,
+    }),
+    false,
+  );
+  assert.equal(
+    canRebuildDocument({ doc_id: "unknown", source_type: "database" }),
+    false,
+  );
+});
+
+test("hasRebuildableSource accepts supported source strategies", () => {
+  assert.equal(
+    hasRebuildableSource({
+      source_type: "file",
+      file_path: "/kb/files/doc-1/source.md",
+    }),
+    true,
+  );
+  assert.equal(
+    hasRebuildableSource({
+      source_type: "url",
+      source_uri: "https://example.com",
+    }),
+    true,
+  );
+  assert.equal(
+    hasRebuildableSource({
+      source_type: "import",
+      chunk_count: 2,
+    }),
+    true,
+  );
+});
+
+test("getBatchRebuildState enforces capability limit and busy state", () => {
+  assert.deepEqual(
+    getBatchRebuildState({
+      selectedIds: ["doc-1", "doc-2", "doc-2"],
+      maxDocuments: 1,
+    }),
+    {
+      selectedIds: ["doc-1", "doc-2"],
+      selectedCount: 2,
+      limit: 1,
+      exceedsLimit: true,
+      hasSelection: true,
+      canRebuild: false,
+    },
+  );
+
+  assert.equal(
+    getBatchRebuildState({
+      selectedIds: ["doc-1"],
+      maxDocuments: 1,
+      busy: true,
+    }).canRebuild,
+    false,
+  );
+});
+
+test("getBatchRebuildState filters selected documents without rebuildable sources", () => {
+  assert.deepEqual(
+    getBatchRebuildState({
+      selectedIds: ["file-doc", "url-doc", "empty-import", "unknown-doc"],
+      documents: [
+        {
+          doc_id: "file-doc",
+          source_type: "file",
+          file_path: "/kb/files/file-doc/source.md",
+        },
+        {
+          doc_id: "url-doc",
+          source_type: "url",
+          source_uri: "https://example.com",
+        },
+        {
+          doc_id: "empty-import",
+          source_type: "import",
+          chunk_count: 0,
+        },
+        {
+          doc_id: "unknown-doc",
+          source_type: "database",
+        },
+      ],
+    }),
+    {
+      selectedIds: ["file-doc", "url-doc"],
+      selectedCount: 2,
+      limit: null,
+      exceedsLimit: false,
+      hasSelection: true,
+      canRebuild: true,
+    },
+  );
+});
+
+test("getBatchRebuildState preserves ids when document details are unavailable", () => {
+  assert.deepEqual(
+    getBatchRebuildState({
+      selectedIds: ["doc-1"],
+      documents: [],
+    }),
+    {
+      selectedIds: ["doc-1"],
+      selectedCount: 1,
+      limit: null,
+      exceedsLimit: false,
+      hasSelection: true,
+      canRebuild: true,
+    },
+  );
+});
+
+test("getBatchRebuildState keeps selection visible when feature is disabled", () => {
+  assert.deepEqual(
+    getBatchRebuildState({
+      selectedIds: ["doc-1"],
+      enabled: false,
+    }),
+    {
+      selectedIds: ["doc-1"],
+      selectedCount: 1,
+      limit: null,
+      exceedsLimit: false,
+      hasSelection: true,
+      canRebuild: false,
+    },
+  );
+});
+
+test("isBatchSelectableDocument rejects transient document rows", () => {
+  assert.equal(isBatchSelectableDocument({ doc_id: "ready" }), true);
+  assert.equal(
+    isBatchSelectableDocument({ doc_id: "uploading", uploading: true }),
+    false,
+  );
+  assert.equal(
+    isBatchSelectableDocument({ doc_id: "rebuilding", rebuilding: true }),
+    false,
+  );
+  assert.equal(isBatchSelectableDocument({ doc_id: "" }), false);
+});
+
+test("normalizeSelectedDocumentIds keeps unique selectable ids", () => {
+  const documents = [
+    { doc_id: "doc-1" },
+    { doc_id: "doc-2" },
+    { doc_id: "uploading", uploading: true },
+  ];
+
+  assert.deepEqual(
+    normalizeSelectedDocumentIds(
+      ["doc-1", { doc_id: "doc-2" }, "doc-2", "uploading", "missing"],
+      documents,
+    ),
+    ["doc-1", "doc-2"],
+  );
+});
+
+test("getSelectableDocumentIds returns only persistent rows", () => {
+  assert.deepEqual(
+    getSelectableDocumentIds([
+      { doc_id: "doc-1" },
+      { doc_id: "doc-2", disabled: true },
+      { doc_id: "doc-3", rebuilding: true },
+      { doc_id: "doc-4", uploading: true },
+    ]),
+    ["doc-1"],
+  );
+});
+
+test("getBatchDeleteState enforces capability limit and busy state", () => {
+  const documents = [{ doc_id: "doc-1" }, { doc_id: "doc-2" }];
+
+  assert.deepEqual(
+    getBatchDeleteState({
+      selected: ["doc-1", "doc-2"],
+      documents,
+      maxDocuments: 1,
+    }),
+    {
+      selectedIds: ["doc-1", "doc-2"],
+      selectedCount: 2,
+      limit: 1,
+      exceedsLimit: true,
+      hasSelection: true,
+      canDelete: false,
+    },
+  );
+
+  assert.equal(
+    getBatchDeleteState({
+      selected: ["doc-1"],
+      documents,
+      maxDocuments: 1,
+      busy: true,
+    }).canDelete,
+    false,
+  );
+});
+
+test("getBatchDeleteState reports empty selections", () => {
+  assert.deepEqual(
+    getBatchDeleteState({
+      selected: [],
+      documents: [{ doc_id: "doc-1" }],
+      maxDocuments: 10,
+    }),
+    {
+      selectedIds: [],
+      selectedCount: 0,
+      limit: 10,
+      exceedsLimit: false,
+      hasSelection: false,
+      canDelete: false,
+    },
+  );
+});
+
+test("getBatchDeleteState keeps selection visible when feature is disabled", () => {
+  assert.deepEqual(
+    getBatchDeleteState({
+      selected: ["doc-1"],
+      documents: [{ doc_id: "doc-1" }],
+      enabled: false,
+    }),
+    {
+      selectedIds: ["doc-1"],
+      selectedCount: 1,
+      limit: null,
+      exceedsLimit: false,
+      hasSelection: true,
+      canDelete: false,
+    },
+  );
+});
+
+const labels = {
+  document: "Document",
+  documentId: "Document ID",
+  stage: "Stage",
+  message: "Message",
+  unknownStage: "Unknown stage",
+  noErrorMessage: "No error message",
+};
+
+test("isFailedDocument checks persistent failed document status", () => {
+  assert.equal(isFailedDocument({ status: "failed" }), true);
+  assert.equal(isFailedDocument({ status: "ready" }), false);
+  assert.equal(isFailedDocument(null), false);
+});
+
+test("getDocumentFailureSummary combines stage and message", () => {
+  assert.equal(
+    getDocumentFailureSummary(
+      {
+        status: "failed",
+        error_stage: "parsing",
+        error_message: "cannot parse pdf",
+      },
+      labels,
+    ),
+    "parsing: cannot parse pdf",
+  );
+});
+
+test("getDocumentFailureSummary falls back when diagnostics are missing", () => {
+  assert.equal(
+    getDocumentFailureSummary({ status: "failed" }, labels),
+    "Unknown stage: No error message",
+  );
+  assert.equal(getDocumentFailureSummary({ status: "ready" }, labels), "");
+});
+
+test("buildDocumentFailureText includes stable copyable fields", () => {
+  assert.equal(
+    buildDocumentFailureText(
+      {
+        doc_name: "broken.pdf",
+        doc_id: "doc-1",
+        error_stage: "embedding",
+        error_message: "provider failed",
+      },
+      labels,
+    ),
+    [
+      "Document: broken.pdf",
+      "Document ID: doc-1",
+      "Stage: embedding",
+      "Message: provider failed",
+    ].join("\n"),
+  );
+});
+
+test("buildDocumentFailureText falls back to no error message", () => {
+  assert.equal(buildDocumentFailureText({}, labels), "No error message");
+});
+
+test("buildDocumentListParams includes active document filters", () => {
+  assert.deepEqual(
+    buildDocumentListParams({
+      kbId: "kb-1",
+      page: 2,
+      pageSize: 25,
+      search: " alpha ",
+      status: "ready",
+      sourceType: "file",
+      allowedStatuses: ["ready", "failed"],
+      allowedSourceTypes: ["file", "url"],
+    }),
+    {
+      kb_id: "kb-1",
+      page: 2,
+      page_size: 25,
+      search: "alpha",
+      status: "ready",
+      source_type: "file",
+    },
+  );
+});
+
+test("buildDocumentListParams omits empty document filters", () => {
+  assert.deepEqual(
+    buildDocumentListParams({
+      kbId: "kb-1",
+      page: 1,
+      pageSize: 10,
+      search: "   ",
+      status: null,
+      sourceType: undefined,
+    }),
+    {
+      kb_id: "kb-1",
+      page: 1,
+      page_size: 10,
+      search: undefined,
+      status: undefined,
+      source_type: undefined,
+    },
+  );
+});
+
+test("buildDocumentListParams drops stale values when capabilities are known", () => {
+  assert.deepEqual(
+    buildDocumentListParams({
+      kbId: "kb-1",
+      page: 1,
+      pageSize: 10,
+      status: "archived",
+      sourceType: "api",
+      allowedStatuses: ["ready", "failed"],
+      allowedSourceTypes: ["file", "url"],
+    }),
+    {
+      kb_id: "kb-1",
+      page: 1,
+      page_size: 10,
+      search: undefined,
+      status: undefined,
+      source_type: undefined,
+    },
+  );
+});
+
+test("buildDocumentListParams keeps filters before capabilities load", () => {
+  assert.deepEqual(
+    buildDocumentListParams({
+      kbId: "kb-1",
+      page: 1,
+      pageSize: 10,
+      status: "ready",
+      sourceType: "url",
+    }),
+    {
+      kb_id: "kb-1",
+      page: 1,
+      page_size: 10,
+      search: undefined,
+      status: "ready",
+      source_type: "url",
+    },
+  );
+});
+
+test("createDocumentChunkRouteLocation includes chunkId when available", () => {
+  assert.deepEqual(
+    createDocumentChunkRouteLocation({
+      kbId: "kb-1",
+      docId: "doc-1",
+      chunkId: "chunk-1",
+    }),
+    {
+      name: "NativeDocumentDetail",
+      params: { kbId: "kb-1", docId: "doc-1" },
+      query: { chunkId: "chunk-1" },
+    },
+  );
+});
+
+test("createDocumentChunkRouteLocation omits empty chunkId", () => {
+  assert.deepEqual(
+    createDocumentChunkRouteLocation({
+      kbId: "kb-1",
+      docId: "doc-1",
+      chunkId: "",
+    }),
+    {
+      name: "NativeDocumentDetail",
+      params: { kbId: "kb-1", docId: "doc-1" },
+    },
+  );
+});
+
+test("getFocusedChunkId trims string query values and rejects arrays", () => {
+  assert.equal(getFocusedChunkId({ chunkId: " chunk-1 " }), "chunk-1");
+  assert.equal(getFocusedChunkId({ chunkId: ["chunk-1"] }), "");
+  assert.equal(getFocusedChunkId({ chunkId: "   " }), "");
+});
+
+test("removeFocusedChunkQuery preserves unrelated query keys", () => {
+  const query = { chunkId: "chunk-1", tab: "documents", page: "2" };
+
+  assert.deepEqual(removeFocusedChunkQuery(query), {
+    tab: "documents",
+    page: "2",
+  });
+  assert.deepEqual(query, { chunkId: "chunk-1", tab: "documents", page: "2" });
+});
+
+test("countUploadingDocuments counts only active upload placeholders", () => {
+  assert.equal(
+    countUploadingDocuments([
+      { doc_id: "ready" },
+      { doc_id: "uploading-1", uploading: true },
+      { doc_id: "failed", uploading: false },
+      { doc_id: "uploading-2", uploading: true },
+    ]),
+    2,
+  );
+});
+
+test("buildDocumentDisplayTotals adds upload placeholders to backend totals", () => {
+  assert.deepEqual(
+    buildDocumentDisplayTotals({
+      matchedTotal: 4,
+      documentCount: 10,
+      uploadingCount: 3,
+    }),
+    {
+      filteredTotal: 7,
+      documentCount: 13,
+    },
+  );
+});
+
+test("buildDocumentDisplayTotals falls back to backend total metadata", () => {
+  assert.deepEqual(
+    buildDocumentDisplayTotals({
+      total: 5,
+      uploadingCount: 2,
+    }),
+    {
+      filteredTotal: 7,
+      documentCount: 7,
+    },
+  );
+});
+
+test("buildDocumentDisplayTotals clamps invalid totals instead of drifting", () => {
+  assert.deepEqual(
+    buildDocumentDisplayTotals({
+      matchedTotal: -4,
+      documentCount: Number.NaN,
+      uploadingCount: 2.9,
+    }),
+    {
+      filteredTotal: 2,
+      documentCount: 2,
+    },
+  );
+});
+
+test("markDocumentRebuildStarted marks only the requested document", () => {
+  assert.deepEqual(
+    markDocumentRebuildStarted(
+      [
+        { doc_id: "doc-1", doc_name: "first.md" },
+        { doc_id: "doc-2", doc_name: "second.md" },
+      ],
+      "doc-2",
+      "task-1",
+    ),
+    [
+      { doc_id: "doc-1", doc_name: "first.md" },
+      {
+        doc_id: "doc-2",
+        doc_name: "second.md",
+        rebuilding: true,
+        taskId: "task-1",
+        uploadProgress: {
+          stage: "waiting",
+          current: 0,
+          total: 100,
+        },
+      },
+    ],
+  );
+});
+
+test("markDocumentsRebuildStarted marks selected documents with one task", () => {
+  assert.deepEqual(
+    markDocumentsRebuildStarted(
+      [
+        { doc_id: "doc-1", doc_name: "first.md", selectable: true },
+        { doc_id: "doc-2", doc_name: "second.md", selectable: true },
+        { doc_id: "doc-3", doc_name: "third.md", selectable: true },
+      ],
+      ["doc-1", "doc-3"],
+      "task-1",
+    ),
+    [
+      {
+        doc_id: "doc-1",
+        doc_name: "first.md",
+        selectable: false,
+        rebuilding: true,
+        taskId: "task-1",
+        uploadProgress: {
+          stage: "waiting",
+          current: 0,
+          total: 100,
+        },
+      },
+      { doc_id: "doc-2", doc_name: "second.md", selectable: true },
+      {
+        doc_id: "doc-3",
+        doc_name: "third.md",
+        selectable: false,
+        rebuilding: true,
+        taskId: "task-1",
+        uploadProgress: {
+          stage: "waiting",
+          current: 0,
+          total: 100,
+        },
+      },
+    ],
+  );
+});
+
+test("applyDocumentTaskProgress updates active rebuild documents", () => {
+  assert.deepEqual(
+    applyDocumentTaskProgress(
+      [
+        {
+          doc_id: "doc-1",
+          rebuilding: true,
+          taskId: "task-1",
+          uploadProgress: { stage: "waiting", current: 0, total: 100 },
+        },
+      ],
+      "task-1",
+      { stage: "embedding", current: 3, total: 8 },
+    ),
+    [
+      {
+        doc_id: "doc-1",
+        rebuilding: true,
+        taskId: "task-1",
+        uploadProgress: { stage: "embedding", current: 3, total: 8 },
+      },
+    ],
+  );
+});
+
+test("applyDocumentTaskProgress updates only the matching upload placeholder index", () => {
+  assert.deepEqual(
+    applyDocumentTaskProgress(
+      [
+        {
+          doc_id: "uploading_task-1_0",
+          uploading: true,
+          taskId: "task-1",
+          uploadProgress: { stage: "waiting", current: 0, total: 100 },
+        },
+        {
+          doc_id: "uploading_task-1_1",
+          uploading: true,
+          taskId: "task-1",
+          uploadProgress: { stage: "waiting", current: 0, total: 100 },
+        },
+      ],
+      "task-1",
+      { file_index: 1, stage: "chunking", current: 2, total: 5 },
+    ),
+    [
+      {
+        doc_id: "uploading_task-1_0",
+        uploading: true,
+        taskId: "task-1",
+        uploadProgress: { stage: "waiting", current: 0, total: 100 },
+      },
+      {
+        doc_id: "uploading_task-1_1",
+        uploading: true,
+        taskId: "task-1",
+        uploadProgress: { stage: "chunking", current: 2, total: 5 },
+      },
+    ],
+  );
+});
+
+test("clearDocumentTaskState removes upload placeholders but keeps rebuilt rows", () => {
+  assert.deepEqual(
+    clearDocumentTaskState(
+      [
+        {
+          doc_id: "uploading_task-1_0",
+          uploading: true,
+          taskId: "task-1",
+        },
+        {
+          doc_id: "doc-1",
+          doc_name: "first.md",
+          rebuilding: true,
+          taskId: "task-1",
+          uploadProgress: { stage: "embedding", current: 1, total: 2 },
+        },
+      ],
+      "task-1",
+    ),
+    [
+      {
+        doc_id: "doc-1",
+        doc_name: "first.md",
+      },
+    ],
+  );
+});
+
+test("applyActiveRebuildState preserves rebuild state after list reload", () => {
+  assert.deepEqual(
+    applyActiveRebuildState(
+      [{ doc_id: "doc-1", doc_name: "fresh.md", chunk_count: 3 }],
+      [
+        {
+          doc_id: "doc-1",
+          doc_name: "old.md",
+          rebuilding: true,
+          taskId: "task-1",
+          uploadProgress: { stage: "rebuilding", current: 20, total: 100 },
+        },
+      ],
+    ),
+    [
+      {
+        doc_id: "doc-1",
+        doc_name: "fresh.md",
+        chunk_count: 3,
+        rebuilding: true,
+        taskId: "task-1",
+        uploadProgress: { stage: "rebuilding", current: 20, total: 100 },
+      },
+    ],
+  );
+});
+
+test("formatTitlePath joins non-empty title path segments", () => {
+  assert.equal(
+    formatTitlePath(["Guide", "", "Plugins", null]),
+    "Guide > Plugins",
+  );
+});
+
+test("buildRetrievalSourceChips exposes source metadata chips", () => {
+  assert.deepEqual(
+    buildRetrievalSourceChips({
+      title_path: ["Guide", "Plugins"],
+      page_number: 0,
+      section_index: 0,
+      parent_chunk_id: "parent-1",
+    }),
+    [
+      {
+        key: "title",
+        icon: "mdi-format-header-pound",
+        label: "Guide > Plugins",
+      },
+      {
+        key: "page",
+        icon: "mdi-book-open-page-variant",
+        labelKey: "retrieval.sourcePage",
+        params: { page: 0 },
+      },
+      {
+        key: "section",
+        icon: "mdi-file-tree",
+        labelKey: "retrieval.sourceSection",
+        params: { index: 0 },
+      },
+      {
+        key: "parent",
+        icon: "mdi-family-tree",
+        labelKey: "retrieval.sourceParentChunk",
+        params: { id: "parent-1" },
+      },
+    ],
+  );
+});
+
+test("buildRetrievalSourceChips skips empty source metadata", () => {
+  assert.deepEqual(buildRetrievalSourceChips({}), []);
+  assert.deepEqual(buildRetrievalSourceChips(null), []);
+});
+
+test("buildTraceScoreChips exposes finite trace score fields", () => {
+  assert.deepEqual(
+    buildTraceScoreChips({
+      dense_score: 0.91,
+      sparse_score: 0,
+      rrf_score: 0.032,
+      rerank_score: 0.77,
+    }),
+    [
+      {
+        key: "dense_score",
+        labelKey: "retrieval.traceDenseScore",
+        value: 0.91,
+      },
+      {
+        key: "sparse_score",
+        labelKey: "retrieval.traceSparseScore",
+        value: 0,
+      },
+      {
+        key: "rrf_score",
+        labelKey: "retrieval.traceRrfScore",
+        value: 0.032,
+      },
+      {
+        key: "rerank_score",
+        labelKey: "retrieval.traceRerankScore",
+        value: 0.77,
+      },
+    ],
+  );
+});
+
+test("buildTraceScoreChips skips missing and invalid values", () => {
+  assert.deepEqual(
+    buildTraceScoreChips({
+      dense_score: null,
+      sparse_score: Number.NaN,
+      rrf_score: "0.032",
+      rerank_score: undefined,
+    }),
+    [],
+  );
+});
+
+test("getRepairableConsistencyTypes includes orphan vectors", () => {
+  const report = {
+    summary: {
+      orphan_vectors: 2,
+      chunk_count_mismatches: 0,
+    },
+    issues: {
+      orphan_vectors: [{ doc_id: "doc-gone" }],
+      chunk_count_mismatches: [],
+    },
+  };
+
+  assert.deepEqual(getRepairableConsistencyTypes(report), ["orphan_vectors"]);
+  assert.equal(hasRepairableConsistencyIssues(report), true);
+});
+
+test("getRepairableConsistencyTypes includes only chunk mismatches with extra indexed chunks", () => {
+  const report = {
+    summary: {
+      orphan_vectors: 0,
+      chunk_count_mismatches: 2,
+    },
+    issues: {
+      orphan_vectors: [],
+      chunk_count_mismatches: [
+        {
+          doc_id: "doc-missing-index",
+          expected_chunk_count: 3,
+          actual_chunk_count: 1,
+        },
+        {
+          doc_id: "doc-extra-indexed",
+          expected_chunk_count: 1,
+          actual_chunk_count: 2,
+        },
+      ],
+    },
+  };
+
+  assert.deepEqual(getRepairableConsistencyTypes(report), [
+    "chunk_count_mismatches",
+  ]);
+});
+
+test("getRepairableConsistencyTypes ignores issues that require rebuild or manual action", () => {
+  const report = {
+    summary: {
+      orphan_vectors: 0,
+      missing_vectors: 1,
+      chunk_count_mismatches: 1,
+      missing_source_files: 1,
+    },
+    issues: {
+      missing_vectors: [{ doc_id: "doc-missing-index" }],
+      missing_source_files: [{ doc_id: "doc-missing-file" }],
+      chunk_count_mismatches: [
+        {
+          doc_id: "doc-missing-index",
+          expected_chunk_count: 3,
+          actual_chunk_count: 0,
+        },
+      ],
+    },
+  };
+
+  assert.deepEqual(getRepairableConsistencyTypes(report), []);
+  assert.equal(hasRepairableConsistencyIssues(report), false);
+});
+
+test("isKnowledgeBaseFeatureEnabled keeps features enabled before capabilities load", () => {
+  assert.equal(isKnowledgeBaseFeatureEnabled(null, "url_import"), true);
+  assert.equal(isKnowledgeBaseFeatureEnabled({}, "document_rebuild"), true);
+});
+
+test("isKnowledgeBaseFeatureEnabled follows explicit backend feature flags", () => {
+  const capabilities = {
+    features: {
+      url_import: false,
+      document_rebuild: true,
+    },
+  };
+
+  assert.equal(
+    isKnowledgeBaseFeatureEnabled(capabilities, "url_import"),
+    false,
+  );
+  assert.equal(
+    isKnowledgeBaseFeatureEnabled(capabilities, "document_rebuild"),
+    true,
+  );
+});
+
+test("isKnowledgeBaseFeatureEnabled treats missing feature keys as compatible", () => {
+  const capabilities = {
+    features: {
+      url_import: false,
+    },
+  };
+
+  assert.equal(isKnowledgeBaseFeatureEnabled(capabilities, "kb_rebuild"), true);
+});
+
+test("getKnowledgeBaseListStats prefers refreshed backend statistics", () => {
+  assert.deepEqual(
+    getKnowledgeBaseListStats({
+      doc_count: 1,
+      chunk_count: 2,
+      document_count: 3,
+      indexed_chunk_count: 4,
+    }),
+    {
+      documentCount: 3,
+      chunkCount: 4,
+    },
+  );
+});
+
+test("getKnowledgeBaseListStats preserves zero refreshed values", () => {
+  assert.deepEqual(
+    getKnowledgeBaseListStats({
+      doc_count: 8,
+      chunk_count: 9,
+      document_count: 0,
+      indexed_chunk_count: 0,
+    }),
+    {
+      documentCount: 0,
+      chunkCount: 0,
+    },
+  );
+});
+
+test("getKnowledgeBaseListStats falls back to legacy counters", () => {
+  assert.deepEqual(
+    getKnowledgeBaseListStats({
+      doc_count: 5,
+      chunk_count: 12,
+    }),
+    {
+      documentCount: 5,
+      chunkCount: 12,
+    },
+  );
+});
+
+test("buildKnowledgeBaseListParams includes refresh stats only when requested", () => {
+  assert.deepEqual(
+    buildKnowledgeBaseListParams({
+      page: 2,
+      pageSize: 20,
+      refreshStats: true,
+    }),
+    {
+      page: 2,
+      page_size: 20,
+      refresh_stats: "true",
+    },
+  );
+  assert.deepEqual(
+    buildKnowledgeBaseListParams({
+      page: 1,
+      pageSize: 20,
+      refreshStats: false,
+    }),
+    {
+      page: 1,
+      page_size: 20,
+    },
+  );
+});
+
+test("loadKnowledgeBaseListPages loads every page and preserves request params", async () => {
+  const requests = [];
+  const allItems = [
+    { kb_id: "kb-1" },
+    { kb_id: "kb-2" },
+    { kb_id: "kb-3" },
+    { kb_id: "kb-4" },
+    { kb_id: "kb-5" },
+  ];
+
+  const items = await loadKnowledgeBaseListPages({
+    fetchPage: async (params) => {
+      requests.push(params);
+      const start = (params.page - 1) * params.page_size;
+      return {
+        status: "ok",
+        data: {
+          items: allItems.slice(start, start + params.page_size),
+          page: params.page,
+          page_size: params.page_size,
+          total: allItems.length,
+        },
+      };
+    },
+    pageSize: 2,
+    refreshStats: true,
+  });
+
+  assert.deepEqual(items, allItems);
+  assert.deepEqual(requests, [
+    { page: 1, page_size: 2, refresh_stats: "true" },
+    { page: 2, page_size: 2, refresh_stats: "true" },
+    { page: 3, page_size: 2, refresh_stats: "true" },
+  ]);
+});
+
+test("loadKnowledgeBaseListPages raises backend errors", async () => {
+  await assert.rejects(
+    () =>
+      loadKnowledgeBaseListPages({
+        fetchPage: async () => ({
+          status: "error",
+          message: "database unavailable",
+        }),
+        pageSize: 20,
+      }),
+    /database unavailable/,
+  );
+});
+
+test("normalizePaginatedPayload keeps items and backend pagination metadata", () => {
+  assert.deepEqual(
+    normalizePaginatedPayload({
+      items: ["a", "b"],
+      page: 2,
+      page_size: 50,
+      total: 120,
+    }),
+    {
+      items: ["a", "b"],
+      page: 2,
+      pageSize: 50,
+      total: 120,
+    },
+  );
+});
+
+test("fetchAllPaginatedItems loads every backend page until total is reached", async () => {
+  const requests = [];
+  const items = await fetchAllPaginatedItems(
+    async ({ page, pageSize }) => {
+      requests.push({ page, pageSize });
+      const allItems = ["a", "b", "c", "d", "e"];
+      const start = (page - 1) * pageSize;
+      return {
+        items: allItems.slice(start, start + pageSize),
+        page,
+        page_size: pageSize,
+        total: allItems.length,
+      };
+    },
+    { pageSize: 2 },
+  );
+
+  assert.deepEqual(items, ["a", "b", "c", "d", "e"]);
+  assert.deepEqual(requests, [
+    { page: 1, pageSize: 2 },
+    { page: 2, pageSize: 2 },
+    { page: 3, pageSize: 2 },
+  ]);
+});
+
+test("fetchAllPaginatedItems stops after one page when total is omitted", async () => {
+  const items = await fetchAllPaginatedItems(async () => ({
+    items: ["a", "b"],
+    page: 1,
+    page_size: 100,
+  }));
+
+  assert.deepEqual(items, ["a", "b"]);
+});
+
+test("fetchAllPaginatedItems fails when backend pagination does not advance", async () => {
+  await assert.rejects(
+    () =>
+      fetchAllPaginatedItems(async ({ page, pageSize }) => ({
+        items: [`item-${page}`],
+        page: 1,
+        page_size: pageSize,
+        total: 100,
+      })),
+    /Pagination did not advance/,
+  );
+});
+
+test("getKnowledgeBasePaginationConfig reads backend pagination capabilities", () => {
+  assert.deepEqual(
+    getKnowledgeBasePaginationConfig({
+      pagination: {
+        document_page_size_options: [15, 30],
+        chunk_page_size_options: [20, 40],
+        default_kb_page_size: 25,
+        default_document_page_size: 30,
+        default_chunk_page_size: 20,
+        bulk_page_size: 250,
+      },
+    }),
+    {
+      documentPageSizeOptions: [15, 30],
+      chunkPageSizeOptions: [20, 40],
+      defaultKbPageSize: 25,
+      defaultDocumentPageSize: 30,
+      defaultChunkPageSize: 20,
+      bulkPageSize: 250,
+    },
+  );
+});
+
+test("getKnowledgeBasePaginationConfig falls back to centralized defaults", () => {
+  assert.deepEqual(getKnowledgeBasePaginationConfig(null), {
+    documentPageSizeOptions: DEFAULT_DOCUMENT_PAGE_SIZE_OPTIONS,
+    chunkPageSizeOptions: DEFAULT_CHUNK_PAGE_SIZE_OPTIONS,
+    defaultKbPageSize: DEFAULT_KB_PAGE_SIZE,
+    defaultDocumentPageSize: DEFAULT_DOCUMENT_PAGE_SIZE_OPTIONS[0],
+    defaultChunkPageSize: DEFAULT_CHUNK_PAGE_SIZE_OPTIONS[0],
+    bulkPageSize: DEFAULT_BULK_PAGE_SIZE,
+  });
+});
+
+test("getKnowledgeBasePaginationConfig sanitizes invalid backend values", () => {
+  assert.deepEqual(
+    getKnowledgeBasePaginationConfig({
+      pagination: {
+        document_page_size_options: [0, 25, 25, "50", -1],
+        chunk_page_size_options: [],
+        default_kb_page_size: "bad",
+        default_document_page_size: "bad",
+        default_chunk_page_size: 0,
+        bulk_page_size: -10,
+      },
+    }),
+    {
+      documentPageSizeOptions: [25, 50],
+      chunkPageSizeOptions: DEFAULT_CHUNK_PAGE_SIZE_OPTIONS,
+      defaultKbPageSize: DEFAULT_KB_PAGE_SIZE,
+      defaultDocumentPageSize: 25,
+      defaultChunkPageSize: DEFAULT_CHUNK_PAGE_SIZE_OPTIONS[0],
+      bulkPageSize: DEFAULT_BULK_PAGE_SIZE,
+    },
+  );
+});
+
+test("getKnowledgeBasePaginationConfig keeps defaults inside option lists", () => {
+  assert.deepEqual(
+    getKnowledgeBasePaginationConfig({
+      pagination: {
+        document_page_size_options: [20, 40],
+        chunk_page_size_options: [25, 50],
+        default_document_page_size: 10,
+        default_chunk_page_size: 10,
+      },
+    }),
+    {
+      documentPageSizeOptions: [20, 40],
+      chunkPageSizeOptions: [25, 50],
+      defaultKbPageSize: DEFAULT_KB_PAGE_SIZE,
+      defaultDocumentPageSize: 20,
+      defaultChunkPageSize: 25,
+      bulkPageSize: DEFAULT_BULK_PAGE_SIZE,
+    },
+  );
+});
+
+test("getKnowledgeBaseTaskTypeIcon maps known task types", () => {
+  assert.equal(getKnowledgeBaseTaskTypeIcon("upload"), "mdi-upload");
+  assert.equal(getKnowledgeBaseTaskTypeIcon("document_rebuild"), "mdi-refresh");
+  assert.equal(
+    getKnowledgeBaseTaskTypeIcon("document_batch_rebuild"),
+    "mdi-refresh",
+  );
+  assert.equal(getKnowledgeBaseTaskTypeIcon("kb_rebuild"), "mdi-database-sync");
+  assert.equal(getKnowledgeBaseTaskTypeIcon("custom"), "mdi-progress-clock");
+});
+
+test("getKnowledgeBaseTaskStatusColor maps known statuses", () => {
+  assert.equal(getKnowledgeBaseTaskStatusColor("pending"), "grey");
+  assert.equal(getKnowledgeBaseTaskStatusColor("processing"), "warning");
+  assert.equal(getKnowledgeBaseTaskStatusColor("completed"), "success");
+  assert.equal(getKnowledgeBaseTaskStatusColor("partial_failed"), "warning");
+  assert.equal(getKnowledgeBaseTaskStatusColor("failed"), "error");
+  assert.equal(getKnowledgeBaseTaskStatusColor("custom"), "grey");
+});
+
+test("getKnowledgeBaseTaskProgress prefers nested persisted progress", () => {
+  assert.deepEqual(
+    getKnowledgeBaseTaskProgress({
+      progress_stage: "waiting",
+      progress_current: 0,
+      progress_total: 100,
+      progress: {
+        stage: "embedding",
+        current: 4,
+        total: 10,
+      },
+    }),
+    {
+      stage: "embedding",
+      current: 4,
+      total: 10,
+    },
+  );
+});
+
+test("getKnowledgeBaseTaskProgress falls back to flattened task progress", () => {
+  assert.deepEqual(
+    getKnowledgeBaseTaskProgress({
+      progress_stage: "rebuilding",
+      progress_current: 0,
+      progress_total: 0,
+    }),
+    {
+      stage: "rebuilding",
+      current: 0,
+      total: 1,
+    },
+  );
+});
+
+test("getKnowledgeBaseTaskErrorText handles strings, objects, and fallbacks", () => {
+  assert.equal(getKnowledgeBaseTaskErrorText("boom"), "boom");
+  assert.equal(
+    getKnowledgeBaseTaskErrorText({ message: "parse failed" }),
+    "parse failed",
+  );
+  assert.equal(
+    getKnowledgeBaseTaskErrorText({ stage: "embedding" }),
+    '{"stage":"embedding"}',
+  );
+  assert.equal(getKnowledgeBaseTaskErrorText(null, "none"), "none");
+});
+
+const currentDir = dirname(fileURLToPath(import.meta.url));
+const localeRoot = join(currentDir, "../src/i18n/locales");
+const knowledgeBaseViewRoot = join(currentDir, "../src/views/knowledge-base");
+
+const locales = ["zh-CN", "en-US", "ru-RU"];
+const knowledgeBaseModules = [
+  "features/knowledge-base/index.json",
+  "features/knowledge-base/detail.json",
+  "features/knowledge-base/document.json",
+  "features/alkaid/knowledge-base.json",
+];
+
+const allowedRussianEnglishOnlyValues = new Set([
+  "API",
+  "Context Recall",
+  "MRR",
+  "nDCG",
+  "Precision",
+  "Recall",
+  "Rerank",
+  "Tavily API Key",
+  "URL",
+  "tvly-...",
+]);
+
+function readJson(relativePath) {
+  const content = readFileSync(relativePath, "utf8").replace(/^\uFEFF/, "");
+  return JSON.parse(content);
+}
+
+function flattenKeys(value, prefix = "") {
+  return Object.entries(value).flatMap(([key, nestedValue]) => {
+    const nextKey = prefix ? `${prefix}.${key}` : key;
+    if (
+      nestedValue &&
+      typeof nestedValue === "object" &&
+      !Array.isArray(nestedValue)
+    ) {
+      return flattenKeys(nestedValue, nextKey);
+    }
+    return [nextKey];
+  });
+}
+
+function flattenStringValues(value, prefix = "") {
+  return Object.entries(value).flatMap(([key, nestedValue]) => {
+    const nextKey = prefix ? `${prefix}.${key}` : key;
+    if (
+      nestedValue &&
+      typeof nestedValue === "object" &&
+      !Array.isArray(nestedValue)
+    ) {
+      return flattenStringValues(nestedValue, nextKey);
+    }
+    return [{ key: nextKey, value: nestedValue }];
+  });
+}
+
+function collectVueFiles(directory) {
+  return readdirSync(directory).flatMap((entry) => {
+    const path = join(directory, entry);
+    const stat = statSync(path);
+    if (stat.isDirectory()) {
+      return collectVueFiles(path);
+    }
+    return path.endsWith(".vue") ? [path] : [];
+  });
+}
+
+test("knowledge base locale modules keep matching key sets", () => {
+  for (const modulePath of knowledgeBaseModules) {
+    const localeKeys = new Map(
+      locales.map((locale) => {
+        const data = readJson(join(localeRoot, locale, modulePath));
+        return [locale, new Set(flattenKeys(data))];
+      }),
+    );
+    const allKeys = new Set(
+      [...localeKeys.values()].flatMap((keys) => [...keys]),
+    );
+
+    for (const locale of locales) {
+      const missingKeys = [...allKeys].filter(
+        (key) => !localeKeys.get(locale).has(key),
+      );
+      assert.deepEqual(
+        missingKeys,
+        [],
+        `${locale} is missing keys in ${modulePath}`,
+      );
+    }
+  }
+});
+
+test("Russian knowledge base locale has no untranslated English-only UI phrases", () => {
+  const violations = [];
+
+  for (const modulePath of knowledgeBaseModules) {
+    const data = readJson(join(localeRoot, "ru-RU", modulePath));
+    for (const { key, value } of flattenStringValues(data)) {
+      if (typeof value !== "string") {
+        continue;
+      }
+      const hasLatin = /[A-Za-z]/.test(value);
+      const hasCyrillic = /[\u0400-\u04FF]/.test(value);
+      if (
+        hasLatin &&
+        !hasCyrillic &&
+        !allowedRussianEnglishOnlyValues.has(value)
+      ) {
+        violations.push(`${modulePath}:${key}=${value}`);
+      }
+    }
+  }
+
+  assert.deepEqual(violations, []);
+});
+
+test("knowledge base Vue templates avoid hardcoded visible UI attributes", () => {
+  const violations = [];
+  const visibleAttributePattern =
+    /\s(?<![:@#\w-])(label|placeholder|title|text|message)="([^"]*[A-Za-z][^"]*)"/g;
+
+  for (const vueFile of collectVueFiles(knowledgeBaseViewRoot)) {
+    const content = readFileSync(vueFile, "utf8");
+    for (const match of content.matchAll(visibleAttributePattern)) {
+      violations.push(`${vueFile}:${match[1]}="${match[2]}"`);
+    }
+  }
+
+  assert.deepEqual(violations, []);
+});
diff --git a/tests/test_kb_batch_delete.py b/tests/test_kb_batch_delete.py
new file mode 100644
index 0000000000..4a22e4cead
--- /dev/null
+++ b/tests/test_kb_batch_delete.py
@@ -0,0 +1,722 @@
+"""Tests for batch knowledge-base document deletion."""
+
+import sqlite3
+from unittest.mock import AsyncMock, MagicMock, call
+
+import pytest
+
+
+def _build_helper():
+    from astrbot.core.knowledge_base.kb_helper import KBHelper
+    from astrbot.core.knowledge_base.models import KnowledgeBase
+
+    kb = KnowledgeBase(
+        kb_name="test-kb",
+        kb_id="kb-test-1",
+        embedding_provider_id="emb-1",
+        chunk_size=512,
+        chunk_overlap=50,
+    )
+    helper = KBHelper.__new__(KBHelper)
+    helper.kb = kb
+    helper.kb_db = AsyncMock()
+    helper.kb_db.get_document_by_id = AsyncMock(return_value=None)
+    helper.kb_db.list_media_by_doc = AsyncMock(return_value=[])
+    helper.vec_db = AsyncMock()
+    helper.refresh_kb = AsyncMock()
+    return helper
+
+
+def _build_helper_with_real_dirs(tmp_path):
+    helper = _build_helper()
+    helper.kb_files_dir = tmp_path / "files"
+    helper.kb_medias_dir = tmp_path / "medias"
+    helper.kb_files_dir.mkdir(parents=True)
+    helper.kb_medias_dir.mkdir(parents=True)
+    return helper
+
+
+class TestBatchDeleteKbDb:
+    """Verify batch delete at the kb_db_sqlite layer."""
+
+    @pytest.mark.asyncio
+    async def test_delete_documents_by_ids_empty_list(self):
+        """Empty list returns empty dict."""
+        from astrbot.core.knowledge_base.kb_db_sqlite import KBSQLiteDatabase
+
+        kb_db = KBSQLiteDatabase.__new__(KBSQLiteDatabase)
+        vec_db = AsyncMock()
+
+        results = await kb_db.delete_documents_by_ids([], vec_db)
+
+        assert results == {}
+        vec_db.delete_documents.assert_not_awaited()
+
+    @pytest.mark.asyncio
+    async def test_delete_documents_by_ids_batch_kb_db(self):
+        """Vector cleanup succeeds before kb.db metadata is deleted."""
+        from astrbot.core.knowledge_base.kb_db_sqlite import KBSQLiteDatabase
+
+        kb_db = KBSQLiteDatabase.__new__(KBSQLiteDatabase)
+
+        session = AsyncMock()
+        session.__aenter__.return_value = session
+        session.begin = MagicMock(return_value=session)
+        kb_db.get_db = MagicMock(return_value=session)
+
+        vec_db = AsyncMock()
+        vec_db.delete_documents = AsyncMock()
+
+        results = await kb_db.delete_documents_by_ids(
+            ["doc-1", "doc-2", "doc-3"],
+            vec_db,
+        )
+
+        assert results == {"doc-1": True, "doc-2": True, "doc-3": True}
+        assert vec_db.delete_documents.await_count == 3
+        vec_db.delete_documents.assert_has_awaits(
+            [
+                call(metadata_filters={"kb_doc_id": "doc-1"}),
+                call(metadata_filters={"kb_doc_id": "doc-2"}),
+                call(metadata_filters={"kb_doc_id": "doc-3"}),
+            ],
+            any_order=True,
+        )
+        session.execute.assert_called()
+
+    @pytest.mark.asyncio
+    async def test_delete_documents_best_effort(self):
+        """One vec_db failure doesn't block other deletions."""
+        from astrbot.core.knowledge_base.kb_db_sqlite import KBSQLiteDatabase
+
+        kb_db = KBSQLiteDatabase.__new__(KBSQLiteDatabase)
+
+        session = AsyncMock()
+        session.__aenter__.return_value = session
+        session.begin = MagicMock(return_value=session)
+        kb_db.get_db = MagicMock(return_value=session)
+
+        vec_db = AsyncMock()
+
+        async def _delete_side_effect(metadata_filters):
+            doc_id = metadata_filters["kb_doc_id"]
+            if doc_id == "doc-2":
+                raise RuntimeError("vector delete failed")
+
+        vec_db.delete_documents = AsyncMock(side_effect=_delete_side_effect)
+
+        results = await kb_db.delete_documents_by_ids(
+            ["doc-1", "doc-2", "doc-3"],
+            vec_db,
+        )
+
+        assert results == {"doc-1": True, "doc-2": False, "doc-3": True}
+        assert vec_db.delete_documents.await_count == 3
+
+    @pytest.mark.asyncio
+    async def test_delete_document_keeps_metadata_when_vec_delete_fails(self):
+        """Metadata remains visible when vector deletion fails."""
+        from astrbot.core.knowledge_base.kb_db_sqlite import KBSQLiteDatabase
+        from astrbot.core.knowledge_base.models import KBDocument
+
+        kb_db = KBSQLiteDatabase.__new__(KBSQLiteDatabase)
+        doc = KBDocument(
+            doc_id="doc-1",
+            kb_id="kb-a",
+            doc_name="a.txt",
+            file_type="txt",
+            file_size=1,
+            file_path="",
+        )
+        kb_db.get_document_by_id = AsyncMock(return_value=doc)
+        session = AsyncMock()
+        session.__aenter__.return_value = session
+        session.begin = MagicMock(return_value=session)
+        kb_db.get_db = MagicMock(return_value=session)
+        vec_db = AsyncMock()
+        vec_db.delete_documents = AsyncMock(side_effect=RuntimeError("boom"))
+
+        with pytest.raises(RuntimeError, match="boom"):
+            await kb_db.delete_document_by_id("doc-1", vec_db, kb_id="kb-a")
+
+        session.execute.assert_not_called()
+
+    @pytest.mark.asyncio
+    async def test_delete_document_rejects_wrong_kb_id(self):
+        """A document from another KB must not be deleted."""
+        from astrbot.core.knowledge_base.kb_db_sqlite import KBSQLiteDatabase
+        from astrbot.core.knowledge_base.models import KBDocument
+
+        kb_db = KBSQLiteDatabase.__new__(KBSQLiteDatabase)
+        doc = KBDocument(
+            doc_id="doc-1",
+            kb_id="kb-other",
+            doc_name="a.txt",
+            file_type="txt",
+            file_size=1,
+            file_path="",
+        )
+        kb_db.get_document_by_id = AsyncMock(return_value=doc)
+        vec_db = AsyncMock()
+
+        deleted = await kb_db.delete_document_by_id("doc-1", vec_db, kb_id="kb-a")
+
+        assert deleted is False
+        vec_db.delete_documents.assert_not_awaited()
+
+
+class TestHelperBatchDelete:
+    """Verify batch delete at the kb_helper layer."""
+
+    @pytest.mark.asyncio
+    async def test_delete_documents_updates_stats_once(self):
+        """update_kb_stats is called exactly once, not N times."""
+        helper = _build_helper()
+        helper.kb_db.delete_documents_by_ids = AsyncMock(
+            return_value={"doc-1": True, "doc-2": True},
+        )
+
+        results = await helper.delete_documents(["doc-1", "doc-2"])
+
+        assert results == {"doc-1": True, "doc-2": True}
+        helper.kb_db.delete_documents_by_ids.assert_awaited_once_with(
+            doc_ids=["doc-1", "doc-2"],
+            vec_db=helper.vec_db,
+            kb_id="kb-test-1",
+        )
+        helper.kb_db.update_kb_stats.assert_awaited_once_with(
+            kb_id="kb-test-1",
+            vec_db=helper.vec_db,
+        )
+        helper.refresh_kb.assert_awaited_once()
+
+    @pytest.mark.asyncio
+    async def test_delete_documents_empty_list(self):
+        """Empty list delegates to kb_db layer (returns empty dict)."""
+        helper = _build_helper()
+        helper.kb_db.delete_documents_by_ids = AsyncMock(return_value={})
+
+        results = await helper.delete_documents([])
+
+        assert results == {}
+        helper.kb_db.update_kb_stats.assert_awaited_once()
+        helper.refresh_kb.assert_awaited_once()
+
+    @pytest.mark.asyncio
+    async def test_delete_documents_preserves_failures(self):
+        """Failures from kb_db layer are propagated in the result dict."""
+        helper = _build_helper()
+        helper.kb_db.delete_documents_by_ids = AsyncMock(
+            return_value={"doc-1": True, "doc-2": False, "doc-3": True},
+        )
+
+        results = await helper.delete_documents(["doc-1", "doc-2", "doc-3"])
+
+        assert results == {"doc-1": True, "doc-2": False, "doc-3": True}
+        # stats still updated once even with partial failures
+        helper.kb_db.update_kb_stats.assert_awaited_once()
+        helper.refresh_kb.assert_awaited_once()
+
+    @pytest.mark.asyncio
+    async def test_delete_chunk_raises_when_chunk_is_missing(self):
+        helper = _build_helper()
+        helper.vec_db.delete = AsyncMock(return_value=False)
+
+        with pytest.raises(ValueError, match="无法找到 ID 为 chunk-missing 的文本块"):
+            await helper.delete_chunk("chunk-missing", "doc-1")
+
+        helper.vec_db.delete.assert_awaited_once_with("chunk-missing")
+        helper.kb_db.update_kb_stats.assert_not_awaited()
+        helper.refresh_kb.assert_not_awaited()
+
+    @pytest.mark.asyncio
+    async def test_delete_document_cleans_source_and_media_files(self, tmp_path):
+        from astrbot.core.knowledge_base.models import KBDocument, KBMedia
+
+        helper = _build_helper_with_real_dirs(tmp_path)
+        source_path = helper.kb_files_dir / "doc-1" / "source.txt"
+        media_path = helper.kb_medias_dir / "doc-1" / "image.png"
+        source_path.parent.mkdir(parents=True)
+        media_path.parent.mkdir(parents=True)
+        source_path.write_text("hello", encoding="utf-8")
+        media_path.write_bytes(b"image")
+
+        doc = KBDocument(
+            doc_id="doc-1",
+            kb_id="kb-test-1",
+            doc_name="source.txt",
+            file_type="txt",
+            file_size=5,
+            file_path=str(source_path),
+        )
+        media = KBMedia(
+            media_id="media-1",
+            doc_id="doc-1",
+            kb_id="kb-test-1",
+            media_type="image",
+            file_name="image.png",
+            file_path=str(media_path),
+            file_size=5,
+            mime_type="image/png",
+        )
+        helper.kb_db.get_document_by_id = AsyncMock(return_value=doc)
+        helper.kb_db.list_media_by_doc = AsyncMock(return_value=[media])
+        helper.kb_db.delete_document_by_id = AsyncMock(return_value=True)
+
+        await helper.delete_document("doc-1")
+
+        assert not source_path.exists()
+        assert not media_path.exists()
+        helper.kb_db.delete_document_by_id.assert_awaited_once()
+        helper.kb_db.update_kb_stats.assert_awaited_once()
+
+    @pytest.mark.asyncio
+    async def test_delete_documents_only_cleans_successful_deletes(self, tmp_path):
+        from astrbot.core.knowledge_base.models import KBDocument
+
+        helper = _build_helper_with_real_dirs(tmp_path)
+        success_path = helper.kb_files_dir / "doc-ok" / "ok.txt"
+        failed_path = helper.kb_files_dir / "doc-fail" / "fail.txt"
+        success_path.parent.mkdir(parents=True)
+        failed_path.parent.mkdir(parents=True)
+        success_path.write_text("ok", encoding="utf-8")
+        failed_path.write_text("fail", encoding="utf-8")
+        docs = {
+            "doc-ok": KBDocument(
+                doc_id="doc-ok",
+                kb_id="kb-test-1",
+                doc_name="ok.txt",
+                file_type="txt",
+                file_size=2,
+                file_path=str(success_path),
+            ),
+            "doc-fail": KBDocument(
+                doc_id="doc-fail",
+                kb_id="kb-test-1",
+                doc_name="fail.txt",
+                file_type="txt",
+                file_size=4,
+                file_path=str(failed_path),
+            ),
+        }
+        helper.kb_db.get_document_by_id = AsyncMock(
+            side_effect=lambda doc_id: docs.get(doc_id),
+        )
+        helper.kb_db.list_media_by_doc = AsyncMock(return_value=[])
+        helper.kb_db.delete_documents_by_ids = AsyncMock(
+            return_value={"doc-ok": True, "doc-fail": False},
+        )
+
+        result = await helper.delete_documents(["doc-ok", "doc-fail"])
+
+        assert result == {"doc-ok": True, "doc-fail": False}
+        assert not success_path.exists()
+        assert failed_path.exists()
+
+
+@pytest.mark.asyncio
+async def test_kb_sqlite_migration_adds_index_type_to_legacy_table(tmp_path):
+    from astrbot.core.knowledge_base.kb_db_sqlite import KBSQLiteDatabase
+
+    db_path = tmp_path / "kb.db"
+    conn = sqlite3.connect(db_path)
+    conn.execute(
+        """
+        CREATE TABLE knowledge_bases (
+            id INTEGER PRIMARY KEY AUTOINCREMENT,
+            kb_id VARCHAR(36) NOT NULL UNIQUE,
+            kb_name VARCHAR(100) NOT NULL,
+            description TEXT,
+            emoji VARCHAR(10),
+            embedding_provider_id VARCHAR(100),
+            rerank_provider_id VARCHAR(100),
+            chunk_size INTEGER,
+            chunk_overlap INTEGER,
+            top_k_dense INTEGER,
+            top_k_sparse INTEGER,
+            top_m_final INTEGER,
+            created_at DATETIME NOT NULL,
+            updated_at DATETIME NOT NULL,
+            doc_count INTEGER NOT NULL,
+            chunk_count INTEGER NOT NULL
+        )
+        """,
+    )
+    conn.execute(
+        """
+        CREATE TABLE kb_documents (
+            id INTEGER PRIMARY KEY AUTOINCREMENT,
+            doc_id VARCHAR(36) NOT NULL UNIQUE,
+            kb_id VARCHAR(36) NOT NULL,
+            doc_name VARCHAR(255) NOT NULL,
+            file_type VARCHAR(20) NOT NULL,
+            file_size INTEGER NOT NULL,
+            file_path VARCHAR(512) NOT NULL,
+            chunk_count INTEGER NOT NULL,
+            media_count INTEGER NOT NULL,
+            created_at DATETIME NOT NULL,
+            updated_at DATETIME NOT NULL
+        )
+        """,
+    )
+    conn.execute(
+        """
+        CREATE TABLE kb_media (
+            id INTEGER PRIMARY KEY AUTOINCREMENT,
+            media_id VARCHAR(36) NOT NULL UNIQUE,
+            doc_id VARCHAR(36) NOT NULL,
+            kb_id VARCHAR(36) NOT NULL,
+            media_type VARCHAR(20) NOT NULL,
+            file_name VARCHAR(255) NOT NULL,
+            file_path VARCHAR(512) NOT NULL,
+            file_size INTEGER NOT NULL,
+            mime_type VARCHAR(100) NOT NULL,
+            created_at DATETIME NOT NULL
+        )
+        """,
+    )
+    conn.commit()
+    conn.close()
+
+    kb_db = KBSQLiteDatabase(str(db_path))
+    await kb_db.initialize()
+    await kb_db.migrate_to_v1()
+
+    conn = sqlite3.connect(db_path)
+    columns = {row[1] for row in conn.execute("PRAGMA table_info(knowledge_bases)")}
+    conn.close()
+    await kb_db.close()
+
+    assert "index_type" in columns
+
+
+@pytest.mark.asyncio
+async def test_kb_sqlite_migration_adds_document_governance_columns(tmp_path):
+    from astrbot.core.knowledge_base.kb_db_sqlite import KBSQLiteDatabase
+
+    db_path = tmp_path / "kb.db"
+    conn = sqlite3.connect(db_path)
+    conn.execute(
+        """
+        CREATE TABLE knowledge_bases (
+            id INTEGER PRIMARY KEY AUTOINCREMENT,
+            kb_id VARCHAR(36) NOT NULL UNIQUE,
+            kb_name VARCHAR(100) NOT NULL,
+            description TEXT,
+            emoji VARCHAR(10),
+            embedding_provider_id VARCHAR(100),
+            rerank_provider_id VARCHAR(100),
+            chunk_size INTEGER,
+            chunk_overlap INTEGER,
+            top_k_dense INTEGER,
+            top_k_sparse INTEGER,
+            top_m_final INTEGER,
+            created_at DATETIME NOT NULL,
+            updated_at DATETIME NOT NULL,
+            doc_count INTEGER NOT NULL,
+            chunk_count INTEGER NOT NULL
+        )
+        """,
+    )
+    conn.execute(
+        """
+        CREATE TABLE kb_documents (
+            id INTEGER PRIMARY KEY AUTOINCREMENT,
+            doc_id VARCHAR(36) NOT NULL UNIQUE,
+            kb_id VARCHAR(36) NOT NULL,
+            doc_name VARCHAR(255) NOT NULL,
+            file_type VARCHAR(20) NOT NULL,
+            file_size INTEGER NOT NULL,
+            file_path VARCHAR(512) NOT NULL,
+            chunk_count INTEGER NOT NULL,
+            media_count INTEGER NOT NULL,
+            created_at DATETIME NOT NULL,
+            updated_at DATETIME NOT NULL
+        )
+        """,
+    )
+    conn.execute(
+        """
+        CREATE TABLE kb_media (
+            id INTEGER PRIMARY KEY AUTOINCREMENT,
+            media_id VARCHAR(36) NOT NULL UNIQUE,
+            doc_id VARCHAR(36) NOT NULL,
+            kb_id VARCHAR(36) NOT NULL,
+            media_type VARCHAR(20) NOT NULL,
+            file_name VARCHAR(255) NOT NULL,
+            file_path VARCHAR(512) NOT NULL,
+            file_size INTEGER NOT NULL,
+            mime_type VARCHAR(100) NOT NULL,
+            created_at DATETIME NOT NULL
+        )
+        """,
+    )
+    conn.commit()
+    conn.close()
+
+    kb_db = KBSQLiteDatabase(str(db_path))
+    await kb_db.initialize()
+    await kb_db.migrate_to_v1()
+
+    conn = sqlite3.connect(db_path)
+    doc_columns = {row[1] for row in conn.execute("PRAGMA table_info(kb_documents)")}
+    indexes = {row[1] for row in conn.execute("PRAGMA index_list(kb_documents)")}
+    task_columns = {
+        row[1] for row in conn.execute("PRAGMA table_info(kb_ingestion_tasks)")
+    }
+    task_indexes = {
+        row[1] for row in conn.execute("PRAGMA index_list(kb_ingestion_tasks)")
+    }
+    conn.close()
+    await kb_db.close()
+
+    assert {
+        "source_type",
+        "source_uri",
+        "content_hash",
+        "parser_name",
+        "parser_version",
+        "chunker_name",
+        "chunker_version",
+        "status",
+        "error_stage",
+        "error_message",
+        "version",
+        "parent_doc_id",
+        "indexed_at",
+    }.issubset(doc_columns)
+    assert {
+        "idx_doc_content_hash",
+        "idx_doc_status",
+        "idx_doc_parent_doc_id",
+    }.issubset(indexes)
+    assert {
+        "task_id",
+        "kb_id",
+        "task_type",
+        "status",
+        "progress_stage",
+        "progress_current",
+        "progress_total",
+        "progress",
+        "result",
+        "error",
+        "created_at",
+        "updated_at",
+    }.issubset(task_columns)
+    assert {
+        "idx_task_task_id",
+        "idx_task_kb_id",
+        "idx_task_type",
+        "idx_task_status",
+        "idx_task_created_at",
+    }.issubset(task_indexes)
+
+
+@pytest.mark.asyncio
+async def test_get_document_by_content_hash_scopes_to_kb_and_active_status(tmp_path):
+    from astrbot.core.knowledge_base.kb_db_sqlite import KBSQLiteDatabase
+    from astrbot.core.knowledge_base.models import KBDocument
+
+    kb_db = KBSQLiteDatabase(str(tmp_path / "kb.db"))
+    await kb_db.initialize()
+    await kb_db.migrate_to_v1()
+
+    active_doc = KBDocument(
+        doc_id="doc-active",
+        kb_id="kb-a",
+        doc_name="active.txt",
+        file_type="txt",
+        file_size=1,
+        file_path="",
+        content_hash="hash-a",
+        status="ready",
+    )
+    failed_doc = KBDocument(
+        doc_id="doc-failed",
+        kb_id="kb-a",
+        doc_name="failed.txt",
+        file_type="txt",
+        file_size=1,
+        file_path="",
+        content_hash="hash-failed",
+        status="failed",
+    )
+    other_kb_doc = KBDocument(
+        doc_id="doc-other-kb",
+        kb_id="kb-b",
+        doc_name="other.txt",
+        file_type="txt",
+        file_size=1,
+        file_path="",
+        content_hash="hash-a",
+        status="ready",
+    )
+
+    async with kb_db.get_db() as session:
+        session.add(active_doc)
+        session.add(failed_doc)
+        session.add(other_kb_doc)
+        await session.commit()
+
+    duplicate = await kb_db.get_document_by_content_hash(
+        kb_id="kb-a",
+        content_hash="hash-a",
+    )
+    failed = await kb_db.get_document_by_content_hash(
+        kb_id="kb-a",
+        content_hash="hash-failed",
+    )
+    other_kb = await kb_db.get_document_by_content_hash(
+        kb_id="kb-b",
+        content_hash="hash-a",
+    )
+
+    await kb_db.close()
+
+    assert duplicate is not None
+    assert duplicate.doc_id == "doc-active"
+    assert failed is None
+    assert other_kb is not None
+    assert other_kb.doc_id == "doc-other-kb"
+
+
+@pytest.mark.asyncio
+async def test_document_list_filters_by_status_and_source_type(tmp_path):
+    from astrbot.core.knowledge_base.kb_db_sqlite import KBSQLiteDatabase
+    from astrbot.core.knowledge_base.models import KBDocument
+
+    kb_db = KBSQLiteDatabase(str(tmp_path / "kb.db"))
+    await kb_db.initialize()
+    await kb_db.migrate_to_v1()
+
+    docs = [
+        KBDocument(
+            doc_id="doc-ready-file",
+            kb_id="kb-a",
+            doc_name="alpha.txt",
+            file_type="txt",
+            file_size=1,
+            file_path="",
+            source_type="file",
+            status="ready",
+        ),
+        KBDocument(
+            doc_id="doc-failed-file",
+            kb_id="kb-a",
+            doc_name="alpha-failed.txt",
+            file_type="txt",
+            file_size=1,
+            file_path="",
+            source_type="file",
+            status="failed",
+        ),
+        KBDocument(
+            doc_id="doc-ready-url",
+            kb_id="kb-a",
+            doc_name="alpha-url.txt",
+            file_type="txt",
+            file_size=1,
+            file_path="",
+            source_type="url",
+            status="ready",
+        ),
+        KBDocument(
+            doc_id="doc-other-kb",
+            kb_id="kb-b",
+            doc_name="alpha.txt",
+            file_type="txt",
+            file_size=1,
+            file_path="",
+            source_type="file",
+            status="ready",
+        ),
+    ]
+
+    async with kb_db.get_db() as session:
+        session.add_all(docs)
+        await session.commit()
+
+    filtered_docs = await kb_db.list_documents_by_kb(
+        "kb-a",
+        search="alpha",
+        status="ready",
+        source_type="file",
+    )
+    filtered_count = await kb_db.count_documents_by_kb(
+        "kb-a",
+        search="alpha",
+        status="ready",
+        source_type="file",
+    )
+
+    await kb_db.close()
+
+    assert [doc.doc_id for doc in filtered_docs] == ["doc-ready-file"]
+    assert filtered_count == 1
+
+
+@pytest.mark.asyncio
+async def test_ingestion_task_crud_round_trips_json_and_filters(tmp_path):
+    from astrbot.core.knowledge_base.kb_db_sqlite import KBSQLiteDatabase
+
+    kb_db = KBSQLiteDatabase(str(tmp_path / "kb.db"))
+    await kb_db.initialize()
+    await kb_db.migrate_to_v1()
+
+    created = await kb_db.create_ingestion_task(
+        task_id="task-upload",
+        kb_id="kb-a",
+        task_type="upload",
+        status="pending",
+        progress_stage="waiting",
+        progress={"file_total": 2},
+    )
+    await kb_db.create_ingestion_task(
+        task_id="task-import",
+        kb_id="kb-b",
+        task_type="import",
+        status="processing",
+    )
+
+    updated = await kb_db.update_ingestion_task(
+        "task-upload",
+        status="completed",
+        progress_stage="embedding",
+        progress_current=2,
+        progress_total=2,
+        progress={"file_index": 1, "file_total": 2},
+        result={"success_count": 2, "failed": []},
+        error=None,
+    )
+    missing = await kb_db.update_ingestion_task(
+        "missing-task",
+        status="failed",
+    )
+    fetched = await kb_db.get_ingestion_task("task-upload")
+    completed_tasks = await kb_db.list_ingestion_tasks(status="completed")
+    kb_b_tasks = await kb_db.list_ingestion_tasks(kb_id="kb-b", task_type="import")
+    completed_task_count = await kb_db.count_ingestion_tasks(status="completed")
+    kb_b_task_count = await kb_db.count_ingestion_tasks(
+        kb_id="kb-b",
+        task_type="import",
+    )
+
+    await kb_db.close()
+
+    assert created["task_id"] == "task-upload"
+    assert created["progress"] == {"file_total": 2}
+    assert updated is not None
+    assert updated["status"] == "completed"
+    assert updated["progress_stage"] == "embedding"
+    assert updated["progress_current"] == 2
+    assert updated["progress_total"] == 2
+    assert updated["progress"] == {"file_index": 1, "file_total": 2}
+    assert updated["result"] == {"success_count": 2, "failed": []}
+    assert updated["error"] is None
+    assert missing is None
+    assert fetched == updated
+    assert [task["task_id"] for task in completed_tasks] == ["task-upload"]
+    assert [task["task_id"] for task in kb_b_tasks] == ["task-import"]
+    assert completed_task_count == 1
+    assert kb_b_task_count == 1
diff --git a/tests/test_kb_faiss_async_save.py b/tests/test_kb_faiss_async_save.py
new file mode 100644
index 0000000000..0e5f8767cd
--- /dev/null
+++ b/tests/test_kb_faiss_async_save.py
@@ -0,0 +1,169 @@
+"""Tests for #5: FAISS save_index uses asyncio.to_thread to avoid blocking
+the event loop during synchronous faiss.write_index calls.
+"""
+
+import asyncio
+from unittest.mock import MagicMock, patch
+
+import numpy as np
+import pytest
+
+
+def _make_storage(dimension: int = 128, path: str = "/tmp/test.index"):
+    """Build an EmbeddingStorage instance with a minimal mocked FAISS index."""
+    import asyncio
+
+    from astrbot.core.db.vec_db.faiss_impl.embedding_storage import EmbeddingStorage
+
+    storage = EmbeddingStorage.__new__(EmbeddingStorage)
+    storage.dimension = dimension
+    storage.path = path
+    storage._write_lock = asyncio.Lock()
+    # Mock FAISS index — just enough to satisfy the method guards
+    storage.index = MagicMock()
+    storage.index.ntotal = 100
+    return storage
+
+
+class TestFaissSaveIndexAsync:
+    """Verify save_index delegates to asyncio.to_thread."""
+
+    @pytest.mark.asyncio
+    async def test_save_index_uses_to_thread(self):
+        """save_index offloads faiss.write_index to a thread."""
+        import faiss  # noqa: F401 — ensure faiss is importable
+
+        storage = _make_storage()
+
+        with patch(
+            "astrbot.core.db.vec_db.faiss_impl.embedding_storage.asyncio.to_thread",
+        ) as mock_to_thread:
+            mock_to_thread.return_value = None  # simulate completion
+            await storage.save_index()
+
+        mock_to_thread.assert_awaited_once_with(
+            faiss.write_index,
+            storage.index,
+            storage.path,
+        )
+
+    @pytest.mark.asyncio
+    async def test_save_index_skips_when_index_none(self):
+        """save_index is a no-op when index hasn't been initialized."""
+        storage = _make_storage()
+        storage.index = None
+
+        with patch(
+            "astrbot.core.db.vec_db.faiss_impl.embedding_storage.asyncio.to_thread",
+        ) as mock_to_thread:
+            await storage.save_index()
+
+        mock_to_thread.assert_not_called()
+
+    @pytest.mark.asyncio
+    async def test_insert_calls_save_index(self):
+        """insert() calls _save_index_locked after adding the vector."""
+        storage = _make_storage()
+        storage.index.add_with_ids = MagicMock()
+
+        with patch.object(
+            storage, "_save_index_locked", return_value=None
+        ) as mock_save:
+            vector = np.random.rand(storage.dimension).astype(np.float32)
+            await storage.insert(vector, id=42)
+
+        storage.index.add_with_ids.assert_called_once()
+        mock_save.assert_awaited_once()
+
+    @pytest.mark.asyncio
+    async def test_insert_batch_calls_save_index(self):
+        """insert_batch() calls _save_index_locked after batch-adding vectors."""
+        storage = _make_storage()
+        storage.index.add_with_ids = MagicMock()
+
+        with patch.object(
+            storage, "_save_index_locked", return_value=None
+        ) as mock_save:
+            vectors = np.random.rand(10, storage.dimension).astype(np.float32)
+            ids = list(range(10))
+            await storage.insert_batch(vectors, ids)
+
+        storage.index.add_with_ids.assert_called_once()
+        mock_save.assert_awaited_once()
+
+    @pytest.mark.asyncio
+    async def test_delete_calls_save_index(self):
+        """delete() calls _save_index_locked after removing vectors."""
+        storage = _make_storage()
+        storage.index.remove_ids = MagicMock()
+
+        with patch.object(
+            storage, "_save_index_locked", return_value=None
+        ) as mock_save:
+            await storage.delete([1, 2, 3])
+
+        storage.index.remove_ids.assert_called_once()
+        mock_save.assert_awaited_once()
+
+    @pytest.mark.asyncio
+    async def test_save_index_with_real_faiss_index(self):
+        """End-to-end: save_index with a real FAISS index writes to a temp file."""
+        import tempfile
+
+        import faiss
+
+        dim = 128
+        base_index = faiss.IndexFlatL2(dim)
+        index = faiss.IndexIDMap(base_index)
+        index.add_with_ids(
+            np.random.rand(5, dim).astype(np.float32),
+            np.array([1, 2, 3, 4, 5], dtype=np.int64),
+        )
+
+        with tempfile.NamedTemporaryFile(suffix=".index", delete=False) as tmp:
+            tmp_path = tmp.name
+
+        try:
+            storage = _make_storage(dimension=dim, path=tmp_path)
+            storage.index = index
+
+            await storage.save_index()
+
+            # Verify file was written and is readable
+            assert __import__("os").path.exists(tmp_path)
+            assert __import__("os").path.getsize(tmp_path) > 0
+
+            # Round-trip: read back and verify dimension matches
+            restored = faiss.read_index(tmp_path)
+            assert restored.ntotal == 5
+        finally:
+            __import__("os").unlink(tmp_path)
+
+    @pytest.mark.asyncio
+    async def test_real_save_does_not_block_event_loop(self):
+        """Verify a real save_index completes quickly for a small index."""
+        import tempfile
+
+        import faiss
+
+        dim = 64
+        base_index = faiss.IndexFlatL2(dim)
+        index = faiss.IndexIDMap(base_index)
+        # 1000 vectors — should be very fast
+        index.add_with_ids(
+            np.random.rand(1000, dim).astype(np.float32),
+            np.arange(1000, dtype=np.int64),
+        )
+
+        with tempfile.NamedTemporaryFile(suffix=".index", delete=False) as tmp:
+            tmp_path = tmp.name
+
+        try:
+            storage = _make_storage(dimension=dim, path=tmp_path)
+            storage.index = index
+
+            # Should complete quickly
+            await asyncio.wait_for(storage.save_index(), timeout=5.0)
+            assert __import__("os").path.getsize(tmp_path) > 0
+        finally:
+            __import__("os").unlink(tmp_path)
diff --git a/tests/test_kb_import.py b/tests/test_kb_import.py
index 8795b06da1..82ab3c03a0 100644
--- a/tests/test_kb_import.py
+++ b/tests/test_kb_import.py
@@ -212,12 +212,13 @@ async def test_import_documents_returns_friendly_failure_message(
         max_retries=3,
     )
 
-    assert route.upload_tasks["task-1"]["status"] == "completed"
+    assert route.upload_tasks["task-1"]["status"] == "failed"
     result = route.upload_tasks["task-1"]["result"]
     assert result["success_count"] == 0
     assert result["failed_count"] == 1
     assert result["failed"][0]["file_name"] == "broken.txt"
     assert result["failed"][0]["error"].startswith("broken.txt:")
+    assert route.upload_tasks["task-1"]["error"] == result["failed"][0]["error"]
     assert "向量化失败" in result["failed"][0]["error"]
     assert "期望 2，实际 1" in result["failed"][0]["error"]
     assert "not same nb of vectors as ids" not in result["failed"][0]["error"]
diff --git a/tests/test_kb_sparse_retrieval.py b/tests/test_kb_sparse_retrieval.py
new file mode 100644
index 0000000000..1a356f542f
--- /dev/null
+++ b/tests/test_kb_sparse_retrieval.py
@@ -0,0 +1,329 @@
+"""Tests for sparse retrieval score consistency between FTS5 and BM25 paths.
+
+RRF only uses rank positions, not score magnitudes. The sparse retrieval stage
+just needs consistent sort direction: lower-is-better, ascending order.
+"""
+
+import json
+from unittest.mock import AsyncMock
+
+import pytest
+
+from astrbot.core.knowledge_base.retrieval.sparse_retriever import (
+    SparseResult,
+    SparseRetriever,
+)
+
+
+def _make_fake_doc(doc_id: str, text: str, metadata: dict) -> dict:
+    return {
+        "id": hash(doc_id) % 10000,
+        "doc_id": doc_id,
+        "text": text,
+        "metadata": json.dumps(metadata),
+        "created_at": "2025-01-01T00:00:00",
+        "updated_at": "2025-01-01T00:00:00",
+    }
+
+
+class TestSparseRetrieverScoreDirection:
+    """Verify FTS5 and BM25 both use lower-is-better, ascending sort."""
+
+    @pytest.mark.asyncio
+    async def test_fts5_best_match_has_lowest_score(self):
+        """FTS5: raw bm25=0 (perfect) → score=0, sorts first (ascending)."""
+        sr = SparseRetriever(kb_db=AsyncMock())
+        sr._index_cache = {}
+
+        vec_db = AsyncMock()
+        vec_db.document_storage.search_sparse = AsyncMock(
+            return_value=[
+                {
+                    "id": 1,
+                    "doc_id": "best",
+                    "text": "exact match",
+                    "metadata": json.dumps(
+                        {"chunk_index": 0, "kb_doc_id": "d1", "kb_id": "kb-a"}
+                    ),
+                    "score": 0.0,  # perfect
+                    "created_at": "",
+                    "updated_at": "",
+                },
+                {
+                    "id": 2,
+                    "doc_id": "worst",
+                    "text": "poor match",
+                    "metadata": json.dumps(
+                        {"chunk_index": 1, "kb_doc_id": "d1", "kb_id": "kb-a"}
+                    ),
+                    "score": 50.0,  # terrible
+                    "created_at": "",
+                    "updated_at": "",
+                },
+            ],
+        )
+
+        kb_options = {"kb-a": {"vec_db": vec_db, "top_k_sparse": 10}}
+        results = await sr.retrieve(
+            query="test", kb_ids=["kb-a"], kb_options=kb_options
+        )
+
+        assert len(results) == 2
+        assert results[0].chunk_id == "best", (
+            f"Best should be first, got {results[0].chunk_id}"
+        )
+        assert results[0].score == 0.0  # lower-is-better
+        assert results[0].score < results[1].score  # ascending
+
+    @pytest.mark.asyncio
+    async def test_fts5_negative_bm25_clamped_to_zero(self):
+        """FTS5 bm25() negative values → clamped to 0 (same as perfect match)."""
+        sr = SparseRetriever(kb_db=AsyncMock())
+        sr._index_cache = {}
+
+        vec_db = AsyncMock()
+        vec_db.document_storage.search_sparse = AsyncMock(
+            return_value=[
+                {
+                    "id": 1,
+                    "doc_id": "short-doc",
+                    "text": "short",
+                    "metadata": json.dumps(
+                        {"chunk_index": 0, "kb_doc_id": "d1", "kb_id": "kb-a"}
+                    ),
+                    "score": -8.56,  # FTS5 can be negative for short docs
+                    "created_at": "",
+                    "updated_at": "",
+                },
+            ],
+        )
+
+        kb_options = {"kb-a": {"vec_db": vec_db, "top_k_sparse": 10}}
+        results = await sr.retrieve(
+            query="test", kb_ids=["kb-a"], kb_options=kb_options
+        )
+
+        assert len(results) == 1
+        assert results[0].score == 0.0, (
+            f"Negative raw bm25 should be clamped to 0, got {results[0].score}"
+        )
+
+    @pytest.mark.asyncio
+    async def test_bm25_fallback_negates_scores(self):
+        """BM25Okapi higher=better → negated to lower=better, ascending sort."""
+        sr = SparseRetriever(kb_db=AsyncMock())
+        sr._index_cache = {}
+
+        vec_db = AsyncMock()
+        vec_db.document_storage.get_documents = AsyncMock(
+            return_value=[
+                _make_fake_doc(
+                    "chunk-best",
+                    "exact match hello world",
+                    {"chunk_index": 0, "kb_doc_id": "d1", "kb_id": "kb-a"},
+                ),
+                _make_fake_doc(
+                    "chunk-worst",
+                    "unrelated content here",
+                    {"chunk_index": 0, "kb_doc_id": "d2", "kb_id": "kb-a"},
+                ),
+            ],
+        )
+
+        kb_options = {"kb-a": {"vec_db": vec_db, "top_k_sparse": 50}}
+        results = await sr._retrieve_with_bm25(
+            query="hello", kb_ids=["kb-a"], kb_options=kb_options
+        )
+
+        assert len(results) == 2
+        # Best match should be most negative (negated highest BM25Okapi)
+        assert results[0].score <= results[1].score, (
+            f"Expected ascending sort (lower=better), got {[r.score for r in results]}"
+        )
+        # Best score should be <= 0 (negation of non-negative BM25Okapi)
+        assert results[0].score <= 0, (
+            f"BM25 fallback best match should be negative after negation, got {results[0].score}"
+        )
+
+    @pytest.mark.asyncio
+    async def test_merged_fts5_and_bm25_sort_correctly(self):
+        """Merge: FTS5 (0=best) + BM25 (neg=best) → ascending sort, both can be top."""
+        fts = [
+            SparseResult(
+                chunk_id="fts-best",
+                chunk_index=0,
+                doc_id="d1",
+                kb_id="kb-a",
+                content="a",
+                score=0.0,
+            ),
+            SparseResult(
+                chunk_id="fts-mid",
+                chunk_index=1,
+                doc_id="d1",
+                kb_id="kb-a",
+                content="b",
+                score=3.0,
+            ),
+            SparseResult(
+                chunk_id="fts-worst",
+                chunk_index=2,
+                doc_id="d2",
+                kb_id="kb-a",
+                content="c",
+                score=12.5,
+            ),
+        ]
+        bm25 = [
+            SparseResult(
+                chunk_id="bm25-good",
+                chunk_index=0,
+                doc_id="d3",
+                kb_id="kb-b",
+                content="d",
+                score=-15.0,
+            ),  # negated best
+            SparseResult(
+                chunk_id="bm25-ok",
+                chunk_index=1,
+                doc_id="d3",
+                kb_id="kb-b",
+                content="e",
+                score=-5.0,
+            ),
+            SparseResult(
+                chunk_id="bm25-poor",
+                chunk_index=2,
+                doc_id="d4",
+                kb_id="kb-b",
+                content="f",
+                score=0.0,
+            ),  # negated worst
+        ]
+
+        merged = fts + bm25
+        merged.sort(key=lambda x: x.score)  # ascending, lower=better
+
+        # Expected: bm25-good(-15) < fts-best(0) < fts-mid(3) < bm25-ok(-5) < bm25-poor(0) < fts-worst(12.5)
+        # Wait: -15 < -5 < 0 < 0 < 3 < 12.5
+        assert merged[0].chunk_id == "bm25-good"
+        assert merged[1].chunk_id == "bm25-ok"
+        # fts-best(0) and bm25-poor(0) tie — stable sort preserves order
+        assert merged[4].chunk_id == "fts-mid"
+        assert merged[5].chunk_id == "fts-worst"
+
+    @pytest.mark.asyncio
+    async def test_fts5_and_bm25_both_contribute_to_sort(self):
+        """Integration: both paths produce consistent lower-is-better scores."""
+        sr = SparseRetriever(kb_db=AsyncMock())
+
+        # KB "a" uses FTS5
+        fts_vec_db = AsyncMock()
+        fts_vec_db.document_storage.search_sparse = AsyncMock(
+            return_value=[
+                {
+                    "id": 1,
+                    "doc_id": "fts-hit",
+                    "text": "test query match",
+                    "metadata": json.dumps(
+                        {"chunk_index": 0, "kb_doc_id": "d1", "kb_id": "kb-a"}
+                    ),
+                    "score": 0.0,
+                },
+            ],
+        )
+
+        # KB "b" falls back to BM25
+        bm25_vec_db = AsyncMock()
+        bm25_vec_db.document_storage.search_sparse = AsyncMock(return_value=None)
+        bm25_vec_db.document_storage.get_documents = AsyncMock(
+            return_value=[
+                _make_fake_doc(
+                    "bm25-hit",
+                    "test query result",
+                    {"chunk_index": 0, "kb_doc_id": "d2", "kb_id": "kb-b"},
+                ),
+                _make_fake_doc(
+                    "bm25-miss",
+                    "unrelated",
+                    {"chunk_index": 0, "kb_doc_id": "d3", "kb_id": "kb-b"},
+                ),
+            ],
+        )
+
+        kb_options = {
+            "kb-a": {"vec_db": fts_vec_db, "top_k_sparse": 10},
+            "kb-b": {"vec_db": bm25_vec_db, "top_k_sparse": 10},
+        }
+
+        results = await sr.retrieve(
+            query="test", kb_ids=["kb-a", "kb-b"], kb_options=kb_options
+        )
+
+        assert len(results) >= 2
+        # Ascending order
+        for i in range(len(results) - 1):
+            assert results[i].score <= results[i + 1].score, (
+                f"Not sorted ascending at index {i}: {results[i].score} > {results[i + 1].score}"
+            )
+        # No out-of-range scores
+        for r in results:
+            assert r.score >= -1000.0, f"Unexpectedly low score: {r.score}"
+
+    @pytest.mark.asyncio
+    async def test_bm25_fallback_honors_chunk_limit(self):
+        """BM25 fallback caps loaded chunks at MAX_BM25_DOCS to prevent OOM."""
+        sr = SparseRetriever(kb_db=AsyncMock())
+
+        cap = sr.MAX_BM25_DOCS
+        # Create more docs than the cap
+        many_docs = [
+            _make_fake_doc(
+                f"chunk-{i}",
+                f"document content {i}",
+                {"chunk_index": i, "kb_doc_id": f"d{i // 10}", "kb_id": "kb-a"},
+            )
+            for i in range(cap + 100)
+        ]
+
+        vec_db = AsyncMock()
+        vec_db.document_storage.search_sparse = AsyncMock(return_value=None)
+        vec_db.document_storage.get_documents = AsyncMock(return_value=many_docs)
+
+        kb_options = {"kb-a": {"vec_db": vec_db, "top_k_sparse": 50}}
+
+        results = await sr.retrieve(
+            query="test", kb_ids=["kb-a"], kb_options=kb_options
+        )
+
+        # get_documents was called with the cap as limit
+        vec_db.document_storage.get_documents.assert_awaited_once_with(
+            metadata_filters={"kb_id": "kb-a"},
+            limit=cap,
+            offset=0,
+        )
+
+        # Results should not exceed the cap (minus what top_k_sparse filters)
+        assert len(results) <= 50  # top_k_sparse limit
+
+    @pytest.mark.asyncio
+    async def test_bm25_fallback_filters_by_kb_id(self):
+        """BM25 fallback now passes kb_id metadata filter to get_documents."""
+        sr = SparseRetriever(kb_db=AsyncMock())
+
+        vec_db = AsyncMock()
+        vec_db.document_storage.search_sparse = AsyncMock(return_value=None)
+        vec_db.document_storage.get_documents = AsyncMock(return_value=[])
+
+        kb_options = {
+            "kb-a": {"vec_db": vec_db, "top_k_sparse": 10},
+        }
+
+        await sr.retrieve(query="test", kb_ids=["kb-a"], kb_options=kb_options)
+
+        # Verify the kb_id filter is passed (previously was empty {})
+        vec_db.document_storage.get_documents.assert_awaited_once_with(
+            metadata_filters={"kb_id": "kb-a"},
+            limit=sr.MAX_BM25_DOCS,
+            offset=0,
+        )
diff --git a/tests/test_kb_stats.py b/tests/test_kb_stats.py
new file mode 100644
index 0000000000..24f0543d9e
--- /dev/null
+++ b/tests/test_kb_stats.py
@@ -0,0 +1,190 @@
+"""Tests for knowledge base statistics accuracy."""
+
+from unittest.mock import AsyncMock, MagicMock
+
+import pytest
+
+from astrbot.core.knowledge_base.kb_db_sqlite import KBSQLiteDatabase
+
+
+class TestUpdateKbStatsChunkCountScope:
+    """Verify update_kb_stats scopes chunk counts to the correct KB."""
+
+    @staticmethod
+    def _patch_get_db(db: KBSQLiteDatabase) -> None:
+        """Replace get_db with a mock that simulates the real async-CM flow.
+
+        In production::
+
+            async with self.get_db() as session, session.begin():
+                ...
+
+        Broken down:
+          1. ``self.get_db()`` → async CM
+          2. ``__aenter__()`` → await → session (bound via ``as``)
+          3. ``session.begin()`` → second async CM
+          4. ``__aenter__()`` → await → enters the transaction
+
+        We must ensure the ``session`` yielded by step 2 has a ``begin`` that
+        returns a valid async CM so the second ``async with`` succeeds.
+        """
+        session = AsyncMock()
+        # Step 2: __aenter__ must yield *this* session (with .begin overridden)
+        session.__aenter__.return_value = session
+        # Step 3-4: session.begin() returns an async CM → we return session itself
+        session.begin = MagicMock(return_value=session)
+
+        db.get_db = MagicMock(return_value=session)
+
+    @pytest.mark.asyncio
+    async def test_update_kb_stats_filters_chunk_count_by_kb_id(self):
+        """chunk_cnt should only count documents belonging to the target KB."""
+        db = KBSQLiteDatabase.__new__(KBSQLiteDatabase)
+        self._patch_get_db(db)
+
+        vec_db = AsyncMock()
+        vec_db.count_documents = AsyncMock(return_value=42)
+
+        await db.update_kb_stats(kb_id="kb-abc", vec_db=vec_db)
+
+        vec_db.count_documents.assert_awaited_once_with(
+            metadata_filter={"kb_id": "kb-abc"},
+        )
+
+    @pytest.mark.asyncio
+    async def test_update_kb_stats_passes_different_kb_ids(self):
+        """Each KB update should filter chunks by its own kb_id."""
+        db = KBSQLiteDatabase.__new__(KBSQLiteDatabase)
+        self._patch_get_db(db)
+
+        vec_db_a = AsyncMock()
+        vec_db_a.count_documents = AsyncMock(return_value=10)
+        vec_db_b = AsyncMock()
+        vec_db_b.count_documents = AsyncMock(return_value=20)
+
+        await db.update_kb_stats(kb_id="kb-alpha", vec_db=vec_db_a)
+        await db.update_kb_stats(kb_id="kb-beta", vec_db=vec_db_b)
+
+        vec_db_a.count_documents.assert_awaited_once_with(
+            metadata_filter={"kb_id": "kb-alpha"},
+        )
+        vec_db_b.count_documents.assert_awaited_once_with(
+            metadata_filter={"kb_id": "kb-beta"},
+        )
+
+    @pytest.mark.asyncio
+    async def test_update_kb_stats_zero_chunks(self):
+        """When a KB has no chunks, chunk_count should be set to 0."""
+        db = KBSQLiteDatabase.__new__(KBSQLiteDatabase)
+        self._patch_get_db(db)
+
+        vec_db = AsyncMock()
+        vec_db.count_documents = AsyncMock(return_value=0)
+
+        await db.update_kb_stats(kb_id="kb-empty", vec_db=vec_db)
+
+        vec_db.count_documents.assert_awaited_once_with(
+            metadata_filter={"kb_id": "kb-empty"},
+        )
+
+
+@pytest.mark.asyncio
+async def test_get_kb_stats_returns_status_and_chunk_breakdown(tmp_path):
+    from astrbot.core.knowledge_base.models import KBDocument, KBMedia, KnowledgeBase
+
+    kb_db = KBSQLiteDatabase(str(tmp_path / "kb.db"))
+    await kb_db.initialize()
+    await kb_db.migrate_to_v1()
+
+    kb = KnowledgeBase(
+        kb_id="kb-stats",
+        kb_name="stats",
+        embedding_provider_id="emb-1",
+        doc_count=3,
+        chunk_count=8,
+    )
+    docs = [
+        KBDocument(
+            doc_id="doc-ready-1",
+            kb_id="kb-stats",
+            doc_name="ready-1.txt",
+            file_type="txt",
+            file_size=10,
+            file_path=str(tmp_path / "ready-1.txt"),
+            source_type="file",
+            status="ready",
+            chunk_count=3,
+        ),
+        KBDocument(
+            doc_id="doc-ready-2",
+            kb_id="kb-stats",
+            doc_name="ready-2.txt",
+            file_type="txt",
+            file_size=20,
+            file_path="",
+            source_type="file",
+            status="ready",
+            chunk_count=5,
+        ),
+        KBDocument(
+            doc_id="doc-failed",
+            kb_id="kb-stats",
+            doc_name="failed.txt",
+            file_type="txt",
+            file_size=30,
+            file_path="",
+            source_type="file",
+            status="failed",
+            chunk_count=0,
+        ),
+        KBDocument(
+            doc_id="doc-other",
+            kb_id="kb-other",
+            doc_name="other.txt",
+            file_type="txt",
+            file_size=40,
+            file_path=str(tmp_path / "other.txt"),
+            source_type="file",
+            status="ready",
+            chunk_count=99,
+        ),
+    ]
+    media = KBMedia(
+        media_id="media-1",
+        doc_id="doc-ready-1",
+        kb_id="kb-stats",
+        media_type="image",
+        file_name="image.png",
+        file_path="",
+        file_size=7,
+        mime_type="image/png",
+    )
+
+    async with kb_db.get_db() as session:
+        session.add(kb)
+        for doc in docs:
+            session.add(doc)
+        session.add(media)
+        await session.commit()
+
+    stats = await kb_db.get_kb_stats("kb-stats")
+    missing = await kb_db.get_kb_stats("missing-kb")
+
+    await kb_db.close()
+
+    assert stats is not None
+    assert stats["kb_id"] == "kb-stats"
+    assert stats["doc_count"] == 3
+    assert stats["chunk_count"] == 8
+    assert stats["document_count"] == 3
+    assert stats["ready_document_count"] == 2
+    assert stats["failed_document_count"] == 1
+    assert stats["pending_document_count"] == 0
+    assert stats["processing_document_count"] == 0
+    assert stats["indexed_chunk_count"] == 8
+    assert stats["document_chunk_count"] == 8
+    assert stats["media_count"] == 1
+    assert stats["source_file_count"] == 1
+    assert stats["storage_bytes"] == 17
+    assert stats["status_counts"] == {"failed": 1, "ready": 2}
+    assert missing is None
diff --git a/tests/test_kb_update_route.py b/tests/test_kb_update_route.py
new file mode 100644
index 0000000000..5d9f3c298d
--- /dev/null
+++ b/tests/test_kb_update_route.py
@@ -0,0 +1,1882 @@
+from unittest.mock import AsyncMock, MagicMock, patch
+
+import pytest
+from quart import Quart
+
+
+def _build_route_with_manager(kb_manager: MagicMock):
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+    route._get_kb_manager = MagicMock(return_value=kb_manager)
+    return route
+
+
+def _build_kb_helper(rerank_provider_id: str | None = "rerank-1"):
+    from astrbot.core.knowledge_base.models import KnowledgeBase
+
+    kb = KnowledgeBase(
+        kb_id="kb-1",
+        kb_name="kb",
+        embedding_provider_id="emb-1",
+        rerank_provider_id=rerank_provider_id,
+    )
+    helper = MagicMock()
+    helper.kb = kb
+    return helper
+
+
+def _build_kb_helper_with_options(**kwargs):
+    from astrbot.core.knowledge_base.models import KnowledgeBase
+
+    kb = KnowledgeBase(
+        kb_id=kwargs.get("kb_id", "kb-1"),
+        kb_name=kwargs.get("kb_name", "kb"),
+        embedding_provider_id="emb-1",
+        rerank_provider_id=kwargs.get("rerank_provider_id", "rerank-1"),
+        chunk_size=kwargs.get("chunk_size", 512),
+        chunk_overlap=kwargs.get("chunk_overlap", 50),
+        top_k_dense=kwargs.get("top_k_dense", 50),
+        top_k_sparse=kwargs.get("top_k_sparse", 50),
+        top_m_final=kwargs.get("top_m_final", 5),
+        index_type=kwargs.get("index_type", "flat"),
+    )
+    helper = MagicMock()
+    helper.kb = kb
+    return helper
+
+
+@pytest.mark.asyncio
+async def test_get_capabilities_returns_backend_limits():
+    from astrbot.core.knowledge_base.capabilities import (
+        ALLOWED_UPLOAD_EXTENSIONS,
+        CHUNK_PAGE_SIZE_OPTIONS,
+        DEFAULT_BULK_PAGE_SIZE,
+        DEFAULT_CHUNK_OVERLAP,
+        DEFAULT_CHUNK_PAGE_SIZE,
+        DEFAULT_CHUNK_SIZE,
+        DEFAULT_DOCUMENT_PAGE_SIZE,
+        DEFAULT_INDEX_TYPE,
+        DEFAULT_KB_PAGE_SIZE,
+        DEFAULT_TOP_K_DENSE,
+        DEFAULT_TOP_K_SPARSE,
+        DEFAULT_TOP_M_FINAL,
+        DEFAULT_UPLOAD_BATCH_SIZE,
+        DEFAULT_UPLOAD_MAX_RETRIES,
+        DEFAULT_UPLOAD_TASKS_LIMIT,
+        DOCUMENT_FILTER_SOURCE_TYPES,
+        DOCUMENT_FILTER_STATUSES,
+        DOCUMENT_PAGE_SIZE_OPTIONS,
+        FEATURE_BATCH_DELETE,
+        FEATURE_BATCH_REBUILD,
+        FEATURE_CONSISTENCY_CHECK,
+        FEATURE_CONSISTENCY_REPAIR,
+        FEATURE_DOCUMENT_REBUILD,
+        FEATURE_KB_REBUILD,
+        FEATURE_RERANK,
+        FEATURE_SPARSE_RETRIEVAL,
+        FEATURE_URL_IMPORT,
+        MAX_BATCH_DELETE_DOCUMENTS,
+        MAX_BATCH_REBUILD_DOCUMENTS,
+        MAX_RETRIEVE_TOP_K,
+        MAX_UPLOAD_FILE_SIZE,
+        MAX_UPLOAD_FILES,
+    )
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    route = _build_route_with_manager(MagicMock())
+
+    response = await KnowledgeBaseRoute.get_capabilities(route)
+
+    assert response["status"] == "ok"
+    assert response["data"] == {
+        "upload": {
+            "allowed_extensions": sorted(ALLOWED_UPLOAD_EXTENSIONS),
+            "max_file_size_bytes": MAX_UPLOAD_FILE_SIZE,
+            "max_files_per_upload": MAX_UPLOAD_FILES,
+        },
+        "defaults": {
+            "chunk_size": DEFAULT_CHUNK_SIZE,
+            "chunk_overlap": DEFAULT_CHUNK_OVERLAP,
+            "batch_size": DEFAULT_UPLOAD_BATCH_SIZE,
+            "tasks_limit": DEFAULT_UPLOAD_TASKS_LIMIT,
+            "max_retries": DEFAULT_UPLOAD_MAX_RETRIES,
+            "top_k_dense": DEFAULT_TOP_K_DENSE,
+            "top_k_sparse": DEFAULT_TOP_K_SPARSE,
+            "top_m_final": DEFAULT_TOP_M_FINAL,
+            "index_type": DEFAULT_INDEX_TYPE,
+        },
+        "limits": {
+            "max_retrieve_top_k": MAX_RETRIEVE_TOP_K,
+            "max_batch_delete_documents": MAX_BATCH_DELETE_DOCUMENTS,
+            "max_batch_rebuild_documents": MAX_BATCH_REBUILD_DOCUMENTS,
+        },
+        "pagination": {
+            "document_page_size_options": list(DOCUMENT_PAGE_SIZE_OPTIONS),
+            "chunk_page_size_options": list(CHUNK_PAGE_SIZE_OPTIONS),
+            "default_kb_page_size": DEFAULT_KB_PAGE_SIZE,
+            "default_document_page_size": DEFAULT_DOCUMENT_PAGE_SIZE,
+            "default_chunk_page_size": DEFAULT_CHUNK_PAGE_SIZE,
+            "bulk_page_size": DEFAULT_BULK_PAGE_SIZE,
+        },
+        "document_filters": {
+            "statuses": list(DOCUMENT_FILTER_STATUSES),
+            "source_types": list(DOCUMENT_FILTER_SOURCE_TYPES),
+        },
+        "features": {
+            "sparse_retrieval": FEATURE_SPARSE_RETRIEVAL,
+            "rerank": FEATURE_RERANK,
+            "url_import": FEATURE_URL_IMPORT,
+            "document_rebuild": FEATURE_DOCUMENT_REBUILD,
+            "kb_rebuild": FEATURE_KB_REBUILD,
+            "consistency_check": FEATURE_CONSISTENCY_CHECK,
+            "consistency_repair": FEATURE_CONSISTENCY_REPAIR,
+            "batch_delete": FEATURE_BATCH_DELETE,
+            "batch_rebuild": FEATURE_BATCH_REBUILD,
+        },
+    }
+
+
+def test_validate_upload_file_uses_configured_size_limit_in_message():
+    from astrbot.core.knowledge_base.capabilities import MAX_UPLOAD_FILE_SIZE
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    with pytest.raises(ValueError, match="文件超过 .* 限制: too-large.md"):
+        KnowledgeBaseRoute._validate_upload_file(
+            "too-large.md",
+            MAX_UPLOAD_FILE_SIZE + 1,
+        )
+
+
+@pytest.mark.asyncio
+async def test_update_kb_omits_unprovided_rerank_provider_id():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=_build_kb_helper_with_options())
+    kb_manager.update_kb = AsyncMock(return_value=_build_kb_helper())
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/update",
+        method="POST",
+        json={"kb_id": "kb-1", "chunk_size": 1024},
+    ):
+        response = await KnowledgeBaseRoute.update_kb(route)
+
+    assert response["status"] == "ok"
+    kwargs = kb_manager.update_kb.await_args.kwargs
+    assert kwargs["kb_id"] == "kb-1"
+    assert kwargs["chunk_size"] == 1024
+    assert "rerank_provider_id" not in kwargs
+
+
+@pytest.mark.asyncio
+async def test_update_kb_explicit_null_forwards_rerank_provider_id():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=_build_kb_helper_with_options())
+    kb_manager.update_kb = AsyncMock(return_value=_build_kb_helper(None))
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/update",
+        method="POST",
+        json={"kb_id": "kb-1", "rerank_provider_id": None},
+    ):
+        response = await KnowledgeBaseRoute.update_kb(route)
+
+    assert response["status"] == "ok"
+    kwargs = kb_manager.update_kb.await_args.kwargs
+    assert kwargs["kb_id"] == "kb-1"
+    assert kwargs["rerank_provider_id"] is None
+
+
+@pytest.mark.asyncio
+async def test_update_kb_rejects_overlap_not_less_than_chunk_size():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=_build_kb_helper_with_options())
+    kb_manager.update_kb = AsyncMock()
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/update",
+        method="POST",
+        json={"kb_id": "kb-1", "chunk_size": 100, "chunk_overlap": 100},
+    ):
+        response = await KnowledgeBaseRoute.update_kb(route)
+
+    assert response["status"] == "error"
+    assert "chunk_overlap" in response["message"]
+    kb_manager.update_kb.assert_not_awaited()
+
+
+@pytest.mark.asyncio
+async def test_retrieve_accepts_kb_ids():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_manager = MagicMock()
+    kb_manager.retrieve = AsyncMock(return_value={"results": []})
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/retrieve",
+        method="POST",
+        json={"query": "hello", "kb_ids": ["kb-1"], "top_k": 3},
+    ):
+        response = await KnowledgeBaseRoute.retrieve(route)
+
+    assert response["status"] == "ok"
+    kb_manager.retrieve.assert_awaited_once_with(
+        query="hello",
+        kb_names=None,
+        kb_ids=["kb-1"],
+        top_m_final=3,
+        include_trace=False,
+    )
+
+
+@pytest.mark.asyncio
+async def test_retrieve_includes_trace_when_requested():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    trace = {
+        "dense": [{"rank": 1, "chunk_id": "chunk-1", "score": 0.9}],
+        "sparse": [],
+        "fusion": [],
+        "rerank": [],
+        "final": [],
+    }
+    app = Quart(__name__)
+    kb_manager = MagicMock()
+    kb_manager.retrieve = AsyncMock(
+        return_value={
+            "results": [
+                {
+                    "chunk_id": "chunk-1",
+                    "doc_id": "doc-1",
+                    "kb_id": "kb-1",
+                    "kb_name": "kb",
+                    "doc_name": "doc.md",
+                    "chunk_index": 0,
+                    "content": "hello",
+                    "score": 0.9,
+                    "char_count": 5,
+                },
+            ],
+            "trace": trace,
+        },
+    )
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/retrieve",
+        method="POST",
+        json={"query": "hello", "kb_ids": ["kb-1"], "top_k": 3, "trace": True},
+    ):
+        response = await KnowledgeBaseRoute.retrieve(route)
+
+    assert response["status"] == "ok"
+    assert response["data"]["trace"] == trace
+    kb_manager.retrieve.assert_awaited_once_with(
+        query="hello",
+        kb_names=None,
+        kb_ids=["kb-1"],
+        top_m_final=3,
+        include_trace=True,
+    )
+
+
+@pytest.mark.asyncio
+async def test_retrieve_rejects_invalid_trace_flag():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_manager = MagicMock()
+    kb_manager.retrieve = AsyncMock()
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/retrieve",
+        method="POST",
+        json={"query": "hello", "kb_ids": ["kb-1"], "trace": "maybe"},
+    ):
+        response = await KnowledgeBaseRoute.retrieve(route)
+
+    assert response["status"] == "error"
+    assert "trace" in response["message"]
+    kb_manager.retrieve.assert_not_awaited()
+
+
+@pytest.mark.asyncio
+async def test_retrieve_rejects_invalid_top_k():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_manager = MagicMock()
+    kb_manager.retrieve = AsyncMock()
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/retrieve",
+        method="POST",
+        json={"query": "hello", "kb_ids": ["kb-1"], "top_k": 0},
+    ):
+        response = await KnowledgeBaseRoute.retrieve(route)
+
+    assert response["status"] == "error"
+    assert "top_k" in response["message"]
+    kb_manager.retrieve.assert_not_awaited()
+
+
+@pytest.mark.asyncio
+async def test_retrieve_rejects_top_k_above_capability_limit():
+    from astrbot.core.knowledge_base.capabilities import MAX_RETRIEVE_TOP_K
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_manager = MagicMock()
+    kb_manager.retrieve = AsyncMock()
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/retrieve",
+        method="POST",
+        json={
+            "query": "hello",
+            "kb_ids": ["kb-1"],
+            "top_k": MAX_RETRIEVE_TOP_K + 1,
+        },
+    ):
+        response = await KnowledgeBaseRoute.retrieve(route)
+
+    assert response["status"] == "error"
+    assert str(MAX_RETRIEVE_TOP_K) in response["message"]
+    kb_manager.retrieve.assert_not_awaited()
+
+
+@pytest.mark.asyncio
+async def test_list_kbs_uses_capability_default_page_size():
+    from astrbot.core.knowledge_base.capabilities import DEFAULT_KB_PAGE_SIZE
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb = MagicMock()
+    kb.model_dump.return_value = {"kb_id": "kb-1", "kb_name": "kb"}
+    kb_manager = MagicMock()
+    kb_manager.list_kbs = AsyncMock(return_value=[kb])
+    kb_manager.get_kb = AsyncMock(return_value=MagicMock(init_error=None))
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/list",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.list_kbs(route)
+
+    assert response["status"] == "ok"
+    assert response["data"]["page"] == 1
+    assert response["data"]["page_size"] == DEFAULT_KB_PAGE_SIZE
+    assert response["data"]["total"] == 1
+
+
+@pytest.mark.asyncio
+async def test_list_kbs_returns_requested_page_and_total():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kbs = []
+    for index in range(1, 6):
+        kb = MagicMock()
+        kb.kb_id = f"kb-{index}"
+        kb.model_dump.return_value = {
+            "kb_id": f"kb-{index}",
+            "kb_name": f"kb {index}",
+        }
+        kbs.append(kb)
+    kb_manager = MagicMock()
+    kb_manager.list_kbs = AsyncMock(return_value=kbs)
+    kb_manager.get_kb = AsyncMock(return_value=MagicMock(init_error=None))
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/list?page=2&page_size=2",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.list_kbs(route)
+
+    assert response["status"] == "ok"
+    assert response["data"] == {
+        "items": [
+            {"kb_id": "kb-3", "kb_name": "kb 3"},
+            {"kb_id": "kb-4", "kb_name": "kb 4"},
+        ],
+        "page": 2,
+        "page_size": 2,
+        "total": 5,
+    }
+    kbs[0].model_dump.assert_not_called()
+    kbs[1].model_dump.assert_not_called()
+    kbs[4].model_dump.assert_not_called()
+
+
+@pytest.mark.asyncio
+async def test_list_kbs_refresh_stats_merges_database_stats():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb = MagicMock()
+    kb.kb_id = "kb-1"
+    kb.model_dump.return_value = {
+        "kb_id": "kb-1",
+        "kb_name": "kb",
+        "doc_count": 1,
+        "chunk_count": 2,
+    }
+    kb_manager = MagicMock()
+    kb_manager.list_kbs = AsyncMock(return_value=[kb])
+    kb_manager.get_kb = AsyncMock(return_value=MagicMock(init_error=None))
+    kb_db = MagicMock()
+    kb_db.get_kb_stats = AsyncMock(
+        return_value={
+            "kb_id": "kb-1",
+            "kb_name": "kb",
+            "document_count": 3,
+            "ready_document_count": 2,
+            "failed_document_count": 1,
+            "indexed_chunk_count": 8,
+            "document_chunk_count": 9,
+            "storage_bytes": 1024,
+            "status_counts": {"ready": 2, "failed": 1},
+        },
+    )
+    route = _build_route_with_manager(kb_manager)
+    route._get_kb_db = MagicMock(return_value=kb_db)
+
+    async with app.test_request_context(
+        "/api/kb/list?refresh_stats=true",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.list_kbs(route)
+
+    assert response["status"] == "ok"
+    item = response["data"]["items"][0]
+    assert item["document_count"] == 3
+    assert item["ready_document_count"] == 2
+    assert item["failed_document_count"] == 1
+    assert item["indexed_chunk_count"] == 8
+    assert item["document_chunk_count"] == 9
+    assert item["storage_bytes"] == 1024
+    assert item["status_counts"] == {"ready": 2, "failed": 1}
+    kb_db.get_kb_stats.assert_awaited_once_with("kb-1")
+
+
+@pytest.mark.asyncio
+async def test_list_kbs_skips_database_stats_without_refresh_flag():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb = MagicMock()
+    kb.kb_id = "kb-1"
+    kb.model_dump.return_value = {"kb_id": "kb-1", "kb_name": "kb"}
+    kb_manager = MagicMock()
+    kb_manager.list_kbs = AsyncMock(return_value=[kb])
+    kb_manager.get_kb = AsyncMock(return_value=MagicMock(init_error=None))
+    kb_db = MagicMock()
+    kb_db.get_kb_stats = AsyncMock(return_value={})
+    route = _build_route_with_manager(kb_manager)
+    route._get_kb_db = MagicMock(return_value=kb_db)
+
+    async with app.test_request_context(
+        "/api/kb/list",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.list_kbs(route)
+
+    assert response["status"] == "ok"
+    assert response["data"]["items"] == [{"kb_id": "kb-1", "kb_name": "kb"}]
+    kb_db.get_kb_stats.assert_not_awaited()
+
+
+@pytest.mark.asyncio
+async def test_list_documents_returns_total_and_uses_requested_pagination():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_helper = MagicMock()
+    doc = MagicMock()
+    doc.model_dump.return_value = {"doc_id": "doc-1", "doc_name": "alpha.md"}
+    kb_helper.list_documents = AsyncMock(return_value=[doc])
+    kb_helper.count_documents = AsyncMock(side_effect=[12, 123])
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=kb_helper)
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/document/list?kb_id=kb-1&page=3&page_size=25&search=alpha&status=ready&source_type=file",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.list_documents(route)
+
+    assert response["status"] == "ok"
+    assert response["data"]["items"] == [{"doc_id": "doc-1", "doc_name": "alpha.md"}]
+    assert response["data"]["page"] == 3
+    assert response["data"]["page_size"] == 25
+    assert response["data"]["total"] == 12
+    assert response["data"]["filtered_total"] == 12
+    assert response["data"]["document_count"] == 123
+    kb_helper.list_documents.assert_awaited_once_with(
+        offset=50,
+        limit=25,
+        search="alpha",
+        status="ready",
+        source_type="file",
+    )
+    assert kb_helper.count_documents.await_args_list[0].kwargs == {
+        "search": "alpha",
+        "status": "ready",
+        "source_type": "file",
+    }
+    assert kb_helper.count_documents.await_args_list[1].args == ()
+    assert kb_helper.count_documents.await_args_list[1].kwargs == {}
+
+
+@pytest.mark.asyncio
+async def test_list_documents_uses_total_as_document_count_without_search():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_helper = MagicMock()
+    kb_helper.list_documents = AsyncMock(return_value=[])
+    kb_helper.count_documents = AsyncMock(return_value=7)
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=kb_helper)
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/document/list?kb_id=kb-1&page=1&page_size=25",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.list_documents(route)
+
+    assert response["status"] == "ok"
+    assert response["data"]["total"] == 7
+    assert response["data"]["filtered_total"] == 7
+    assert response["data"]["document_count"] == 7
+    kb_helper.count_documents.assert_awaited_once_with(
+        search=None,
+        status=None,
+        source_type=None,
+    )
+
+
+@pytest.mark.asyncio
+async def test_list_documents_uses_capability_default_page_size():
+    from astrbot.core.knowledge_base.capabilities import DEFAULT_DOCUMENT_PAGE_SIZE
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_helper = MagicMock()
+    kb_helper.list_documents = AsyncMock(return_value=[])
+    kb_helper.count_documents = AsyncMock(return_value=7)
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=kb_helper)
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/document/list?kb_id=kb-1",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.list_documents(route)
+
+    assert response["status"] == "ok"
+    assert response["data"]["page_size"] == DEFAULT_DOCUMENT_PAGE_SIZE
+    kb_helper.list_documents.assert_awaited_once_with(
+        offset=0,
+        limit=DEFAULT_DOCUMENT_PAGE_SIZE,
+        search=None,
+        status=None,
+        source_type=None,
+    )
+
+
+@pytest.mark.asyncio
+async def test_list_documents_rejects_invalid_filters():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=MagicMock())
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/document/list?kb_id=kb-1&status=deleted",
+        method="GET",
+    ):
+        invalid_status_response = await KnowledgeBaseRoute.list_documents(route)
+
+    async with app.test_request_context(
+        "/api/kb/document/list?kb_id=kb-1&source_type=database",
+        method="GET",
+    ):
+        invalid_source_response = await KnowledgeBaseRoute.list_documents(route)
+
+    assert invalid_status_response["status"] == "error"
+    assert "status" in invalid_status_response["message"]
+    assert invalid_source_response["status"] == "error"
+    assert "source_type" in invalid_source_response["message"]
+
+
+@pytest.mark.asyncio
+async def test_get_document_rejects_other_kb_document():
+    from astrbot.core.knowledge_base.kb_helper import KBHelper
+    from astrbot.core.knowledge_base.models import KBDocument, KnowledgeBase
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_helper = KBHelper.__new__(KBHelper)
+    kb_helper.kb = KnowledgeBase(
+        kb_id="kb-1",
+        kb_name="kb",
+        embedding_provider_id="emb-1",
+    )
+    kb_helper.kb_db = MagicMock()
+    kb_helper.kb_db.get_document_by_id = AsyncMock(
+        return_value=KBDocument(
+            doc_id="doc-1",
+            kb_id="kb-2",
+            doc_name="doc.md",
+            file_type="md",
+            file_size=1,
+            file_path="",
+            status="ready",
+        ),
+    )
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=kb_helper)
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/document/get?kb_id=kb-1&doc_id=doc-1",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.get_document(route)
+
+    assert response["status"] == "error"
+    assert response["message"] == "文档不存在"
+    kb_helper.kb_db.get_document_by_id.assert_awaited_once_with("doc-1")
+
+
+@pytest.mark.asyncio
+async def test_list_chunks_forwards_search_and_total():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_helper = MagicMock()
+    kb_helper.search_chunks_by_doc_id = AsyncMock(
+        return_value=([{"chunk_id": "c1"}], 7),
+    )
+    kb_helper.get_chunk_count_by_doc_id = AsyncMock(return_value=42)
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=kb_helper)
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/chunk/list?kb_id=kb-1&doc_id=doc-1&page=2&page_size=3&search=hello",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.list_chunks(route)
+
+    assert response["status"] == "ok"
+    assert response["data"] == {
+        "items": [{"chunk_id": "c1"}],
+        "page": 2,
+        "page_size": 3,
+        "total": 7,
+        "filtered_total": 7,
+        "document_chunk_count": 42,
+    }
+    kb_helper.search_chunks_by_doc_id.assert_awaited_once_with(
+        doc_id="doc-1",
+        search="hello",
+        offset=3,
+        limit=3,
+    )
+    kb_helper.get_chunk_count_by_doc_id.assert_awaited_once_with("doc-1")
+
+
+@pytest.mark.asyncio
+async def test_list_chunks_uses_filtered_total_as_document_chunk_count_without_search():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_helper = MagicMock()
+    kb_helper.search_chunks_by_doc_id = AsyncMock(
+        return_value=([{"chunk_id": "c1"}], 7),
+    )
+    kb_helper.get_chunk_count_by_doc_id = AsyncMock()
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=kb_helper)
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/chunk/list?kb_id=kb-1&doc_id=doc-1&page=1&page_size=10",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.list_chunks(route)
+
+    assert response["status"] == "ok"
+    assert response["data"]["total"] == 7
+    assert response["data"]["filtered_total"] == 7
+    assert response["data"]["document_chunk_count"] == 7
+    kb_helper.get_chunk_count_by_doc_id.assert_not_awaited()
+
+
+@pytest.mark.asyncio
+async def test_list_chunks_uses_capability_default_page_size():
+    from astrbot.core.knowledge_base.capabilities import DEFAULT_CHUNK_PAGE_SIZE
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_helper = MagicMock()
+    kb_helper.search_chunks_by_doc_id = AsyncMock(return_value=([], 0))
+    kb_helper.get_chunk_count_by_doc_id = AsyncMock()
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=kb_helper)
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/chunk/list?kb_id=kb-1&doc_id=doc-1",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.list_chunks(route)
+
+    assert response["status"] == "ok"
+    assert response["data"]["page_size"] == DEFAULT_CHUNK_PAGE_SIZE
+    kb_helper.search_chunks_by_doc_id.assert_awaited_once_with(
+        doc_id="doc-1",
+        search=None,
+        offset=0,
+        limit=DEFAULT_CHUNK_PAGE_SIZE,
+    )
+
+
+@pytest.mark.asyncio
+async def test_get_chunk_context_returns_helper_context():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_helper = MagicMock()
+    kb_helper.get_chunk_context = AsyncMock(
+        return_value={
+            "previous": None,
+            "current": {"chunk_id": "chunk-1"},
+            "next": {"chunk_id": "chunk-2"},
+        },
+    )
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=kb_helper)
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/chunk/context?kb_id=kb-1&doc_id=doc-1&chunk_id=chunk-1",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.get_chunk_context(route)
+
+    assert response["status"] == "ok"
+    assert response["data"]["current"] == {"chunk_id": "chunk-1"}
+    kb_manager.get_kb.assert_awaited_once_with("kb-1")
+    kb_helper.get_chunk_context.assert_awaited_once_with(
+        chunk_id="chunk-1",
+        doc_id="doc-1",
+    )
+
+
+@pytest.mark.asyncio
+async def test_get_chunk_context_requires_chunk_id():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_manager = MagicMock()
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/chunk/context?kb_id=kb-1&doc_id=doc-1",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.get_chunk_context(route)
+
+    assert response["status"] == "error"
+    assert response["message"] == "缺少参数 chunk_id"
+    kb_manager.get_kb.assert_not_called()
+
+
+@pytest.mark.asyncio
+async def test_get_kb_stats_returns_extended_database_stats():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_helper = _build_kb_helper_with_options(kb_id="kb-1", kb_name="kb")
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=kb_helper)
+    kb_db = MagicMock()
+    kb_db.get_kb_stats = AsyncMock(
+        return_value={
+            "kb_id": "kb-1",
+            "kb_name": "kb",
+            "doc_count": 3,
+            "chunk_count": 8,
+            "document_count": 3,
+            "ready_document_count": 2,
+            "failed_document_count": 1,
+            "pending_document_count": 0,
+            "processing_document_count": 0,
+            "indexed_chunk_count": 8,
+            "document_chunk_count": 8,
+            "media_count": 1,
+            "source_file_count": 1,
+            "storage_bytes": 17,
+            "status_counts": {"ready": 2, "failed": 1},
+            "created_at": "2026-06-01T00:00:00+00:00",
+            "updated_at": "2026-06-01T00:00:00+00:00",
+        },
+    )
+    kb_manager.kb_db = kb_db
+    route = _build_route_with_manager(kb_manager)
+    route._get_kb_db = MagicMock(return_value=kb_db)
+
+    async with app.test_request_context(
+        "/api/kb/stats?kb_id=kb-1",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.get_kb_stats(route)
+
+    assert response["status"] == "ok"
+    assert response["data"]["document_count"] == 3
+    assert response["data"]["ready_document_count"] == 2
+    assert response["data"]["failed_document_count"] == 1
+    assert response["data"]["source_file_count"] == 1
+    assert response["data"]["storage_bytes"] == 17
+    assert response["data"]["status_counts"] == {"ready": 2, "failed": 1}
+    kb_db.get_kb_stats.assert_awaited_once_with("kb-1")
+
+
+@pytest.mark.asyncio
+async def test_get_kb_stats_fallback_keeps_extended_schema():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_helper = _build_kb_helper_with_options(kb_id="kb-1", kb_name="kb")
+    kb_helper.kb.doc_count = 3
+    kb_helper.kb.chunk_count = 8
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=kb_helper)
+    kb_db = MagicMock()
+    kb_db.get_kb_stats = AsyncMock(return_value=None)
+    route = _build_route_with_manager(kb_manager)
+    route._get_kb_db = MagicMock(return_value=kb_db)
+
+    async with app.test_request_context(
+        "/api/kb/stats?kb_id=kb-1",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.get_kb_stats(route)
+
+    assert response["status"] == "ok"
+    assert response["data"]["document_count"] == 3
+    assert response["data"]["ready_document_count"] == 3
+    assert response["data"]["indexed_chunk_count"] == 8
+    assert response["data"]["document_chunk_count"] == 8
+    assert response["data"]["media_count"] == 0
+    assert response["data"]["source_file_count"] == 0
+    assert response["data"]["storage_bytes"] == 0
+    assert response["data"]["status_counts"] == {"ready": 3}
+    kb_db.get_kb_stats.assert_awaited_once_with("kb-1")
+
+
+@pytest.mark.asyncio
+async def test_check_kb_consistency_returns_helper_report():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    report = {
+        "kb_id": "kb-1",
+        "summary": {"healthy": False, "missing_vectors": 1},
+        "issues": {"missing_vectors": [{"doc_id": "doc-1"}]},
+    }
+    kb_helper = MagicMock()
+    kb_helper.check_consistency = AsyncMock(return_value=report)
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=kb_helper)
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/consistency/check?kb_id=kb-1",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.check_kb_consistency(route)
+
+    assert response["status"] == "ok"
+    assert response["data"] == report
+    kb_manager.get_kb.assert_awaited_once_with("kb-1")
+    kb_helper.check_consistency.assert_awaited_once_with()
+
+
+@pytest.mark.asyncio
+async def test_check_kb_consistency_requires_existing_kb():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=None)
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/consistency/check?kb_id=missing-kb",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.check_kb_consistency(route)
+
+    assert response["status"] == "error"
+    assert response["message"] == "知识库不存在"
+    kb_manager.get_kb.assert_awaited_once_with("missing-kb")
+
+
+@pytest.mark.asyncio
+async def test_repair_kb_consistency_returns_helper_report():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    report = {
+        "kb_id": "kb-1",
+        "summary": {"repaired_count": 1, "failed_count": 0},
+        "actions": {"repaired": [{"type": "orphan_vectors"}]},
+    }
+    kb_helper = MagicMock()
+    kb_helper.repair_consistency = AsyncMock(return_value=report)
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=kb_helper)
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/consistency/repair",
+        method="POST",
+        json={
+            "kb_id": "kb-1",
+            "repair_types": ["orphan_vectors"],
+        },
+    ):
+        response = await KnowledgeBaseRoute.repair_kb_consistency(route)
+
+    assert response["status"] == "ok"
+    assert response["data"] == report
+    kb_manager.get_kb.assert_awaited_once_with("kb-1")
+    kb_helper.repair_consistency.assert_awaited_once_with(
+        repair_types=["orphan_vectors"],
+    )
+
+
+@pytest.mark.asyncio
+async def test_repair_kb_consistency_requires_existing_kb():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=None)
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/consistency/repair",
+        method="POST",
+        json={"kb_id": "missing-kb"},
+    ):
+        response = await KnowledgeBaseRoute.repair_kb_consistency(route)
+
+    assert response["status"] == "error"
+    assert response["message"] == "知识库不存在"
+    kb_manager.get_kb.assert_awaited_once_with("missing-kb")
+
+
+@pytest.mark.asyncio
+async def test_repair_kb_consistency_rejects_invalid_repair_types():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock()
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/consistency/repair",
+        method="POST",
+        json={"kb_id": "kb-1", "repair_types": "orphan_vectors"},
+    ):
+        response = await KnowledgeBaseRoute.repair_kb_consistency(route)
+
+    assert response["status"] == "error"
+    assert response["message"] == "repair_types 格式错误"
+    kb_manager.get_kb.assert_not_awaited()
+
+
+@pytest.mark.asyncio
+async def test_repair_kb_consistency_returns_helper_validation_errors():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_helper = MagicMock()
+    kb_helper.repair_consistency = AsyncMock(
+        side_effect=ValueError("不支持的一致性修复类型: invalid"),
+    )
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=kb_helper)
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/consistency/repair",
+        method="POST",
+        json={"kb_id": "kb-1", "repair_types": ["invalid"]},
+    ):
+        response = await KnowledgeBaseRoute.repair_kb_consistency(route)
+
+    assert response["status"] == "error"
+    assert response["message"] == "不支持的一致性修复类型: invalid"
+    kb_helper.repair_consistency.assert_awaited_once_with(
+        repair_types=["invalid"],
+    )
+
+
+@pytest.mark.asyncio
+async def test_get_upload_progress_falls_back_to_persistent_task():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    route = _build_route_with_manager(MagicMock())
+    route.upload_tasks = {}
+    route.upload_progress = {}
+    route._get_persistent_task = AsyncMock(
+        return_value={
+            "task_id": "task-1",
+            "status": "completed",
+            "progress_stage": "embedding",
+            "progress_current": 5,
+            "progress_total": 5,
+            "progress": {"stage": "embedding", "current": 5, "total": 5},
+            "result": {"success_count": 1},
+            "error": None,
+        },
+    )
+
+    async with app.test_request_context(
+        "/api/kb/document/upload/progress?task_id=task-1",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.get_upload_progress(route)
+
+    assert response["status"] == "ok"
+    assert response["data"] == {
+        "task_id": "task-1",
+        "status": "completed",
+        "progress_stage": "embedding",
+        "progress_current": 5,
+        "progress_total": 5,
+        "progress": {"stage": "embedding", "current": 5, "total": 5},
+        "result": {"success_count": 1},
+    }
+    route._get_persistent_task.assert_awaited_once_with("task-1")
+
+
+@pytest.mark.asyncio
+async def test_get_upload_progress_returns_flattened_persistent_progress():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    route = _build_route_with_manager(MagicMock())
+    route.upload_tasks = {}
+    route.upload_progress = {}
+    route._get_persistent_task = AsyncMock(
+        return_value={
+            "task_id": "task-1",
+            "status": "processing",
+            "progress_stage": "chunking",
+            "progress_current": 2,
+            "progress_total": 8,
+            "progress": None,
+            "result": None,
+            "error": None,
+        },
+    )
+
+    async with app.test_request_context(
+        "/api/kb/document/upload/progress?task_id=task-1",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.get_upload_progress(route)
+
+    assert response["status"] == "ok"
+    assert response["data"] == {
+        "task_id": "task-1",
+        "status": "processing",
+        "progress_stage": "chunking",
+        "progress_current": 2,
+        "progress_total": 8,
+    }
+    route._get_persistent_task.assert_awaited_once_with("task-1")
+
+
+def test_get_persistent_progress_updates_includes_flattened_fields():
+    route = _build_route_with_manager(MagicMock())
+    route.upload_progress = {
+        "task-1": {
+            "status": "completed",
+            "stage": "completed",
+            "current": 3,
+            "total": 3,
+        },
+    }
+
+    assert route._get_persistent_progress_updates("task-1") == {
+        "progress_stage": "completed",
+        "progress_current": 3,
+        "progress_total": 3,
+        "progress": {
+            "status": "completed",
+            "stage": "completed",
+            "current": 3,
+            "total": 3,
+        },
+    }
+    assert route._get_persistent_progress_updates("missing-task") == {}
+
+
+def test_batch_task_status_and_error_helpers_report_partial_failures():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    failed_docs = [
+        {"file_name": "a.md", "error": "a.md: fail"},
+        {"file_name": "b.md", "error": "b.md: fail"},
+    ]
+
+    assert KnowledgeBaseRoute._resolve_batch_task_status(2, 0) == "completed"
+    assert KnowledgeBaseRoute._resolve_batch_task_status(0, 2) == "failed"
+    assert KnowledgeBaseRoute._resolve_batch_task_status(1, 2) == "partial_failed"
+    assert (
+        KnowledgeBaseRoute._build_batch_failure_error(
+            failed_docs,
+            success_count=1,
+            action="导入",
+        )
+        == "部分文档导入失败，共 2 个失败。"
+    )
+    assert (
+        KnowledgeBaseRoute._build_batch_failure_error(
+            failed_docs,
+            success_count=0,
+            action="导入",
+        )
+        == "所有文档导入失败，共 2 个失败。"
+    )
+
+
+@pytest.mark.asyncio
+@pytest.mark.parametrize(
+    ("status", "uploaded", "total", "success_count", "progress"),
+    [
+        (
+            "failed",
+            [],
+            1,
+            0,
+            {"status": "failed", "stage": "parsing", "current": 0, "total": 100},
+        ),
+        (
+            "partial_failed",
+            [{"doc_id": "doc-1"}],
+            2,
+            1,
+            {
+                "status": "partial_failed",
+                "stage": "completed",
+                "current": 2,
+                "total": 2,
+            },
+        ),
+    ],
+)
+async def test_get_upload_progress_returns_terminal_task_result_from_memory(
+    status: str,
+    uploaded: list[dict],
+    total: int,
+    success_count: int,
+    progress: dict,
+):
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    route = _build_route_with_manager(MagicMock())
+    result = {
+        "task_id": "task-1",
+        "uploaded": uploaded,
+        "failed": [{"file_name": "same.md", "error": "same.md: duplicate"}],
+        "total": total,
+        "success_count": success_count,
+        "failed_count": 1,
+    }
+    route.upload_tasks = {
+        "task-1": {
+            "status": status,
+            "result": result,
+            "error": "same.md: duplicate",
+        },
+    }
+    route.upload_progress = {"task-1": progress}
+    route._cleanup_task = MagicMock()
+
+    async with app.test_request_context(
+        "/api/kb/document/upload/progress?task_id=task-1",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.get_upload_progress(route)
+
+    assert response["status"] == "ok"
+    assert response["data"] == {
+        "task_id": "task-1",
+        "status": status,
+        "result": result,
+        "error": "same.md: duplicate",
+    }
+    route._cleanup_task.assert_called_once_with("task-1")
+
+
+@pytest.mark.asyncio
+@pytest.mark.parametrize(
+    (
+        "status",
+        "uploaded",
+        "total",
+        "success_count",
+        "progress_stage",
+        "progress_current",
+        "progress_total",
+    ),
+    [
+        ("failed", [], 1, 0, "parsing", 0, 100),
+        ("partial_failed", [{"doc_id": "doc-1"}], 2, 1, "completed", 2, 2),
+    ],
+)
+async def test_get_upload_progress_returns_terminal_persistent_task_result(
+    status: str,
+    uploaded: list[dict],
+    total: int,
+    success_count: int,
+    progress_stage: str,
+    progress_current: int,
+    progress_total: int,
+):
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    route = _build_route_with_manager(MagicMock())
+    route.upload_tasks = {}
+    route.upload_progress = {}
+    result = {
+        "task_id": "task-1",
+        "uploaded": uploaded,
+        "failed": [{"file_name": "same.md", "error": "same.md: duplicate"}],
+        "total": total,
+        "success_count": success_count,
+        "failed_count": 1,
+    }
+    route._get_persistent_task = AsyncMock(
+        return_value={
+            "task_id": "task-1",
+            "status": status,
+            "progress_stage": progress_stage,
+            "progress_current": progress_current,
+            "progress_total": progress_total,
+            "progress": {
+                "stage": progress_stage,
+                "current": progress_current,
+                "total": progress_total,
+            },
+            "result": result,
+            "error": "same.md: duplicate",
+        },
+    )
+
+    async with app.test_request_context(
+        "/api/kb/document/upload/progress?task_id=task-1",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.get_upload_progress(route)
+
+    assert response["status"] == "ok"
+    assert response["data"] == {
+        "task_id": "task-1",
+        "status": status,
+        "progress_stage": progress_stage,
+        "progress_current": progress_current,
+        "progress_total": progress_total,
+        "progress": {
+            "stage": progress_stage,
+            "current": progress_current,
+            "total": progress_total,
+        },
+        "result": result,
+        "error": "same.md: duplicate",
+    }
+    route._get_persistent_task.assert_awaited_once_with("task-1")
+
+
+@pytest.mark.asyncio
+async def test_get_task_returns_persistent_task():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    route = _build_route_with_manager(MagicMock())
+    route._get_persistent_task = AsyncMock(
+        return_value={"task_id": "task-1", "status": "completed"},
+    )
+
+    async with app.test_request_context(
+        "/api/kb/task/get?task_id=task-1",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.get_task(route)
+
+    assert response["status"] == "ok"
+    assert response["data"] == {"task_id": "task-1", "status": "completed"}
+    route._get_persistent_task.assert_awaited_once_with("task-1")
+
+
+@pytest.mark.asyncio
+async def test_get_task_requires_task_id():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    route = _build_route_with_manager(MagicMock())
+    route._get_persistent_task = AsyncMock()
+
+    async with app.test_request_context(
+        "/api/kb/task/get",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.get_task(route)
+
+    assert response["status"] == "error"
+    assert "task_id" in response["message"]
+    route._get_persistent_task.assert_not_awaited()
+
+
+@pytest.mark.asyncio
+async def test_list_tasks_forwards_filters_and_pagination():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_db = MagicMock()
+    kb_db.list_ingestion_tasks = AsyncMock(
+        return_value=[{"task_id": "task-1", "status": "completed"}],
+    )
+    kb_db.count_ingestion_tasks = AsyncMock(return_value=76)
+    route = _build_route_with_manager(MagicMock())
+    route._get_kb_db = MagicMock(return_value=kb_db)
+
+    async with app.test_request_context(
+        "/api/kb/task/list?kb_id=kb-1&status=completed&task_type=upload&page=3&page_size=25",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.list_tasks(route)
+
+    assert response["status"] == "ok"
+    assert response["data"] == {
+        "items": [{"task_id": "task-1", "status": "completed"}],
+        "total": 76,
+        "page": 3,
+        "page_size": 25,
+    }
+    kb_db.list_ingestion_tasks.assert_awaited_once_with(
+        kb_id="kb-1",
+        status="completed",
+        task_type="upload",
+        offset=50,
+        limit=25,
+    )
+    kb_db.count_ingestion_tasks.assert_awaited_once_with(
+        kb_id="kb-1",
+        status="completed",
+        task_type="upload",
+    )
+
+
+@pytest.mark.asyncio
+async def test_list_tasks_uses_capability_default_page_size():
+    from astrbot.core.knowledge_base.capabilities import DEFAULT_DOCUMENT_PAGE_SIZE
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_db = MagicMock()
+    kb_db.list_ingestion_tasks = AsyncMock(return_value=[])
+    kb_db.count_ingestion_tasks = AsyncMock(return_value=0)
+    route = _build_route_with_manager(MagicMock())
+    route._get_kb_db = MagicMock(return_value=kb_db)
+
+    async with app.test_request_context(
+        "/api/kb/task/list",
+        method="GET",
+    ):
+        response = await KnowledgeBaseRoute.list_tasks(route)
+
+    assert response["status"] == "ok"
+    assert response["data"]["page_size"] == DEFAULT_DOCUMENT_PAGE_SIZE
+    kb_db.list_ingestion_tasks.assert_awaited_once_with(
+        kb_id=None,
+        status=None,
+        task_type=None,
+        offset=0,
+        limit=DEFAULT_DOCUMENT_PAGE_SIZE,
+    )
+
+
+@pytest.mark.asyncio
+async def test_rebuild_document_route_forwards_options():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_helper = MagicMock()
+    doc = MagicMock()
+    doc.model_dump.return_value = {
+        "doc_id": "new-doc",
+        "parent_doc_id": "old-doc",
+        "version": 2,
+    }
+    kb_helper.rebuild_document = AsyncMock(return_value=doc)
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=kb_helper)
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/document/rebuild",
+        method="POST",
+        json={
+            "kb_id": "kb-1",
+            "doc_id": "old-doc",
+            "chunk_size": 256,
+            "chunk_overlap": 32,
+            "batch_size": 4,
+            "tasks_limit": 2,
+            "max_retries": 1,
+        },
+    ):
+        response = await KnowledgeBaseRoute.rebuild_document(route)
+
+    assert response["status"] == "ok"
+    assert response["data"]["doc_id"] == "new-doc"
+    kb_helper.rebuild_document.assert_awaited_once_with(
+        "old-doc",
+        chunk_size=256,
+        chunk_overlap=32,
+        batch_size=4,
+        tasks_limit=2,
+        max_retries=1,
+    )
+
+
+@pytest.mark.asyncio
+async def test_rebuild_document_route_can_start_background_task():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_helper = MagicMock()
+    kb_helper.rebuild_document = AsyncMock()
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=kb_helper)
+    route = _build_route_with_manager(kb_manager)
+    route.upload_tasks = {}
+    route.upload_progress = {}
+    route._create_persistent_task = AsyncMock()
+    background_call = object()
+    route._background_rebuild_document_task = MagicMock(return_value=background_call)
+
+    with (
+        patch(
+            "astrbot.dashboard.routes.knowledge_base.uuid.uuid4",
+            return_value="task-1",
+        ),
+        patch(
+            "astrbot.dashboard.routes.knowledge_base.asyncio.create_task"
+        ) as create_task,
+    ):
+        async with app.test_request_context(
+            "/api/kb/document/rebuild",
+            method="POST",
+            json={
+                "kb_id": "kb-1",
+                "doc_id": "old-doc",
+                "chunk_size": 256,
+                "chunk_overlap": 32,
+                "batch_size": 4,
+                "tasks_limit": 2,
+                "max_retries": 1,
+                "background": True,
+            },
+        ):
+            response = await KnowledgeBaseRoute.rebuild_document(route)
+
+    assert response["status"] == "ok"
+    assert response["data"] == {
+        "task_id": "task-1",
+        "doc_id": "old-doc",
+        "message": "document rebuild task created, processing in background",
+    }
+    assert route.upload_tasks["task-1"]["status"] == "pending"
+    route._create_persistent_task.assert_awaited_once_with(
+        task_id="task-1",
+        kb_id="kb-1",
+        task_type="document_rebuild",
+        status="pending",
+        progress={
+            "status": "pending",
+            "file_index": 0,
+            "file_total": 1,
+            "file_name": "old-doc",
+            "stage": "waiting",
+            "current": 0,
+            "total": 100,
+        },
+    )
+    route._background_rebuild_document_task.assert_called_once_with(
+        task_id="task-1",
+        kb_helper=kb_helper,
+        doc_id="old-doc",
+        chunk_size=256,
+        chunk_overlap=32,
+        batch_size=4,
+        tasks_limit=2,
+        max_retries=1,
+    )
+    create_task.assert_called_once_with(background_call)
+    kb_helper.rebuild_document.assert_not_awaited()
+
+
+@pytest.mark.asyncio
+async def test_rebuild_document_route_rejects_invalid_background_flag():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock()
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/document/rebuild",
+        method="POST",
+        json={
+            "kb_id": "kb-1",
+            "doc_id": "doc-1",
+            "background": "later",
+        },
+    ):
+        response = await KnowledgeBaseRoute.rebuild_document(route)
+
+    assert response["status"] == "error"
+    assert "background" in response["message"]
+    kb_manager.get_kb.assert_not_awaited()
+
+
+@pytest.mark.asyncio
+async def test_rebuild_document_route_rejects_invalid_options():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock()
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/document/rebuild",
+        method="POST",
+        json={
+            "kb_id": "kb-1",
+            "doc_id": "doc-1",
+            "chunk_size": 10,
+            "chunk_overlap": 10,
+        },
+    ):
+        response = await KnowledgeBaseRoute.rebuild_document(route)
+
+    assert response["status"] == "error"
+    assert "chunk_overlap" in response["message"]
+    kb_manager.get_kb.assert_not_awaited()
+
+
+@pytest.mark.asyncio
+async def test_rebuild_kb_route_forwards_options():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_helper = MagicMock()
+    kb_helper.rebuild_all_documents = AsyncMock(
+        return_value={
+            "total": 1,
+            "success_count": 1,
+            "failed_count": 0,
+            "rebuilt": [{"doc_id": "doc-new"}],
+            "failed": [],
+        },
+    )
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=kb_helper)
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/rebuild",
+        method="POST",
+        json={
+            "kb_id": "kb-1",
+            "chunk_size": 256,
+            "chunk_overlap": 32,
+            "batch_size": 4,
+            "tasks_limit": 2,
+            "max_retries": 1,
+        },
+    ):
+        response = await KnowledgeBaseRoute.rebuild_kb(route)
+
+    assert response["status"] == "ok"
+    assert response["data"]["success_count"] == 1
+    kb_helper.rebuild_all_documents.assert_awaited_once_with(
+        chunk_size=256,
+        chunk_overlap=32,
+        batch_size=4,
+        tasks_limit=2,
+        max_retries=1,
+    )
+
+
+@pytest.mark.asyncio
+async def test_rebuild_kb_route_can_start_background_task():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_helper = _build_kb_helper_with_options(kb_id="kb-1", kb_name="docs")
+    kb_helper.rebuild_all_documents = AsyncMock()
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=kb_helper)
+    route = _build_route_with_manager(kb_manager)
+    route.upload_tasks = {}
+    route.upload_progress = {}
+    route._create_persistent_task = AsyncMock()
+    background_call = object()
+    route._background_rebuild_kb_task = MagicMock(return_value=background_call)
+
+    with (
+        patch(
+            "astrbot.dashboard.routes.knowledge_base.uuid.uuid4",
+            return_value="task-1",
+        ),
+        patch(
+            "astrbot.dashboard.routes.knowledge_base.asyncio.create_task"
+        ) as create_task,
+    ):
+        async with app.test_request_context(
+            "/api/kb/rebuild",
+            method="POST",
+            json={
+                "kb_id": "kb-1",
+                "chunk_size": 256,
+                "chunk_overlap": 32,
+                "batch_size": 4,
+                "tasks_limit": 2,
+                "max_retries": 1,
+                "background": True,
+            },
+        ):
+            response = await KnowledgeBaseRoute.rebuild_kb(route)
+
+    assert response["status"] == "ok"
+    assert response["data"] == {
+        "task_id": "task-1",
+        "kb_id": "kb-1",
+        "message": "knowledge base rebuild task created, processing in background",
+    }
+    assert route.upload_tasks["task-1"]["status"] == "pending"
+    route._create_persistent_task.assert_awaited_once_with(
+        task_id="task-1",
+        kb_id="kb-1",
+        task_type="kb_rebuild",
+        status="pending",
+        progress={
+            "status": "pending",
+            "file_index": 0,
+            "file_total": 1,
+            "file_name": "docs",
+            "stage": "waiting",
+            "current": 0,
+            "total": 100,
+        },
+    )
+    route._background_rebuild_kb_task.assert_called_once_with(
+        task_id="task-1",
+        kb_helper=kb_helper,
+        chunk_size=256,
+        chunk_overlap=32,
+        batch_size=4,
+        tasks_limit=2,
+        max_retries=1,
+    )
+    create_task.assert_called_once_with(background_call)
+    kb_helper.rebuild_all_documents.assert_not_awaited()
+
+
+@pytest.mark.asyncio
+async def test_rebuild_kb_route_requires_kb_id():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock()
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/rebuild",
+        method="POST",
+        json={},
+    ):
+        response = await KnowledgeBaseRoute.rebuild_kb(route)
+
+    assert response["status"] == "error"
+    assert "kb_id" in response["message"]
+    kb_manager.get_kb.assert_not_awaited()
+
+
+@pytest.mark.asyncio
+async def test_batch_rebuild_documents_route_starts_background_task():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_helper = MagicMock()
+    kb_helper.rebuild_documents = AsyncMock()
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock(return_value=kb_helper)
+    route = _build_route_with_manager(kb_manager)
+    route.upload_tasks = {}
+    route.upload_progress = {}
+    route._create_persistent_task = AsyncMock()
+    background_call = object()
+    route._background_rebuild_documents_task = MagicMock(
+        return_value=background_call,
+    )
+
+    with (
+        patch(
+            "astrbot.dashboard.routes.knowledge_base.uuid.uuid4",
+            return_value="task-1",
+        ),
+        patch(
+            "astrbot.dashboard.routes.knowledge_base.asyncio.create_task"
+        ) as create_task,
+    ):
+        async with app.test_request_context(
+            "/api/kb/document/batch-rebuild",
+            method="POST",
+            json={
+                "kb_id": "kb-1",
+                "doc_ids": ["doc-1", "doc-2", "doc-1"],
+                "chunk_size": 256,
+                "chunk_overlap": 32,
+                "batch_size": 4,
+                "tasks_limit": 2,
+                "max_retries": 1,
+            },
+        ):
+            response = await KnowledgeBaseRoute.batch_rebuild_documents(route)
+
+    assert response["status"] == "ok"
+    assert response["data"] == {
+        "task_id": "task-1",
+        "doc_ids": ["doc-1", "doc-2"],
+        "message": "document batch rebuild task created, processing in background",
+    }
+    assert route.upload_tasks["task-1"]["status"] == "pending"
+    route._create_persistent_task.assert_awaited_once_with(
+        task_id="task-1",
+        kb_id="kb-1",
+        task_type="document_batch_rebuild",
+        status="pending",
+        progress={
+            "status": "pending",
+            "file_index": 0,
+            "file_total": 2,
+            "file_name": "2 selected documents",
+            "stage": "waiting",
+            "current": 0,
+            "total": 2,
+        },
+    )
+    route._background_rebuild_documents_task.assert_called_once_with(
+        task_id="task-1",
+        kb_helper=kb_helper,
+        doc_ids=["doc-1", "doc-2"],
+        chunk_size=256,
+        chunk_overlap=32,
+        batch_size=4,
+        tasks_limit=2,
+        max_retries=1,
+    )
+    create_task.assert_called_once_with(background_call)
+    kb_helper.rebuild_documents.assert_not_awaited()
+
+
+@pytest.mark.asyncio
+async def test_batch_rebuild_documents_route_rejects_invalid_doc_ids():
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock()
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/document/batch-rebuild",
+        method="POST",
+        json={"kb_id": "kb-1", "doc_ids": []},
+    ):
+        response = await KnowledgeBaseRoute.batch_rebuild_documents(route)
+
+    assert response["status"] == "error"
+    assert "doc_ids" in response["message"]
+    kb_manager.get_kb.assert_not_awaited()
+
+
+@pytest.mark.asyncio
+async def test_batch_rebuild_documents_route_rejects_limit_excess():
+    from astrbot.core.knowledge_base.capabilities import MAX_BATCH_REBUILD_DOCUMENTS
+    from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+    app = Quart(__name__)
+    kb_manager = MagicMock()
+    kb_manager.get_kb = AsyncMock()
+    route = _build_route_with_manager(kb_manager)
+
+    async with app.test_request_context(
+        "/api/kb/document/batch-rebuild",
+        method="POST",
+        json={
+            "kb_id": "kb-1",
+            "doc_ids": [
+                f"doc-{index}" for index in range(MAX_BATCH_REBUILD_DOCUMENTS + 1)
+            ],
+        },
+    ):
+        response = await KnowledgeBaseRoute.batch_rebuild_documents(route)
+
+    assert response["status"] == "error"
+    assert str(MAX_BATCH_REBUILD_DOCUMENTS) in response["message"]
+    kb_manager.get_kb.assert_not_awaited()
diff --git a/tests/test_kb_upload_memory_leak.py b/tests/test_kb_upload_memory_leak.py
new file mode 100644
index 0000000000..9e56cd02d9
--- /dev/null
+++ b/tests/test_kb_upload_memory_leak.py
@@ -0,0 +1,844 @@
+"""Tests for #1: Memory leak fix in upload_tasks / upload_progress.
+
+Verifies:
+- Completed/failed tasks are cleaned up on poll (get_upload_progress)
+- Processing/pending tasks are NOT cleaned up
+- Delayed cleanup is scheduled by background tasks (finally block)
+- Delayed cleanup actually removes after sleep
+- Cleanup is idempotent
+- CancelledError is handled gracefully
+"""
+
+import asyncio
+from unittest.mock import AsyncMock, MagicMock
+
+import pytest
+
+
+def _persistent_progress_kwargs(progress: dict) -> dict:
+    return {
+        "progress_stage": progress.get("stage"),
+        "progress_current": progress.get("current"),
+        "progress_total": progress.get("total"),
+        "progress": progress,
+    }
+
+
+class TestUploadTaskCleanup:
+    """Verify task cleanup in get_upload_progress."""
+
+    @pytest.mark.asyncio
+    async def test_create_persistent_task_writes_to_kb_db(self):
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        kb_db = MagicMock()
+        kb_db.create_ingestion_task = AsyncMock()
+        route._get_kb_db = MagicMock(return_value=kb_db)
+
+        await route._create_persistent_task(
+            task_id="task-1",
+            kb_id="kb-1",
+            task_type="upload",
+            status="pending",
+            progress={
+                "stage": "waiting",
+                "current": 0,
+                "total": 100,
+            },
+        )
+
+        kb_db.create_ingestion_task.assert_awaited_once_with(
+            task_id="task-1",
+            kb_id="kb-1",
+            task_type="upload",
+            status="pending",
+            progress_stage="waiting",
+            progress_current=0,
+            progress_total=100,
+            progress={
+                "stage": "waiting",
+                "current": 0,
+                "total": 100,
+            },
+        )
+
+    @pytest.mark.asyncio
+    async def test_persist_progress_updates_kb_db_from_memory(self):
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        route.upload_progress = {
+            "task-1": {
+                "status": "processing",
+                "stage": "embedding",
+                "current": 2,
+                "total": 5,
+            },
+        }
+        route._update_persistent_task = AsyncMock()
+
+        await route._persist_progress("task-1")
+
+        route._update_persistent_task.assert_awaited_once_with(
+            "task-1",
+            status="processing",
+            progress_stage="embedding",
+            progress_current=2,
+            progress_total=5,
+            progress={
+                "status": "processing",
+                "stage": "embedding",
+                "current": 2,
+                "total": 5,
+            },
+        )
+
+    def test_format_failed_doc_error_only_skips_exact_file_prefix(self):
+        """File names that are only a prefix of another word still get prepended."""
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        assert (
+            KnowledgeBaseRoute._format_failed_doc_error(
+                "doc",
+                ValueError("document parse error"),
+            )
+            == "doc: document parse error"
+        )
+        assert (
+            KnowledgeBaseRoute._format_failed_doc_error(
+                "doc",
+                ValueError("doc: parse error"),
+            )
+            == "doc: parse error"
+        )
+
+    def test_build_batch_failure_error_uses_single_document_reason(self):
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        assert (
+            KnowledgeBaseRoute._build_batch_failure_error(
+                [{"file_name": "doc.md", "error": "doc.md: duplicate"}],
+            )
+            == "doc.md: duplicate"
+        )
+        assert KnowledgeBaseRoute._build_batch_failure_error([]) is None
+
+    @pytest.mark.asyncio
+    async def test_cleanup_on_completed_poll(self):
+        """Completed task cleaned up when client polls for result."""
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        route.upload_tasks = {
+            "task-1": {
+                "status": "completed",
+                "result": {"uploaded": []},
+                "error": None,
+            },
+        }
+        route.upload_progress = {
+            "task-1": {"status": "completed", "file_index": 0, "file_total": 1},
+        }
+
+        route._cleanup_task("task-1")
+
+        assert "task-1" not in route.upload_tasks
+        assert "task-1" not in route.upload_progress
+
+    @pytest.mark.asyncio
+    async def test_cleanup_on_failed_poll(self):
+        """Failed task cleaned up when client polls for result."""
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        route.upload_tasks = {
+            "task-1": {
+                "status": "failed",
+                "result": None,
+                "error": "upload failed",
+            },
+        }
+        route.upload_progress = {
+            "task-1": {"status": "failed", "file_index": 0, "file_total": 1},
+        }
+
+        route._cleanup_task("task-1")
+
+        assert "task-1" not in route.upload_tasks
+        assert "task-1" not in route.upload_progress
+
+    def test_no_cleanup_for_processing(self):
+        """_cleanup_task only removes what it's told — caller decides status filter."""
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        route.upload_tasks = {
+            "task-1": {"status": "processing", "result": None, "error": None},
+        }
+        route.upload_progress = {
+            "task-1": {"status": "processing", "file_index": 1, "file_total": 5},
+        }
+
+        # _cleanup_task is status-agnostic; the caller (get_upload_progress)
+        # only calls it for completed/failed.  This test verifies that
+        # processing entries CAN be cleaned up by the method, not that
+        # get_upload_progress cleans them up.
+        route._cleanup_task("task-1")
+
+        assert "task-1" not in route.upload_tasks
+        assert "task-1" not in route.upload_progress
+
+    def test_cleanup_task_idempotent(self):
+        """Calling _cleanup_task twice is safe (idempotent)."""
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        route.upload_tasks = {"task-1": {}}
+        route.upload_progress = {"task-1": {}}
+
+        route._cleanup_task("task-1")
+        route._cleanup_task("task-1")  # second call should not raise
+        route._cleanup_task("never-existed")  # non-existent should not raise
+
+        assert "task-1" not in route.upload_tasks
+        assert "task-1" not in route.upload_progress
+
+    @pytest.mark.asyncio
+    async def test_delayed_cleanup_removes_after_sleep(self):
+        """_schedule_delayed_cleanup removes task after delay."""
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        route.upload_tasks = {"task-1": {"status": "completed"}}
+        route.upload_progress = {"task-1": {"status": "completed"}}
+
+        # Use a very short delay for test
+        await route._schedule_delayed_cleanup("task-1", delay_seconds=0.01)
+
+        assert "task-1" not in route.upload_tasks
+        assert "task-1" not in route.upload_progress
+
+    @pytest.mark.asyncio
+    async def test_delayed_cleanup_idempotent(self):
+        """Delayed cleanup is safe even if task already removed by poll."""
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        route.upload_tasks = {}
+        route.upload_progress = {}
+
+        # Should not raise even though task doesn't exist
+        await route._schedule_delayed_cleanup("task-1", delay_seconds=0.01)
+
+    @pytest.mark.asyncio
+    async def test_delayed_cleanup_cancelled_error_graceful(self):
+        """CancelledError inside _schedule_delayed_cleanup is caught, task not cleaned."""
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        route.upload_tasks = {"task-1": {"status": "completed"}}
+        route.upload_progress = {"task-1": {"status": "completed"}}
+
+        # Create the cleanup task
+        cleanup_task = asyncio.create_task(
+            route._schedule_delayed_cleanup("task-1", delay_seconds=10)
+        )
+        await asyncio.sleep(0.02)  # let it start sleeping
+        cleanup_task.cancel()
+
+        # The outer task will get CancelledError, but the inner method catches it
+        try:
+            await cleanup_task
+        except asyncio.CancelledError:
+            pass  # the asyncio.create_task wrapper gets cancelled
+
+        # Since CancelledError was caught internally and returned early,
+        # the task data should still be there
+        assert "task-1" in route.upload_tasks
+        assert "task-1" in route.upload_progress
+
+    # ── Background task finally-block tests ──
+
+    @pytest.mark.asyncio
+    async def test_background_upload_schedules_cleanup_on_success(self):
+        """_background_upload_task schedules delayed cleanup in finally block."""
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        route.upload_tasks = {}
+        route.upload_progress = {}
+        route._init_task = MagicMock()
+        route._set_task_result = MagicMock()
+        route._update_progress = MagicMock()
+        route._make_progress_callback = MagicMock(return_value=AsyncMock())
+        route._cleanup_task = MagicMock()
+
+        async def fake_schedule(*args, **kwargs):
+            route._cleanup_task(*args)
+            await asyncio.sleep(0)
+
+        route._schedule_delayed_cleanup = fake_schedule
+
+        kb_helper = AsyncMock()
+        kb_helper.upload_document = AsyncMock(
+            return_value=MagicMock(
+                model_dump=MagicMock(return_value={"doc_id": "doc-1"}),
+            )
+        )
+
+        files = [
+            {"file_name": "test.txt", "file_content": b"hello", "file_type": "txt"}
+        ]
+
+        await route._background_upload_task(
+            task_id="task-1",
+            kb_helper=kb_helper,
+            files_to_upload=files,
+            chunk_size=512,
+            chunk_overlap=50,
+            batch_size=32,
+            tasks_limit=3,
+            max_retries=3,
+        )
+
+        # The finally block should have triggered _cleanup_task via
+        # the asyncio.create_task(_schedule_delayed_cleanup) call.
+        # Since we used a real async sleep of 0, the task should complete.
+        await asyncio.sleep(0.05)
+        route._cleanup_task.assert_called_with("task-1")
+
+    @pytest.mark.asyncio
+    async def test_background_upload_schedules_cleanup_on_failure(self):
+        """Finally block still runs even when task fails."""
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        route.upload_tasks = {}
+        route.upload_progress = {}
+        route._init_task = MagicMock()
+        route._set_task_result = MagicMock()
+        route._update_progress = MagicMock()
+        route._make_progress_callback = MagicMock(return_value=AsyncMock())
+        route._cleanup_task = MagicMock()
+        route._format_failed_doc_error = MagicMock(return_value="test error")
+
+        async def fake_schedule(*args, **kwargs):
+            route._cleanup_task(*args)
+            await asyncio.sleep(0)
+
+        route._schedule_delayed_cleanup = fake_schedule
+
+        kb_helper = AsyncMock()
+        kb_helper.upload_document = AsyncMock(
+            side_effect=RuntimeError("upload exploded"),
+        )
+
+        files = [
+            {"file_name": "test.txt", "file_content": b"hello", "file_type": "txt"}
+        ]
+
+        await route._background_upload_task(
+            task_id="task-1",
+            kb_helper=kb_helper,
+            files_to_upload=files,
+            chunk_size=512,
+            chunk_overlap=50,
+            batch_size=32,
+            tasks_limit=3,
+            max_retries=3,
+        )
+
+        await asyncio.sleep(0.05)
+        route._cleanup_task.assert_called_with("task-1")
+
+    @pytest.mark.asyncio
+    async def test_background_upload_marks_task_failed_when_all_files_fail(self):
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        route.upload_tasks = {}
+        route.upload_progress = {}
+        route._update_persistent_task = AsyncMock()
+        route._cleanup_task = MagicMock()
+
+        async def fake_schedule(*args, **kwargs):
+            route._cleanup_task(*args)
+            await asyncio.sleep(0)
+
+        route._schedule_delayed_cleanup = fake_schedule
+
+        kb_helper = AsyncMock()
+        kb_helper.upload_document = AsyncMock(
+            side_effect=RuntimeError("重复文档：same.md 已存在"),
+        )
+
+        files = [{"file_name": "same.md", "file_content": b"same", "file_type": "md"}]
+
+        await route._background_upload_task(
+            task_id="task-dup",
+            kb_helper=kb_helper,
+            files_to_upload=files,
+            chunk_size=512,
+            chunk_overlap=50,
+            batch_size=32,
+            tasks_limit=3,
+            max_retries=3,
+        )
+
+        await asyncio.sleep(0.05)
+
+        result = route.upload_tasks["task-dup"]["result"]
+        error = route.upload_tasks["task-dup"]["error"]
+        assert route.upload_tasks["task-dup"]["status"] == "failed"
+        assert result["success_count"] == 0
+        assert result["failed_count"] == 1
+        assert result["failed"][0]["error"] == ("same.md: 重复文档：same.md 已存在")
+        assert error == "same.md: 重复文档：same.md 已存在"
+        route._update_persistent_task.assert_any_await(
+            "task-dup",
+            status="failed",
+            result=result,
+            error=error,
+            **_persistent_progress_kwargs(route.upload_progress["task-dup"]),
+        )
+        route._cleanup_task.assert_called_with("task-dup")
+
+    @pytest.mark.asyncio
+    async def test_background_import_schedules_cleanup(self):
+        """_background_import_task schedules delayed cleanup in finally block."""
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        route.upload_tasks = {}
+        route.upload_progress = {}
+        route._init_task = MagicMock()
+        route._set_task_result = MagicMock()
+        route._update_progress = MagicMock()
+        route._make_progress_callback = MagicMock(return_value=AsyncMock())
+        route._cleanup_task = MagicMock()
+
+        async def fake_schedule(*args, **kwargs):
+            route._cleanup_task(*args)
+            await asyncio.sleep(0)
+
+        route._schedule_delayed_cleanup = fake_schedule
+
+        kb_helper = AsyncMock()
+        kb_helper.upload_document = AsyncMock(
+            return_value=MagicMock(
+                model_dump=MagicMock(return_value={"doc_id": "doc-1"}),
+            )
+        )
+
+        documents = [{"file_name": "test.txt", "chunks": ["chunk 1", "chunk 2"]}]
+
+        await route._background_import_task(
+            task_id="task-2",
+            kb_helper=kb_helper,
+            documents=documents,
+            batch_size=32,
+            tasks_limit=3,
+            max_retries=3,
+        )
+
+        await asyncio.sleep(0.05)
+        route._cleanup_task.assert_called_with("task-2")
+
+    @pytest.mark.asyncio
+    async def test_background_url_upload_schedules_cleanup(self):
+        """_background_upload_from_url_task schedules delayed cleanup."""
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        route.upload_tasks = {}
+        route.upload_progress = {}
+        route._init_task = MagicMock()
+        route._set_task_result = MagicMock()
+        route._update_progress = MagicMock()
+        route._make_progress_callback = MagicMock(return_value=AsyncMock())
+        route._cleanup_task = MagicMock()
+
+        async def fake_schedule(*args, **kwargs):
+            route._cleanup_task(*args)
+            await asyncio.sleep(0)
+
+        route._schedule_delayed_cleanup = fake_schedule
+
+        kb_helper = AsyncMock()
+        kb_helper.upload_from_url = AsyncMock(
+            return_value=MagicMock(
+                model_dump=MagicMock(return_value={"doc_id": "doc-1"}),
+            )
+        )
+
+        await route._background_upload_from_url_task(
+            task_id="task-3",
+            kb_helper=kb_helper,
+            url="https://example.com",
+            chunk_size=512,
+            chunk_overlap=50,
+            batch_size=32,
+            tasks_limit=3,
+            max_retries=3,
+            enable_cleaning=False,
+            cleaning_provider_id=None,
+        )
+
+        await asyncio.sleep(0.05)
+        route._cleanup_task.assert_called_with("task-3")
+
+    @pytest.mark.asyncio
+    async def test_background_rebuild_document_records_success_and_cleanup(self):
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        route.upload_tasks = {}
+        route.upload_progress = {}
+        route._update_persistent_task = AsyncMock()
+        route._cleanup_task = MagicMock()
+
+        async def fake_schedule(*args, **kwargs):
+            route._cleanup_task(*args)
+            await asyncio.sleep(0)
+
+        route._schedule_delayed_cleanup = fake_schedule
+
+        doc = MagicMock()
+        doc.model_dump.return_value = {"doc_id": "doc-new", "version": 2}
+        kb_helper = AsyncMock()
+        kb_helper.rebuild_document = AsyncMock(return_value=doc)
+
+        await route._background_rebuild_document_task(
+            task_id="task-4",
+            kb_helper=kb_helper,
+            doc_id="doc-old",
+            chunk_size=512,
+            chunk_overlap=50,
+            batch_size=32,
+            tasks_limit=3,
+            max_retries=3,
+        )
+
+        await asyncio.sleep(0.05)
+
+        kb_helper.rebuild_document.assert_awaited_once()
+        rebuild_call = kb_helper.rebuild_document.await_args
+        assert rebuild_call.args == ("doc-old",)
+        assert rebuild_call.kwargs["chunk_size"] == 512
+        assert rebuild_call.kwargs["chunk_overlap"] == 50
+        assert rebuild_call.kwargs["batch_size"] == 32
+        assert rebuild_call.kwargs["tasks_limit"] == 3
+        assert rebuild_call.kwargs["max_retries"] == 3
+        assert rebuild_call.kwargs["progress_callback"] is not None
+        assert route.upload_tasks["task-4"]["status"] == "completed"
+        assert route.upload_tasks["task-4"]["result"] == {
+            "task_id": "task-4",
+            "rebuilt": [{"doc_id": "doc-new", "version": 2}],
+            "failed": [],
+            "total": 1,
+            "success_count": 1,
+            "failed_count": 0,
+        }
+        route._update_persistent_task.assert_any_await(
+            "task-4",
+            status="completed",
+            result=route.upload_tasks["task-4"]["result"],
+            error=None,
+            **_persistent_progress_kwargs(route.upload_progress["task-4"]),
+        )
+        route._cleanup_task.assert_called_with("task-4")
+
+    @pytest.mark.asyncio
+    async def test_background_rebuild_document_records_failure_and_cleanup(self):
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        route.upload_tasks = {}
+        route.upload_progress = {}
+        route._update_persistent_task = AsyncMock()
+        route._cleanup_task = MagicMock()
+
+        async def fake_schedule(*args, **kwargs):
+            route._cleanup_task(*args)
+            await asyncio.sleep(0)
+
+        route._schedule_delayed_cleanup = fake_schedule
+
+        kb_helper = AsyncMock()
+        kb_helper.rebuild_document = AsyncMock(side_effect=RuntimeError("boom"))
+
+        await route._background_rebuild_document_task(
+            task_id="task-5",
+            kb_helper=kb_helper,
+            doc_id="doc-old",
+            chunk_size=None,
+            chunk_overlap=None,
+            batch_size=32,
+            tasks_limit=3,
+            max_retries=3,
+        )
+
+        await asyncio.sleep(0.05)
+
+        assert route.upload_tasks["task-5"] == {
+            "status": "failed",
+            "result": None,
+            "error": "boom",
+        }
+        route._update_persistent_task.assert_any_await(
+            "task-5",
+            status="failed",
+            error="boom",
+            **_persistent_progress_kwargs(route.upload_progress["task-5"]),
+        )
+        route._cleanup_task.assert_called_with("task-5")
+
+    @pytest.mark.asyncio
+    async def test_background_rebuild_kb_records_success_and_cleanup(self):
+        from astrbot.core.knowledge_base.models import KnowledgeBase
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        route.upload_tasks = {}
+        route.upload_progress = {}
+        route._update_persistent_task = AsyncMock()
+        route._cleanup_task = MagicMock()
+
+        async def fake_schedule(*args, **kwargs):
+            route._cleanup_task(*args)
+            await asyncio.sleep(0)
+
+        route._schedule_delayed_cleanup = fake_schedule
+
+        kb_helper = AsyncMock()
+        kb_helper.kb = KnowledgeBase(
+            kb_id="kb-1",
+            kb_name="docs",
+            embedding_provider_id="emb-1",
+        )
+        kb_helper.rebuild_all_documents = AsyncMock(
+            return_value={
+                "rebuilt": [{"doc_id": "doc-new"}],
+                "failed": [],
+                "total": 1,
+                "success_count": 1,
+                "failed_count": 0,
+            },
+        )
+
+        await route._background_rebuild_kb_task(
+            task_id="task-6",
+            kb_helper=kb_helper,
+            chunk_size=512,
+            chunk_overlap=50,
+            batch_size=32,
+            tasks_limit=3,
+            max_retries=3,
+        )
+
+        await asyncio.sleep(0.05)
+
+        kb_helper.rebuild_all_documents.assert_awaited_once()
+        rebuild_call = kb_helper.rebuild_all_documents.await_args
+        assert rebuild_call.kwargs["chunk_size"] == 512
+        assert rebuild_call.kwargs["chunk_overlap"] == 50
+        assert rebuild_call.kwargs["batch_size"] == 32
+        assert rebuild_call.kwargs["tasks_limit"] == 3
+        assert rebuild_call.kwargs["max_retries"] == 3
+        assert rebuild_call.kwargs["progress_callback"] is not None
+        assert route.upload_tasks["task-6"]["status"] == "completed"
+        assert route.upload_tasks["task-6"]["result"] == {
+            "task_id": "task-6",
+            "rebuilt": [{"doc_id": "doc-new"}],
+            "failed": [],
+            "total": 1,
+            "success_count": 1,
+            "failed_count": 0,
+        }
+        route._update_persistent_task.assert_any_await(
+            "task-6",
+            status="completed",
+            result=route.upload_tasks["task-6"]["result"],
+            error=None,
+            **_persistent_progress_kwargs(route.upload_progress["task-6"]),
+        )
+        route._cleanup_task.assert_called_with("task-6")
+
+    @pytest.mark.asyncio
+    async def test_background_rebuild_kb_records_failure_and_cleanup(self):
+        from astrbot.core.knowledge_base.models import KnowledgeBase
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        route.upload_tasks = {}
+        route.upload_progress = {}
+        route._update_persistent_task = AsyncMock()
+        route._cleanup_task = MagicMock()
+
+        async def fake_schedule(*args, **kwargs):
+            route._cleanup_task(*args)
+            await asyncio.sleep(0)
+
+        route._schedule_delayed_cleanup = fake_schedule
+
+        kb_helper = AsyncMock()
+        kb_helper.kb = KnowledgeBase(
+            kb_id="kb-1",
+            kb_name="docs",
+            embedding_provider_id="emb-1",
+        )
+        kb_helper.rebuild_all_documents = AsyncMock(
+            side_effect=RuntimeError("rebuild exploded"),
+        )
+
+        await route._background_rebuild_kb_task(
+            task_id="task-7",
+            kb_helper=kb_helper,
+            chunk_size=None,
+            chunk_overlap=None,
+            batch_size=32,
+            tasks_limit=3,
+            max_retries=3,
+        )
+
+        await asyncio.sleep(0.05)
+
+        assert route.upload_tasks["task-7"] == {
+            "status": "failed",
+            "result": None,
+            "error": "rebuild exploded",
+        }
+        route._update_persistent_task.assert_any_await(
+            "task-7",
+            status="failed",
+            error="rebuild exploded",
+            **_persistent_progress_kwargs(route.upload_progress["task-7"]),
+        )
+        route._cleanup_task.assert_called_with("task-7")
+
+    @pytest.mark.asyncio
+    async def test_background_rebuild_kb_marks_empty_kb_progress_completed(self):
+        from astrbot.core.knowledge_base.models import KnowledgeBase
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        route.upload_tasks = {}
+        route.upload_progress = {}
+        route._update_persistent_task = AsyncMock()
+        route._cleanup_task = MagicMock()
+
+        async def fake_schedule(*args, **kwargs):
+            route._cleanup_task(*args)
+            await asyncio.sleep(0)
+
+        route._schedule_delayed_cleanup = fake_schedule
+
+        kb_helper = AsyncMock()
+        kb_helper.kb = KnowledgeBase(
+            kb_id="kb-1",
+            kb_name="empty-docs",
+            embedding_provider_id="emb-1",
+        )
+        kb_helper.rebuild_all_documents = AsyncMock(
+            return_value={
+                "rebuilt": [],
+                "failed": [],
+                "total": 0,
+                "success_count": 0,
+                "failed_count": 0,
+            },
+        )
+
+        await route._background_rebuild_kb_task(
+            task_id="task-8",
+            kb_helper=kb_helper,
+            chunk_size=None,
+            chunk_overlap=None,
+            batch_size=32,
+            tasks_limit=3,
+            max_retries=3,
+        )
+
+        await asyncio.sleep(0.05)
+
+        assert route.upload_tasks["task-8"]["result"]["total"] == 0
+        assert route.upload_progress["task-8"]["status"] == "completed"
+        assert route.upload_progress["task-8"]["stage"] == "completed"
+        assert route.upload_progress["task-8"]["current"] == 1
+        assert route.upload_progress["task-8"]["total"] == 1
+        route._update_persistent_task.assert_any_await(
+            "task-8",
+            status="completed",
+            result=route.upload_tasks["task-8"]["result"],
+            error=None,
+            **_persistent_progress_kwargs(route.upload_progress["task-8"]),
+        )
+        route._cleanup_task.assert_called_with("task-8")
+
+    @pytest.mark.asyncio
+    async def test_background_rebuild_documents_records_success_and_cleanup(self):
+        from astrbot.dashboard.routes.knowledge_base import KnowledgeBaseRoute
+
+        route = KnowledgeBaseRoute.__new__(KnowledgeBaseRoute)
+        route.upload_tasks = {}
+        route.upload_progress = {}
+        route._update_persistent_task = AsyncMock()
+        route._cleanup_task = MagicMock()
+
+        async def fake_schedule(*args, **kwargs):
+            route._cleanup_task(*args)
+            await asyncio.sleep(0)
+
+        route._schedule_delayed_cleanup = fake_schedule
+
+        kb_helper = AsyncMock()
+        kb_helper.rebuild_documents = AsyncMock(
+            return_value={
+                "rebuilt": [{"doc_id": "doc-new"}],
+                "failed": [],
+                "total": 2,
+                "success_count": 2,
+                "failed_count": 0,
+            },
+        )
+
+        await route._background_rebuild_documents_task(
+            task_id="task-9",
+            kb_helper=kb_helper,
+            doc_ids=["doc-1", "doc-2"],
+            chunk_size=512,
+            chunk_overlap=50,
+            batch_size=32,
+            tasks_limit=3,
+            max_retries=3,
+        )
+
+        await asyncio.sleep(0.05)
+
+        kb_helper.rebuild_documents.assert_awaited_once()
+        rebuild_call = kb_helper.rebuild_documents.await_args
+        assert rebuild_call.args == (["doc-1", "doc-2"],)
+        assert rebuild_call.kwargs["chunk_size"] == 512
+        assert rebuild_call.kwargs["chunk_overlap"] == 50
+        assert rebuild_call.kwargs["batch_size"] == 32
+        assert rebuild_call.kwargs["tasks_limit"] == 3
+        assert rebuild_call.kwargs["max_retries"] == 3
+        assert rebuild_call.kwargs["progress_callback"] is not None
+        assert route.upload_tasks["task-9"]["status"] == "completed"
+        assert route.upload_tasks["task-9"]["result"] == {
+            "task_id": "task-9",
+            "rebuilt": [{"doc_id": "doc-new"}],
+            "failed": [],
+            "total": 2,
+            "success_count": 2,
+            "failed_count": 0,
+        }
+        route._update_persistent_task.assert_any_await(
+            "task-9",
+            status="completed",
+            result=route.upload_tasks["task-9"]["result"],
+            error=None,
+            **_persistent_progress_kwargs(route.upload_progress["task-9"]),
+        )
+        route._cleanup_task.assert_called_with("task-9")
diff --git a/tests/test_kb_upload_rollback.py b/tests/test_kb_upload_rollback.py
new file mode 100644
index 0000000000..7ab1eeef1c
--- /dev/null
+++ b/tests/test_kb_upload_rollback.py
@@ -0,0 +1,1671 @@
+"""Tests for upload metadata persistence and failure rollback."""
+
+from pathlib import Path
+from unittest.mock import AsyncMock, MagicMock, PropertyMock, patch
+
+import pytest
+
+
+def _build_helper():
+    from astrbot.core.knowledge_base.kb_helper import KBHelper
+    from astrbot.core.knowledge_base.models import KnowledgeBase
+
+    kb = KnowledgeBase(
+        kb_name="test-kb",
+        kb_id="kb-test-1",
+        embedding_provider_id="emb-1",
+        chunk_size=512,
+        chunk_overlap=50,
+    )
+    helper = KBHelper.__new__(KBHelper)
+    helper.kb = kb
+    helper.kb_db = MagicMock()
+    helper.kb_db.get_document_by_content_hash = AsyncMock(return_value=None)
+    helper.kb_db.get_db.side_effect = RuntimeError("test db is not configured")
+    helper.kb_dir = MagicMock()
+    helper.kb_medias_dir = MagicMock()
+    helper.kb_files_dir = MagicMock()
+    helper.prov_mgr = MagicMock()
+    helper.chunker = AsyncMock()
+    helper.vec_db = AsyncMock()
+    helper._ensure_vec_db = AsyncMock()
+    helper.init_error = None
+    return helper
+
+
+def _build_helper_with_real_dirs(tmp_path):
+    helper = _build_helper()
+    helper.kb_files_dir = tmp_path / "files"
+    helper.kb_medias_dir = tmp_path / "medias"
+    helper.kb_files_dir.mkdir(parents=True)
+    helper.kb_medias_dir.mkdir(parents=True)
+    return helper
+
+
+def _mock_parser(mock_select, text="hello world test content", text_segments=None):
+    parser = AsyncMock()
+    result = MagicMock()
+    type(result).text = PropertyMock(return_value=text)
+    type(result).media = PropertyMock(return_value=[])
+    type(result).text_segments = PropertyMock(return_value=text_segments)
+    parser.parse = AsyncMock(return_value=result)
+    mock_select.return_value = parser
+
+
+def _make_session_context():
+    session = MagicMock()
+    session.__aenter__ = AsyncMock(return_value=session)
+    session.__aexit__ = AsyncMock(return_value=False)
+    session.begin = MagicMock(return_value=session)
+    session.add = MagicMock()
+    session.commit = AsyncMock()
+    session.refresh = AsyncMock()
+    return session
+
+
+def _existing_doc():
+    from astrbot.core.knowledge_base.models import KBDocument
+
+    return KBDocument(
+        doc_id="existing-doc",
+        kb_id="kb-test-1",
+        doc_name="existing.txt",
+        file_type="txt",
+        file_size=11,
+        file_path="",
+        content_hash="existing-hash",
+        status="ready",
+    )
+
+
+def _chunk_doc(
+    *,
+    chunk_id: str,
+    text: str,
+    doc_id: str = "doc-1",
+    index: int = 0,
+    previous_chunk_id: str | None = None,
+    next_chunk_id: str | None = None,
+):
+    import json
+
+    return {
+        "doc_id": chunk_id,
+        "text": text,
+        "metadata": json.dumps(
+            {
+                "kb_id": "kb-test-1",
+                "kb_doc_id": doc_id,
+                "chunk_index": index,
+                "previous_chunk_id": previous_chunk_id,
+                "next_chunk_id": next_chunk_id,
+            },
+        ),
+    }
+
+
+class TestUploadDocumentRollback:
+    """Verify vectors are cleaned up when metadata save fails after insert."""
+
+    @pytest.mark.asyncio
+    async def test_rollback_when_metadata_save_fails(self):
+        from astrbot.core.exceptions import KnowledgeBaseUploadError
+
+        with (
+            patch(
+                "astrbot.core.knowledge_base.kb_helper.select_parser",
+                new_callable=AsyncMock,
+            ) as mock_select,
+            patch(
+                "astrbot.core.knowledge_base.kb_helper._compact_chunks",
+                return_value=["chunk 1", "chunk 2", "chunk 3"],
+            ),
+        ):
+            _mock_parser(mock_select)
+            helper = _build_helper()
+            helper.vec_db.insert_batch = AsyncMock(return_value=[1, 2, 3])
+            helper.vec_db.delete_documents = AsyncMock()
+            helper.kb_db.get_db.side_effect = RuntimeError("DB connection lost")
+
+            with pytest.raises(KnowledgeBaseUploadError) as exc_info:
+                await helper.upload_document(
+                    file_name="test.txt",
+                    file_content=b"hello world",
+                    file_type="txt",
+                )
+
+            assert exc_info.value.stage == "metadata"
+            helper.vec_db.delete_documents.assert_awaited_once()
+
+    @pytest.mark.asyncio
+    async def test_no_rollback_when_insert_fails(self):
+        from astrbot.core.exceptions import KnowledgeBaseUploadError
+
+        with (
+            patch(
+                "astrbot.core.knowledge_base.kb_helper.select_parser",
+                new_callable=AsyncMock,
+            ) as mock_select,
+            patch(
+                "astrbot.core.knowledge_base.kb_helper._compact_chunks",
+                return_value=["chunk 1"],
+            ),
+        ):
+            _mock_parser(mock_select)
+            helper = _build_helper()
+            helper.vec_db.insert_batch.side_effect = KnowledgeBaseUploadError(
+                stage="embedding",
+                user_message="模拟失败",
+                details={},
+            )
+            helper.vec_db.delete_documents = AsyncMock()
+
+            with pytest.raises(KnowledgeBaseUploadError) as exc_info:
+                await helper.upload_document(
+                    file_name="test.txt",
+                    file_content=b"hello",
+                    file_type="txt",
+                )
+
+            assert exc_info.value.stage == "embedding"
+            helper.vec_db.delete_documents.assert_not_awaited()
+
+    @pytest.mark.asyncio
+    async def test_parse_failure_persists_failed_document_record(self, tmp_path):
+        from astrbot.core.exceptions import KnowledgeBaseUploadError
+        from astrbot.core.knowledge_base.document_metadata import build_content_hash
+
+        with patch(
+            "astrbot.core.knowledge_base.kb_helper.select_parser",
+            new_callable=AsyncMock,
+        ) as mock_select:
+            parser = AsyncMock()
+            parser.parse = AsyncMock(side_effect=RuntimeError("broken parser"))
+            mock_select.return_value = parser
+
+            helper = _build_helper_with_real_dirs(tmp_path)
+            session = _make_session_context()
+            helper.kb_db.get_db = MagicMock(return_value=session)
+            helper.kb_db.update_kb_stats = AsyncMock()
+            helper.refresh_kb = AsyncMock()
+            helper.refresh_document = AsyncMock()
+            helper.vec_db.insert_batch = AsyncMock()
+            helper.vec_db.delete_documents = AsyncMock()
+            helper.vec_db.count_documents = AsyncMock(return_value=0)
+
+            with pytest.raises(KnowledgeBaseUploadError) as exc_info:
+                await helper.upload_document(
+                    file_name="broken.txt",
+                    file_content=b"not parseable",
+                    file_type="txt",
+                )
+
+            failed_doc = session.add.call_args.args[0]
+            assert exc_info.value.stage == "parsing"
+            assert failed_doc.status == "failed"
+            assert failed_doc.error_stage == "parsing"
+            assert "文档解析失败" in failed_doc.error_message
+            assert failed_doc.source_type == "file"
+            assert failed_doc.source_uri == "broken.txt"
+            assert failed_doc.content_hash == build_content_hash(b"not parseable")
+            assert failed_doc.file_size == len(b"not parseable")
+            assert Path(failed_doc.file_path).exists()
+            assert Path(failed_doc.file_path).read_bytes() == b"not parseable"
+            helper.vec_db.insert_batch.assert_not_awaited()
+            helper.vec_db.delete_documents.assert_not_awaited()
+
+    @pytest.mark.asyncio
+    async def test_empty_pre_chunked_import_persists_failed_document_record(
+        self,
+        tmp_path,
+    ):
+        from astrbot.core.exceptions import KnowledgeBaseUploadError
+        from astrbot.core.knowledge_base.document_metadata import build_content_hash
+
+        helper = _build_helper_with_real_dirs(tmp_path)
+        session = _make_session_context()
+        helper.kb_db.get_db = MagicMock(return_value=session)
+        helper.kb_db.update_kb_stats = AsyncMock()
+        helper.refresh_kb = AsyncMock()
+        helper.refresh_document = AsyncMock()
+        helper.vec_db.insert_batch = AsyncMock()
+        helper.vec_db.delete_documents = AsyncMock()
+        helper.vec_db.count_documents = AsyncMock(return_value=0)
+
+        with pytest.raises(KnowledgeBaseUploadError) as exc_info:
+            await helper.upload_document(
+                file_name="empty-import.txt",
+                file_content=None,
+                file_type="txt",
+                pre_chunked_text=[" ", ""],
+                source_type="import",
+                source_uri="manual-import",
+            )
+
+        failed_doc = session.add.call_args.args[0]
+        assert exc_info.value.stage == "validation"
+        assert failed_doc.status == "failed"
+        assert failed_doc.error_stage == "validation"
+        assert "预分块文本为空" in failed_doc.error_message
+        assert failed_doc.source_type == "import"
+        assert failed_doc.source_uri == "manual-import"
+        assert failed_doc.file_path == ""
+        assert failed_doc.file_size == 0
+        assert failed_doc.content_hash == build_content_hash([])
+        assert failed_doc.chunker_name == "pre_chunked"
+        helper.vec_db.insert_batch.assert_not_awaited()
+        helper.vec_db.delete_documents.assert_not_awaited()
+
+    @pytest.mark.asyncio
+    async def test_cleanup_failure_does_not_suppress_original_error(self):
+        from astrbot.core.exceptions import KnowledgeBaseUploadError
+
+        with (
+            patch(
+                "astrbot.core.knowledge_base.kb_helper.select_parser",
+                new_callable=AsyncMock,
+            ) as mock_select,
+            patch(
+                "astrbot.core.knowledge_base.kb_helper._compact_chunks",
+                return_value=["chunk 1"],
+            ),
+        ):
+            _mock_parser(mock_select)
+            helper = _build_helper()
+            helper.vec_db.insert_batch = AsyncMock(return_value=[1])
+            helper.vec_db.delete_documents.side_effect = RuntimeError("cleanup fail")
+            helper.kb_db.get_db.side_effect = RuntimeError("DB lost")
+
+            with pytest.raises(KnowledgeBaseUploadError) as exc_info:
+                await helper.upload_document(
+                    file_name="test.txt",
+                    file_content=b"hello",
+                    file_type="txt",
+                )
+
+            assert exc_info.value.stage == "metadata"
+            helper.vec_db.delete_documents.assert_awaited_once()
+
+    @pytest.mark.asyncio
+    async def test_metadata_refresh_failure_preserves_committed_source_file(
+        self,
+        tmp_path,
+    ):
+        from astrbot.core.exceptions import KnowledgeBaseUploadError
+
+        with (
+            patch(
+                "astrbot.core.knowledge_base.kb_helper.select_parser",
+                new_callable=AsyncMock,
+            ) as mock_select,
+            patch(
+                "astrbot.core.knowledge_base.kb_helper._compact_chunks",
+                return_value=["chunk 1"],
+            ),
+        ):
+            _mock_parser(mock_select)
+            helper = _build_helper_with_real_dirs(tmp_path)
+
+            session = _make_session_context()
+            helper.kb_db.get_db = MagicMock(return_value=session)
+            helper.kb_db.update_kb_stats = AsyncMock(
+                side_effect=RuntimeError("stats fail"),
+            )
+            helper.vec_db.insert_batch = AsyncMock(return_value=[1])
+            helper.vec_db.delete_documents = AsyncMock()
+            helper.vec_db.count_documents = AsyncMock(return_value=1)
+            helper.refresh_kb = AsyncMock()
+            helper.refresh_document = AsyncMock()
+
+            with pytest.raises(KnowledgeBaseUploadError) as exc_info:
+                await helper.upload_document(
+                    file_name="committed.txt",
+                    file_content=b"hello world",
+                    file_type="txt",
+                )
+
+            assert exc_info.value.stage == "metadata"
+            saved_files = list(helper.kb_files_dir.glob("*/committed.txt"))
+            assert len(saved_files) == 1
+            assert saved_files[0].read_bytes() == b"hello world"
+            helper.vec_db.delete_documents.assert_not_awaited()
+
+    @pytest.mark.asyncio
+    async def test_no_rollback_on_success(self):
+        with (
+            patch(
+                "astrbot.core.knowledge_base.kb_helper.select_parser",
+                new_callable=AsyncMock,
+            ) as mock_select,
+            patch(
+                "astrbot.core.knowledge_base.kb_helper._compact_chunks",
+                return_value=["chunk 1", "chunk 2"],
+            ),
+        ):
+            _mock_parser(mock_select)
+            helper = _build_helper()
+
+            session = _make_session_context()
+            helper.kb_db.get_db = MagicMock(return_value=session)
+            helper.kb_db.update_kb_stats = AsyncMock()
+            helper.vec_db.insert_batch = AsyncMock(return_value=[1, 2])
+            helper.vec_db.delete_documents = AsyncMock()
+            helper.vec_db.count_documents = AsyncMock(return_value=2)
+            helper.refresh_kb = AsyncMock()
+            helper.refresh_document = AsyncMock()
+
+            doc = await helper.upload_document(
+                file_name="test.txt",
+                file_content=b"hello world",
+                file_type="txt",
+            )
+
+            assert doc is not None
+            helper.vec_db.delete_documents.assert_not_awaited()
+
+    @pytest.mark.asyncio
+    async def test_upload_document_persists_source_metadata_and_original_file(
+        self,
+        tmp_path,
+    ):
+        from astrbot.core.knowledge_base.document_metadata import build_content_hash
+
+        with (
+            patch(
+                "astrbot.core.knowledge_base.kb_helper.select_parser",
+                new_callable=AsyncMock,
+            ) as mock_select,
+            patch(
+                "astrbot.core.knowledge_base.kb_helper._compact_chunks",
+                return_value=["chunk 1", "chunk 2"],
+            ),
+        ):
+            _mock_parser(mock_select)
+            helper = _build_helper_with_real_dirs(tmp_path)
+
+            session = _make_session_context()
+            helper.kb_db.get_db = MagicMock(return_value=session)
+            helper.kb_db.update_kb_stats = AsyncMock()
+            helper.vec_db.insert_batch = AsyncMock(return_value=[1, 2])
+            helper.vec_db.delete_documents = AsyncMock()
+            helper.vec_db.count_documents = AsyncMock(return_value=2)
+            helper.refresh_kb = AsyncMock()
+            helper.refresh_document = AsyncMock()
+
+            doc = await helper.upload_document(
+                file_name="../../unsafe.md",
+                file_content=b"# Title\nhello world",
+                file_type="md",
+            )
+
+            saved_path = Path(doc.file_path)
+            assert doc.source_type == "file"
+            assert doc.source_uri == "../../unsafe.md"
+            assert doc.content_hash == build_content_hash(b"# Title\nhello world")
+            assert doc.parser_name is not None
+            assert doc.parser_version == "1"
+            assert doc.chunker_name == "MarkdownChunker"
+            assert doc.chunker_version == "1"
+            assert doc.status == "ready"
+            assert doc.indexed_at is not None
+            assert saved_path.exists()
+            assert saved_path.read_bytes() == b"# Title\nhello world"
+            assert saved_path.name == "unsafe.md"
+            assert saved_path.is_relative_to(helper.kb_files_dir)
+            helper.vec_db.delete_documents.assert_not_awaited()
+
+    @pytest.mark.asyncio
+    async def test_upload_document_stores_chunk_metadata(self, tmp_path):
+        from astrbot.core.knowledge_base.document_metadata import build_content_hash
+
+        with (
+            patch(
+                "astrbot.core.knowledge_base.kb_helper.select_parser",
+                new_callable=AsyncMock,
+            ) as mock_select,
+            patch(
+                "astrbot.core.knowledge_base.kb_helper._compact_chunks",
+                return_value=["first chunk", "second"],
+            ),
+        ):
+            _mock_parser(mock_select)
+            helper = _build_helper_with_real_dirs(tmp_path)
+
+            session = _make_session_context()
+            helper.kb_db.get_db = MagicMock(return_value=session)
+            helper.kb_db.update_kb_stats = AsyncMock()
+            helper.vec_db.insert_batch = AsyncMock(return_value=[1, 2])
+            helper.vec_db.delete_documents = AsyncMock()
+            helper.vec_db.count_documents = AsyncMock(return_value=2)
+            helper.refresh_kb = AsyncMock()
+            helper.refresh_document = AsyncMock()
+
+            await helper.upload_document(
+                file_name="chunks.txt",
+                file_content=b"source",
+                file_type="txt",
+            )
+
+        kwargs = helper.vec_db.insert_batch.await_args.kwargs
+        chunk_ids = kwargs["ids"]
+        metadatas = kwargs["metadatas"]
+        assert len(chunk_ids) == 2
+        assert len(set(chunk_ids)) == 2
+        assert metadatas == [
+            {
+                "kb_id": "kb-test-1",
+                "kb_doc_id": session.add.call_args.args[0].doc_id,
+                "chunk_index": 0,
+                "section_index": 0,
+                "content_hash": build_content_hash("first chunk"),
+                "char_count": len("first chunk"),
+                "token_count_estimate": 3,
+                "start_offset": 0,
+                "end_offset": len("first chunk"),
+                "previous_chunk_id": None,
+                "next_chunk_id": chunk_ids[1],
+            },
+            {
+                "kb_id": "kb-test-1",
+                "kb_doc_id": session.add.call_args.args[0].doc_id,
+                "chunk_index": 1,
+                "section_index": 1,
+                "content_hash": build_content_hash("second"),
+                "char_count": len("second"),
+                "token_count_estimate": 1,
+                "start_offset": len("first chunk"),
+                "end_offset": len("first chunk") + len("second"),
+                "previous_chunk_id": chunk_ids[0],
+                "next_chunk_id": None,
+            },
+        ]
+
+    @pytest.mark.asyncio
+    async def test_upload_markdown_document_stores_title_path_metadata(self, tmp_path):
+        with patch(
+            "astrbot.core.knowledge_base.kb_helper.select_parser",
+            new_callable=AsyncMock,
+        ) as mock_select:
+            _mock_parser(
+                mock_select,
+                text=("# Guide\nIntro\n\n## Install\nStep one\n\n## Usage\nStep two"),
+            )
+            helper = _build_helper_with_real_dirs(tmp_path)
+
+            session = _make_session_context()
+            helper.kb_db.get_db = MagicMock(return_value=session)
+            helper.kb_db.update_kb_stats = AsyncMock()
+            helper.vec_db.insert_batch = AsyncMock(return_value=[1, 2, 3])
+            helper.vec_db.delete_documents = AsyncMock()
+            helper.vec_db.count_documents = AsyncMock(return_value=3)
+            helper.refresh_kb = AsyncMock()
+            helper.refresh_document = AsyncMock()
+
+            await helper.upload_document(
+                file_name="guide.md",
+                file_content=b"# Guide\nIntro",
+                file_type="md",
+            )
+
+        metadatas = helper.vec_db.insert_batch.await_args.kwargs["metadatas"]
+        assert [metadata.get("title_path") for metadata in metadatas] == [
+            ["Guide"],
+            ["Guide", "Install"],
+            ["Guide", "Usage"],
+        ]
+        assert [metadata.get("section_index") for metadata in metadatas] == [0, 1, 2]
+        assert all(
+            metadata.get("token_count_estimate") is not None for metadata in metadatas
+        )
+
+    @pytest.mark.asyncio
+    async def test_upload_markdown_document_keeps_title_path_on_split_chunks(
+        self,
+        tmp_path,
+    ):
+        markdown_text = "# Guide\n" + "\n".join(
+            f"Long installation paragraph {idx}." for idx in range(16)
+        )
+
+        with patch(
+            "astrbot.core.knowledge_base.kb_helper.select_parser",
+            new_callable=AsyncMock,
+        ) as mock_select:
+            _mock_parser(mock_select, text=markdown_text)
+            helper = _build_helper_with_real_dirs(tmp_path)
+
+            session = _make_session_context()
+            helper.kb_db.get_db = MagicMock(return_value=session)
+            helper.kb_db.update_kb_stats = AsyncMock()
+            helper.vec_db.insert_batch = AsyncMock(return_value=[1])
+            helper.vec_db.delete_documents = AsyncMock()
+            helper.vec_db.count_documents = AsyncMock(return_value=1)
+            helper.refresh_kb = AsyncMock()
+            helper.refresh_document = AsyncMock()
+
+            await helper.upload_document(
+                file_name="guide.md",
+                file_content=markdown_text.encode(),
+                file_type="md",
+                chunk_size=90,
+                chunk_overlap=0,
+            )
+
+        metadatas = helper.vec_db.insert_batch.await_args.kwargs["metadatas"]
+        assert len(metadatas) > 1
+        assert all(metadata.get("title_path") == ["Guide"] for metadata in metadatas)
+        assert all(metadata.get("section_index") == 0 for metadata in metadatas)
+
+    @pytest.mark.asyncio
+    async def test_upload_xlsx_uses_markdown_chunker_for_table_protection(
+        self,
+        tmp_path,
+    ):
+        table_text = "# Sheet1\n| Name | Value |\n| --- | --- |\n" + "\n".join(
+            f"| row-{idx} | value-{idx} |" for idx in range(8)
+        )
+
+        with patch(
+            "astrbot.core.knowledge_base.kb_helper.select_parser",
+            new_callable=AsyncMock,
+        ) as mock_select:
+            _mock_parser(mock_select, text=table_text)
+            helper = _build_helper_with_real_dirs(tmp_path)
+
+            session = _make_session_context()
+            helper.kb_db.get_db = MagicMock(return_value=session)
+            helper.kb_db.update_kb_stats = AsyncMock()
+            helper.vec_db.insert_batch = AsyncMock(return_value=[1, 2, 3])
+            helper.vec_db.delete_documents = AsyncMock()
+            helper.vec_db.count_documents = AsyncMock(return_value=3)
+            helper.refresh_kb = AsyncMock()
+            helper.refresh_document = AsyncMock()
+
+            doc = await helper.upload_document(
+                file_name="sheet.xlsx",
+                file_content=b"xlsx-bytes",
+                file_type="xlsx",
+                chunk_size=90,
+                chunk_overlap=0,
+            )
+
+        contents = helper.vec_db.insert_batch.await_args.kwargs["contents"]
+        table_chunks = [
+            content for content in contents if "| Name | Value |" in content
+        ]
+
+        assert doc.chunker_name == "MarkdownChunker"
+        assert len(table_chunks) > 1
+        assert all("| --- | --- |" in content for content in table_chunks)
+
+    @pytest.mark.asyncio
+    async def test_upload_document_stores_page_number_from_text_segments(
+        self,
+        tmp_path,
+    ):
+        from astrbot.core.knowledge_base.chunking.recursive import (
+            RecursiveCharacterChunker,
+        )
+        from astrbot.core.knowledge_base.parsers.base import TextSegment
+
+        with patch(
+            "astrbot.core.knowledge_base.kb_helper.select_parser",
+            new_callable=AsyncMock,
+        ) as mock_select:
+            _mock_parser(
+                mock_select,
+                text="Page one text\n\nPage two text",
+                text_segments=[
+                    TextSegment(text="Page one text", metadata={"page_number": 1}),
+                    TextSegment(text="Page two text", metadata={"page_number": 2}),
+                ],
+            )
+            helper = _build_helper_with_real_dirs(tmp_path)
+            helper.chunker = RecursiveCharacterChunker()
+
+            session = _make_session_context()
+            helper.kb_db.get_db = MagicMock(return_value=session)
+            helper.kb_db.update_kb_stats = AsyncMock()
+            helper.vec_db.insert_batch = AsyncMock(return_value=[1, 2])
+            helper.vec_db.delete_documents = AsyncMock()
+            helper.vec_db.count_documents = AsyncMock(return_value=2)
+            helper.refresh_kb = AsyncMock()
+            helper.refresh_document = AsyncMock()
+
+            await helper.upload_document(
+                file_name="guide.pdf",
+                file_content=b"%PDF-1.7",
+                file_type="pdf",
+            )
+
+        metadatas = helper.vec_db.insert_batch.await_args.kwargs["metadatas"]
+        assert [metadata.get("page_number") for metadata in metadatas] == [1, 2]
+        assert [metadata["chunk_index"] for metadata in metadatas] == [0, 1]
+        assert [metadata["section_index"] for metadata in metadatas] == [0, 1]
+
+    @pytest.mark.asyncio
+    async def test_get_chunks_by_doc_id_returns_chunk_metadata(self):
+        import json
+
+        helper = _build_helper()
+        helper.vec_db = MagicMock()
+        helper.vec_db.document_storage = MagicMock()
+        helper.vec_db.document_storage.get_documents = AsyncMock(
+            return_value=[
+                {
+                    "doc_id": "chunk-1",
+                    "text": "first chunk",
+                    "metadata": json.dumps(
+                        {
+                            "kb_id": "kb-test-1",
+                            "kb_doc_id": "doc-1",
+                            "chunk_index": 0,
+                            "section_index": 0,
+                            "content_hash": "hash-1",
+                            "char_count": 11,
+                            "token_count_estimate": 3,
+                            "start_offset": 0,
+                            "end_offset": 11,
+                            "previous_chunk_id": None,
+                            "next_chunk_id": "chunk-2",
+                        },
+                    ),
+                },
+                {
+                    "doc_id": "legacy-chunk",
+                    "text": "legacy",
+                    "metadata": json.dumps(
+                        {
+                            "kb_id": "kb-test-1",
+                            "kb_doc_id": "doc-1",
+                            "chunk_index": 1,
+                        },
+                    ),
+                },
+            ],
+        )
+
+        chunks = await helper.get_chunks_by_doc_id("doc-1", offset=2, limit=3)
+
+        helper.vec_db.document_storage.get_documents.assert_awaited_once_with(
+            metadata_filters={"kb_doc_id": "doc-1"},
+            offset=2,
+            limit=3,
+        )
+        assert chunks[0] == {
+            "chunk_id": "chunk-1",
+            "doc_id": "doc-1",
+            "kb_id": "kb-test-1",
+            "chunk_index": 0,
+            "section_index": 0,
+            "content": "first chunk",
+            "char_count": 11,
+            "token_count_estimate": 3,
+            "content_hash": "hash-1",
+            "start_offset": 0,
+            "end_offset": 11,
+            "previous_chunk_id": None,
+            "next_chunk_id": "chunk-2",
+            "title_path": None,
+            "page_number": None,
+            "parent_chunk_id": None,
+        }
+        assert chunks[1]["chunk_id"] == "legacy-chunk"
+        assert chunks[1]["char_count"] == len("legacy")
+        assert chunks[1]["section_index"] is None
+        assert chunks[1]["token_count_estimate"] is None
+        assert chunks[1]["content_hash"] is None
+
+    @pytest.mark.asyncio
+    async def test_search_chunks_by_doc_id_uses_document_storage_search(self):
+        import json
+
+        helper = _build_helper()
+        helper.vec_db = MagicMock()
+        helper.vec_db.document_storage = MagicMock()
+        helper.vec_db.document_storage.search_documents = AsyncMock(
+            return_value=(
+                [
+                    {
+                        "doc_id": "chunk-1",
+                        "text": "matched chunk",
+                        "metadata": json.dumps(
+                            {
+                                "kb_id": "kb-test-1",
+                                "kb_doc_id": "doc-1",
+                                "chunk_index": 0,
+                            },
+                        ),
+                    },
+                ],
+                3,
+            ),
+        )
+
+        chunks, total = await helper.search_chunks_by_doc_id(
+            "doc-1",
+            search="matched",
+            offset=2,
+            limit=1,
+        )
+
+        helper.vec_db.document_storage.search_documents.assert_awaited_once_with(
+            "matched",
+            metadata_filters={"kb_doc_id": "doc-1"},
+            offset=2,
+            limit=1,
+        )
+        assert total == 3
+        assert chunks[0]["chunk_id"] == "chunk-1"
+
+    @pytest.mark.asyncio
+    async def test_get_chunk_context_returns_adjacent_chunks(self):
+        helper = _build_helper()
+        helper.vec_db = MagicMock()
+        helper.vec_db.document_storage = MagicMock()
+
+        docs = {
+            "chunk-1": _chunk_doc(
+                chunk_id="chunk-1",
+                text="previous",
+                index=0,
+                next_chunk_id="chunk-2",
+            ),
+            "chunk-2": _chunk_doc(
+                chunk_id="chunk-2",
+                text="current",
+                index=1,
+                previous_chunk_id="chunk-1",
+                next_chunk_id="chunk-3",
+            ),
+            "chunk-3": _chunk_doc(
+                chunk_id="chunk-3",
+                text="next",
+                index=2,
+                previous_chunk_id="chunk-2",
+            ),
+        }
+        helper.vec_db.document_storage.get_document_by_doc_id = AsyncMock(
+            side_effect=lambda chunk_id: docs.get(chunk_id),
+        )
+
+        context = await helper.get_chunk_context("chunk-2", "doc-1")
+
+        assert context["previous"]["chunk_id"] == "chunk-1"
+        assert context["current"]["chunk_id"] == "chunk-2"
+        assert context["next"]["chunk_id"] == "chunk-3"
+        assert (
+            helper.vec_db.document_storage.get_document_by_doc_id.await_args_list[
+                0
+            ].args[0]
+            == "chunk-2"
+        )
+
+    @pytest.mark.asyncio
+    async def test_get_chunk_context_filters_adjacent_chunks_from_other_docs(self):
+        helper = _build_helper()
+        helper.vec_db = MagicMock()
+        helper.vec_db.document_storage = MagicMock()
+
+        docs = {
+            "chunk-2": _chunk_doc(
+                chunk_id="chunk-2",
+                text="current",
+                index=1,
+                previous_chunk_id="other-doc-chunk",
+            ),
+            "other-doc-chunk": _chunk_doc(
+                chunk_id="other-doc-chunk",
+                text="wrong document",
+                doc_id="doc-2",
+                index=0,
+            ),
+        }
+        helper.vec_db.document_storage.get_document_by_doc_id = AsyncMock(
+            side_effect=lambda chunk_id: docs.get(chunk_id),
+        )
+
+        context = await helper.get_chunk_context("chunk-2", "doc-1")
+
+        assert context["current"]["chunk_id"] == "chunk-2"
+        assert context["previous"] is None
+        assert context["next"] is None
+
+    @pytest.mark.asyncio
+    async def test_get_chunk_context_raises_when_chunk_is_missing(self):
+        helper = _build_helper()
+        helper.vec_db = MagicMock()
+        helper.vec_db.document_storage = MagicMock()
+        helper.vec_db.document_storage.get_document_by_doc_id = AsyncMock(
+            return_value=None,
+        )
+
+        with pytest.raises(ValueError, match="无法找到"):
+            await helper.get_chunk_context("missing", "doc-1")
+
+    @pytest.mark.asyncio
+    async def test_upload_document_rejects_duplicate_before_storage(self, tmp_path):
+        from astrbot.core.exceptions import KnowledgeBaseUploadError
+        from astrbot.core.knowledge_base.document_metadata import build_content_hash
+
+        helper = _build_helper_with_real_dirs(tmp_path)
+        helper.kb_db.get_document_by_content_hash = AsyncMock(
+            return_value=_existing_doc(),
+        )
+        helper.vec_db.insert_batch = AsyncMock()
+        helper.vec_db.delete_documents = AsyncMock()
+
+        with pytest.raises(KnowledgeBaseUploadError) as exc_info:
+            await helper.upload_document(
+                file_name="duplicate.txt",
+                file_content=b"hello world",
+                file_type="txt",
+            )
+
+        assert exc_info.value.stage == "deduplication"
+        assert exc_info.value.details == {
+            "file_name": "duplicate.txt",
+            "content_hash": build_content_hash(b"hello world"),
+            "existing_doc_id": "existing-doc",
+            "existing_doc_name": "existing.txt",
+        }
+        helper.kb_db.get_document_by_content_hash.assert_awaited_once_with(
+            kb_id="kb-test-1",
+            content_hash=build_content_hash(b"hello world"),
+        )
+        assert list(helper.kb_files_dir.glob("**/*")) == []
+        helper.vec_db.insert_batch.assert_not_awaited()
+        helper.vec_db.delete_documents.assert_not_awaited()
+
+    @pytest.mark.asyncio
+    async def test_upload_document_wraps_duplicate_lookup_failure(self, tmp_path):
+        from astrbot.core.exceptions import KnowledgeBaseUploadError
+
+        helper = _build_helper_with_real_dirs(tmp_path)
+        helper.kb_db.get_document_by_content_hash = AsyncMock(
+            side_effect=RuntimeError("db unavailable"),
+        )
+        helper.vec_db.insert_batch = AsyncMock()
+        helper.vec_db.delete_documents = AsyncMock()
+
+        with pytest.raises(KnowledgeBaseUploadError) as exc_info:
+            await helper.upload_document(
+                file_name="lookup-fails.txt",
+                file_content=b"hello world",
+                file_type="txt",
+            )
+
+        assert exc_info.value.stage == "deduplication"
+        assert "重复检测失败" in exc_info.value.user_message
+        assert list(helper.kb_files_dir.glob("**/*")) == []
+        helper.vec_db.insert_batch.assert_not_awaited()
+        helper.vec_db.delete_documents.assert_not_awaited()
+
+    @pytest.mark.asyncio
+    async def test_pre_chunked_upload_persists_import_metadata(self, tmp_path):
+        from astrbot.core.knowledge_base.document_metadata import build_content_hash
+
+        helper = _build_helper_with_real_dirs(tmp_path)
+
+        session = _make_session_context()
+        helper.kb_db.get_db = MagicMock(return_value=session)
+        helper.kb_db.update_kb_stats = AsyncMock()
+        helper.vec_db.insert_batch = AsyncMock(return_value=[1, 2])
+        helper.vec_db.delete_documents = AsyncMock()
+        helper.vec_db.count_documents = AsyncMock(return_value=2)
+        helper.refresh_kb = AsyncMock()
+        helper.refresh_document = AsyncMock()
+
+        doc = await helper.upload_document(
+            file_name="imported.txt",
+            file_content=None,
+            file_type="txt",
+            pre_chunked_text=["chunk 1", "chunk 2"],
+            source_type="import",
+            source_uri="manual-import",
+        )
+
+        assert doc.source_type == "import"
+        assert doc.source_uri == "manual-import"
+        assert doc.file_path == ""
+        assert doc.file_size == len("chunk 1") + len("chunk 2")
+        assert doc.content_hash == build_content_hash(["chunk 1", "chunk 2"])
+        assert doc.parser_name is None
+        assert doc.parser_version is None
+        assert doc.chunker_name == "pre_chunked"
+        assert doc.chunker_version == "1"
+        assert doc.status == "ready"
+        assert doc.indexed_at is not None
+        helper.vec_db.delete_documents.assert_not_awaited()
+
+    @pytest.mark.asyncio
+    async def test_pre_chunked_upload_rejects_duplicate_before_embedding(
+        self,
+        tmp_path,
+    ):
+        from astrbot.core.exceptions import KnowledgeBaseUploadError
+        from astrbot.core.knowledge_base.document_metadata import build_content_hash
+
+        helper = _build_helper_with_real_dirs(tmp_path)
+        helper.kb_db.get_document_by_content_hash = AsyncMock(
+            return_value=_existing_doc(),
+        )
+        helper.vec_db.insert_batch = AsyncMock()
+        helper.vec_db.delete_documents = AsyncMock()
+
+        with pytest.raises(KnowledgeBaseUploadError) as exc_info:
+            await helper.upload_document(
+                file_name="duplicate-import.txt",
+                file_content=None,
+                file_type="txt",
+                pre_chunked_text=["chunk 1", "chunk 2"],
+                source_type="import",
+            )
+
+        assert exc_info.value.stage == "deduplication"
+        helper.kb_db.get_document_by_content_hash.assert_awaited_once_with(
+            kb_id="kb-test-1",
+            content_hash=build_content_hash(["chunk 1", "chunk 2"]),
+        )
+        assert list(helper.kb_files_dir.glob("**/*")) == []
+        helper.vec_db.insert_batch.assert_not_awaited()
+        helper.vec_db.delete_documents.assert_not_awaited()
+
+    @pytest.mark.asyncio
+    async def test_pre_chunked_upload_uses_explicit_url_metadata(self, tmp_path):
+        from astrbot.core.knowledge_base.document_metadata import build_content_hash
+        from astrbot.core.knowledge_base.parsers.url_parser import URLExtractor
+
+        helper = _build_helper_with_real_dirs(tmp_path)
+
+        session = _make_session_context()
+        helper.kb_db.get_db = MagicMock(return_value=session)
+        helper.kb_db.update_kb_stats = AsyncMock()
+        helper.vec_db.insert_batch = AsyncMock(return_value=[1])
+        helper.vec_db.delete_documents = AsyncMock()
+        helper.vec_db.count_documents = AsyncMock(return_value=1)
+        helper.refresh_kb = AsyncMock()
+        helper.refresh_document = AsyncMock()
+
+        doc = await helper.upload_document(
+            file_name="example.url",
+            file_content=None,
+            file_type="url",
+            pre_chunked_text=["cleaned chunk"],
+            source_type="url",
+            source_uri="https://example.com/a",
+            source_content_hash=build_content_hash("raw page text"),
+            source_parser_name=URLExtractor.__name__,
+            source_chunker_name="RecursiveCharacterChunker",
+        )
+
+        assert doc.source_type == "url"
+        assert doc.source_uri == "https://example.com/a"
+        assert doc.content_hash == build_content_hash("raw page text")
+        assert doc.parser_name == URLExtractor.__name__
+        assert doc.parser_version == "1"
+        assert doc.chunker_name == "RecursiveCharacterChunker"
+        assert doc.chunker_version == "1"
+        assert doc.file_path == ""
+
+    @pytest.mark.asyncio
+    async def test_url_upload_missing_tavily_key_persists_failed_document(
+        self,
+        tmp_path,
+    ):
+        from astrbot.core.exceptions import KnowledgeBaseUploadError
+
+        helper = _build_helper_with_real_dirs(tmp_path)
+        helper.prov_mgr.acm.default_conf = {"provider_settings": {}}
+        session = _make_session_context()
+        helper.kb_db.get_db = MagicMock(return_value=session)
+        helper.kb_db.update_kb_stats = AsyncMock()
+        helper.refresh_kb = AsyncMock()
+        helper.refresh_document = AsyncMock()
+        helper.vec_db.count_documents = AsyncMock(return_value=0)
+
+        with (
+            patch(
+                "astrbot.core.knowledge_base.kb_helper.extract_text_from_url",
+                new_callable=AsyncMock,
+            ) as mock_extract,
+            pytest.raises(KnowledgeBaseUploadError) as exc_info,
+        ):
+            await helper.upload_from_url("https://example.com/page")
+
+        failed_doc = session.add.call_args.args[0]
+        assert exc_info.value.stage == "configuration"
+        assert failed_doc.status == "failed"
+        assert failed_doc.error_stage == "configuration"
+        assert "Tavily API key" in failed_doc.error_message
+        assert failed_doc.source_type == "url"
+        assert failed_doc.source_uri == "https://example.com/page"
+        assert failed_doc.doc_name == "page.url"
+        assert failed_doc.file_type == "url"
+        assert failed_doc.file_size == 0
+        assert failed_doc.file_path == ""
+        assert failed_doc.content_hash is None
+        mock_extract.assert_not_awaited()
+
+    @pytest.mark.asyncio
+    async def test_url_upload_extract_failure_persists_failed_document(
+        self,
+        tmp_path,
+    ):
+        from astrbot.core.exceptions import KnowledgeBaseUploadError
+
+        helper = _build_helper_with_real_dirs(tmp_path)
+        helper.prov_mgr.acm.default_conf = {
+            "provider_settings": {"websearch_tavily_key": ["key-1"]},
+        }
+        session = _make_session_context()
+        helper.kb_db.get_db = MagicMock(return_value=session)
+        helper.kb_db.update_kb_stats = AsyncMock()
+        helper.refresh_kb = AsyncMock()
+        helper.refresh_document = AsyncMock()
+        helper.vec_db.count_documents = AsyncMock(return_value=0)
+
+        with (
+            patch(
+                "astrbot.core.knowledge_base.kb_helper.extract_text_from_url",
+                new_callable=AsyncMock,
+                side_effect=RuntimeError("network down"),
+            ) as mock_extract,
+            pytest.raises(KnowledgeBaseUploadError) as exc_info,
+        ):
+            await helper.upload_from_url("https://example.com/a")
+
+        failed_doc = session.add.call_args.args[0]
+        assert exc_info.value.stage == "extracting"
+        assert failed_doc.status == "failed"
+        assert failed_doc.error_stage == "extracting"
+        assert "无法提取网页内容" in failed_doc.error_message
+        assert failed_doc.source_type == "url"
+        assert failed_doc.source_uri == "https://example.com/a"
+        assert failed_doc.content_hash is None
+        mock_extract.assert_awaited_once_with("https://example.com/a", ["key-1"])
+
+    @pytest.mark.asyncio
+    async def test_url_upload_empty_cleaning_result_persists_failed_document(
+        self,
+        tmp_path,
+    ):
+        from astrbot.core.exceptions import KnowledgeBaseUploadError
+        from astrbot.core.knowledge_base.document_metadata import build_content_hash
+
+        helper = _build_helper_with_real_dirs(tmp_path)
+        helper.prov_mgr.acm.default_conf = {
+            "provider_settings": {"websearch_tavily_key": ["key-1"]},
+        }
+        helper._clean_and_rechunk_content = AsyncMock(return_value=[])
+        helper.upload_document = AsyncMock()
+        session = _make_session_context()
+        helper.kb_db.get_db = MagicMock(return_value=session)
+        helper.kb_db.update_kb_stats = AsyncMock()
+        helper.refresh_kb = AsyncMock()
+        helper.refresh_document = AsyncMock()
+        helper.vec_db.count_documents = AsyncMock(return_value=0)
+
+        with (
+            patch(
+                "astrbot.core.knowledge_base.kb_helper.extract_text_from_url",
+                new_callable=AsyncMock,
+                return_value="raw page text",
+            ) as mock_extract,
+            pytest.raises(KnowledgeBaseUploadError) as exc_info,
+        ):
+            await helper.upload_from_url(
+                "https://example.com/docs",
+                enable_cleaning=True,
+                cleaning_provider_id="llm-1",
+            )
+
+        failed_doc = session.add.call_args.args[0]
+        assert exc_info.value.stage == "cleaning"
+        assert failed_doc.status == "failed"
+        assert failed_doc.error_stage == "cleaning"
+        assert "内容清洗后未提取到有效文本" in failed_doc.error_message
+        assert failed_doc.source_type == "url"
+        assert failed_doc.source_uri == "https://example.com/docs"
+        assert failed_doc.file_size == len("raw page text")
+        assert failed_doc.content_hash == build_content_hash("raw page text")
+        mock_extract.assert_awaited_once_with("https://example.com/docs", ["key-1"])
+        helper.upload_document.assert_not_awaited()
+
+    @pytest.mark.asyncio
+    async def test_rebuild_document_reuploads_saved_source_as_next_version(
+        self,
+        tmp_path,
+    ):
+        from astrbot.core.knowledge_base.models import KBDocument
+
+        helper = _build_helper_with_real_dirs(tmp_path)
+        source_path = helper.kb_files_dir / "old-doc" / "source.md"
+        source_path.parent.mkdir(parents=True)
+        source_path.write_bytes(b"# Title\nhello")
+        old_doc = KBDocument(
+            doc_id="old-doc",
+            kb_id="kb-test-1",
+            doc_name="source.md",
+            file_type="md",
+            file_size=13,
+            file_path=str(source_path),
+            source_type="file",
+            source_uri="source.md",
+            version=2,
+        )
+        new_doc = KBDocument(
+            doc_id="new-doc",
+            kb_id="kb-test-1",
+            doc_name="source.md",
+            file_type="md",
+            file_size=13,
+            file_path="",
+            version=3,
+            parent_doc_id="old-doc",
+        )
+        helper.kb_db.get_document_by_id = AsyncMock(return_value=old_doc)
+        helper.delete_document = AsyncMock()
+        helper.upload_document = AsyncMock(return_value=new_doc)
+
+        rebuilt = await helper.rebuild_document("old-doc", batch_size=8)
+
+        assert rebuilt is new_doc
+        helper.upload_document.assert_awaited_once_with(
+            file_name="source.md",
+            file_content=b"# Title\nhello",
+            file_type="md",
+            chunk_size=512,
+            chunk_overlap=50,
+            batch_size=8,
+            tasks_limit=3,
+            max_retries=3,
+            progress_callback=None,
+            source_type="file",
+            source_uri="source.md",
+            parent_doc_id="old-doc",
+            document_version=3,
+            skip_duplicate_check=True,
+        )
+        helper.delete_document.assert_awaited_once_with("old-doc")
+
+    @pytest.mark.asyncio
+    async def test_rebuild_url_document_reimports_source_as_next_version(self):
+        from astrbot.core.knowledge_base.models import KBDocument
+
+        helper = _build_helper()
+        old_doc = KBDocument(
+            doc_id="old-url-doc",
+            kb_id="kb-test-1",
+            doc_name="page.url",
+            file_type="url",
+            file_size=13,
+            file_path="",
+            source_type="url",
+            source_uri="https://example.com/page",
+            version=4,
+        )
+        new_doc = KBDocument(
+            doc_id="new-url-doc",
+            kb_id="kb-test-1",
+            doc_name="page.url",
+            file_type="url",
+            file_size=15,
+            file_path="",
+            source_type="url",
+            source_uri="https://example.com/page",
+            version=5,
+            parent_doc_id="old-url-doc",
+        )
+        helper.kb_db.get_document_by_id = AsyncMock(return_value=old_doc)
+        helper.delete_document = AsyncMock()
+        helper.upload_from_url = AsyncMock(return_value=new_doc)
+
+        rebuilt = await helper.rebuild_document(
+            "old-url-doc",
+            chunk_size=256,
+            chunk_overlap=32,
+            batch_size=8,
+        )
+
+        assert rebuilt is new_doc
+        helper.upload_from_url.assert_awaited_once_with(
+            url="https://example.com/page",
+            chunk_size=256,
+            chunk_overlap=32,
+            batch_size=8,
+            tasks_limit=3,
+            max_retries=3,
+            progress_callback=None,
+            parent_doc_id="old-url-doc",
+            document_version=5,
+            skip_duplicate_check=True,
+        )
+        helper.delete_document.assert_awaited_once_with("old-url-doc")
+
+    @pytest.mark.asyncio
+    async def test_rebuild_url_document_rejects_missing_source_uri(self):
+        from astrbot.core.knowledge_base.models import KBDocument
+
+        helper = _build_helper()
+        doc = KBDocument(
+            doc_id="old-url-doc",
+            kb_id="kb-test-1",
+            doc_name="page.url",
+            file_type="url",
+            file_size=13,
+            file_path="",
+            source_type="url",
+            source_uri=None,
+        )
+        helper.kb_db.get_document_by_id = AsyncMock(return_value=doc)
+        helper.delete_document = AsyncMock()
+        helper.upload_from_url = AsyncMock()
+
+        with pytest.raises(ValueError, match="URL 来源"):
+            await helper.rebuild_document("old-url-doc")
+
+        helper.delete_document.assert_not_awaited()
+        helper.upload_from_url.assert_not_awaited()
+
+    @pytest.mark.asyncio
+    async def test_upload_from_url_forwards_rebuild_version_metadata(self):
+        from astrbot.core.knowledge_base.document_metadata import build_content_hash
+
+        helper = _build_helper()
+        helper.prov_mgr.acm.default_conf = {
+            "provider_settings": {"websearch_tavily_key": ["key-1"]},
+        }
+        helper._clean_and_rechunk_content = AsyncMock(return_value=["new chunk"])
+        helper.upload_document = AsyncMock(return_value=object())
+
+        with patch(
+            "astrbot.core.knowledge_base.kb_helper.extract_text_from_url",
+            new_callable=AsyncMock,
+            return_value="fresh page text",
+        ):
+            await helper.upload_from_url(
+                "https://example.com/page",
+                parent_doc_id="old-url-doc",
+                document_version=5,
+                skip_duplicate_check=True,
+            )
+
+        helper.upload_document.assert_awaited_once()
+        upload_kwargs = helper.upload_document.await_args.kwargs
+        assert upload_kwargs["pre_chunked_text"] == ["new chunk"]
+        assert upload_kwargs["source_type"] == "url"
+        assert upload_kwargs["source_uri"] == "https://example.com/page"
+        assert upload_kwargs["source_content_hash"] == build_content_hash(
+            "fresh page text",
+        )
+        assert upload_kwargs["parent_doc_id"] == "old-url-doc"
+        assert upload_kwargs["document_version"] == 5
+        assert upload_kwargs["skip_duplicate_check"] is True
+
+    @pytest.mark.asyncio
+    async def test_rebuild_import_document_reuses_indexed_chunks_as_next_version(
+        self,
+    ):
+        from astrbot.core.knowledge_base.document_metadata import build_content_hash
+        from astrbot.core.knowledge_base.models import KBDocument
+
+        helper = _build_helper()
+        old_doc = KBDocument(
+            doc_id="old-import-doc",
+            kb_id="kb-test-1",
+            doc_name="manual.txt",
+            file_type="txt",
+            file_size=18,
+            file_path="",
+            source_type="import",
+            source_uri="manual-import",
+            chunker_name="pre_chunked",
+            version=2,
+        )
+        new_doc = KBDocument(
+            doc_id="new-import-doc",
+            kb_id="kb-test-1",
+            doc_name="manual.txt",
+            file_type="txt",
+            file_size=18,
+            file_path="",
+            source_type="import",
+            source_uri="manual-import",
+            version=3,
+            parent_doc_id="old-import-doc",
+        )
+        helper.kb_db.get_document_by_id = AsyncMock(return_value=old_doc)
+        helper.get_chunks_by_doc_id = AsyncMock(
+            return_value=[
+                {"chunk_index": 1, "content": "second chunk"},
+                {"chunk_index": 0, "content": "first chunk"},
+            ],
+        )
+        helper.upload_document = AsyncMock(return_value=new_doc)
+        helper.delete_document = AsyncMock()
+
+        rebuilt = await helper.rebuild_document("old-import-doc", batch_size=8)
+
+        assert rebuilt is new_doc
+        helper.upload_document.assert_awaited_once_with(
+            file_name="manual.txt",
+            file_content=None,
+            file_type="txt",
+            chunk_size=512,
+            chunk_overlap=50,
+            batch_size=8,
+            tasks_limit=3,
+            max_retries=3,
+            progress_callback=None,
+            pre_chunked_text=["first chunk", "second chunk"],
+            source_type="import",
+            source_uri="manual-import",
+            source_content_hash=build_content_hash(["first chunk", "second chunk"]),
+            source_chunker_name="pre_chunked",
+            parent_doc_id="old-import-doc",
+            document_version=3,
+            skip_duplicate_check=True,
+        )
+        helper.delete_document.assert_awaited_once_with("old-import-doc")
+
+    @pytest.mark.asyncio
+    async def test_rebuild_import_document_rejects_missing_indexed_chunks(self):
+        from astrbot.core.knowledge_base.models import KBDocument
+
+        helper = _build_helper()
+        doc = KBDocument(
+            doc_id="old-import-doc",
+            kb_id="kb-test-1",
+            doc_name="manual.txt",
+            file_type="txt",
+            file_size=18,
+            file_path="",
+            source_type="import",
+            source_uri="manual-import",
+        )
+        helper.kb_db.get_document_by_id = AsyncMock(return_value=doc)
+        helper.get_chunks_by_doc_id = AsyncMock(return_value=[])
+        helper.upload_document = AsyncMock()
+        helper.delete_document = AsyncMock()
+
+        with pytest.raises(ValueError, match="导入文本块"):
+            await helper.rebuild_document("old-import-doc")
+
+        helper.upload_document.assert_not_awaited()
+        helper.delete_document.assert_not_awaited()
+
+    @pytest.mark.asyncio
+    async def test_get_import_rebuild_chunks_reads_every_page(self):
+        from astrbot.core.knowledge_base.kb_helper import DOCUMENT_REBUILD_PAGE_SIZE
+
+        helper = _build_helper()
+        first_page = [
+            {"chunk_index": index + 1, "content": f"chunk {index + 1}"}
+            for index in range(DOCUMENT_REBUILD_PAGE_SIZE)
+        ]
+        second_page = [{"chunk_index": 0, "content": "chunk 0"}]
+        helper.get_chunks_by_doc_id = AsyncMock(side_effect=[first_page, second_page])
+
+        chunks = await helper._get_import_rebuild_chunks("doc-1")
+
+        assert chunks == ["chunk 0", *[f"chunk {index + 1}" for index in range(100)]]
+        assert helper.get_chunks_by_doc_id.await_args_list[0].kwargs == {
+            "offset": 0,
+            "limit": DOCUMENT_REBUILD_PAGE_SIZE,
+        }
+        assert helper.get_chunks_by_doc_id.await_args_list[1].kwargs == {
+            "offset": DOCUMENT_REBUILD_PAGE_SIZE,
+            "limit": DOCUMENT_REBUILD_PAGE_SIZE,
+        }
+
+    @pytest.mark.asyncio
+    async def test_rebuild_document_rejects_missing_source_file(self, tmp_path):
+        from astrbot.core.knowledge_base.models import KBDocument
+
+        helper = _build_helper_with_real_dirs(tmp_path)
+        doc = KBDocument(
+            doc_id="old-doc",
+            kb_id="kb-test-1",
+            doc_name="missing.txt",
+            file_type="txt",
+            file_size=1,
+            file_path=str(helper.kb_files_dir / "missing" / "missing.txt"),
+            source_type="file",
+        )
+        helper.kb_db.get_document_by_id = AsyncMock(return_value=doc)
+        helper.delete_document = AsyncMock()
+        helper.upload_document = AsyncMock()
+
+        with pytest.raises(ValueError, match="原始文件"):
+            await helper.rebuild_document("old-doc")
+
+        helper.delete_document.assert_not_awaited()
+        helper.upload_document.assert_not_awaited()
+
+    @pytest.mark.asyncio
+    async def test_rebuild_document_keeps_old_doc_when_upload_fails(self, tmp_path):
+        from astrbot.core.exceptions import KnowledgeBaseUploadError
+        from astrbot.core.knowledge_base.models import KBDocument
+
+        helper = _build_helper_with_real_dirs(tmp_path)
+        source_path = helper.kb_files_dir / "old-doc" / "source.txt"
+        source_path.parent.mkdir(parents=True)
+        source_path.write_bytes(b"hello")
+        old_doc = KBDocument(
+            doc_id="old-doc",
+            kb_id="kb-test-1",
+            doc_name="source.txt",
+            file_type="txt",
+            file_size=5,
+            file_path=str(source_path),
+            source_type="file",
+        )
+        helper.kb_db.get_document_by_id = AsyncMock(return_value=old_doc)
+        helper.upload_document = AsyncMock(
+            side_effect=KnowledgeBaseUploadError(
+                stage="embedding",
+                user_message="embedding failed",
+            ),
+        )
+        helper.delete_document = AsyncMock()
+
+        with pytest.raises(KnowledgeBaseUploadError) as exc_info:
+            await helper.rebuild_document("old-doc")
+
+        assert exc_info.value.stage == "embedding"
+        helper.delete_document.assert_not_awaited()
+
+    @pytest.mark.asyncio
+    async def test_rebuild_document_rolls_back_new_doc_when_replace_fails(
+        self,
+        tmp_path,
+    ):
+        from astrbot.core.exceptions import KnowledgeBaseUploadError
+        from astrbot.core.knowledge_base.models import KBDocument
+
+        helper = _build_helper_with_real_dirs(tmp_path)
+        source_path = helper.kb_files_dir / "old-doc" / "source.txt"
+        source_path.parent.mkdir(parents=True)
+        source_path.write_bytes(b"hello")
+        old_doc = KBDocument(
+            doc_id="old-doc",
+            kb_id="kb-test-1",
+            doc_name="source.txt",
+            file_type="txt",
+            file_size=5,
+            file_path=str(source_path),
+            source_type="file",
+        )
+        new_doc = KBDocument(
+            doc_id="new-doc",
+            kb_id="kb-test-1",
+            doc_name="source.txt",
+            file_type="txt",
+            file_size=5,
+            file_path="",
+        )
+        helper.kb_db.get_document_by_id = AsyncMock(return_value=old_doc)
+        helper.upload_document = AsyncMock(return_value=new_doc)
+        helper.delete_document = AsyncMock(
+            side_effect=[RuntimeError("old delete failed"), None],
+        )
+
+        with pytest.raises(KnowledgeBaseUploadError) as exc_info:
+            await helper.rebuild_document("old-doc")
+
+        assert exc_info.value.stage == "rebuild"
+        assert exc_info.value.details == {
+            "doc_id": "old-doc",
+            "new_doc_id": "new-doc",
+        }
+        assert helper.delete_document.await_args_list[0].args == ("old-doc",)
+        assert helper.delete_document.await_args_list[1].args == ("new-doc",)
+
+    @pytest.mark.asyncio
+    async def test_rebuild_all_documents_preserves_partial_failures(self, tmp_path):
+        from astrbot.core.knowledge_base.models import KBDocument
+
+        helper = _build_helper_with_real_dirs(tmp_path)
+        docs = [
+            KBDocument(
+                doc_id="doc-ok",
+                kb_id="kb-test-1",
+                doc_name="ok.txt",
+                file_type="txt",
+                file_size=2,
+                file_path="",
+            ),
+            KBDocument(
+                doc_id="doc-fail",
+                kb_id="kb-test-1",
+                doc_name="fail.txt",
+                file_type="txt",
+                file_size=4,
+                file_path="",
+            ),
+        ]
+        rebuilt_doc = KBDocument(
+            doc_id="doc-new",
+            kb_id="kb-test-1",
+            doc_name="ok.txt",
+            file_type="txt",
+            file_size=2,
+            file_path="",
+        )
+        helper.list_documents = AsyncMock(return_value=docs)
+        helper.rebuild_document = AsyncMock(
+            side_effect=[rebuilt_doc, ValueError("missing source")],
+        )
+
+        result = await helper.rebuild_all_documents(batch_size=6)
+
+        assert result["total"] == 2
+        assert result["success_count"] == 1
+        assert result["failed_count"] == 1
+        assert result["rebuilt"][0]["doc_id"] == "doc-new"
+        assert result["failed"] == [
+            {
+                "doc_id": "doc-fail",
+                "doc_name": "fail.txt",
+                "error": "missing source",
+            },
+        ]
+        assert helper.rebuild_document.await_args_list[0].kwargs["batch_size"] == 6
+        assert helper.rebuild_document.await_args_list[1].kwargs["batch_size"] == 6
+
+    @pytest.mark.asyncio
+    async def test_rebuild_all_documents_reads_every_page(self, tmp_path):
+        from astrbot.core.knowledge_base.kb_helper import DOCUMENT_REBUILD_PAGE_SIZE
+        from astrbot.core.knowledge_base.models import KBDocument
+
+        helper = _build_helper_with_real_dirs(tmp_path)
+        docs = [
+            KBDocument(
+                doc_id=f"doc-{index}",
+                kb_id="kb-test-1",
+                doc_name=f"doc-{index}.txt",
+                file_type="txt",
+                file_size=2,
+                file_path="",
+            )
+            for index in range(DOCUMENT_REBUILD_PAGE_SIZE + 1)
+        ]
+
+        async def list_documents(offset=0, limit=100, search=None):
+            return docs[offset : offset + limit]
+
+        helper.list_documents = AsyncMock(side_effect=list_documents)
+        helper.rebuild_document = AsyncMock(
+            side_effect=[
+                KBDocument(
+                    doc_id=f"rebuilt-{index}",
+                    kb_id="kb-test-1",
+                    doc_name=f"doc-{index}.txt",
+                    file_type="txt",
+                    file_size=2,
+                    file_path="",
+                )
+                for index in range(DOCUMENT_REBUILD_PAGE_SIZE + 1)
+            ],
+        )
+
+        result = await helper.rebuild_all_documents()
+
+        assert result["total"] == DOCUMENT_REBUILD_PAGE_SIZE + 1
+        assert result["success_count"] == DOCUMENT_REBUILD_PAGE_SIZE + 1
+        assert helper.list_documents.await_args_list[0].kwargs == {
+            "offset": 0,
+            "limit": DOCUMENT_REBUILD_PAGE_SIZE,
+        }
+        assert helper.list_documents.await_args_list[1].kwargs == {
+            "offset": DOCUMENT_REBUILD_PAGE_SIZE,
+            "limit": DOCUMENT_REBUILD_PAGE_SIZE,
+        }
+
+    @pytest.mark.asyncio
+    async def test_rebuild_documents_preserves_partial_failures(self, tmp_path):
+        from astrbot.core.knowledge_base.models import KBDocument
+
+        helper = _build_helper_with_real_dirs(tmp_path)
+        failed_doc = KBDocument(
+            doc_id="doc-fail",
+            kb_id="kb-test-1",
+            doc_name="fail.txt",
+            file_type="txt",
+            file_size=4,
+            file_path="",
+        )
+        rebuilt_doc = KBDocument(
+            doc_id="doc-new",
+            kb_id="kb-test-1",
+            doc_name="ok.txt",
+            file_type="txt",
+            file_size=2,
+            file_path="",
+        )
+        helper.rebuild_document = AsyncMock(
+            side_effect=[rebuilt_doc, ValueError("missing source")],
+        )
+        helper.get_document = AsyncMock(return_value=failed_doc)
+
+        result = await helper.rebuild_documents(
+            ["doc-ok", "doc-fail", "doc-ok"],
+            batch_size=6,
+        )
+
+        assert result["total"] == 2
+        assert result["success_count"] == 1
+        assert result["failed_count"] == 1
+        assert result["rebuilt"][0]["doc_id"] == "doc-new"
+        assert result["failed"] == [
+            {
+                "doc_id": "doc-fail",
+                "doc_name": "fail.txt",
+                "error": "missing source",
+            },
+        ]
+        assert helper.rebuild_document.await_args_list[0].args == ("doc-ok",)
+        assert helper.rebuild_document.await_args_list[1].args == ("doc-fail",)
+        assert helper.rebuild_document.await_args_list[0].kwargs["batch_size"] == 6
+        assert helper.rebuild_document.await_args_list[1].kwargs["batch_size"] == 6
diff --git a/tests/unit/test_document_storage_fts.py b/tests/unit/test_document_storage_fts.py
index a367634e9d..2284e45737 100644
--- a/tests/unit/test_document_storage_fts.py
+++ b/tests/unit/test_document_storage_fts.py
@@ -1,3 +1,4 @@
+import asyncio
 import sqlite3
 
 import pytest
@@ -58,6 +59,87 @@ async def test_document_storage_fts_rebuilds_existing_documents(tmp_path):
     await storage.close()
 
 
+@pytest.mark.asyncio
+async def test_document_storage_search_documents_filters_and_paginates(tmp_path):
+    storage = DocumentStorage(str(tmp_path / "doc.db"))
+    await storage.initialize()
+
+    await storage.insert_documents_batch(
+        doc_ids=["chunk-1", "chunk-2", "chunk-3"],
+        texts=[
+            "AstrBot plugin lifecycle",
+            "AstrBot provider lifecycle",
+            "unrelated content",
+        ],
+        metadatas=[
+            {"kb_doc_id": "doc-1", "kb_id": "kb-1", "chunk_index": 0},
+            {"kb_doc_id": "doc-1", "kb_id": "kb-1", "chunk_index": 1},
+            {"kb_doc_id": "doc-2", "kb_id": "kb-1", "chunk_index": 0},
+        ],
+    )
+
+    result = await storage.search_documents(
+        "lifecycle",
+        metadata_filters={"kb_doc_id": "doc-1"},
+        offset=1,
+        limit=1,
+    )
+
+    assert result is not None
+    docs, total = result
+    assert total == 2
+    assert [doc["doc_id"] for doc in docs] == ["chunk-2"]
+
+    await storage.close()
+
+
+@pytest.mark.asyncio
+async def test_document_storage_search_sparse_non_positive_limit_falls_back(tmp_path):
+    storage = DocumentStorage(str(tmp_path / "doc.db"))
+    await storage.initialize()
+
+    assert await storage.search_sparse(["知识库"], limit=0) is None
+
+    await storage.close()
+
+
+@pytest.mark.asyncio
+async def test_document_storage_fts_rebuild_is_serialized(tmp_path, monkeypatch):
+    storage = DocumentStorage(str(tmp_path / "doc.db"))
+    await storage.initialize()
+
+    storage.fts5_available = False
+    await storage.insert_document(
+        doc_id="legacy-chunk",
+        text="legacy 知识库 文本",
+        metadata={"kb_doc_id": "doc-1", "kb_id": "kb-1", "chunk_index": 0},
+    )
+
+    storage.fts5_available = True
+    storage._fts_index_ready = False
+    rebuild_count = 0
+    original_rebuild = storage._rebuild_fts_index_unlocked
+
+    async def counted_rebuild():
+        nonlocal rebuild_count
+        rebuild_count += 1
+        await asyncio.sleep(0)
+        await original_rebuild()
+
+    monkeypatch.setattr(storage, "_rebuild_fts_index_unlocked", counted_rebuild)
+
+    results = await asyncio.gather(
+        storage.ensure_fts_index(),
+        storage.ensure_fts_index(),
+        storage.ensure_fts_index(),
+    )
+
+    assert results == [True, True, True]
+    assert rebuild_count == 1
+
+    await storage.close()
+
+
 @pytest.mark.asyncio
 async def test_document_storage_fts_delete_skips_missing_fts_row(tmp_path):
     storage = DocumentStorage(str(tmp_path / "doc.db"))
@@ -137,3 +219,44 @@ async def test_document_storage_adds_unique_doc_id_index_to_existing_table(tmp_p
         )
 
     await storage.close()
+
+
+@pytest.mark.asyncio
+async def test_document_storage_adds_missing_kb_id_generated_column(tmp_path):
+    db_path = tmp_path / "doc.db"
+    conn = sqlite3.connect(db_path)
+    conn.execute(
+        """
+        CREATE TABLE documents (
+            id INTEGER PRIMARY KEY AUTOINCREMENT,
+            doc_id VARCHAR NOT NULL,
+            text VARCHAR NOT NULL,
+            metadata TEXT,
+            created_at DATETIME,
+            updated_at DATETIME,
+            kb_doc_id TEXT GENERATED ALWAYS AS
+                (json_extract(metadata, '$.kb_doc_id')) VIRTUAL
+        )
+        """,
+    )
+    conn.execute(
+        """
+        INSERT INTO documents (doc_id, text, metadata)
+        VALUES (
+            'legacy-chunk',
+            'legacy text',
+            '{"kb_doc_id":"doc-1","kb_id":"kb-1","chunk_index":0}'
+        )
+        """,
+    )
+    conn.commit()
+    conn.close()
+
+    storage = DocumentStorage(str(db_path))
+    await storage.initialize()
+
+    docs = await storage.get_documents(metadata_filters={"kb_id": "kb-1"})
+
+    assert [doc["doc_id"] for doc in docs] == ["legacy-chunk"]
+
+    await storage.close()
diff --git a/tests/unit/test_embedding_storage.py b/tests/unit/test_embedding_storage.py
new file mode 100644
index 0000000000..a51a1f1fc3
--- /dev/null
+++ b/tests/unit/test_embedding_storage.py
@@ -0,0 +1,377 @@
+"""测试 FAISS EmbeddingStorage — 向量归一化、余弦相似度、写锁、索引迁移"""
+
+import asyncio
+import tempfile
+from pathlib import Path
+
+import numpy as np
+import pytest
+
+from astrbot.core.db.vec_db.faiss_impl.embedding_storage import EmbeddingStorage
+
+DIM = 128
+
+
+def make_random_vector(dim: int = DIM) -> np.ndarray:
+    return np.random.default_rng(42).random(dim).astype(np.float32)
+
+
+def make_random_batch(n: int, dim: int = DIM) -> np.ndarray:
+    return np.random.default_rng(42).random((n, dim)).astype(np.float32)
+
+
+def _normalize_vector(v: np.ndarray) -> None:
+    """用 FAISS 归一化单个向量（原地修改）"""
+    faiss = pytest.importorskip("faiss")
+    faiss.normalize_L2(v.reshape(1, -1))
+
+
+def assert_unit_norm(vector: np.ndarray) -> None:
+    """断言向量已 L2 归一化（模长 ≈ 1.0）"""
+    norm = np.linalg.norm(vector)
+    assert abs(norm - 1.0) < 1e-5, f"向量未归一化, 模长={norm}"
+
+
+class TestVectorNormalization:
+    """Phase 1A: 验证入库向量归一化 & 余弦相似度"""
+
+    @pytest.mark.asyncio
+    async def test_insert_normalizes_vector(self):
+        """插入后存储的向量应该已被 L2 归一化（通过自身搜索验证）
+
+        插入时自动归一化向量，用同一向量查询应得到接近 1.0 的内积分。
+        """
+        with tempfile.TemporaryDirectory() as tmpdir:
+            index_path = Path(tmpdir) / "index.faiss"
+            storage = EmbeddingStorage(dimension=DIM, path=str(index_path))
+
+            v = make_random_vector()
+            await storage.insert(v, id=1)
+
+            # 搜索自身：归一化后内积应 ≈ 1.0
+            distances, indices = await storage.search(v.copy().reshape(1, -1), k=1)
+            assert indices[0][0] == 1, f"应返回 id=1，实际={indices[0][0]}"
+            assert distances[0][0] > 0.999, (
+                f"归一化后自身内积应 ≈ 1.0，实际={distances[0][0]}"
+            )
+
+    @pytest.mark.asyncio
+    async def test_insert_batch_normalizes_vectors(self):
+        """批量插入后所有存储的向量应该已被 L2 归一化（通过搜索验证）"""
+        with tempfile.TemporaryDirectory() as tmpdir:
+            index_path = Path(tmpdir) / "index.faiss"
+            storage = EmbeddingStorage(dimension=DIM, path=str(index_path))
+
+            vectors = make_random_batch(10)
+            ids = list(range(10))
+            await storage.insert_batch(vectors, ids)
+
+            # 用其中一个向量搜索自身
+            q = vectors[0].copy()
+            distances, _ = await storage.search(q.reshape(1, -1), k=1)
+            assert distances[0][0] > 0.999, (
+                f"归一化后自身内积应 ≈ 1.0，实际={distances[0][0]}"
+            )
+
+    @pytest.mark.asyncio
+    async def test_search_returns_ip_scores(self):
+        """IP 搜索对归一化向量应返回内积分数 (≈余弦相似度)"""
+        with tempfile.TemporaryDirectory() as tmpdir:
+            index_path = Path(tmpdir) / "index.faiss"
+            storage = EmbeddingStorage(dimension=DIM, path=str(index_path))
+
+            # 插入一个向量
+            v = np.ones(DIM, dtype=np.float32)
+            _normalize_vector(v)
+            await storage.insert(v, id=1)
+
+            # 用相同向量搜索自身 — 内积应接近 1.0
+            query = v.copy()
+            distances, indices = await storage.search(query.reshape(1, -1), k=1)
+            # IP 分数应在 [-1, 1] 范围内
+            assert -1.0 - 1e-5 <= distances[0][0] <= 1.0 + 1e-5, (
+                f"IP 分数超出 [-1,1] 范围: {distances[0][0]}"
+            )
+            # 同向量内积应接近 1.0
+            assert abs(distances[0][0] - 1.0) < 1e-3, (
+                f"自身内积应 ≈ 1.0，实际={distances[0][0]}"
+            )
+
+    @pytest.mark.asyncio
+    async def test_score_conversion_range(self):
+        """分数转换 (scores + 1) / 2 应映射 [-1,1] → [0,1]"""
+
+        # 模拟检索后分数转换
+        test_cases = [
+            (np.array([[1.0]]), 1.0),  # 完美匹配
+            (np.array([[0.0]]), 0.5),  # 正交
+            (np.array([[-1.0]]), 0.0),  # 完全相反
+        ]
+        for raw_scores, expected in test_cases:
+            converted = (raw_scores[0] + 1.0) / 2.0
+            assert abs(converted[0] - expected) < 1e-5, (
+                f"转换错误: {raw_scores[0][0]} → {converted[0]}, 期望 {expected}"
+            )
+
+
+class TestWriteLock:
+    """Phase 1B: 验证 asyncio.Lock 串行化写入操作"""
+
+    @pytest.mark.asyncio
+    async def test_concurrent_inserts_serialized(self):
+        """并发插入应被正确序列化，最终 ntotal 正确"""
+        with tempfile.TemporaryDirectory() as tmpdir:
+            index_path = Path(tmpdir) / "index.faiss"
+            storage = EmbeddingStorage(dimension=DIM, path=str(index_path))
+
+            async def insert_one(offset: int) -> None:
+                for i in range(5):
+                    v = make_random_vector()
+                    await storage.insert(v, id=offset * 5 + i)
+
+            # 4 个协程并发插入
+            await asyncio.gather(
+                insert_one(0),
+                insert_one(1),
+                insert_one(2),
+                insert_one(3),
+            )
+
+            assert storage.index.ntotal == 20, (
+                f"并发插入后 ntotal 应为 20, 实际={storage.index.ntotal}"
+            )
+
+    @pytest.mark.asyncio
+    async def test_search_not_blocked_by_write(self):
+        """写入锁不应阻塞搜索（搜索不加锁）"""
+        with tempfile.TemporaryDirectory() as tmpdir:
+            index_path = Path(tmpdir) / "index.faiss"
+            storage = EmbeddingStorage(dimension=DIM, path=str(index_path))
+
+            # 预先插入一些数据
+            for i in range(10):
+                v = make_random_vector()
+                await storage.insert(v, id=i)
+
+            query = make_random_vector()
+
+            # 同时进行搜索和插入
+            search_task = asyncio.create_task(storage.search(query.reshape(1, -1), k=5))
+            insert_task = asyncio.create_task(
+                storage.insert(make_random_vector(), id=100)
+            )
+
+            results = await asyncio.gather(search_task, insert_task)
+            distances, _ = results[0]
+            assert len(distances[0]) == 5
+
+
+class TestIndexMigration:
+    """Phase 1A: 向后兼容 — L2 索引迁移到 IP"""
+
+    @pytest.mark.asyncio
+    async def test_migration_l2_to_ip(self):
+        """加载旧的 L2 索引时自动迁移为 IP"""
+        faiss = pytest.importorskip("faiss")
+
+        with tempfile.TemporaryDirectory() as tmpdir:
+            index_path = Path(tmpdir) / "index.faiss"
+
+            # 模拟旧版 L2 索引
+            old_index = faiss.IndexIDMap(faiss.IndexFlatL2(DIM))
+            v = make_random_vector()
+            old_index.add_with_ids(v.reshape(1, -1), np.array([1]))
+            faiss.write_index(old_index, str(index_path))
+
+            # 加载时应检测 L2 并迁移
+            storage = EmbeddingStorage(dimension=DIM, path=str(index_path))
+
+            # 迁移后应为有效索引
+            assert storage.index is not None
+            assert storage.index.ntotal == 1
+
+            # 确保能正常搜索（search 方法自动归一化查询向量）
+            distances, _ = await storage.search(v.copy().reshape(1, -1), k=1)
+            assert distances[0][0] > 0.9, (
+                f"迁移后搜索自身应有高分, 实际={distances[0][0]}"
+            )
+
+    @pytest.mark.asyncio
+    async def test_migration_preserves_external_ids(self):
+        faiss = pytest.importorskip("faiss")
+
+        with tempfile.TemporaryDirectory() as tmpdir:
+            index_path = Path(tmpdir) / "index.faiss"
+            old_index = faiss.IndexIDMap(faiss.IndexFlatL2(DIM))
+            vectors = make_random_batch(3)
+            ids = np.array([10, 42, 99], dtype=np.int64)
+            old_index.add_with_ids(vectors, ids)
+            faiss.write_index(old_index, str(index_path))
+
+            storage = EmbeddingStorage(dimension=DIM, path=str(index_path))
+
+            _, result_ids = await storage.search(vectors[1].copy().reshape(1, -1), k=1)
+            assert result_ids[0][0] == 42
+
+    @pytest.mark.asyncio
+    async def test_migration_creates_backup_before_overwrite(self):
+        faiss = pytest.importorskip("faiss")
+
+        with tempfile.TemporaryDirectory() as tmpdir:
+            index_path = Path(tmpdir) / "index.faiss"
+            old_index = faiss.IndexIDMap(faiss.IndexFlatL2(DIM))
+            vectors = make_random_batch(2)
+            ids = np.array([7, 8], dtype=np.int64)
+            old_index.add_with_ids(vectors, ids)
+            faiss.write_index(old_index, str(index_path))
+
+            storage = EmbeddingStorage(dimension=DIM, path=str(index_path))
+
+            backups = list(index_path.parent.glob("index.faiss.bak.*"))
+            assert len(backups) == 1
+
+            migrated_base_index = (
+                storage.index.index
+                if hasattr(storage.index, "index")
+                else storage.index
+            )
+            assert migrated_base_index.metric_type == faiss.METRIC_INNER_PRODUCT
+
+            backup_index = faiss.read_index(str(backups[0]))
+            backup_base_index = (
+                backup_index.index if hasattr(backup_index, "index") else backup_index
+            )
+            assert backup_base_index.metric_type == faiss.METRIC_L2
+            assert backup_index.ntotal == 2
+
+    @pytest.mark.asyncio
+    async def test_no_crash_on_reload_existing_ip_index(self):
+        """重新加载已有的 IP 索引不应报错"""
+        with tempfile.TemporaryDirectory() as tmpdir:
+            index_path = Path(tmpdir) / "index.faiss"
+
+            # 创建 IP 索引
+            storage = EmbeddingStorage(dimension=DIM, path=str(index_path))
+            v = make_random_vector()
+            await storage.insert(v, id=1)  # insert 自动归一化
+
+            # 重新加载
+            storage2 = EmbeddingStorage(dimension=DIM, path=str(index_path))
+            assert storage2.index is not None
+            assert storage2.index.ntotal == 1
+
+    @pytest.mark.asyncio
+    async def test_dimension_mismatch_on_load_raises_error(self):
+        """加载维度不匹配的索引时应抛出清晰错误"""
+        faiss = pytest.importorskip("faiss")
+
+        with tempfile.TemporaryDirectory() as tmpdir:
+            index_path = Path(tmpdir) / "index.faiss"
+            # 创建不同维度的索引
+            wrong_dim = 256
+            index = faiss.IndexIDMap(faiss.IndexFlatIP(wrong_dim))
+            faiss.write_index(index, str(index_path))
+
+            with pytest.raises(ValueError, match="索引维度不匹配"):
+                EmbeddingStorage(dimension=DIM, path=str(index_path))
+
+
+class TestZeroVectorGuard:
+    """零向量应抛出明确错误，而非静默产生无意义数据"""
+
+    @pytest.mark.asyncio
+    async def test_zero_vector_insert_raises_error(self):
+        """插入零向量应抛出 ValueError"""
+        with tempfile.TemporaryDirectory() as tmpdir:
+            index_path = Path(tmpdir) / "index.faiss"
+            storage = EmbeddingStorage(dimension=DIM, path=str(index_path))
+
+            zero_v = np.zeros(DIM, dtype=np.float32)
+            with pytest.raises(ValueError, match="零向量"):
+                await storage.insert(zero_v, id=1)
+
+    @pytest.mark.asyncio
+    async def test_batch_zero_vectors_raises_error(self):
+        """批量插入含零向量应抛出 ValueError"""
+        with tempfile.TemporaryDirectory() as tmpdir:
+            index_path = Path(tmpdir) / "index.faiss"
+            storage = EmbeddingStorage(dimension=DIM, path=str(index_path))
+
+            vectors = make_random_batch(10)
+            vectors[0] = np.zeros(DIM, dtype=np.float32)
+            ids = list(range(10))
+            with pytest.raises(ValueError, match="零向量"):
+                await storage.insert_batch(vectors, ids)
+
+    @pytest.mark.asyncio
+    async def test_near_zero_vector_inserted_normally(self):
+        """接近零但不为零的向量应正常插入并归一化"""
+        with tempfile.TemporaryDirectory() as tmpdir:
+            index_path = Path(tmpdir) / "index.faiss"
+            storage = EmbeddingStorage(dimension=DIM, path=str(index_path))
+
+            # 非常小但不为零的向量
+            tiny_v = np.full(DIM, 1e-8, dtype=np.float32)
+            await storage.insert(tiny_v, id=1)
+            assert storage.index.ntotal == 1
+
+
+class TestHNSWIndex:
+    """Phase 2A: HNSW 索引创建、持久化和搜索"""
+
+    @pytest.mark.asyncio
+    async def test_create_hnsw_index(self):
+        """创建 HNSW 索引应成功"""
+        with tempfile.TemporaryDirectory() as tmpdir:
+            index_path = Path(tmpdir) / "index.faiss"
+            storage = EmbeddingStorage(
+                dimension=DIM,
+                path=str(index_path),
+                index_type="hnsw",
+            )
+            assert storage.index is not None
+            assert storage.index.ntotal == 0
+
+    @pytest.mark.asyncio
+    async def test_hnsw_insert_and_search(self):
+        """HNSW 索引应支持插入和搜索"""
+        with tempfile.TemporaryDirectory() as tmpdir:
+            index_path = Path(tmpdir) / "index.faiss"
+            storage = EmbeddingStorage(
+                dimension=DIM,
+                path=str(index_path),
+                index_type="hnsw",
+            )
+            # 插入多个向量
+            for i in range(10):
+                v = make_random_vector()
+                await storage.insert(v, id=i)
+
+            assert storage.index.ntotal == 10
+
+            # 搜索
+            q = make_random_vector()
+            distances, indices = await storage.search(q.reshape(1, -1), k=5)
+            assert len(indices[0]) == 5
+
+    @pytest.mark.asyncio
+    async def test_hnsw_persistence(self):
+        """HNSW 索引应能持久化并重新加载"""
+        with tempfile.TemporaryDirectory() as tmpdir:
+            index_path = Path(tmpdir) / "index.faiss"
+            storage = EmbeddingStorage(
+                dimension=DIM,
+                path=str(index_path),
+                index_type="hnsw",
+            )
+            v = make_random_vector()
+            await storage.insert(v, id=1)
+
+            # 重新加载
+            storage2 = EmbeddingStorage(
+                dimension=DIM,
+                path=str(index_path),
+                index_type="hnsw",
+            )
+            assert storage2.index is not None
+            assert storage2.index.ntotal == 1
diff --git a/tests/unit/test_faiss_vec_db.py b/tests/unit/test_faiss_vec_db.py
index d294d51cd3..88cb273518 100644
--- a/tests/unit/test_faiss_vec_db.py
+++ b/tests/unit/test_faiss_vec_db.py
@@ -1,35 +1,49 @@
-from unittest.mock import AsyncMock
+from unittest.mock import AsyncMock, MagicMock
 
+import numpy as np
 import pytest
 
-from astrbot.core.db.vec_db.faiss_impl.vec_db import FaissVecDB
+from astrbot.core.db.vec_db.faiss_impl.vec_db import EmbeddingCache, FaissVecDB
 from astrbot.core.exceptions import KnowledgeBaseUploadError
 
 
-@pytest.mark.asyncio
-async def test_insert_batch_skips_empty_contents() -> None:
+def _make_vecdb():
+    """创建最小化的 FaissVecDB mock"""
     vec_db = FaissVecDB.__new__(FaissVecDB)
     vec_db.embedding_provider = AsyncMock()
     vec_db.document_storage = AsyncMock()
-    vec_db.embedding_storage = AsyncMock()
+    vec_db.embedding_storage = MagicMock()
+    vec_db.embedding_storage.dimension = 128
+    vec_db.embedding_cache = EmbeddingCache(max_size=100)
+    return vec_db
+
+
+@pytest.mark.asyncio
+async def test_insert_batch_skips_empty_contents() -> None:
+    vec_db = _make_vecdb()
 
     result = await FaissVecDB.insert_batch(vec_db, [])
 
     assert result == []
-    vec_db.embedding_provider.get_embeddings_batch.assert_not_awaited()
-    vec_db.document_storage.insert_documents_batch.assert_not_awaited()
-    vec_db.embedding_storage.insert_batch.assert_not_awaited()
+    vec_db.embedding_provider.get_embeddings_batch.assert_not_called()
+    vec_db.document_storage.insert_documents_batch.assert_not_called()
+    vec_db.embedding_storage.insert_batch.assert_not_called()
 
 
 @pytest.mark.asyncio
-async def test_insert_batch_raises_friendly_error_for_embedding_count_mismatch() -> (
-    None
-):
-    vec_db = FaissVecDB.__new__(FaissVecDB)
-    vec_db.embedding_provider = AsyncMock()
-    vec_db.embedding_provider.get_embeddings_batch.return_value = [[0.1, 0.2]]
-    vec_db.document_storage = AsyncMock()
-    vec_db.embedding_storage = AsyncMock()
+@pytest.mark.parametrize(
+    ("embeddings", "expected_fragments"),
+    [
+        ([[0.1, 0.2]], ("期望 2", "实际 1")),
+        ([[0.1, 0.2], [0.3]], ()),
+    ],
+)
+async def test_insert_batch_rejects_invalid_embeddings_before_writing_documents(
+    embeddings: list[list[float]],
+    expected_fragments: tuple[str, ...],
+) -> None:
+    vec_db = _make_vecdb()
+    vec_db.embedding_provider.get_embeddings_batch.return_value = embeddings
     vec_db.embedding_storage.dimension = 2
 
     with pytest.raises(KnowledgeBaseUploadError) as exc_info:
@@ -40,7 +54,137 @@ async def test_insert_batch_raises_friendly_error_for_embedding_count_mismatch()
             ids=["doc-1", "doc-2"],
         )
 
+    assert exc_info.value.stage == "embedding"
     assert "向量化失败" in str(exc_info.value)
-    assert "期望 2，实际 1" in str(exc_info.value)
-    vec_db.document_storage.insert_documents_batch.assert_not_awaited()
-    vec_db.embedding_storage.insert_batch.assert_not_awaited()
+    for fragment in expected_fragments:
+        assert fragment in str(exc_info.value)
+    vec_db.document_storage.insert_documents_batch.assert_not_called()
+    vec_db.embedding_storage.insert_batch.assert_not_called()
+
+
+@pytest.mark.asyncio
+async def test_insert_batch_cleans_document_rows_when_faiss_insert_fails() -> None:
+    vec_db = _make_vecdb()
+    vec_db.embedding_provider.get_embeddings_batch.return_value = [
+        [0.1] * 128,
+        [0.2] * 128,
+    ]
+    vec_db.document_storage.insert_documents_batch = AsyncMock(return_value=[10, 11])
+    vec_db.document_storage.delete_document_by_doc_id = AsyncMock()
+    vec_db.embedding_storage.insert_batch = AsyncMock(
+        side_effect=RuntimeError("faiss fail"),
+    )
+    vec_db.embedding_storage.delete = AsyncMock()
+
+    with pytest.raises(RuntimeError, match="faiss fail"):
+        await FaissVecDB.insert_batch(
+            vec_db,
+            contents=["chunk-1", "chunk-2"],
+            metadatas=[{}, {}],
+            ids=["doc-1", "doc-2"],
+        )
+
+    vec_db.embedding_storage.delete.assert_awaited_once_with([10, 11])
+    vec_db.document_storage.delete_document_by_doc_id.assert_any_await("doc-1")
+    vec_db.document_storage.delete_document_by_doc_id.assert_any_await("doc-2")
+    assert vec_db.document_storage.delete_document_by_doc_id.await_count == 2
+
+
+@pytest.mark.asyncio
+async def test_delete_returns_false_when_chunk_is_missing() -> None:
+    vec_db = _make_vecdb()
+    vec_db.document_storage.get_document_by_doc_id.return_value = None
+    vec_db.document_storage.delete_document_by_doc_id = AsyncMock()
+    vec_db.embedding_storage.delete = AsyncMock()
+
+    deleted = await FaissVecDB.delete(vec_db, "missing-chunk")
+
+    assert deleted is False
+    vec_db.document_storage.delete_document_by_doc_id.assert_not_called()
+    vec_db.embedding_storage.delete.assert_not_called()
+
+
+@pytest.mark.asyncio
+async def test_delete_returns_true_when_chunk_exists() -> None:
+    vec_db = _make_vecdb()
+    vec_db.document_storage.get_document_by_doc_id.return_value = {"id": 42}
+    vec_db.document_storage.delete_document_by_doc_id = AsyncMock()
+    vec_db.embedding_storage.delete = AsyncMock()
+
+    deleted = await FaissVecDB.delete(vec_db, "chunk-1")
+
+    assert deleted is True
+    vec_db.document_storage.delete_document_by_doc_id.assert_awaited_once_with(
+        "chunk-1"
+    )
+    vec_db.embedding_storage.delete.assert_awaited_once_with([42])
+
+
+class TestEmbeddingCache:
+    """Phase 2B: 嵌入缓存测试"""
+
+    @pytest.mark.asyncio
+    async def test_cache_hit_returns_cached_value(self):
+        """缓存命中时返回已缓存的向量"""
+        cache = EmbeddingCache(max_size=100)
+        text = "hello world"
+        emb = np.array([0.1, 0.2, 0.3], dtype=np.float32)
+
+        await cache.put(text, emb)
+        result = await cache.get(text)
+
+        assert result is not None
+        assert np.array_equal(result, emb)
+
+    @pytest.mark.asyncio
+    async def test_cache_miss_returns_none(self):
+        """缓存未命中时返回 None"""
+        cache = EmbeddingCache(max_size=100)
+        result = await cache.get("unknown text")
+        assert result is None
+
+    @pytest.mark.asyncio
+    async def test_cache_lru_eviction(self):
+        """超出 max_size 时最早的条目应被淘汰"""
+        cache = EmbeddingCache(max_size=3)
+        for i in range(5):
+            await cache.put(f"text_{i}", np.array([float(i)], dtype=np.float32))
+
+        assert await cache.__len__() == 3
+        # text_0 和 text_1 应该被淘汰
+        assert await cache.get("text_0") is None
+        assert await cache.get("text_1") is None
+        # text_2, text_3, text_4 应该仍然存在
+        assert await cache.get("text_2") is not None
+        assert await cache.get("text_3") is not None
+        assert await cache.get("text_4") is not None
+
+    @pytest.mark.asyncio
+    async def test_insert_batch_uses_cache(self):
+        """insert_batch 缓存命中时减少 provider 调用"""
+        vec_db = _make_vecdb()
+        # 预缓存两个文本
+        await vec_db.embedding_cache.put(
+            "cached_1",
+            np.array([0.5] * 128, dtype=np.float32),
+        )
+        await vec_db.embedding_cache.put(
+            "cached_2",
+            np.array([0.6] * 128, dtype=np.float32),
+        )
+        vec_db.embedding_provider.get_embeddings_batch.return_value = [[0.1] * 128]
+        vec_db.document_storage.insert_documents_batch = AsyncMock(
+            return_value=[10, 11, 12],
+        )
+        vec_db.embedding_storage.insert_batch = AsyncMock()
+
+        result = await FaissVecDB.insert_batch(
+            vec_db,
+            contents=["cached_1", "cached_2", "fresh_text"],
+            batch_size=32,
+            tasks_limit=3,
+            max_retries=3,
+        )
+        assert len(result) == 3
+        # 只应调用一次 get_embeddings_batch（仅 fresh_text 未缓存）
+        assert vec_db.embedding_provider.get_embeddings_batch.call_count == 1
diff --git a/tests/unit/test_kb_core_features.py b/tests/unit/test_kb_core_features.py
new file mode 100644
index 0000000000..3b4668d9a8
--- /dev/null
+++ b/tests/unit/test_kb_core_features.py
@@ -0,0 +1,1069 @@
+import copy
+import json
+from types import SimpleNamespace
+from unittest.mock import AsyncMock, MagicMock
+
+import pytest
+
+from astrbot.core.db.vec_db.base import Result
+from astrbot.core.knowledge_base.capabilities import (
+    DEFAULT_CHUNK_OVERLAP,
+    DEFAULT_CHUNK_SIZE,
+    DEFAULT_INDEX_TYPE,
+    DEFAULT_TOP_K_DENSE,
+    DEFAULT_TOP_K_SPARSE,
+    DEFAULT_TOP_M_FINAL,
+)
+from astrbot.core.knowledge_base.chunking.markdown import MarkdownChunker
+from astrbot.core.knowledge_base.kb_helper import (
+    CONSISTENCY_CHECK_PAGE_SIZE,
+    CONSISTENCY_REPAIR_TYPES,
+    KBHelper,
+)
+from astrbot.core.knowledge_base.kb_mgr import KnowledgeBaseManager
+from astrbot.core.knowledge_base.models import KBDocument, KnowledgeBase
+from astrbot.core.knowledge_base.parsers import pdf_parser
+from astrbot.core.knowledge_base.parsers.pdf_parser import PDFParser
+from astrbot.core.knowledge_base.retrieval.manager import (
+    RetrievalManager,
+    RetrievalResult,
+)
+from astrbot.core.knowledge_base.retrieval.rank_fusion import RankFusion
+from astrbot.core.knowledge_base.retrieval.sparse_retriever import SparseResult
+
+
+def test_knowledge_base_model_defaults_match_capabilities():
+    kb = KnowledgeBase(kb_name="defaults", embedding_provider_id="emb-1")
+
+    assert kb.chunk_size == DEFAULT_CHUNK_SIZE
+    assert kb.chunk_overlap == DEFAULT_CHUNK_OVERLAP
+    assert kb.top_k_dense == DEFAULT_TOP_K_DENSE
+    assert kb.top_k_sparse == DEFAULT_TOP_K_SPARSE
+    assert kb.top_m_final == DEFAULT_TOP_M_FINAL
+    assert kb.index_type == DEFAULT_INDEX_TYPE
+
+
+@pytest.mark.asyncio
+async def test_create_kb_uses_capability_defaults(monkeypatch):
+    from astrbot.core.knowledge_base.kb_helper import KBHelper
+    from astrbot.core.knowledge_base.kb_mgr import KnowledgeBaseManager
+
+    manager = KnowledgeBaseManager.__new__(KnowledgeBaseManager)
+    manager.provider_manager = MagicMock()
+    manager.kb_db = MagicMock()
+    manager.kb_insts = {}
+    manager._kb_name_index = {}
+
+    session = MagicMock()
+    session.add = MagicMock()
+    session.flush = AsyncMock()
+    session.commit = AsyncMock()
+    context = MagicMock()
+    context.__aenter__ = AsyncMock(return_value=session)
+    context.__aexit__ = AsyncMock(return_value=False)
+    manager.kb_db.get_db.return_value = context
+
+    async def initialize(self):
+        return None
+
+    monkeypatch.setattr(KBHelper, "initialize", initialize)
+
+    kb_helper = await manager.create_kb(
+        kb_name="defaults",
+        embedding_provider_id="emb-1",
+    )
+
+    created_kb = session.add.call_args.args[0]
+    assert created_kb is kb_helper.kb
+    assert created_kb.chunk_size == DEFAULT_CHUNK_SIZE
+    assert created_kb.chunk_overlap == DEFAULT_CHUNK_OVERLAP
+    assert created_kb.top_k_dense == DEFAULT_TOP_K_DENSE
+    assert created_kb.top_k_sparse == DEFAULT_TOP_K_SPARSE
+    assert created_kb.top_m_final == DEFAULT_TOP_M_FINAL
+    assert created_kb.index_type == DEFAULT_INDEX_TYPE
+
+
+@pytest.mark.asyncio
+async def test_markdown_chunk_returns_text_only_compatibility() -> None:
+    chunker = MarkdownChunker(chunk_size=200, chunk_overlap=0)
+    text = "# Guide\nIntro\n\n## Install\nStep one"
+
+    chunks = await chunker.chunk(text)
+    chunks_with_metadata = await chunker.chunk_with_metadata(text)
+
+    assert chunks == [chunk.text for chunk in chunks_with_metadata]
+    assert [chunk.title_path for chunk in chunks_with_metadata] == [
+        ["Guide"],
+        ["Guide", "Install"],
+    ]
+    assert [chunk.section_index for chunk in chunks_with_metadata] == [0, 1]
+
+
+@pytest.mark.asyncio
+async def test_markdown_split_chunks_keep_current_title_path() -> None:
+    chunker = MarkdownChunker(chunk_size=80, chunk_overlap=0)
+    text = "# Guide\n" + "\n".join(
+        f"Long installation paragraph {idx}." for idx in range(12)
+    )
+
+    chunks = await chunker.chunk_with_metadata(text)
+
+    assert len(chunks) > 1
+    assert all(chunk.title_path == ["Guide"] for chunk in chunks)
+    assert all(chunk.section_index == 0 for chunk in chunks)
+
+
+@pytest.mark.asyncio
+async def test_markdown_chunker_skips_front_matter() -> None:
+    chunker = MarkdownChunker(chunk_size=200, chunk_overlap=0)
+    text = "---\noutline: deep\n---\n\n# Guide\nVisible content"
+
+    chunks = await chunker.chunk_with_metadata(text)
+
+    assert len(chunks) == 1
+    assert "outline: deep" not in chunks[0].text
+    assert chunks[0].text.startswith("# Guide")
+
+
+@pytest.mark.asyncio
+async def test_markdown_chunker_splits_long_tables_with_header() -> None:
+    chunker = MarkdownChunker(chunk_size=90, chunk_overlap=0)
+    table_rows = "\n".join(f"| row-{idx} | value-{idx} |" for idx in range(8))
+    text = "# Data\n| Name | Value |\n| --- | --- |\n" + table_rows
+
+    chunks = await chunker.chunk_with_metadata(text)
+    table_chunks = [chunk.text for chunk in chunks if "| Name | Value |" in chunk.text]
+
+    assert len(table_chunks) > 1
+    assert all("| --- | --- |" in chunk for chunk in table_chunks)
+    assert all("| Name | Value |" in chunk for chunk in table_chunks)
+
+
+@pytest.mark.asyncio
+async def test_markdown_chunker_keeps_code_fences_when_splitting() -> None:
+    chunker = MarkdownChunker(chunk_size=90, chunk_overlap=0)
+    code = "\n".join(f"print('line {idx}')" for idx in range(12))
+    text = f"# Code\n```python\n{code}\n```"
+
+    chunks = await chunker.chunk_with_metadata(text)
+    code_chunks = [chunk.text for chunk in chunks if "```python" in chunk.text]
+
+    assert len(code_chunks) > 1
+    assert all(chunk.count("```") == 2 for chunk in code_chunks)
+    assert all(chunk.rstrip().endswith("```") for chunk in code_chunks)
+
+
+@pytest.mark.asyncio
+async def test_markdown_chunker_preserves_links_inside_long_paragraphs() -> None:
+    chunker = MarkdownChunker(chunk_size=90, chunk_overlap=0)
+    url = "https://example.com/docs/plugin-development-reference"
+    text = (
+        "# Links\nRead the official guide at "
+        f"[plugin docs]({url}) " + "before changing provider settings. " * 5
+    )
+
+    chunks = await chunker.chunk_with_metadata(text)
+    link_chunks = [chunk.text for chunk in chunks if "plugin docs" in chunk.text]
+
+    assert len(link_chunks) == 1
+    assert f"[plugin docs]({url})" in link_chunks[0]
+    assert sum(chunk.text.count("[plugin docs](") for chunk in chunks) == 1
+
+
+@pytest.mark.asyncio
+async def test_markdown_chunker_keeps_callout_blocks_together() -> None:
+    chunker = MarkdownChunker(chunk_size=200, chunk_overlap=0)
+    text = (
+        "# Notice\n"
+        "> [!WARNING]\n"
+        "> Keep the provider settings unchanged during migration.\n"
+        "> Rebuild only new documents.\n\n"
+        "Normal paragraph after the callout."
+    )
+
+    chunks = await chunker.chunk_with_metadata(text)
+    callout_chunks = [chunk.text for chunk in chunks if "[!WARNING]" in chunk.text]
+
+    assert len(callout_chunks) == 1
+    assert "Rebuild only new documents." in callout_chunks[0]
+
+
+@pytest.mark.asyncio
+async def test_markdown_chunker_keeps_math_block_wrapped_when_splitting() -> None:
+    chunker = MarkdownChunker(chunk_size=90, chunk_overlap=0)
+    formula_lines = "\n".join(
+        rf"a_{{{idx}}} = b_{{{idx}}} + c_{{{idx}}}" for idx in range(10)
+    )
+    text = f"# Math\n$$\n{formula_lines}\n$$"
+
+    chunks = await chunker.chunk_with_metadata(text)
+    math_chunks = [chunk.text for chunk in chunks if "$$" in chunk.text]
+
+    assert len(math_chunks) > 1
+    assert all(chunk.startswith("$$") or "\n$$" in chunk for chunk in math_chunks)
+    assert all(chunk.rstrip().endswith("$$") for chunk in math_chunks)
+
+
+@pytest.mark.asyncio
+async def test_markdown_chunker_preserves_inline_math_spans() -> None:
+    chunker = MarkdownChunker(chunk_size=80, chunk_overlap=0)
+    formula = r"$E = mc^2 + \alpha + \beta + \gamma$"
+    bracket_formula = r"\(a^2 + b^2 = c^2\)"
+    text = (
+        "# Math\n"
+        "Use "
+        f"{formula} and {bracket_formula} "
+        + "inside a paragraph with enough surrounding words to split. "
+        * 4
+    )
+
+    chunks = await chunker.chunk_with_metadata(text)
+    inline_math_chunks = [chunk.text for chunk in chunks if "E = mc^2" in chunk.text]
+    bracket_math_chunks = [chunk.text for chunk in chunks if "a^2 + b^2" in chunk.text]
+
+    assert len(inline_math_chunks) == 1
+    assert formula in inline_math_chunks[0]
+    assert len(bracket_math_chunks) == 1
+    assert bracket_formula in bracket_math_chunks[0]
+
+
+@pytest.mark.asyncio
+async def test_pdf_parser_preserves_page_number_segments(monkeypatch) -> None:
+    page_one = MagicMock()
+    page_one.extract_text.return_value = "Page one"
+    page_two = MagicMock()
+    page_two.extract_text.return_value = "Page two"
+    reader = MagicMock()
+    reader.pages = [page_one, page_two]
+    monkeypatch.setattr(pdf_parser, "PdfReader", MagicMock(return_value=reader))
+
+    result = await PDFParser().parse(b"pdf bytes", "guide.pdf")
+
+    assert result.text == "Page one\n\nPage two"
+    assert [segment.text for segment in result.text_segments or []] == [
+        "Page one",
+        "Page two",
+    ]
+    assert [segment.metadata for segment in result.text_segments or []] == [
+        {"page_number": 1},
+        {"page_number": 2},
+    ]
+
+
+def _manager() -> KnowledgeBaseManager:
+    return KnowledgeBaseManager.__new__(KnowledgeBaseManager)
+
+
+def test_format_result_source_includes_structural_metadata():
+    manager = _manager()
+    result = RetrievalResult(
+        chunk_id="chunk-1",
+        doc_id="doc-1",
+        doc_name="guide.md",
+        kb_id="kb-1",
+        kb_name="Docs",
+        content="content",
+        score=0.9,
+        metadata={
+            "chunk_index": 3,
+            "section_index": 2,
+            "title_path": ["Plugin", "Install"],
+            "page_number": 5,
+            "parent_chunk_id": "parent-1",
+        },
+    )
+
+    assert manager._format_result_source(result) == {
+        "kb_name": "Docs",
+        "document_name": "guide.md",
+        "chunk_index": 3,
+        "section_index": 2,
+        "title_path": ["Plugin", "Install"],
+        "page_number": 5,
+        "parent_chunk_id": "parent-1",
+    }
+
+
+def test_format_context_includes_source_location_details():
+    manager = _manager()
+    result = RetrievalResult(
+        chunk_id="chunk-1",
+        doc_id="doc-1",
+        doc_name="guide.md",
+        kb_id="kb-1",
+        kb_name="Docs",
+        content="Install steps",
+        score=0.91,
+        metadata={
+            "chunk_index": 0,
+            "section_index": 2,
+            "title_path": ["Plugin", "Install"],
+            "page_number": 5,
+        },
+    )
+
+    context = manager._format_context([result])
+
+    assert "Docs / guide.md (Plugin > Install; 第 5 页; 章节 2)" in context
+    assert "Install steps" in context
+
+
+def _dense_result(
+    *,
+    chunk_id: str,
+    doc_id: str,
+    kb_id: str = "kb-1",
+    chunk_index: int = 0,
+    text: str,
+    similarity: float,
+    metadata: dict | None = None,
+) -> Result:
+    chunk_metadata = {
+        "chunk_index": chunk_index,
+        "kb_doc_id": doc_id,
+        "kb_id": kb_id,
+    }
+    if metadata:
+        chunk_metadata.update(metadata)
+    return Result(
+        similarity=similarity,
+        data={
+            "doc_id": chunk_id,
+            "text": text,
+            "metadata": json.dumps(chunk_metadata),
+        },
+    )
+
+
+def _metadata(doc_id: str, kb_id: str = "kb-1") -> dict:
+    return {
+        "document": SimpleNamespace(doc_id=doc_id, doc_name=f"{doc_id}.md"),
+        "knowledge_base": SimpleNamespace(kb_id=kb_id, kb_name="kb"),
+    }
+
+
+def test_build_kb_options_uses_capability_defaults_for_empty_kb_values():
+    manager = RetrievalManager(
+        sparse_retriever=SimpleNamespace(),
+        rank_fusion=SimpleNamespace(),
+        kb_db=SimpleNamespace(),
+    )
+    kb_helper = SimpleNamespace(
+        kb=SimpleNamespace(
+            top_k_dense=None,
+            top_k_sparse=None,
+            top_m_final=None,
+            rerank_provider_id=None,
+        ),
+        vec_db=SimpleNamespace(),
+    )
+
+    kb_ids, kb_options = manager._build_kb_options(
+        ["kb-1"],
+        {"kb-1": kb_helper},
+    )
+
+    assert kb_ids == ["kb-1"]
+    assert kb_options["kb-1"]["top_k_dense"] == DEFAULT_TOP_K_DENSE
+    assert kb_options["kb-1"]["top_k_sparse"] == DEFAULT_TOP_K_SPARSE
+    assert kb_options["kb-1"]["top_m_final"] == DEFAULT_TOP_M_FINAL
+
+
+@pytest.mark.asyncio
+async def test_retrieve_with_trace_exposes_pipeline_stages_and_ranks():
+    dense_results = [
+        _dense_result(
+            chunk_id="chunk-b",
+            doc_id="doc-b",
+            chunk_index=1,
+            text="dense only content",
+            similarity=0.92,
+        ),
+        _dense_result(
+            chunk_id="chunk-a",
+            doc_id="doc-a",
+            chunk_index=0,
+            text="hybrid dense content",
+            similarity=0.81,
+        ),
+    ]
+    sparse_results = [
+        SparseResult(
+            chunk_id="chunk-a",
+            chunk_index=0,
+            doc_id="doc-a",
+            kb_id="kb-1",
+            content="hybrid sparse content",
+            score=0.0,
+            metadata={
+                "chunk_index": 0,
+                "kb_doc_id": "doc-a",
+                "kb_id": "kb-1",
+                "title_path": ["Guide", "Install"],
+                "page_number": 2,
+            },
+        ),
+        SparseResult(
+            chunk_id="chunk-c",
+            chunk_index=2,
+            doc_id="doc-c",
+            kb_id="kb-1",
+            content="sparse only content",
+            score=4.0,
+        ),
+    ]
+
+    vec_db = SimpleNamespace(retrieve=AsyncMock(return_value=dense_results))
+    kb_helper = SimpleNamespace(
+        kb=SimpleNamespace(
+            top_k_dense=2,
+            top_k_sparse=2,
+            top_m_final=2,
+            rerank_provider_id=None,
+        ),
+        vec_db=vec_db,
+    )
+    sparse_retriever = SimpleNamespace(
+        retrieve=AsyncMock(return_value=sparse_results),
+    )
+    kb_db = SimpleNamespace(
+        get_documents_with_metadata_batch=AsyncMock(
+            return_value={
+                "doc-a": _metadata("doc-a"),
+                "doc-b": _metadata("doc-b"),
+                "doc-c": _metadata("doc-c"),
+            },
+        ),
+    )
+    manager = RetrievalManager(
+        sparse_retriever=sparse_retriever,
+        rank_fusion=RankFusion(kb_db),
+        kb_db=kb_db,
+    )
+
+    response = await manager.retrieve_with_trace(
+        query="hybrid",
+        kb_ids=["kb-1"],
+        kb_id_helper_map={"kb-1": kb_helper},
+        top_k_fusion=3,
+        top_m_final=2,
+    )
+
+    assert [result.chunk_id for result in response.results] == [
+        "chunk-a",
+        "chunk-b",
+    ]
+    trace = response.trace.to_dict()
+    assert set(trace) == {
+        "dense",
+        "sparse",
+        "fusion",
+        "dedup",
+        "dedup_removed",
+        "rerank",
+        "final",
+    }
+    assert [item["chunk_id"] for item in trace["dense"]] == ["chunk-b", "chunk-a"]
+    assert [item["chunk_id"] for item in trace["sparse"]] == ["chunk-a", "chunk-c"]
+
+    hybrid_trace = trace["fusion"][0]
+    assert hybrid_trace["chunk_id"] == "chunk-a"
+    assert hybrid_trace["dense_rank"] == 2
+    assert hybrid_trace["sparse_rank"] == 1
+    assert hybrid_trace["dense_score"] == 0.81
+    assert hybrid_trace["sparse_score"] == 0.0
+    assert hybrid_trace["rrf_score"] == hybrid_trace["score"]
+    assert hybrid_trace["doc_name"] == "doc-a.md"
+    assert hybrid_trace["score"] > trace["fusion"][1]["score"]
+    assert hybrid_trace["title_path"] == ["Guide", "Install"]
+    assert hybrid_trace["page_number"] == 2
+
+    assert [item["chunk_id"] for item in trace["dedup"]] == [
+        "chunk-a",
+        "chunk-b",
+        "chunk-c",
+    ]
+    assert trace["dedup_removed"] == []
+    assert trace["rerank"] == []
+    assert [item["chunk_id"] for item in trace["final"]] == ["chunk-a", "chunk-b"]
+    assert trace["final"][0]["title_path"] == ["Guide", "Install"]
+    assert trace["final"][0]["page_number"] == 2
+    assert trace["final"][0]["dense_score"] == 0.81
+    assert trace["final"][0]["sparse_score"] == 0.0
+    assert trace["final"][0]["rrf_score"] == trace["final"][0]["score"]
+
+
+@pytest.mark.asyncio
+async def test_retrieve_with_trace_deduplicates_near_identical_contexts():
+    dense_results = [
+        _dense_result(
+            chunk_id="chunk-a",
+            doc_id="doc-a",
+            chunk_index=0,
+            text="Install AstrBot plugin with pip and restart the service.",
+            similarity=0.95,
+        ),
+        _dense_result(
+            chunk_id="chunk-b",
+            doc_id="doc-b",
+            chunk_index=1,
+            text="Install AstrBot plugin with pip and restart the service.",
+            similarity=0.93,
+        ),
+        _dense_result(
+            chunk_id="chunk-c",
+            doc_id="doc-c",
+            chunk_index=2,
+            text="Configure the provider in the dashboard settings.",
+            similarity=0.75,
+        ),
+    ]
+
+    vec_db = SimpleNamespace(retrieve=AsyncMock(return_value=dense_results))
+    kb_helper = SimpleNamespace(
+        kb=SimpleNamespace(
+            top_k_dense=3,
+            top_k_sparse=1,
+            top_m_final=3,
+            rerank_provider_id=None,
+        ),
+        vec_db=vec_db,
+    )
+    sparse_retriever = SimpleNamespace(retrieve=AsyncMock(return_value=[]))
+    kb_db = SimpleNamespace(
+        get_documents_with_metadata_batch=AsyncMock(
+            return_value={
+                "doc-a": _metadata("doc-a"),
+                "doc-b": _metadata("doc-b"),
+                "doc-c": _metadata("doc-c"),
+            },
+        ),
+    )
+    manager = RetrievalManager(
+        sparse_retriever=sparse_retriever,
+        rank_fusion=RankFusion(kb_db),
+        kb_db=kb_db,
+    )
+
+    response = await manager.retrieve_with_trace(
+        query="install plugin",
+        kb_ids=["kb-1"],
+        kb_id_helper_map={"kb-1": kb_helper},
+        top_k_fusion=3,
+        top_m_final=3,
+    )
+
+    trace = response.trace.to_dict()
+    assert [item["chunk_id"] for item in trace["fusion"]] == [
+        "chunk-a",
+        "chunk-b",
+        "chunk-c",
+    ]
+    assert [item["chunk_id"] for item in trace["dedup"]] == [
+        "chunk-a",
+        "chunk-c",
+    ]
+    assert [item["chunk_id"] for item in trace["dedup_removed"]] == ["chunk-b"]
+    assert trace["dedup_removed"][0]["duplicate_of_chunk_id"] == "chunk-a"
+    assert trace["dedup_removed"][0]["duplicate_of_doc_id"] == "doc-a"
+    assert trace["dedup_removed"][0]["dedup_similarity"] == 1.0
+    assert [result.chunk_id for result in response.results] == [
+        "chunk-a",
+        "chunk-c",
+    ]
+
+
+@pytest.mark.asyncio
+async def test_retrieve_with_trace_applies_temporary_retrieval_overrides():
+    dense_results = [
+        _dense_result(
+            chunk_id="chunk-a",
+            doc_id="doc-a",
+            text="temporary override content",
+            similarity=0.9,
+        ),
+    ]
+    vec_db = SimpleNamespace(retrieve=AsyncMock(return_value=dense_results))
+    kb = SimpleNamespace(
+        top_k_dense=10,
+        top_k_sparse=10,
+        top_m_final=5,
+        rerank_provider_id="rerank-1",
+    )
+    kb_helper = SimpleNamespace(kb=kb, vec_db=vec_db)
+    sparse_retriever = SimpleNamespace(retrieve=AsyncMock(return_value=[]))
+    kb_db = SimpleNamespace(
+        get_documents_with_metadata_batch=AsyncMock(
+            return_value={"doc-a": _metadata("doc-a")},
+        ),
+    )
+    manager = RetrievalManager(
+        sparse_retriever=sparse_retriever,
+        rank_fusion=RankFusion(kb_db),
+        kb_db=kb_db,
+    )
+
+    response = await manager.retrieve_with_trace(
+        query="override",
+        kb_ids=["kb-1"],
+        kb_id_helper_map={"kb-1": kb_helper},
+        top_k_fusion=3,
+        top_m_final=2,
+        retrieval_overrides={
+            "top_k_dense": 2,
+            "top_k_sparse": 3,
+            "top_m_final": 2,
+            "rerank_provider_id": None,
+        },
+    )
+
+    assert [result.chunk_id for result in response.results] == ["chunk-a"]
+    vec_db.retrieve.assert_awaited_once()
+    assert vec_db.retrieve.await_args.kwargs["k"] == 2
+    assert vec_db.retrieve.await_args.kwargs["fetch_k"] == 4
+    sparse_retriever.retrieve.assert_awaited_once()
+    assert (
+        sparse_retriever.retrieve.await_args.kwargs["kb_options"]["kb-1"][
+            "top_k_sparse"
+        ]
+        == 3
+    )
+    assert (
+        sparse_retriever.retrieve.await_args.kwargs["kb_options"]["kb-1"][
+            "rerank_provider_id"
+        ]
+        is None
+    )
+    assert kb.top_k_dense == 10
+    assert kb.top_k_sparse == 10
+    assert kb.rerank_provider_id == "rerank-1"
+
+
+@pytest.mark.asyncio
+async def test_retrieve_with_trace_preserves_rerank_and_rrf_scores():
+    dense_results = [
+        _dense_result(
+            chunk_id="chunk-a",
+            doc_id="doc-a",
+            text="alpha content",
+            similarity=0.9,
+        ),
+        _dense_result(
+            chunk_id="chunk-b",
+            doc_id="doc-b",
+            text="beta content",
+            similarity=0.8,
+        ),
+    ]
+
+    class FakeRerankProvider:
+        def meta(self):
+            return SimpleNamespace(id="rerank-1")
+
+        async def rerank(self, *, query, documents):
+            assert query == "rerank"
+            assert documents == ["alpha content", "beta content"]
+            return [
+                SimpleNamespace(index=1, relevance_score=0.95),
+                SimpleNamespace(index=0, relevance_score=0.4),
+            ]
+
+    vec_db = SimpleNamespace(
+        retrieve=AsyncMock(return_value=dense_results),
+        rerank_provider=FakeRerankProvider(),
+    )
+    kb_helper = SimpleNamespace(
+        kb=SimpleNamespace(
+            top_k_dense=2,
+            top_k_sparse=0,
+            top_m_final=2,
+            rerank_provider_id="rerank-1",
+        ),
+        vec_db=vec_db,
+    )
+    sparse_retriever = SimpleNamespace(retrieve=AsyncMock(return_value=[]))
+    kb_db = SimpleNamespace(
+        get_documents_with_metadata_batch=AsyncMock(
+            return_value={
+                "doc-a": _metadata("doc-a"),
+                "doc-b": _metadata("doc-b"),
+            },
+        ),
+    )
+    manager = RetrievalManager(
+        sparse_retriever=sparse_retriever,
+        rank_fusion=RankFusion(kb_db),
+        kb_db=kb_db,
+    )
+
+    response = await manager.retrieve_with_trace(
+        query="rerank",
+        kb_ids=["kb-1"],
+        kb_id_helper_map={"kb-1": kb_helper},
+        top_k_fusion=2,
+        top_m_final=2,
+    )
+
+    trace = response.trace.to_dict()
+    assert [result.chunk_id for result in response.results] == [
+        "chunk-b",
+        "chunk-a",
+    ]
+    assert [item["chunk_id"] for item in trace["rerank"]] == [
+        "chunk-b",
+        "chunk-a",
+    ]
+    assert trace["final"][0]["chunk_id"] == "chunk-b"
+    assert trace["final"][0]["score"] == 0.95
+    assert trace["final"][0]["rerank_score"] == 0.95
+    assert trace["final"][0]["rrf_score"] != trace["final"][0]["rerank_score"]
+    assert trace["final"][0]["dense_score"] == 0.8
+
+
+def _build_doc(
+    *,
+    doc_id: str,
+    file_path: str,
+    chunk_count: int,
+    status: str = "ready",
+    source_type: str = "file",
+) -> KBDocument:
+    return KBDocument(
+        doc_id=doc_id,
+        kb_id="kb-1",
+        doc_name=f"{doc_id}.md",
+        file_type="md",
+        file_size=1,
+        file_path=file_path,
+        source_type=source_type,
+        status=status,
+        chunk_count=chunk_count,
+    )
+
+
+@pytest.mark.asyncio
+async def test_check_consistency_reports_metadata_file_and_vector_issues(tmp_path):
+    files_root = tmp_path / "files" / "kb-1"
+    source_path = files_root / "doc-ok" / "ok.md"
+    source_path.parent.mkdir(parents=True)
+    source_path.write_text("hello", encoding="utf-8")
+    outside_source_path = tmp_path / "outside.md"
+    outside_source_path.write_text("outside", encoding="utf-8")
+
+    docs = [
+        _build_doc(
+            doc_id="doc-ok",
+            file_path=str(source_path),
+            chunk_count=2,
+        ),
+        _build_doc(
+            doc_id="doc-missing",
+            file_path=str(files_root / "doc-missing" / "missing.md"),
+            chunk_count=1,
+        ),
+        _build_doc(
+            doc_id="doc-unsafe",
+            file_path=str(outside_source_path),
+            chunk_count=0,
+        ),
+    ]
+    chunks = [
+        {
+            "id": 1,
+            "doc_id": "chunk-ok-1",
+            "text": "hello",
+            "metadata": json.dumps(
+                {"kb_id": "kb-1", "kb_doc_id": "doc-ok", "chunk_index": 0},
+            ),
+        },
+        {
+            "id": 2,
+            "doc_id": "chunk-orphan",
+            "text": "orphan",
+            "metadata": json.dumps(
+                {"kb_id": "kb-1", "kb_doc_id": "doc-gone", "chunk_index": 0},
+            ),
+        },
+        {
+            "id": 3,
+            "doc_id": "chunk-invalid",
+            "text": "bad",
+            "metadata": "{not-json",
+        },
+    ]
+
+    storage = MagicMock()
+    storage.get_documents = AsyncMock(return_value=chunks)
+    vec_db = MagicMock()
+    vec_db.document_storage = storage
+
+    helper = KBHelper.__new__(KBHelper)
+    helper.kb = KnowledgeBase(
+        kb_id="kb-1",
+        kb_name="kb",
+        embedding_provider_id="emb-1",
+    )
+    helper.kb_files_dir = files_root
+    helper.vec_db = vec_db
+    helper.list_documents = AsyncMock(return_value=docs)
+
+    report = await KBHelper.check_consistency(helper)
+
+    assert report["kb_id"] == "kb-1"
+    assert report["summary"]["sqlite_document_count"] == 3
+    assert report["summary"]["document_chunk_count"] == 3
+    assert report["summary"]["indexed_chunk_count"] == 3
+    assert report["summary"]["source_file_count"] == 1
+    assert report["summary"]["missing_vectors"] == 1
+    assert report["summary"]["orphan_vectors"] == 1
+    assert report["summary"]["missing_source_files"] == 1
+    assert report["summary"]["chunk_count_mismatches"] == 2
+    assert report["summary"]["invalid_vector_metadata"] == 1
+    assert report["summary"]["unsafe_source_paths"] == 1
+    assert report["summary"]["healthy"] is False
+    assert report["issues"]["missing_vectors"][0]["doc_id"] == "doc-missing"
+    assert report["issues"]["orphan_vectors"][0]["doc_id"] == "doc-gone"
+    assert report["issues"]["unsafe_source_paths"][0]["doc_id"] == "doc-unsafe"
+    assert (
+        report["issues"]["invalid_vector_metadata"][0]["metadata_error"]
+        == "invalid metadata JSON"
+    )
+
+    helper.list_documents.assert_awaited_once_with(offset=0, limit=1000)
+    storage.get_documents.assert_awaited_once_with(
+        metadata_filters={"kb_id": "kb-1"},
+        offset=0,
+        limit=1000,
+    )
+
+
+@pytest.mark.asyncio
+async def test_check_consistency_reads_all_document_and_chunk_pages(tmp_path):
+    docs = [
+        _build_doc(
+            doc_id=f"doc-{index}",
+            file_path="",
+            chunk_count=0,
+        )
+        for index in range(CONSISTENCY_CHECK_PAGE_SIZE + 1)
+    ]
+    chunks = [
+        {
+            "id": index,
+            "doc_id": f"chunk-{index}",
+            "text": "hello",
+            "metadata": json.dumps(
+                {
+                    "kb_id": "kb-1",
+                    "kb_doc_id": f"doc-{index}",
+                    "chunk_index": 0,
+                },
+            ),
+        }
+        for index in range(CONSISTENCY_CHECK_PAGE_SIZE + 1)
+    ]
+
+    async def list_documents(offset=0, limit=100):
+        return docs[offset : offset + limit]
+
+    async def list_chunks(metadata_filters=None, offset=0, limit=100):
+        return chunks[offset : offset + limit]
+
+    storage = MagicMock()
+    storage.get_documents = AsyncMock(side_effect=list_chunks)
+    vec_db = MagicMock()
+    vec_db.document_storage = storage
+
+    helper = KBHelper.__new__(KBHelper)
+    helper.kb = KnowledgeBase(
+        kb_id="kb-1",
+        kb_name="kb",
+        embedding_provider_id="emb-1",
+    )
+    helper.kb_files_dir = tmp_path
+    helper.vec_db = vec_db
+    helper.list_documents = AsyncMock(side_effect=list_documents)
+
+    report = await KBHelper.check_consistency(helper)
+
+    assert report["summary"]["sqlite_document_count"] == len(docs)
+    assert report["summary"]["indexed_chunk_count"] == len(chunks)
+    assert helper.list_documents.await_args_list[0].kwargs == {
+        "offset": 0,
+        "limit": CONSISTENCY_CHECK_PAGE_SIZE,
+    }
+    assert helper.list_documents.await_args_list[1].kwargs == {
+        "offset": CONSISTENCY_CHECK_PAGE_SIZE,
+        "limit": CONSISTENCY_CHECK_PAGE_SIZE,
+    }
+    assert storage.get_documents.await_args_list[0].kwargs == {
+        "metadata_filters": {"kb_id": "kb-1"},
+        "offset": 0,
+        "limit": CONSISTENCY_CHECK_PAGE_SIZE,
+    }
+    assert storage.get_documents.await_args_list[1].kwargs == {
+        "metadata_filters": {"kb_id": "kb-1"},
+        "offset": CONSISTENCY_CHECK_PAGE_SIZE,
+        "limit": CONSISTENCY_CHECK_PAGE_SIZE,
+    }
+
+
+@pytest.mark.asyncio
+async def test_check_consistency_reports_unsupported_storage_backend():
+    helper = KBHelper.__new__(KBHelper)
+    helper.kb = KnowledgeBase(
+        kb_id="kb-1",
+        kb_name="kb",
+        embedding_provider_id="emb-1",
+    )
+    helper.vec_db = MagicMock()
+    helper.list_documents = AsyncMock(return_value=[])
+
+    with pytest.raises(ValueError, match="不支持一致性检查"):
+        await KBHelper.check_consistency(helper)
+
+
+@pytest.mark.asyncio
+async def test_repair_consistency_repairs_safe_issues_and_skips_rebuild_cases():
+    pre_report = {
+        "kb_id": "kb-1",
+        "kb_name": "kb",
+        "checked_at": "2026-06-01T00:00:00+00:00",
+        "summary": {"healthy": False},
+        "issues": {
+            "orphan_vectors": [
+                {"doc_id": "doc-gone", "chunk_id": "chunk-1"},
+                {"doc_id": "doc-gone", "chunk_id": "chunk-2"},
+            ],
+            "chunk_count_mismatches": [
+                {
+                    "doc_id": "doc-extra-indexed",
+                    "expected_chunk_count": 1,
+                    "actual_chunk_count": 2,
+                },
+                {
+                    "doc_id": "doc-missing-index",
+                    "expected_chunk_count": 3,
+                    "actual_chunk_count": 1,
+                },
+            ],
+            "missing_vectors": [{"doc_id": "doc-missing-index"}],
+            "missing_source_files": [{"doc_id": "doc-missing-file"}],
+            "invalid_vector_metadata": [{"chunk_id": "chunk-invalid"}],
+            "unsafe_source_paths": [{"doc_id": "doc-unsafe"}],
+        },
+    }
+    post_report = copy.deepcopy(pre_report)
+    post_report["summary"] = {"healthy": True}
+    post_report["issues"] = {
+        "orphan_vectors": [],
+        "chunk_count_mismatches": [],
+        "missing_vectors": [],
+        "missing_source_files": [],
+        "invalid_vector_metadata": [],
+        "unsafe_source_paths": [],
+    }
+
+    vec_db = MagicMock()
+    vec_db.delete_documents = AsyncMock()
+    kb_db = MagicMock()
+    kb_db.update_kb_stats = AsyncMock()
+
+    helper = KBHelper.__new__(KBHelper)
+    helper.kb = KnowledgeBase(
+        kb_id="kb-1",
+        kb_name="kb",
+        embedding_provider_id="emb-1",
+    )
+    helper.vec_db = vec_db
+    helper.kb_db = kb_db
+    helper.check_consistency = AsyncMock(side_effect=[pre_report, post_report])
+    helper.refresh_document = AsyncMock()
+    helper.refresh_kb = AsyncMock()
+
+    result = await KBHelper.repair_consistency(helper)
+
+    assert result["repair_types"] == sorted(CONSISTENCY_REPAIR_TYPES)
+    assert result["summary"] == {
+        "repaired_count": 2,
+        "skipped_count": 5,
+        "failed_count": 0,
+        "healthy_after_repair": True,
+    }
+    vec_db.delete_documents.assert_awaited_once_with(
+        metadata_filters={"kb_id": "kb-1", "kb_doc_id": "doc-gone"},
+    )
+    helper.refresh_document.assert_awaited_once_with("doc-extra-indexed")
+    kb_db.update_kb_stats.assert_awaited_once_with(
+        kb_id="kb-1",
+        vec_db=vec_db,
+    )
+    helper.refresh_kb.assert_awaited_once_with()
+    assert result["actions"]["repaired"][0]["type"] == "orphan_vectors"
+    assert result["actions"]["repaired"][0]["count"] == 2
+    assert any(
+        action["type"] == "chunk_count_mismatches"
+        and action["reason"] == "missing_vectors_require_rebuild"
+        for action in result["actions"]["skipped"]
+    )
+    assert any(
+        action["type"] == "missing_vectors"
+        and action["reason"] == "document_rebuild_required"
+        for action in result["actions"]["skipped"]
+    )
+
+
+@pytest.mark.asyncio
+async def test_repair_consistency_only_runs_selected_repair_types():
+    pre_report = {
+        "kb_id": "kb-1",
+        "kb_name": "kb",
+        "checked_at": "2026-06-01T00:00:00+00:00",
+        "summary": {"healthy": False},
+        "issues": {
+            "orphan_vectors": [{"doc_id": "doc-gone", "chunk_id": "chunk-1"}],
+            "chunk_count_mismatches": [
+                {
+                    "doc_id": "doc-extra-indexed",
+                    "expected_chunk_count": 1,
+                    "actual_chunk_count": 2,
+                },
+            ],
+            "missing_vectors": [],
+            "missing_source_files": [],
+            "invalid_vector_metadata": [],
+            "unsafe_source_paths": [],
+        },
+    }
+    post_report = copy.deepcopy(pre_report)
+
+    vec_db = MagicMock()
+    vec_db.delete_documents = AsyncMock()
+    kb_db = MagicMock()
+    kb_db.update_kb_stats = AsyncMock()
+
+    helper = KBHelper.__new__(KBHelper)
+    helper.kb = KnowledgeBase(
+        kb_id="kb-1",
+        kb_name="kb",
+        embedding_provider_id="emb-1",
+    )
+    helper.vec_db = vec_db
+    helper.kb_db = kb_db
+    helper.check_consistency = AsyncMock(side_effect=[pre_report, post_report])
+    helper.refresh_document = AsyncMock()
+    helper.refresh_kb = AsyncMock()
+
+    result = await KBHelper.repair_consistency(
+        helper,
+        repair_types=["chunk_count_mismatches"],
+    )
+
+    assert result["repair_types"] == ["chunk_count_mismatches"]
+    vec_db.delete_documents.assert_not_awaited()
+    helper.refresh_document.assert_awaited_once_with("doc-extra-indexed")
+
+
+def test_normalize_consistency_repair_types_rejects_unknown_types():
+    with pytest.raises(ValueError, match="unsupported"):
+        KBHelper._normalize_consistency_repair_types(["unsupported"])
diff --git a/tests/unit/test_kb_manager_delete.py b/tests/unit/test_kb_manager_delete.py
new file mode 100644
index 0000000000..5addd3501c
--- /dev/null
+++ b/tests/unit/test_kb_manager_delete.py
@@ -0,0 +1,136 @@
+from datetime import datetime, timezone
+from unittest.mock import AsyncMock, MagicMock
+
+import pytest
+
+
+@pytest.mark.asyncio
+async def test_delete_kb_removes_related_document_and_media_metadata(tmp_path):
+    from astrbot.core.knowledge_base.kb_db_sqlite import KBSQLiteDatabase
+    from astrbot.core.knowledge_base.kb_helper import KBHelper
+    from astrbot.core.knowledge_base.kb_mgr import KnowledgeBaseManager
+    from astrbot.core.knowledge_base.models import (
+        KBDocument,
+        KBMedia,
+        KnowledgeBase,
+    )
+
+    kb_db = KBSQLiteDatabase(str(tmp_path / "kb.db"))
+    await kb_db.initialize()
+    await kb_db.migrate_to_v1()
+
+    kb = KnowledgeBase(
+        kb_id="kb-delete",
+        kb_name="delete-me",
+        embedding_provider_id="emb-1",
+    )
+    other_kb = KnowledgeBase(
+        kb_id="kb-keep",
+        kb_name="keep-me",
+        embedding_provider_id="emb-1",
+    )
+    doc = KBDocument(
+        doc_id="doc-delete",
+        kb_id="kb-delete",
+        doc_name="delete.txt",
+        file_type="txt",
+        file_size=1,
+        file_path="",
+    )
+    other_doc = KBDocument(
+        doc_id="doc-keep",
+        kb_id="kb-keep",
+        doc_name="keep.txt",
+        file_type="txt",
+        file_size=1,
+        file_path="",
+    )
+    media = KBMedia(
+        media_id="media-delete",
+        doc_id="doc-delete",
+        kb_id="kb-delete",
+        media_type="image",
+        file_name="delete.png",
+        file_path="",
+        file_size=1,
+        mime_type="image/png",
+        created_at=datetime.now(timezone.utc),
+    )
+    other_media = KBMedia(
+        media_id="media-keep",
+        doc_id="doc-keep",
+        kb_id="kb-keep",
+        media_type="image",
+        file_name="keep.png",
+        file_path="",
+        file_size=1,
+        mime_type="image/png",
+        created_at=datetime.now(timezone.utc),
+    )
+    async with kb_db.get_db() as session:
+        session.add(kb)
+        session.add(other_kb)
+        session.add(doc)
+        session.add(other_doc)
+        session.add(media)
+        session.add(other_media)
+        await session.commit()
+
+    helper = KBHelper.__new__(KBHelper)
+    helper.kb = kb
+    helper.delete_vec_db = AsyncMock()
+
+    manager = KnowledgeBaseManager.__new__(KnowledgeBaseManager)
+    manager.kb_db = kb_db
+    manager.kb_insts = {"kb-delete": helper}
+
+    deleted = await manager.delete_kb("kb-delete")
+
+    assert deleted is True
+    helper.delete_vec_db.assert_awaited_once()
+    assert await kb_db.get_kb_by_id("kb-delete") is None
+    assert await kb_db.get_document_by_id("doc-delete") is None
+    assert await kb_db.get_media_by_id("media-delete") is None
+    assert await kb_db.get_kb_by_id("kb-keep") is not None
+    assert await kb_db.get_document_by_id("doc-keep") is not None
+    assert await kb_db.get_media_by_id("media-keep") is not None
+    assert await manager.get_kb_by_name("delete-me") is None
+
+    await kb_db.close()
+
+
+@pytest.mark.asyncio
+async def test_create_kb_cleans_created_directory_when_initialize_fails(
+    tmp_path,
+    monkeypatch,
+):
+    from astrbot.core.knowledge_base.kb_helper import KBHelper
+    from astrbot.core.knowledge_base.kb_mgr import KnowledgeBaseManager
+
+    manager = KnowledgeBaseManager.__new__(KnowledgeBaseManager)
+    manager.provider_manager = MagicMock()
+    manager.kb_db = MagicMock()
+    manager.kb_insts = {}
+
+    session = MagicMock()
+    session.add = MagicMock()
+    session.flush = AsyncMock()
+    session.commit = AsyncMock()
+    context = MagicMock()
+    context.__aenter__ = AsyncMock(return_value=session)
+    context.__aexit__ = AsyncMock(return_value=False)
+    manager.kb_db.get_db.return_value = context
+
+    async def fail_initialize(self):
+        raise RuntimeError("provider unavailable")
+
+    monkeypatch.setattr(KBHelper, "initialize", fail_initialize)
+    monkeypatch.setattr("astrbot.core.knowledge_base.kb_mgr.FILES_PATH", str(tmp_path))
+
+    with pytest.raises(RuntimeError, match="provider unavailable"):
+        await manager.create_kb(
+            kb_name="broken",
+            embedding_provider_id="emb-1",
+        )
+
+    assert list(tmp_path.iterdir()) == []
diff --git a/tests/unit/test_kb_manager_resilience.py b/tests/unit/test_kb_manager_resilience.py
index ed43a338f8..5b0fae9309 100644
--- a/tests/unit/test_kb_manager_resilience.py
+++ b/tests/unit/test_kb_manager_resilience.py
@@ -10,6 +10,7 @@
 in the astrbot core module chain.
 """
 
+import asyncio
 import sys
 import types
 from pathlib import Path
@@ -87,6 +88,59 @@ def mock_embedding_provider():
     return provider
 
 
+@pytest.mark.asyncio
+async def test_load_kbs_does_not_limit_database_records(
+    stub_provider_manager_module,
+    mock_provider_manager,
+    mock_kb_db,
+):
+    from astrbot.core.knowledge_base.kb_helper import KBHelper
+    from astrbot.core.knowledge_base.kb_mgr import KnowledgeBaseManager
+
+    kb_mgr = KnowledgeBaseManager.__new__(KnowledgeBaseManager)
+    kb_mgr.provider_manager = mock_provider_manager
+    kb_mgr.kb_db = mock_kb_db
+    kb_mgr.kb_insts = {}
+    kb_mgr._kb_name_index = {}
+
+    with patch.object(KBHelper, "initialize", new_callable=AsyncMock):
+        await kb_mgr.load_kbs()
+
+    mock_kb_db.list_kbs.assert_awaited_once_with()
+
+
+@pytest.mark.asyncio
+async def test_update_kb_invalid_options_do_not_mutate_existing_kb(
+    stub_provider_manager_module,
+    mock_provider_manager,
+    mock_kb_db,
+    mock_knowledge_base,
+):
+    from astrbot.core.knowledge_base.kb_helper import KBHelper
+    from astrbot.core.knowledge_base.kb_mgr import KnowledgeBaseManager
+
+    old_helper = KBHelper.__new__(KBHelper)
+    old_helper.kb = mock_knowledge_base
+    old_helper.init_error = None
+
+    kb_mgr = KnowledgeBaseManager.__new__(KnowledgeBaseManager)
+    kb_mgr.provider_manager = mock_provider_manager
+    kb_mgr.kb_db = mock_kb_db
+    kb_mgr.kb_insts = {mock_knowledge_base.kb_id: old_helper}
+
+    with patch.object(KBHelper, "initialize", new_callable=AsyncMock) as mock_init:
+        with pytest.raises(ValueError, match="chunk_overlap"):
+            await kb_mgr.update_kb(
+                kb_id=mock_knowledge_base.kb_id,
+                chunk_size=100,
+                chunk_overlap=100,
+            )
+
+    mock_init.assert_not_awaited()
+    assert mock_knowledge_base.chunk_size == 512
+    assert mock_knowledge_base.chunk_overlap == 50
+
+
 @pytest.mark.asyncio
 async def test_update_kb_preserves_old_instance_when_reinit_fails(
     stub_provider_manager_module,
@@ -218,6 +272,99 @@ async def test_update_kb_switches_instance_only_after_new_reinit_success(
         old_helper.terminate.assert_called_once()
 
 
+@pytest.mark.asyncio
+async def test_get_kb_waits_for_update_instance_swap(
+    stub_provider_manager_module,
+    mock_provider_manager,
+    mock_kb_db,
+    mock_knowledge_base,
+):
+    from astrbot.core.knowledge_base.kb_helper import KBHelper
+    from astrbot.core.knowledge_base.kb_mgr import KnowledgeBaseManager
+
+    old_helper = KBHelper.__new__(KBHelper)
+    old_helper.kb = mock_knowledge_base
+    old_helper.init_error = None
+    old_helper.terminate = AsyncMock()
+
+    kb_mgr = KnowledgeBaseManager.__new__(KnowledgeBaseManager)
+    kb_mgr.provider_manager = mock_provider_manager
+    kb_mgr.kb_db = mock_kb_db
+    kb_mgr.kb_insts = {mock_knowledge_base.kb_id: old_helper}
+
+    commit_started = asyncio.Event()
+    release_commit = asyncio.Event()
+
+    async def commit():
+        commit_started.set()
+        await release_commit.wait()
+
+    mock_session = MagicMock()
+    mock_session.add = MagicMock()
+    mock_session.commit = AsyncMock(side_effect=commit)
+    mock_session.refresh = AsyncMock()
+    mock_db_context = MagicMock()
+    mock_db_context.__aenter__ = AsyncMock(return_value=mock_session)
+    mock_db_context.__aexit__ = AsyncMock(return_value=False)
+    mock_kb_db.get_db.return_value = mock_db_context
+
+    with patch.object(KBHelper, "initialize", new_callable=AsyncMock):
+        update_task = asyncio.create_task(
+            kb_mgr.update_kb(
+                kb_id=mock_knowledge_base.kb_id,
+                kb_name="updated_kb",
+            )
+        )
+        await commit_started.wait()
+
+        get_task = asyncio.create_task(kb_mgr.get_kb(mock_knowledge_base.kb_id))
+        await asyncio.sleep(0)
+        assert not get_task.done()
+
+        release_commit.set()
+        updated_helper = await update_task
+        observed_helper = await get_task
+
+    assert updated_helper is observed_helper
+    assert observed_helper is kb_mgr.kb_insts[mock_knowledge_base.kb_id]
+    assert observed_helper is not old_helper
+
+
+@pytest.mark.asyncio
+async def test_get_kb_does_not_retry_failed_helper_during_cooldown(
+    stub_provider_manager_module,
+    mock_provider_manager,
+    mock_kb_db,
+    mock_knowledge_base,
+):
+    from astrbot.core.knowledge_base.kb_helper import KBHelper
+    from astrbot.core.knowledge_base.kb_mgr import (
+        INIT_RETRY_COOLDOWN_SECONDS,
+        KnowledgeBaseManager,
+    )
+
+    helper = KBHelper.__new__(KBHelper)
+    helper.kb = mock_knowledge_base
+    helper.init_error = "provider unavailable"
+    helper.init_retry_count = 0
+    helper.last_init_retry_at = 100.0
+    helper.initialize = AsyncMock()
+
+    kb_mgr = KnowledgeBaseManager.__new__(KnowledgeBaseManager)
+    kb_mgr.provider_manager = mock_provider_manager
+    kb_mgr.kb_db = mock_kb_db
+    kb_mgr.kb_insts = {mock_knowledge_base.kb_id: helper}
+
+    with patch(
+        "astrbot.core.knowledge_base.kb_mgr.time.monotonic",
+        return_value=100.0 + INIT_RETRY_COOLDOWN_SECONDS - 1,
+    ):
+        result = await kb_mgr.get_kb(mock_knowledge_base.kb_id)
+
+    assert result is helper
+    helper.initialize.assert_not_awaited()
+
+
 @pytest.mark.asyncio
 async def test_ensure_vec_db_clears_stale_init_error(
     stub_provider_manager_module,
@@ -264,6 +411,87 @@ async def test_ensure_vec_db_clears_stale_init_error(
         assert helper.vec_db is mock_vec_db
 
 
+@pytest.mark.asyncio
+async def test_update_kb_omitted_rerank_provider_preserves_existing_value(
+    stub_provider_manager_module,
+    mock_provider_manager,
+    mock_kb_db,
+    mock_knowledge_base,
+):
+    from astrbot.core.knowledge_base.kb_helper import KBHelper
+    from astrbot.core.knowledge_base.kb_mgr import KnowledgeBaseManager
+
+    mock_knowledge_base.rerank_provider_id = "rerank-1"
+    old_helper = KBHelper.__new__(KBHelper)
+    old_helper.kb = mock_knowledge_base
+    old_helper.init_error = None
+    old_helper.terminate = AsyncMock()
+
+    kb_mgr = KnowledgeBaseManager.__new__(KnowledgeBaseManager)
+    kb_mgr.provider_manager = mock_provider_manager
+    kb_mgr.kb_db = mock_kb_db
+    kb_mgr.kb_insts = {mock_knowledge_base.kb_id: old_helper}
+
+    mock_session = MagicMock()
+    mock_session.add = MagicMock()
+    mock_session.commit = AsyncMock()
+    mock_session.refresh = AsyncMock()
+    mock_db_context = MagicMock()
+    mock_db_context.__aenter__ = AsyncMock(return_value=mock_session)
+    mock_db_context.__aexit__ = AsyncMock()
+    mock_kb_db.get_db.return_value = mock_db_context
+
+    with patch.object(KBHelper, "initialize", new_callable=AsyncMock):
+        result = await kb_mgr.update_kb(
+            kb_id=mock_knowledge_base.kb_id,
+            kb_name="updated_kb",
+        )
+
+    assert result is not None
+    assert result.kb.rerank_provider_id == "rerank-1"
+
+
+@pytest.mark.asyncio
+async def test_update_kb_explicit_none_clears_rerank_provider(
+    stub_provider_manager_module,
+    mock_provider_manager,
+    mock_kb_db,
+    mock_knowledge_base,
+):
+    from astrbot.core.knowledge_base.kb_helper import KBHelper
+    from astrbot.core.knowledge_base.kb_mgr import KnowledgeBaseManager
+
+    mock_knowledge_base.rerank_provider_id = "rerank-1"
+    old_helper = KBHelper.__new__(KBHelper)
+    old_helper.kb = mock_knowledge_base
+    old_helper.init_error = None
+    old_helper.terminate = AsyncMock()
+
+    kb_mgr = KnowledgeBaseManager.__new__(KnowledgeBaseManager)
+    kb_mgr.provider_manager = mock_provider_manager
+    kb_mgr.kb_db = mock_kb_db
+    kb_mgr.kb_insts = {mock_knowledge_base.kb_id: old_helper}
+
+    mock_session = MagicMock()
+    mock_session.add = MagicMock()
+    mock_session.commit = AsyncMock()
+    mock_session.refresh = AsyncMock()
+    mock_db_context = MagicMock()
+    mock_db_context.__aenter__ = AsyncMock(return_value=mock_session)
+    mock_db_context.__aexit__ = AsyncMock()
+    mock_kb_db.get_db.return_value = mock_db_context
+
+    with patch.object(KBHelper, "initialize", new_callable=AsyncMock):
+        result = await kb_mgr.update_kb(
+            kb_id=mock_knowledge_base.kb_id,
+            kb_name="updated_kb",
+            rerank_provider_id=None,
+        )
+
+    assert result is not None
+    assert result.kb.rerank_provider_id is None
+
+
 @pytest.mark.asyncio
 async def test_ensure_vec_db_sets_init_error_on_failure(
     stub_provider_manager_module,
diff --git a/tests/unit/test_kb_rate_limiter.py b/tests/unit/test_kb_rate_limiter.py
new file mode 100644
index 0000000000..2341f017de
--- /dev/null
+++ b/tests/unit/test_kb_rate_limiter.py
@@ -0,0 +1,38 @@
+import asyncio
+from types import SimpleNamespace
+
+import pytest
+
+from astrbot.core.knowledge_base import kb_helper
+from astrbot.core.knowledge_base.kb_helper import RateLimiter
+
+
+@pytest.mark.asyncio
+async def test_rate_limiter_serializes_concurrent_entries(monkeypatch):
+    real_sleep = asyncio.sleep
+    monotonic_values = iter([0.0, 0.0, 0.0, 0.0])
+    sleeps: list[float] = []
+
+    async def fake_sleep(delay: float) -> None:
+        sleeps.append(delay)
+        await real_sleep(0)
+
+    monkeypatch.setattr(
+        kb_helper,
+        "time",
+        SimpleNamespace(monotonic=lambda: next(monotonic_values)),
+    )
+    monkeypatch.setattr(
+        kb_helper,
+        "asyncio",
+        SimpleNamespace(Lock=asyncio.Lock, sleep=fake_sleep),
+    )
+
+    limiter = RateLimiter(max_rpm=60)
+    limiter.last_call_time = -1.0
+    await asyncio.gather(
+        limiter.__aenter__(),
+        limiter.__aenter__(),
+    )
+
+    assert sleeps == [1.0]
diff --git a/tests/unit/test_knowledge_base_tools.py b/tests/unit/test_knowledge_base_tools.py
new file mode 100644
index 0000000000..abbda85991
--- /dev/null
+++ b/tests/unit/test_knowledge_base_tools.py
@@ -0,0 +1,26 @@
+from unittest.mock import AsyncMock, MagicMock
+
+import pytest
+
+
+@pytest.mark.asyncio
+async def test_retrieve_knowledge_base_reports_all_invalid_session_kbs(monkeypatch):
+    from astrbot.core.tools import knowledge_base_tools
+
+    context = MagicMock()
+    context.kb_manager.get_kb = AsyncMock(return_value=None)
+
+    monkeypatch.setattr(
+        knowledge_base_tools.sp,
+        "session_get",
+        AsyncMock(return_value={"kb_ids": ["missing-kb"], "top_k": 5}),
+    )
+
+    result = await knowledge_base_tools.retrieve_knowledge_base(
+        query="hello",
+        umo="session-1",
+        context=context,
+    )
+
+    assert result == "会话配置的知识库均不存在或未加载，请检查知识库设置。"
+    context.kb_manager.retrieve.assert_not_called()
diff --git a/tests/unit/test_sparse_retriever.py b/tests/unit/test_sparse_retriever.py
index 11c491b4d2..5d1d52769d 100644
--- a/tests/unit/test_sparse_retriever.py
+++ b/tests/unit/test_sparse_retriever.py
@@ -91,3 +91,53 @@ async def test_sparse_retriever_falls_back_to_bm25_when_fts5_is_unavailable():
     assert [result.chunk_id for result in results] == ["chunk-1"]
     assert storage.search_sparse_calls == 1
     assert storage.get_documents_calls == 1
+
+
+class MultiKBStorage:
+    """模拟多知识库 BM25 回退场景"""
+
+    def __init__(self, kb_id: str):
+        self.kb_id = kb_id
+        self.search_sparse_calls = 0
+        self.get_documents_calls = 0
+
+    async def search_sparse(self, query_tokens: list[str], limit: int):
+        self.search_sparse_calls += 1
+        return None  # 始终回退到 BM25
+
+    async def get_documents(self, metadata_filters: dict, limit: int | None, offset):
+        self.get_documents_calls += 1
+        # 返回 10 条 chunk，远多于 top_k_sparse 限制
+        return [
+            make_doc(f"{self.kb_id}-chunk-{i}", f"document chunk {i}", i)
+            for i in range(10)
+        ]
+
+
+@pytest.mark.asyncio
+async def test_bm25_fallback_respects_per_kb_top_k_sparse():
+    """多知识库 BM25 回退时，每个知识库的结果应被截断到各自的 top_k_sparse
+
+    Phase 1C: 验证 top_k_sparse 不再被错误求和，而是逐 KB 截断。
+    """
+    storage_a = MultiKBStorage("kb-a")
+    storage_b = MultiKBStorage("kb-b")
+    vec_db_a = SimpleNamespace(document_storage=storage_a)
+    vec_db_b = SimpleNamespace(document_storage=storage_b)
+    retriever = SparseRetriever(kb_db=None)
+
+    results = await retriever.retrieve(
+        query="test query",
+        kb_ids=["kb-a", "kb-b"],
+        kb_options={
+            "kb-a": {"vec_db": vec_db_a, "top_k_sparse": 2},
+            "kb-b": {"vec_db": vec_db_b, "top_k_sparse": 3},
+        },
+    )
+
+    # 总结果数不应超过 max(2, 3) = 3（最终截断），且每个 KB 各贡献 ≤ 其 top_k
+    assert len(results) <= 3, f"结果过多: {len(results)}"
+    kb_a_count = sum(1 for r in results if r.kb_id == "kb-a")
+    kb_b_count = sum(1 for r in results if r.kb_id == "kb-b")
+    assert kb_a_count <= 2, f"KB-A 贡献了 {kb_a_count} 条，应 ≤ 2"
+    assert kb_b_count <= 3, f"KB-B 贡献了 {kb_b_count} 条，应 ≤ 3"