-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy path_conf_schema.txt
More file actions
44 lines (44 loc) · 2.48 KB
/
Copy path_conf_schema.txt
File metadata and controls
44 lines (44 loc) · 2.48 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
{
"tavily_api_key": {
"description": "Tavily API 密钥(可选,留空则使用AstrBot全局配置)",
"hint": "从 https://tavily.com 注册获取。用于网页内容提取和搜索引擎发现子页面。留空则自动使用AstrBot全局已配置的Tavily Key",
"type": "string",
"default": ""
},
"extract_timeout": {
"description": "网页提取超时(秒)",
"hint": "Tavily 提取网页内容的最大等待时间。遇到频繁timeout可适当增大(如120),网络好的话可减小(如60)",
"type": "int",
"default": 90
},
"search_max_results": {
"description": "整站爬取时搜索引擎最大结果数",
"hint": "影响 importkb-site 命令能发现的子页面数量。越大发现越全但导入越慢,建议范围:20~50,最大不要超过100",
"type": "int",
"default": 50
},
"submit_delay": {
"description": "单条URL提交后等待时间(秒)",
"hint": "每个网页导入请求提交后等待的秒数,确保AstrBot知识库后台异步任务有足够时间处理,防止静默丢弃。建议5秒以上,遇到大量丢页可增至8秒",
"type": "int",
"default": 5
},
"batch_delay": {
"description": "整站批量导入额外间隔(秒)",
"hint": "每导入5个页面后额外暂停的秒数。此延迟叠加在单条提交延迟之上。建议15秒以上,确保批量任务全部完成",
"type": "int",
"default": 15
},
"enable_auto_cleaning": {
"description": "启用自动内容清洗",
"hint": "开启后自动去除网页中的导航栏、侧边栏、广告、页脚、Cookie提示等非正文噪音;关闭则保留原文不做任何清洗",
"type": "bool",
"default": true
},
"naming_mode": {
"description": "导入时的知识库命名方式",
"hint": "【smart】= 智能命名:自动从网页标题/域名提取品牌名(如OpenClaw),结合路径判断语言(如中文),生成有意义的知识库名称(例如「OpenClaw中文文档」),不同网站会导入到各自独立的知识库。\n【fixed】= 固定分类:使用通用分类名(技术文档库/AI知识库/产品文档库/设计资源库/通用知识库),同类型网站会合并到同一个知识库中。\n推荐使用smart模式,知识库更有辨识度。",
"type": "string",
"default": "smart"
}
}