Skip to content

Commit ff561d7

Browse files
committed
docs correction
1 parent afca9df commit ff561d7

16 files changed

+104
-99
lines changed

docs/guidebook/zh/2_2_1_智能体创建与使用.md

+7-7
Original file line numberDiff line numberDiff line change
@@ -20,11 +20,11 @@
2020
* `introduction`: 智能体角色介绍
2121
* `target`: 智能体目标
2222
* `instruction`: 智能体指令
23-
* `llm_model`: 智能体使用的LLM
24-
* `name`: LLM 名称
25-
* `model_name`: LLM 模型名
23+
* `llm_model`: 智能体使用的LLM
24+
* `name`: LLM 名称
25+
* `model_name`: LLM 模型名
2626

27-
您可以选择已有或接入任意的LLM,我们在本部分不展开说明,您可以关注[模型LLM章节](2_2_2_模型.md)
27+
其中`introduction`, `target`, `instruction`与模型prompt相关,可以通过`prompt_version`以额外的yaml进行配置。另外您可以选择已有或接入任意的LLM,我们在本部分不展开说明,您可以关注[模型LLM章节](2_2_2_模型.md)
2828

2929
### 设置智能体计划
3030
**`plan` - 智能体计划**
@@ -136,7 +136,7 @@ agent执行前的输入处理节点, agent的输入可以是自然语言或者js
136136

137137
该部分拥有两个输入参数,如下:
138138
* `input_object`: 智能体输入原始数据
139-
* 可通过 `input_object.get_data('input_key')` 方法获取input_object中的对于数据
139+
* 可通过 `input_object.get_data('input_key')` 方法获取input_object中的对应数据
140140

141141
例如: 用户对智能体输入`question=xxx`, 我们可以通过`input_object.get_data('question')`获取用户当前的提问。
142142

@@ -266,7 +266,7 @@ def parse_input(self, input_object: InputObject, agent_input: dict) -> dict:
266266
agent_input['input'] = input_object.get_data('input')
267267
return agent_input
268268
```
269-
在其对应agent设置`sample_standard_app.app.core.agent.rag_agent_case.demo_rag_agent.yaml`中的`instruction`部分我们可以看到如下配置:
269+
在其对应agent设置`sample_standard_app.app.core.prompt.demo_rag_agent_cn.yaml`中的`instruction`部分我们可以看到如下配置:
270270
```text
271271
instruction: |
272272
你需要遵守的规则是:
@@ -357,7 +357,7 @@ metadata:
357357
在agentUniverse中所有agent实体都由全局agent管理器进行管理,在任何框架执行过程中如果您需要使用智能体可以通过agent管理器。同时通过框架的服务化能力,您可以将agent快速服务化并通过标准的http或rpc协议对其进行网络调用。
358358
359359
## 方案一: 使用agent管理器
360-
通过agent管理器中的`get_instance_obj('agent_name_xxx')` 方法可以获取对应名称的agent实例,同时通过agent自身的`run(input='xxx')`方法使用agent,下面的test类中的`test_rag_agent(self)`方法就是使用该方式对于agent进行了调试。
360+
通过agent管理器中的`get_instance_obj('agent_name_xxx')` 方法可以获取对应名称的agent实例,同时通过agent自身的`run(input='xxx')`方法使用agent,下面的test类中的[`test_rag_agent(self)`](../../../sample_standard_app/app/test/test_rag_agent.py)方法就是使用该方式对于agent进行了调试。
361361
```python
362362
import unittest
363363

docs/guidebook/zh/2_2_3_集成LangChain工具.md

+15-13
Original file line numberDiff line numberDiff line change
@@ -1,8 +1,9 @@
11
# 集成LangChain工具
22

33
根据langchain中工具对象的初始化的难易程度,可以将其分为两类:
4-
第一类,简单初始化,只需要简单的参数配置即可完成初始化。
5-
第二类,复杂初始化,内部包含一些复杂的对象需要进行初始化。
4+
- 第一类,简单初始化,只需要简单的参数配置即可完成初始化。
5+
- 第二类,复杂初始化,内部包含一些复杂的对象需要进行初始化。
6+
67
对于一类工具,你可以在aU中直接使用配置文件进行初始化,如DuDuckGo搜索工具的初始化。
78
对于第二类工具,我们实现了一个LangChainTool基础类,你只需要实现该类的init_langchain_tool方法,初始化对应的langchain工具对象即可,参考维基百科的初始化方法。
89

@@ -24,18 +25,19 @@ metadata:
2425
class: 'LangChainTool'
2526
```
2627
参数说明:
27-
langchain: 你打算使用的langchain工具,需要配置module和class_name
28-
langchain.module: langchain的模块名,例如langchain_community.tools
29-
langchain.class_name: langchain的类名,例如HumanInputRun
30-
langchain.init_params langchain的初始化参数,例如:
31-
```yaml
32-
langchain:
33-
module: langchain_community.tools
34-
class_name: HumanInputRun
35-
init_params:
36-
prompt: '请输入你的问题'
37-
```
28+
- `langchain`: 你打算使用的langchain工具,需要配置module和class_name
29+
- `langchain.module`: langchain的模块名,例如langchain_community.tools
30+
- `langchain.class_name`: langchain的类名,例如HumanInputRun
31+
- `langchain.init_params`: langchain的初始化参数,例如:
32+
```yaml
33+
langchain:
34+
module: langchain_community.tools
35+
class_name: HumanInputRun
36+
init_params:
37+
prompt: '请输入你的问题'
38+
```
3839
如果需要使用你完全重写了init_langchain_tool方法,那么你不需要配置该部分
40+
3941
该工具可以直接使用,无需任何keys
4042

4143
## 1. 集成LangChain中的DuckDuckGo工具

docs/guidebook/zh/2_2_3_集成的工具.md

+5-4
Original file line numberDiff line numberDiff line change
@@ -181,8 +181,9 @@ metadata:
181181
class: 'RequestTool'
182182
```
183183
参数说明:
184-
method 请求的方式GET/POST/PUT等
185-
headers 发送请求需要使用的 http的header,
186-
json_parse 输入参数是否需要是要HTTP解析,POST请求时需要设置为True,GET请求需要设置为False
187-
response_content_type http请求结果的解析方式,设置为json时,会返回json结果,设置为text时会返回text结果
184+
- `method`: 请求的方式GET/POST/PUT等
185+
- `headers`: 发送请求需要使用的 http的header
186+
- `json_parse`: 输入参数是否需要是要HTTP解析,POST请求时需要设置为True,GET请求需要设置为False
187+
- `response_content_type`: http请求结果的解析方式,设置为json时,会返回json结果,设置为text时会返回text结果
188+
188189
该工具可以直接使用,无需任何keys

docs/guidebook/zh/2_2_4_DocProcessor.md

+15-15
Original file line numberDiff line numberDiff line change
@@ -27,11 +27,11 @@ class Document(BaseModel):
2727
values['id'] = str(uuid.uuid5(uuid.NAMESPACE_URL, text))
2828
return values
2929
```
30-
- id:用于标识一段特定文档的唯一标识,默认通过uuid生成。
31-
- text文档中的文本内容
32-
- metadata文档的元数据信息,通常包含原始文件名、原始文件中的位置等。
33-
- embedding文档向量化后的形式,可以是文本向量,在Document的子类ImageDocument中,也可以是图像向量化后的结果。
34-
- keywords文档中的关键词,也可以是这段文本的tag。
30+
- `id`: 用于标识一段特定文档的唯一标识,默认通过uuid生成。
31+
- `text`: 文档中的文本内容
32+
- `metadata`: 文档的元数据信息,通常包含原始文件名、原始文件中的位置等。
33+
- `embedding`: 文档向量化后的形式,可以是文本向量,在Document的子类ImageDocument中,也可以是图像向量化后的结果。
34+
- `keywords`: 文档中的关键词,也可以是这段文本的tag。
3535

3636
DocProcessor定义如下:
3737
```python
@@ -96,9 +96,9 @@ metadata:
9696
module: 'agentuniverse.agent.action.knowledge.doc_processor.character_text_splitter'
9797
class: 'CharacterTextSplitter'
9898
```
99-
- chunk_size: 切分后文本长度大小。
100-
- chunk_overlap: 相邻切分文本重合部分的长度。
101-
- separators: 指定的分隔符
99+
- `chunk_size`: 切分后文本长度大小。
100+
- `chunk_overlap`: 相邻切分文本重合部分的长度。
101+
- `separators`: 指定的分隔符
102102

103103
### [TokenTextSplitter](../../../agentuniverse/agent/action/knowledge/doc_processor/character_text_splitter.yaml)
104104
该组件根据指定的 tokenizer 对文本进行切分,按照设定的 chunk_size 和 chunk_overlap 将文本拆分为多个片段,每个片段包含指定数量的tokens。
@@ -116,9 +116,9 @@ metadata:
116116
module: 'agentuniverse.agent.action.knowledge.doc_processor.token_text_splitter'
117117
class: 'TokenTextSplitter'
118118
```
119-
- chunk_size: 切分后文本的token数量。
120-
- chunk_overlap: 相邻切分文本重合部分的token数量。
121-
- tokenizer: 指定的tokenizer,用于将文本切分为tokens
119+
- `chunk_size`: 切分后文本的token数量。
120+
- `chunk_overlap`: 相邻切分文本重合部分的token数量。
121+
- `tokenizer`: 指定的tokenizer,用于将文本切分为tokens
122122

123123
### [RecursiveCharacterTextSplitter](../../../agentuniverse/agent/action/knowledge/doc_processor/recursive_character_text_splitter.yaml)
124124

@@ -138,9 +138,9 @@ metadata:
138138
module: 'agentuniverse.agent.action.knowledge.doc_processor.recursive_character_text_splitter'
139139
class: 'RecursiveCharacterTextSplitter'
140140
```
141-
- chunk_size: 切分后文本长度大小。
142-
- chunk_overlap: 相邻切分文本重合部分的长度。
143-
- separators: 指定的分隔符列表,按顺序尝试使用分隔符进行切分。如果第一个分隔符不能满足条件,则递归地使用下一个分隔符。
141+
- `chunk_size`: 切分后文本长度大小。
142+
- `chunk_overlap`: 相邻切分文本重合部分的长度。
143+
- `separators`: 指定的分隔符列表,按顺序尝试使用分隔符进行切分。如果第一个分隔符不能满足条件,则递归地使用下一个分隔符。
144144

145145
### [JiebaKeywordExtractor](../../../agentuniverse/agent/action/knowledge/doc_processor/jieba_keyword_extractor.yaml)
146146
该组件使用结巴(Jieba)分词库从文本中提取关键词。它可以根据设定的 top_k 参数提取出最重要的几个关键词,用于后续作为倒排索引。
@@ -154,7 +154,7 @@ metadata:
154154
module: 'agentuniverse.agent.action.knowledge.doc_processor.jieba_keyword_extractor'
155155
class: 'JiebaKeywordExtractor'
156156
```
157-
- top_k: 从文本中提取的关键词数量,即排名前 top_k 的关键词会被提取。
157+
- `top_k`: 从文本中提取的关键词数量,即排名前 top_k 的关键词会被提取。
158158

159159
### [DashscopeReranker](../../../agentuniverse/agent/action/knowledge/doc_processor/dashscope_reranker.yaml)
160160

docs/guidebook/zh/2_2_4_QueryParaphraser.md

+7-7
Original file line numberDiff line numberDiff line change
@@ -19,13 +19,13 @@ class Query(BaseModel):
1919
ext_info: dict = {}
2020
similarity_top_k: Optional[int] = None
2121
```
22-
- query_str: 一个可选的字符串字段,用于存储原始查询的文本内容。
23-
- query_text_bundles: 一个可选的字符串列表字段,用于存储多个改写后的查询文本片段。
24-
- query_image_bundles: 一个可选的图像列表字段,用于存储多个查询图像。
25-
- keywords: 一个可选的集合字段,用于存储查询的关键词。
26-
- embeddings: 一个嵌入向量列表字段,用于存储查询的嵌入表示,用于相似度匹配。
27-
- ext_info: 一个字典字段,用于存储与查询相关的额外信息,支持任意扩展。
28-
- similarity_top_k: 一个可选的整数字段,用于指定相似度搜索中返回的最相似结果的数量。
22+
- `query_str`: 一个可选的字符串字段,用于存储原始查询的文本内容。
23+
- `query_text_bundles`: 一个可选的字符串列表字段,用于存储多个改写后的查询文本片段。
24+
- `query_image_bundles`: 一个可选的图像列表字段,用于存储多个查询图像。
25+
- `keywords`: 一个可选的集合字段,用于存储查询的关键词。
26+
- `embeddings`: 一个嵌入向量列表字段,用于存储查询的嵌入表示,用于相似度匹配。
27+
- `ext_info`: 一个字典字段,用于存储与查询相关的额外信息,支持任意扩展。
28+
- `similarity_top_k`: 一个可选的整数字段,用于指定相似度搜索中返回的最相似结果的数量。
2929

3030
QueryParaphraser定义如下:
3131
```python

docs/guidebook/zh/2_2_4_RagRouter.md

+2-2
Original file line numberDiff line numberDiff line change
@@ -77,5 +77,5 @@ metadata:
7777
class: 'NluRagRouter'
7878
```
7979
其中需要用户填写的内容包括:
80-
- store_amount: 指定查询会被路由到的存储库数量,控制查询的分发范围。
81-
- llm: 包含大语言模型的配置,用于根据Store的描述信息和Query中的query_str筛选相关的数据库。name 表示模型组件的名称,model_name 指定使用的具体模型。
80+
- `store_amount`: 指定查询会被路由到的存储库数量,控制查询的分发范围。
81+
- `llm`: 包含大语言模型的配置,用于根据Store的描述信息和Query中的query_str筛选相关的数据库。name 表示模型组件的名称,model_name 指定使用的具体模型。

docs/guidebook/zh/2_2_4_如何构建RAG智能体.md

+2-2
Original file line numberDiff line numberDiff line change
@@ -6,7 +6,7 @@
66
本案例基于RagPlanner,搭建了一个简单的法律咨询智能体,通过检索民法典和刑法中的相关条例并结合案件背景给出相关的法律建议。
77
该案例基于千问大模型和DashScope的embedding和rerank功能,使用前需要您在环境变量中配置`DASHSCOPE_API_KEY`
88

9-
知识文件的定义如下
9+
[知识文件](../../../sample_standard_app/app/core/knowledge/law_knowledge.yaml)的定义如下
1010
```yaml
1111
name: "law_knowledge"
1212
description: "中国民法与刑法相关的知识库"
@@ -52,7 +52,7 @@ insert_processors:
5252

5353
### 配置Store
5454
本案例中包含四个Store:民法和刑法分别存储至sqlite以及chromadb中。我们仅以`civil_law_chroma_store`作为例子,其它Store类似。
55-
`civil_law_chroma_store`配置如下:
55+
[`civil_law_chroma_store`](../../../sample_standard_app/app/core/store/civil_law_chroma_store.yaml)配置如下:
5656
```yaml
5757
name: 'civil_law_chroma_store'
5858
description: '保存了中国民法典的所有内容,以文本向量形式存储'

docs/guidebook/zh/3_2_1_gRPC.md

+14-14
Original file line numberDiff line numberDiff line change
@@ -9,9 +9,9 @@ activate = 'true'
99
max_workers = 10
1010
server_port = 50051
1111
```
12-
- **activate**: 仅在该值为`true`的时候启动gRPC服务器
13-
- **max_workers**: gRPC服务器线程池的最大线程数量,默认为10
14-
- **server_port**: gRPC服务器的服务端口,默认为50051
12+
- **`activate`**: 仅在该值为`true`的时候启动gRPC服务器
13+
- **`max_workers`**: gRPC服务器线程池的最大线程数量,默认为10
14+
- **`server_port`**: gRPC服务器的服务端口,默认为50051
1515

1616
然后启动grpc服务器:
1717
```python
@@ -64,9 +64,9 @@ service AgentUniverseService {
6464
rpc service_run_result(AgentResultRequest) returns (AgentServiceResponse);
6565
}
6666
```
67-
- **service_run**: 同步调用Agent服务,调用过程中阻塞直到Agent返回结果。
68-
- **service_run_async**: 异步调用Agent服务,调用后先返回一个`request_id`,后续可用该ID通过`service_run_result`接口查询Agent服务结果。
69-
- **service_run_result**: 查询Agent服务的结果。
67+
- **`service_run`**: 同步调用Agent服务,调用过程中阻塞直到Agent返回结果。
68+
- **`service_run_async`**: 异步调用Agent服务,调用后先返回一个`request_id`,后续可用该ID通过`service_run_result`接口查询Agent服务结果。
69+
- **`service_run_result`**: 查询Agent服务的结果。
7070

7171
\
7272
调用Agent服务的请求体结构如下:
@@ -77,9 +77,9 @@ message AgentServiceRequest {
7777
bool saved = 3;
7878
}
7979
```
80-
- **service_id**: 应用中注册的模型服务id。
81-
- **params**: JSON String格式的服务入参,会被`json.loads`拆解为`**kwargs`的形式传递给底层的Agent。
82-
- **saved**: 是否需要保存本次请求结果,该值为`false`的话则本次请求无法在`service_run_result`中查询到。
80+
- **`service_id`**: 应用中注册的模型服务id。
81+
- **`params`**: JSON String格式的服务入参,会被`json.loads`拆解为`**kwargs`的形式传递给底层的Agent。
82+
- **`saved`**: 是否需要保存本次请求结果,该值为`false`的话则本次请求无法在`service_run_result`中查询到。
8383

8484
\
8585
查询Agent服务结果的请求体结构如下:
@@ -88,7 +88,7 @@ message AgentResultRequest {
8888
string request_id = 1;
8989
}
9090
```
91-
- **request_id**: 需要查询的请求ID。
91+
- **`request_id`**: 需要查询的请求ID。
9292

9393
\
9494
返回结果的结构如下:
@@ -100,10 +100,10 @@ message AgentServiceResponse {
100100
string result = 4;
101101
}
102102
```
103-
- **message**: 请求失败时的详细错误信息。
104-
- **success**: 表示本次请求执行是否成功。
105-
- **request_id**: 本次请求的Id。
106-
- **result**: Agent服务执行的结果,异步接口`service_run_async`中为空。
103+
- **`message`**: 请求失败时的详细错误信息。
104+
- **`success`**: 表示本次请求执行是否成功。
105+
- **`request_id`**: 本次请求的Id。
106+
- **`result`**: Agent服务执行的结果,异步接口`service_run_async`中为空。
107107

108108
### 调用示例
109109
```python

docs/guidebook/zh/3_3_1_Milvus.md

+5-5
Original file line numberDiff line numberDiff line change
@@ -42,11 +42,11 @@ metadata:
4242
module: 'agentuniverse.agent.action.knowledge.store.milvus_store'
4343
class: 'MilvusStore'
4444
```
45-
- connection_args: 连接 Milvus 数据库的参数,包括主机地址 (host) 和端口号 (port)。
46-
- search_args: 搜索参数,定义了搜索时使用的距离度量类型 (metric_type) 和相关参数(如 nprobe)。
47-
- index_params: 索引参数,定义了使用的索引类型 (index_type)、距离度量类型 (metric_type) 以及构建索引时的具体参数(如 M 和 efConstruction)。
48-
- embedding_model: 用于生成嵌入向量的模型名称,这里指定为 dashscope_embedding。
49-
- similarity_top_k: 在相似度搜索中返回最相似结果的数量。
45+
- `connection_args`: 连接 Milvus 数据库的参数,包括主机地址 (host) 和端口号 (port)。
46+
- `search_args`: 搜索参数,定义了搜索时使用的距离度量类型 (metric_type) 和相关参数(如 nprobe)。
47+
- `index_params`: 索引参数,定义了使用的索引类型 (index_type)、距离度量类型 (metric_type) 以及构建索引时的具体参数(如 M 和 efConstruction)。
48+
- `embedding_model`: 用于生成嵌入向量的模型名称,这里指定为 dashscope_embedding。
49+
- `similarity_top_k`: 在相似度搜索中返回最相似结果的数量。
5050

5151
### 使用方式
5252
[知识定义与使用](2_2_4_知识定义与使用.md)

docs/guidebook/zh/3_3_2_ChromaDB.md

+3-3
Original file line numberDiff line numberDiff line change
@@ -15,9 +15,9 @@ metadata:
1515
module: 'agentuniverse.agent.action.knowledge.store.chroma_store'
1616
class: 'ChromaStore'
1717
```
18-
- persist_path: 数据库的持久化存储路径,用于存储和加载向量数据。
19-
- embedding_model: 用于生成嵌入向量的模型名称,这里指定为 dashscope_embedding。
20-
- similarity_top_k: 在相似度搜索中返回最相似结果的数量。
18+
- `persist_path`: 数据库的持久化存储路径,用于存储和加载向量数据。
19+
- `embedding_model`: 用于生成嵌入向量的模型名称,这里指定为 dashscope_embedding。
20+
- `similarity_top_k`: 在相似度搜索中返回最相似结果的数量。
2121

2222
### 使用方式
2323
[知识定义与使用](2_2_4_知识定义与使用.md)

docs/guidebook/zh/3_3_3_Sqlite.md

+5-5
Original file line numberDiff line numberDiff line change
@@ -18,11 +18,11 @@ metadata:
1818
module: 'agentuniverse.agent.action.knowledge.store.sqlite_store'
1919
class: 'SQLiteStore'
2020
```
21-
- db_path: SQLite 数据库文件的路径,用于存储和管理文本数据。
22-
- k1: BM25 算法中的参数 k1,控制词频对得分的影响。
23-
- b: BM25 算法中的参数 b,控制文档长度对得分的影响。
24-
- keyword_extractor: 用于提取关键词的工具名称,这里指定为 jieba_keyword_extractor。
25-
- similarity_top_k: 根据BM25分数返回的最相关的top k。
21+
- `db_path`: SQLite 数据库文件的路径,用于存储和管理文本数据。
22+
- `k1`: BM25 算法中的参数 k1,控制词频对得分的影响。
23+
- `b`: BM25 算法中的参数 b,控制文档长度对得分的影响。
24+
- `keyword_extractor`: 用于提取关键词的工具名称,这里指定为 jieba_keyword_extractor。
25+
- `similarity_top_k`: 根据BM25分数返回的最相关的top k。
2626

2727
### 使用方式
2828
[知识定义与使用](2_2_4_知识定义与使用.md)

0 commit comments

Comments
 (0)