开始: 2026-03-12 完成: 2026-03-12
- "version": "1.0.0"
+ "version": "3.0.0"
- "name": "发票处理专员"
+ "name": "发票童子甲"
- "supported_formats": ["PNG", "JPEG", "WebP"]
+ "supported_formats": ["PNG", "JPEG", "JPG", "WebP", "BMP", "GIF", "TIFF", "PDF"]
- "max_batch_size": 10
+ "max_batch_size": 50
+ "pdf_support": true
+ "max_pdf_pages": 100
+ "max_file_size_mb": 50
+ "mixed_format_batch": true- ✅ PDF 处理能力(自动转换、逐页识别)
- ✅ 批量处理能力(50文件/次)
- ✅ 混合格式处理
- ✅ 性能提升说明(1.22秒/张)
recognize_document()- 新增 PDF 参数说明batch_recognize()- 批量处理详细说明- 新增支持格式列表(11种)
内容结构:
- 一、子Agent基础配置
- 二、主Agent如何使用(含调用流程和示例)
- 三、子Agent如何工作(处理流程详解)
- 四、注意事项和限制
- 五、升级日志
- 六、快速参考
重点内容:
- ✅ 调用流程图
- ✅ 代码示例(单文件/PDF/批量)
- ✅ 返回格式说明
- ✅ 故障排除指南
- ✅ 调用前检查清单
内容结构:
- 身份标识
- v3.0 新能力清单
- 调用示例(3种场景)
- 重要规则
- 支持格式
- 返回格式
| 能力 | v2.0 | v3.0 |
|---|---|---|
| 处理PDF | ❌ 不知道 | ✅ 知道并会使用 |
| 批量处理 | ❌ 10个 | ✅ 50个 |
| 混合格式 | ❌ 不支持 | ✅ 支持图片+PDF |
| 处理速度 | ❌ 7秒/张 | ✅ 1.22秒/张 |
| 文件格式 | ❌ 3种 | ✅ 11种 |
-
❌ attachments 被禁用
- 不要尝试传递附件参数
- 必须用 task 参数传递文件路径
-
📍 必须用绝对路径
- 文件路径必须是绝对路径
- 写在 task 参数里
-
🚀 先移动文件
- 调用前先把文件移到 workspace/temp/
- 不要在主agent工作区保留文件
-
⏱️ 设置合理超时
- 单文件: 120秒
- PDF: 300秒
- 批量: 600秒
sessions_spawn(
agentId="invoice-agent",
mode="run",
task="请处理发票: /absolute/path/to/file.png",
cwd="~/.openclaw/workspace-invoice-agent",
timeoutSeconds=120
)sessions_spawn(
agentId="invoice-agent",
mode="run",
task="请处理PDF发票: /absolute/path/to/invoice.pdf",
cwd="~/.openclaw/workspace-invoice-agent",
timeoutSeconds=300 # PDF需要更长时间
)sessions_spawn(
agentId="invoice-agent",
mode="run",
task="批量处理: /path/file1.png, /path/file2.pdf, /path/file3.jpg",
cwd="~/.openclaw/workspace-invoice-agent",
timeoutSeconds=600
)agents/invoice-agent/
├── config.json [修改] 版本升级至3.0.0
├── SOUL.md [修改] 新增v3.0能力说明
├── AGENT_CONFIG_GUIDE.md [新增] 完整配置方案
└── README_QUICK.md [新增] 快速参考卡片
| 文件 | 状态 | 行数 |
|---|---|---|
| config.json | 修改 | ~130 |
| SOUL.md | 修改 | ~550 |
| AGENT_CONFIG_GUIDE.md | 新增 | ~600 |
| README_QUICK.md | 新增 | ~100 |
总计: 约 1380 行配置和文档
- config.json 版本升级至 3.0.0
- 名称更新为"发票童子甲"
- 支持格式扩展至 11 种
- 批量大小更新为 50
- 新增 PDF 支持配置
- SOUL.md 能力说明更新
- 新增完整配置指南
- 新增快速参考卡片
- 调用规范明确说明
- 代码示例完整
- Git 提交完成
- 推送到远程仓库
升级状态: ✅ 配置升级完成
核心成果:
- ✅ Agent 知道自己的新能力(PDF、批量、混合格式)
- ✅ 调用规范明确(绝对路径、先移动、设置超时)
- ✅ 完整文档支持(配置指南 + 快速参考)
- ✅ 代码示例齐全(3种调用场景)
Git 提交:
- Commit: 5c2d9ae
- 已推送到 origin/main ✅
后续工作:
- 主Agent 需要按照新规范调用
- 监控新能力的实际使用情况
- 收集反馈并继续优化
配置升级完成 🎊
发票童子甲现在已经完全知晓并可以使用 PaddleOCR-VL v3.0 的所有新能力!