智能体在运行时无法在上下文中访问的任何内容,对它来说都不存在。优化目标从"人类可读"转向"智能体可推理"。
- 优先选择 API 稳定、训练集覆盖好的技术
- "无聊"技术对智能体来说更容易建模:可组合性好、API 稳定、训练数据充分
原文示例:没有引入通用的 p-limit 风格包,而是自研了带并发的 map 辅助函数:
- 与自有 OpenTelemetry 仪表紧密集成
- 100% 测试覆盖
- 行为完全符合运行时预期
判断标准:上游行为是否不透明?如果是,重新实现子集可能更便宜。
- 应用可以根据 git worktree 启动 → 每次变更启动独立实例
- Chrome DevTools 协议接入智能体运行时 → DOM 快照、截图、导航
- 本地可观测性堆栈(LogQL 查日志、PromQL 查指标)→ 临时环境,任务完成即删除
这使得以下提示词变得可行:
- "确保服务启动在 800ms 内完成"
- "这四个关键用户旅程中的任何跨度都不得超过两秒"
上下文窗口填满后,模型性能会退化("dumb zone")。应对策略:
- Compaction — 智能压缩和卸载上下文
- 工具输出卸载 — 保留大输出的头尾,完整内容存文件系统
- 渐进式披露(Skills) — 按需加载,不在启动时预装所有工具
AGENTS.md 控制在 60 行以内。超过这个长度,效果反而下降。
限制解空间反而让 AI 更可靠。
这是一个反直觉的洞察:给智能体的自由度越大,它犯错的概率越高。通过架构约束收窄解空间,智能体在约束内的表现会显著提升。