|
5 | 5 |
|
6 | 6 | > 注:Anthropic 在这一能力上的 API 形态仍在持续演进。写作本章时,公开文档同时出现过 **extended thinking**、**interleaved thinking**、**adaptive thinking** 等表述。工程上应以官方当前文档为准;本章重点解释设计原则、成本结构和使用边界,而不是绑定某一个短期版本字段。 |
7 | 7 | > |
8 | | -> **2026 年 4 月更新**:API 对不同模型的 thinking 支持已明确分化: |
9 | | -> - **Claude Opus 4.7**:仅支持 Adaptive Thinking(`thinking={type: "adaptive"}`),不再接受 `type: "enabled"` 的旧语法(会返回 400 错误)。 |
| 8 | +> **2026 年 6 月更新**:API 对不同模型的 thinking 支持已明确分化: |
| 9 | +> - **Claude Opus 4.8 / 4.7**:仅支持 Adaptive Thinking(`thinking={type: "adaptive"}`),不再接受 `type: "enabled"` 的旧语法(会返回 400 错误)。 |
10 | 10 | > - **Claude Sonnet 4.6**:支持 Adaptive Thinking(推荐)和 Extended Thinking(`thinking={type: "enabled", "budget_tokens": N}`,已弃用但仍可用)。 |
11 | 11 | > - **Claude Opus 4.6**:支持 Adaptive Thinking(推荐)和 Extended Thinking(`thinking={type: "enabled", "budget_tokens": N}`,已弃用但仍可用)。 |
12 | 12 | > - **Claude Haiku 4.5**:支持 Extended Thinking(`thinking={type: "enabled"}`),但不支持 Adaptive Thinking。 |
|
32 | 32 | 可以把它理解为下面这种抽象调用: |
33 | 33 |
|
34 | 34 | ```python |
35 | | -# 推荐写法:Adaptive Thinking(Claude Opus 4.7 / Opus 4.6 / Sonnet 4.6) |
| 35 | +# 推荐写法:Adaptive Thinking(Claude Opus 4.8 / Opus 4.7 / Opus 4.6 / Sonnet 4.6) |
36 | 36 | response = client.messages.create( |
37 | | - model="claude-opus-4-7", |
| 37 | + model="claude-opus-4-8", |
38 | 38 | max_tokens=8192, |
39 | 39 | thinking={"type": "adaptive"}, |
40 | | - output_config={"effort": "high"}, # low / medium / high / max |
| 40 | + output_config={"effort": "high"}, # low / medium / high / xhigh / max |
41 | 41 | messages=[{"role": "user", "content": "设计一个高并发秒杀系统的架构"}] |
42 | 42 | ) |
43 | 43 | ``` |
44 | 44 |
|
45 | 45 | 工程上有两个判断原则: |
46 | 46 |
|
47 | | -* Opus 4.7、Opus 4.6 和 Sonnet 4.6 优先使用 `thinking={"type": "adaptive"}` 配合 `output_config={"effort": ...}` 控制思考深度。 |
| 47 | +* Opus 4.8、Opus 4.7、Opus 4.6 和 Sonnet 4.6 优先使用 `thinking={"type": "adaptive"}` 配合 `output_config={"effort": ...}` 控制思考深度;其中 Opus 4.8 / 4.7 不支持手动 `budget_tokens`。 |
48 | 48 | * Opus 4.6 和 Sonnet 4.6 仍兼容 `thinking={"type": "enabled", "budget_tokens": N}`,但该手动预算模式已弃用;Haiku 4.5 仅支持 Extended Thinking,不支持 Adaptive。 |
49 | 49 |
|
50 | 50 | ### 8.4.3 工作流程解密 |
@@ -149,7 +149,7 @@ response = client.messages.create( |
149 | 149 | * **简单任务**:`effort: "low"`,模型可能跳过思考,响应更快。 |
150 | 150 | * **中等复杂任务**:`effort: "medium"`,适度思考。 |
151 | 151 | * **复杂推理任务**:`effort: "high"`(默认),深度推理。 |
152 | | -* **极端复杂任务/Agentic 编码**:`effort: "max"`(Opus 4.7)或 `"xhigh"`(Opus 4.7 可选),在工具使用密集的场景下提供最充分的推理。使用 `xhigh`/`max` 时建议将 `max_tokens` 设为 64k 以上,为思考和工具调用留出充足空间。 |
| 152 | +* **极端复杂任务/Agentic 编码**:`effort: "xhigh"` 或 `"max"`(Opus 4.8 / 4.7 可用),在工具使用密集的场景下提供更充分的推理。官方默认档位仍是 `high`;使用 `xhigh`/`max` 时建议将 `max_tokens` 设为 64k 以上,为思考和工具调用留出充足空间。 |
153 | 153 |
|
154 | 154 | Adaptive Thinking 会自动启用交错思考(Interleaved Thinking),即在工具调用之间也进行推理,这对 Agent 工作流尤为重要。 |
155 | 155 |
|
|
0 commit comments