Skip to content

Commit dda9df6

Browse files
committed
fix(content): refresh Opus 4.8 guidance
1 parent 57533fe commit dda9df6

9 files changed

Lines changed: 16 additions & 16 deletions

File tree

02_prompt/2.6_format.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -7,7 +7,7 @@ Prompt Engineering 的终极目标往往不仅仅是获得“正确”的答案
77

88
### 2.6.1 核心技术:Prefill
99

10-
> **兼容性提示**:Prefill 在 Claude Mythos Preview、Opus 4.7、Opus 4.6 和 Sonnet 4.6 上**不受支持**,使用时会返回 400 错误。对于这些新模型,请使用 Structured Outputs(见 2.6.3 节)或系统提示词来控制输出格式。以下内容仅适用于 Claude Sonnet 4.5 / 3.5 等仍支持 Prefill 的模型。
10+
> **兼容性提示**:Prefill 在 Claude Mythos Preview、Opus 4.8、Opus 4.7、Opus 4.6 和 Sonnet 4.6 上**不受支持**,使用时会返回 400 错误。对于这些新模型,请使用 Structured Outputs(见 2.6.3 节)或系统提示词来控制输出格式。以下内容仅适用于 Claude Sonnet 4.5 / 3.5 等仍支持 Prefill 的模型。
1111
1212
这是 Claude 早期模型独特的格式控制技术。
1313
在通用的 Chat Completions API (如 OpenAI) 中,通常 `Assistant` 的消息是由模型生成的。但在 Claude 的 Messages API 中,**可以手动代替 Assistant 说“第一句话”**

08_agent/8.4_extended_thinking.md

Lines changed: 7 additions & 7 deletions
Original file line numberDiff line numberDiff line change
@@ -5,8 +5,8 @@
55

66
> 注:Anthropic 在这一能力上的 API 形态仍在持续演进。写作本章时,公开文档同时出现过 **extended thinking****interleaved thinking****adaptive thinking** 等表述。工程上应以官方当前文档为准;本章重点解释设计原则、成本结构和使用边界,而不是绑定某一个短期版本字段。
77
>
8-
> **2026 年 4 月更新**:API 对不同模型的 thinking 支持已明确分化:
9-
> - **Claude Opus 4.7**:仅支持 Adaptive Thinking(`thinking={type: "adaptive"}`),不再接受 `type: "enabled"` 的旧语法(会返回 400 错误)。
8+
> **2026 年 6 月更新**:API 对不同模型的 thinking 支持已明确分化:
9+
> - **Claude Opus 4.8 / 4.7**:仅支持 Adaptive Thinking(`thinking={type: "adaptive"}`),不再接受 `type: "enabled"` 的旧语法(会返回 400 错误)。
1010
> - **Claude Sonnet 4.6**:支持 Adaptive Thinking(推荐)和 Extended Thinking(`thinking={type: "enabled", "budget_tokens": N}`,已弃用但仍可用)。
1111
> - **Claude Opus 4.6**:支持 Adaptive Thinking(推荐)和 Extended Thinking(`thinking={type: "enabled", "budget_tokens": N}`,已弃用但仍可用)。
1212
> - **Claude Haiku 4.5**:支持 Extended Thinking(`thinking={type: "enabled"}`),但不支持 Adaptive Thinking。
@@ -32,19 +32,19 @@
3232
可以把它理解为下面这种抽象调用:
3333

3434
```python
35-
# 推荐写法:Adaptive Thinking(Claude Opus 4.7 / Opus 4.6 / Sonnet 4.6)
35+
# 推荐写法:Adaptive Thinking(Claude Opus 4.8 / Opus 4.7 / Opus 4.6 / Sonnet 4.6)
3636
response = client.messages.create(
37-
model="claude-opus-4-7",
37+
model="claude-opus-4-8",
3838
max_tokens=8192,
3939
thinking={"type": "adaptive"},
40-
output_config={"effort": "high"}, # low / medium / high / max
40+
output_config={"effort": "high"}, # low / medium / high / xhigh / max
4141
messages=[{"role": "user", "content": "设计一个高并发秒杀系统的架构"}]
4242
)
4343
```
4444

4545
工程上有两个判断原则:
4646

47-
* Opus 4.7、Opus 4.6 和 Sonnet 4.6 优先使用 `thinking={"type": "adaptive"}` 配合 `output_config={"effort": ...}` 控制思考深度。
47+
* Opus 4.8、Opus 4.7、Opus 4.6 和 Sonnet 4.6 优先使用 `thinking={"type": "adaptive"}` 配合 `output_config={"effort": ...}` 控制思考深度;其中 Opus 4.8 / 4.7 不支持手动 `budget_tokens`
4848
* Opus 4.6 和 Sonnet 4.6 仍兼容 `thinking={"type": "enabled", "budget_tokens": N}`,但该手动预算模式已弃用;Haiku 4.5 仅支持 Extended Thinking,不支持 Adaptive。
4949

5050
### 8.4.3 工作流程解密
@@ -149,7 +149,7 @@ response = client.messages.create(
149149
* **简单任务**`effort: "low"`,模型可能跳过思考,响应更快。
150150
* **中等复杂任务**`effort: "medium"`,适度思考。
151151
* **复杂推理任务**`effort: "high"`(默认),深度推理。
152-
* **极端复杂任务/Agentic 编码**`effort: "max"`(Opus 4.7)`"xhigh"`(Opus 4.7 可选),在工具使用密集的场景下提供最充分的推理。使用 `xhigh`/`max` 时建议将 `max_tokens` 设为 64k 以上,为思考和工具调用留出充足空间。
152+
* **极端复杂任务/Agentic 编码**`effort: "xhigh"` `"max"`(Opus 4.8 / 4.7 可用),在工具使用密集的场景下提供更充分的推理。官方默认档位仍是 `high`使用 `xhigh`/`max` 时建议将 `max_tokens` 设为 64k 以上,为思考和工具调用留出充足空间。
153153

154154
Adaptive Thinking 会自动启用交错思考(Interleaved Thinking),即在工具调用之间也进行推理,这对 Agent 工作流尤为重要。
155155

10_optimization/10.3_context_mgmt.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,6 +1,6 @@
11
## 10.3 上下文窗口管理
22

3-
Claude Opus 4.7、Opus 4.6 和 Sonnet 4.6 已进入 1 百万 Token 上下文窗口 (Context Window) 的公开规格或 beta 规格;可用性、账号权限和计费方式必须按官方模型页、迁移指南与价格页核验。其他 Claude 模型通常为 200K。这并不意味着应该无限制地往里塞东西。
3+
Claude Opus 4.8、Opus 4.7、Opus 4.6 和 Sonnet 4.6 已进入 1 百万 Token 上下文窗口 (Context Window) 的公开规格或 beta 规格;可用性、账号权限和计费方式必须按官方模型页、迁移指南与价格页核验。其他 Claude 模型通常为 200K。这并不意味着应该无限制地往里塞东西。
44
**长上下文腐烂 (Context Rot)****注意力稀释 (Attention Dilution)** 是真实存在的问题。而且,越长的 Context 意味着越慢的响应速度和更高的延迟。
55

66
本节介绍几种高级的上下文压缩与管理策略。

12_appendix/12.3_glossary.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -53,7 +53,7 @@
5353

5454
* **Prompt Caching**: 一种通过缓存 Prompt 前缀的 KV 状态来降低延迟和成本的技术。
5555
* **Prompt Injection (提示词注入)**: 一种攻击手段,通过特殊的输入诱导模型忽略安全限制或执行恶意指令。
56-
* **Prefill (预填)**: 在 API 请求中,预先填入 Assistant 回复的开头部分(如 `{ "role": "assistant", "content": "{" }`),让旧模型按特定格式续写。该能力不再适用于 Claude Mythos Preview、Opus 4.7、Opus 4.6 和 Sonnet 4.6;新项目应优先使用 Structured Outputs。
56+
* **Prefill (预填)**: 在 API 请求中,预先填入 Assistant 回复的开头部分(如 `{ "role": "assistant", "content": "{" }`),让旧模型按特定格式续写。该能力不再适用于 Claude Mythos Preview、Opus 4.8、Opus 4.7、Opus 4.6 和 Sonnet 4.6;新项目应优先使用 Structured Outputs。
5757

5858
### 12.3.10 R
5959

12_appendix/12.7_volatile_facts.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,6 +1,6 @@
11
## 附录 G:快变事实核验表
22

3-
> Last verified: 2026-05-18. 本表是 Claude 模型、API、价格、隐私与竞品对比的更新入口。
3+
> Last verified: 2026-06-01. 本表是 Claude 模型、API、价格、隐私与竞品对比的更新入口。
44
55
| 类别 | 当前维护口径 | 权威入口 | 编辑要求 |
66
| --- | --- | --- | --- |

13_advanced/13.2_infinite_chats.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,4 +1,4 @@
1-
## 长对话管理实战指南
1+
## 13.2 长对话管理实战指南
22

33
### 序言
44

13_advanced/13.3_context_engineering.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,4 +1,4 @@
1-
## Context Engineering 概览:从提示词工程到上下文工程
1+
## 13.3 Context Engineering 概览:从提示词工程到上下文工程
22

33
### 序言
44

13_advanced/README.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,6 +1,6 @@
11
# 第十三章 进阶能力:Claude 前沿特性与上下文工程
22

3-
> **关于章号**:本书正文为第一至第十一章,本进阶章沿用"第十三章"编号;中间的"第十二"位置对应**附录**部分(API 参考、FAQ、术语表、定价、竞品对比、快变事实核验表等,见侧边目录"附录")。因此目录中第十一章之后直接到本章属于编号设计,并非缺漏。
3+
> **关于章号**:本书正文为第一至第十一章,本进阶章沿用第十三章编号;中间的第十二位置对应**附录**部分(API 参考、FAQ、术语表、定价、竞品对比、快变事实核验表等,见侧边目录“附录”)。因此目录中第十一章之后直接到本章属于编号设计,并非缺漏。
44
55
本章分为已确认信息和基于行业趋势的合理推测两部分。已确认信息以最新的官方文档为准,推测部分基于行业趋势。
66

13_advanced/summary.md

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -149,12 +149,12 @@ RAG(检索增强生成)是上下文工程的实践工具:
149149

150150
### 能力概览(确认方向)
151151

152-
| 维度 | Claude 4.6 / 4.7 当前状态 | 未来模型观察重点 |
152+
| 维度 | Claude 4.6 / 4.7 / 4.8 当前状态 | 未来模型观察重点 |
153153
|------|--------------------|------------------|
154154
| 推理 | 复杂推理与规划能力继续增强 | 是否进一步提升可控 thinking 与长任务稳定性 |
155155
| 编程 | Sonnet/Opus 在编码与 Agent 工作流上表现强 | 是否扩大代码库级任务优势 |
156156
| 多模态 | 视觉与工具工作流结合更深 | 是否出现更强的原生音视频与实时交互能力 |
157-
| 上下文 | Opus 4.7、Opus 4.6 和 Sonnet 4.6 已进入 1M token 公开规格 | 是否在 1M 之上继续扩展或改进利用效率 |
157+
| 上下文 | Opus 4.8、Opus 4.7、Opus 4.6 和 Sonnet 4.6 已进入 1M token 公开规格 | 是否在 1M 之上继续扩展或改进利用效率 |
158158

159159
### 成本参考
160160

0 commit comments

Comments
 (0)