fix(content): refresh Opus 4.8 guidance

yeasy · yeasy · commit dda9df648903 · 2026-06-02T00:48:00.000-07:00
diff --git a/02_prompt/2.6_format.md b/02_prompt/2.6_format.md
@@ -7,7 +7,7 @@ Prompt Engineering 的终极目标往往不仅仅是获得“正确”的答案
 
 ### 2.6.1 核心技术：Prefill
 
-> **兼容性提示**：Prefill 在 Claude Mythos Preview、Opus 4.7、Opus 4.6 和 Sonnet 4.6 上**不受支持**，使用时会返回 400 错误。对于这些新模型，请使用 Structured Outputs（见 2.6.3 节）或系统提示词来控制输出格式。以下内容仅适用于 Claude Sonnet 4.5 / 3.5 等仍支持 Prefill 的模型。
+> **兼容性提示**：Prefill 在 Claude Mythos Preview、Opus 4.8、Opus 4.7、Opus 4.6 和 Sonnet 4.6 上**不受支持**，使用时会返回 400 错误。对于这些新模型，请使用 Structured Outputs（见 2.6.3 节）或系统提示词来控制输出格式。以下内容仅适用于 Claude Sonnet 4.5 / 3.5 等仍支持 Prefill 的模型。
 
 这是 Claude 早期模型独特的格式控制技术。
 在通用的 Chat Completions API (如 OpenAI) 中，通常 `Assistant` 的消息是由模型生成的。但在 Claude 的 Messages API 中，**可以手动代替 Assistant 说“第一句话”**。
diff --git a/08_agent/8.4_extended_thinking.md b/08_agent/8.4_extended_thinking.md
@@ -5,8 +5,8 @@
 
 > 注：Anthropic 在这一能力上的 API 形态仍在持续演进。写作本章时，公开文档同时出现过 **extended thinking**、**interleaved thinking**、**adaptive thinking** 等表述。工程上应以官方当前文档为准；本章重点解释设计原则、成本结构和使用边界，而不是绑定某一个短期版本字段。
 >
-> **2026 年 4 月更新**：API 对不同模型的 thinking 支持已明确分化：
-> - **Claude Opus 4.7**：仅支持 Adaptive Thinking（`thinking={type: "adaptive"}`），不再接受 `type: "enabled"` 的旧语法（会返回 400 错误）。
+> **2026 年 6 月更新**：API 对不同模型的 thinking 支持已明确分化：
+> - **Claude Opus 4.8 / 4.7**：仅支持 Adaptive Thinking（`thinking={type: "adaptive"}`），不再接受 `type: "enabled"` 的旧语法（会返回 400 错误）。
 > - **Claude Sonnet 4.6**：支持 Adaptive Thinking（推荐）和 Extended Thinking（`thinking={type: "enabled", "budget_tokens": N}`，已弃用但仍可用）。
 > - **Claude Opus 4.6**：支持 Adaptive Thinking（推荐）和 Extended Thinking（`thinking={type: "enabled", "budget_tokens": N}`，已弃用但仍可用）。
 > - **Claude Haiku 4.5**：支持 Extended Thinking（`thinking={type: "enabled"}`），但不支持 Adaptive Thinking。
@@ -32,19 +32,19 @@
 可以把它理解为下面这种抽象调用：
 
 ```python
-# 推荐写法：Adaptive Thinking（Claude Opus 4.7 / Opus 4.6 / Sonnet 4.6）
+# 推荐写法：Adaptive Thinking（Claude Opus 4.8 / Opus 4.7 / Opus 4.6 / Sonnet 4.6）
 response = client.messages.create(
-    model="claude-opus-4-7",
+    model="claude-opus-4-8",
     max_tokens=8192,
     thinking={"type": "adaptive"},
-    output_config={"effort": "high"},  # low / medium / high / max
+    output_config={"effort": "high"},  # low / medium / high / xhigh / max
     messages=[{"role": "user", "content": "设计一个高并发秒杀系统的架构"}]
 )
 ```
 
 工程上有两个判断原则：
 
-*   Opus 4.7、Opus 4.6 和 Sonnet 4.6 优先使用 `thinking={"type": "adaptive"}` 配合 `output_config={"effort": ...}` 控制思考深度。
+*   Opus 4.8、Opus 4.7、Opus 4.6 和 Sonnet 4.6 优先使用 `thinking={"type": "adaptive"}` 配合 `output_config={"effort": ...}` 控制思考深度；其中 Opus 4.8 / 4.7 不支持手动 `budget_tokens`。
 *   Opus 4.6 和 Sonnet 4.6 仍兼容 `thinking={"type": "enabled", "budget_tokens": N}`，但该手动预算模式已弃用；Haiku 4.5 仅支持 Extended Thinking，不支持 Adaptive。
 
 ### 8.4.3 工作流程解密
@@ -149,7 +149,7 @@ response = client.messages.create(
 *   **简单任务**：`effort: "low"`，模型可能跳过思考，响应更快。
 *   **中等复杂任务**：`effort: "medium"`，适度思考。
 *   **复杂推理任务**：`effort: "high"`（默认），深度推理。
-*   **极端复杂任务/Agentic 编码**：`effort: "max"`（Opus 4.7）或 `"xhigh"`（Opus 4.7 可选），在工具使用密集的场景下提供最充分的推理。使用 `xhigh`/`max` 时建议将 `max_tokens` 设为 64k 以上，为思考和工具调用留出充足空间。
+*   **极端复杂任务/Agentic 编码**：`effort: "xhigh"` 或 `"max"`（Opus 4.8 / 4.7 可用），在工具使用密集的场景下提供更充分的推理。官方默认档位仍是 `high`；使用 `xhigh`/`max` 时建议将 `max_tokens` 设为 64k 以上，为思考和工具调用留出充足空间。
 
 Adaptive Thinking 会自动启用交错思考（Interleaved Thinking），即在工具调用之间也进行推理，这对 Agent 工作流尤为重要。
 
diff --git a/10_optimization/10.3_context_mgmt.md b/10_optimization/10.3_context_mgmt.md
@@ -1,6 +1,6 @@
 ## 10.3 上下文窗口管理
 
-Claude Opus 4.7、Opus 4.6 和 Sonnet 4.6 已进入 1 百万 Token 上下文窗口 (Context Window) 的公开规格或 beta 规格；可用性、账号权限和计费方式必须按官方模型页、迁移指南与价格页核验。其他 Claude 模型通常为 200K。这并不意味着应该无限制地往里塞东西。
+Claude Opus 4.8、Opus 4.7、Opus 4.6 和 Sonnet 4.6 已进入 1 百万 Token 上下文窗口 (Context Window) 的公开规格或 beta 规格；可用性、账号权限和计费方式必须按官方模型页、迁移指南与价格页核验。其他 Claude 模型通常为 200K。这并不意味着应该无限制地往里塞东西。
 **长上下文腐烂 (Context Rot)** 和 **注意力稀释 (Attention Dilution)** 是真实存在的问题。而且，越长的 Context 意味着越慢的响应速度和更高的延迟。
 
 本节介绍几种高级的上下文压缩与管理策略。
diff --git a/12_appendix/12.3_glossary.md b/12_appendix/12.3_glossary.md
@@ -53,7 +53,7 @@
 
 *   **Prompt Caching**: 一种通过缓存 Prompt 前缀的 KV 状态来降低延迟和成本的技术。
 *   **Prompt Injection (提示词注入)**: 一种攻击手段，通过特殊的输入诱导模型忽略安全限制或执行恶意指令。
-*   **Prefill (预填)**: 在 API 请求中，预先填入 Assistant 回复的开头部分（如 `{ "role": "assistant", "content": "{" }`），让旧模型按特定格式续写。该能力不再适用于 Claude Mythos Preview、Opus 4.7、Opus 4.6 和 Sonnet 4.6；新项目应优先使用 Structured Outputs。
+*   **Prefill (预填)**: 在 API 请求中，预先填入 Assistant 回复的开头部分（如 `{ "role": "assistant", "content": "{" }`），让旧模型按特定格式续写。该能力不再适用于 Claude Mythos Preview、Opus 4.8、Opus 4.7、Opus 4.6 和 Sonnet 4.6；新项目应优先使用 Structured Outputs。
 
 ### 12.3.10 R
 
diff --git a/12_appendix/12.7_volatile_facts.md b/12_appendix/12.7_volatile_facts.md
@@ -1,6 +1,6 @@
 ## 附录 G：快变事实核验表
 
-> Last verified: 2026-05-18. 本表是 Claude 模型、API、价格、隐私与竞品对比的更新入口。
+> Last verified: 2026-06-01. 本表是 Claude 模型、API、价格、隐私与竞品对比的更新入口。
 
 | 类别 | 当前维护口径 | 权威入口 | 编辑要求 |
 | --- | --- | --- | --- |
diff --git a/13_advanced/13.2_infinite_chats.md b/13_advanced/13.2_infinite_chats.md
@@ -1,4 +1,4 @@
-## 长对话管理实战指南
+## 13.2 长对话管理实战指南
 
 ### 序言
 
diff --git a/13_advanced/13.3_context_engineering.md b/13_advanced/13.3_context_engineering.md
@@ -1,4 +1,4 @@
-## Context Engineering 概览：从提示词工程到上下文工程
+## 13.3 Context Engineering 概览：从提示词工程到上下文工程
 
 ### 序言
 
diff --git a/13_advanced/README.md b/13_advanced/README.md
@@ -1,6 +1,6 @@
 # 第十三章 进阶能力：Claude 前沿特性与上下文工程
 
-> **关于章号**：本书正文为第一至第十一章，本进阶章沿用"第十三章"编号；中间的"第十二"位置对应**附录**部分（API 参考、FAQ、术语表、定价、竞品对比、快变事实核验表等，见侧边目录"附录"）。因此目录中第十一章之后直接到本章属于编号设计，并非缺漏。
+> **关于章号**：本书正文为第一至第十一章，本进阶章沿用“第十三章”编号；中间的“第十二”位置对应**附录**部分（API 参考、FAQ、术语表、定价、竞品对比、快变事实核验表等，见侧边目录“附录”）。因此目录中第十一章之后直接到本章属于编号设计，并非缺漏。
 
 本章分为已确认信息和基于行业趋势的合理推测两部分。已确认信息以最新的官方文档为准，推测部分基于行业趋势。
 
diff --git a/13_advanced/summary.md b/13_advanced/summary.md
@@ -149,12 +149,12 @@ RAG（检索增强生成）是上下文工程的实践工具：
 
 ### 能力概览（确认方向）
 
-| 维度 | Claude 4.6 / 4.7 当前状态 | 未来模型观察重点 |
+| 维度 | Claude 4.6 / 4.7 / 4.8 当前状态 | 未来模型观察重点 |
 |------|--------------------|------------------|
 | 推理 | 复杂推理与规划能力继续增强 | 是否进一步提升可控 thinking 与长任务稳定性 |
 | 编程 | Sonnet/Opus 在编码与 Agent 工作流上表现强 | 是否扩大代码库级任务优势 |
 | 多模态 | 视觉与工具工作流结合更深 | 是否出现更强的原生音视频与实时交互能力 |
-| 上下文 | Opus 4.7、Opus 4.6 和 Sonnet 4.6 已进入 1M token 公开规格 | 是否在 1M 之上继续扩展或改进利用效率 |
+| 上下文 | Opus 4.8、Opus 4.7、Opus 4.6 和 Sonnet 4.6 已进入 1M token 公开规格 | 是否在 1M 之上继续扩展或改进利用效率 |
 
 ### 成本参考
 

Original file line number	Diff line number	Diff line change
`@@ -1,4 +1,4 @@`
`1`		`-## 长对话管理实战指南`
	`1`	`+## 13.2 长对话管理实战指南`
`2`	`2`
`3`	`3`	`### 序言`
`4`	`4`
Original file line number	Diff line number	Diff line change
`@@ -1,4 +1,4 @@`
`1`		`-## Context Engineering 概览：从提示词工程到上下文工程`
	`1`	`+## 13.3 Context Engineering 概览：从提示词工程到上下文工程`
`2`	`2`
`3`	`3`	`### 序言`
`4`	`4`