docs: add weekly news 2026-w21

yanglbme · yanglbme · commit 29144e676420 · 2026-05-24T12:12:21.000Z
diff --git a/src/content/weekly/2026-w21.md b/src/content/weekly/2026-w21.md
@@ -0,0 +1,169 @@
+---
+title: "Awesome AI 周报 | 2026-W21"
+date: "2026-w21"
+tags: ["DeepSeek", "Anthropic", "Claude", "Microsoft", "Alibaba", "Google", "NVIDIA", "AI Agent", "AI 定价"]
+summary: "DeepSeek 永久降价 75% 引发价格战，Anthropic 警告 Claude Mythos 找 bug 比修 bug 还快，Microsoft 发布 Webwright 和 Fara1.5 两大 AI Agent 框架，Google AI 眼镜上手体验"
+---
+
+# 本周聚焦：AI 价格战全面开打，Agent 框架密集发布，Claude 能力逼近开发者极限
+
+> 从海量 AI 资讯中提取真正有价值的信号
+
+---
+
+这一周的信息量非常大。AI 行业在多个维度同时发生关键变化：DeepSeek 宣布将 75% 的折扣永久化，输出 token 价格至少比 GPT-5.5 低 34 倍，正式把 AI 模型推向价格战时代。Anthropic 的 Claude Mythos Preview 已经能比开发者更快地发现漏洞——这既是能力的证明，也是安全的警报。Microsoft 一口气发布 Webwright 和 Fara1.5 两套 AI Agent 框架，在终端和浏览器两个场景同时布局。Google 的 AI 眼镜上手体验显示产品"几乎准备好了"。
+
+挑几条值得看的，挨个聊聊。
+
+---
+
+## DeepSeek 将 75% 折扣永久化，输出价格至少比 GPT-5.5 低 34 倍
+
+5 月 23 日，The Decoder 报道 DeepSeek 宣布将其 75% 的折扣永久化，输出 token 定价至少比 GPT-5.5 低 34 倍。
+
+这一举措意味着 DeepSeek 不再将低价视为短期获客手段，而是将其作为长期竞争策略。在 GPT-5.5、Claude Mythos 等顶级模型占据性能高地的同时，DeepSeek 选择以极致的性价比来争夺市场份额。
+
+> **Awesome AI 观点：** AI 模型的价格战正式打响。DeepSeek 的逻辑很清晰——当模型性能差距缩小到一定阈值后，价格就成了决定性的竞争因素。对于开发者和企业来说，这意味着 AI 推理成本的持续下降将成为常态。但对于整个行业来说，这也可能压缩利润空间，迫使更多玩家寻找差异化路径。价格战是行业走向成熟的标志，但也可能加速中小玩家的出局。
+
+来源：[The Decoder](https://the-decoder.com/deepseek-makes-its-75-percent-discount-permanent-pricing-output-tokens-at-least-34x-below-gpt-5-5/)
+
+---
+
+## Anthropic 警告 Claude Mythos Preview 找 bug 比开发者修得还快
+
+5 月 23 日，The Decoder 报道 Anthropic 发出警告：Claude Mythos Preview 发现 bug 的速度已经超过了开发者修复它们的速度。
+
+这不是一个营销话术，而是一个真实的工程瓶颈。当 AI 发现漏洞的能力超越了人类的修复能力时，开发流程本身就面临重新设计的问题。
+
+> **Awesome AI 观点：** 这是一个有趣的"能力溢出"时刻。安全扫描工具的发现速度超过修复速度并不新鲜，但当 AI 不仅能发现 bug，还能理解其上下文、提出修复方案时，这个问题的性质就变了。这可能推动"AI 辅助修复"甚至"AI 自动修复"成为标准实践。同时也提出了一个新的安全哲学问题：当 AI 能自主发现漏洞时，谁在控制这把"双刃剑"？
+
+来源：[The Decoder](https://the-decoder.com/anthropic-warns-claude-mythos-preview-finds-bugs-faster-than-developers-can-patch-them/)
+
+---
+
+## Alibaba 最新 AI 模型自主运行 35 小时优化自研芯片代码
+
+5 月 23 日，The Decoder 报道 Alibaba 的最新 AI 模型自主运行了 35 小时，为其自研芯片优化代码。
+
+这标志着 AI 在硬件设计领域的自主化程度正在快速提升。AI 不再只是辅助工具，而是可以长时间自主完成复杂工程任务的"工程师"。
+
+> **Awesome AI 观点：** 35 小时自主运行意味着 AI 可以跨越人类的工作时间限制，持续迭代和优化。这种"昼夜不停"的工程能力是 AI 在芯片设计等高复杂度领域产生实质性影响的关键。Alibaba 选择用 AI 优化自家芯片代码，说明 AI for Engineering 已经从概念走向了实际生产力。
+
+来源：[The Decoder](https://the-decoder.com/alibabas-latest-ai-model-ran-autonomously-for-35-hours-to-optimize-code-for-its-own-custom-chip/)
+
+---
+
+## Anthropic 可能在五角大楼发出风险警告后继续向 NSA 供应 Claude
+
+5 月 24 日，The Decoder 报道尽管五角大楼将 Claude 标记为供应链风险，Anthropic 可能仍会继续向 NSA 供应 Claude 模型。
+
+这反映了 AI 公司在国家安全需求与安全审查之间的复杂平衡。
+
+> **Awesome AI 观点：** 供应链风险标记是一个严肃的安全信号，但 NSA 作为情报机构，对 AI 能力的需求是刚性的。Anthropic 面临的选择是：放弃一个重要的政府客户，还是冒着声誉风险继续合作。这也暴露了一个更大的问题——当 AI 模型成为国家安全基础设施的一部分时，"供应链安全"的定义需要被重新审视。
+
+来源：[The Decoder](https://the-decoder.com/anthropic-may-keep-supplying-claude-to-the-nsa-despite-being-flagged-as-a-supply-chain-risk-by-the-pentagon/)
+
+---
+
+## Microsoft 发布 Webwright：终端原生 Web Agent 框架
+
+5 月 24 日，Marktechpost 报道 Microsoft Research 发布 Webwright，一个终端原生的 Web Agent 框架，在 Odysseys 基准测试中得分 60.1%，远超基础 GPT-5.4 的 33.5%。
+
+Webwright 代表了 Microsoft 在 Web Agent 方向的最新探索——让 AI 直接在终端环境中与 Web 交互，而非依赖浏览器 UI。
+
+> **Awesome AI 观点：** 60.1% vs 33.5% 的提升幅度非常显著，说明专门的 Agent 框架比单纯调用基础模型有效得多。终端原生的设计思路也很有趣——比起在浏览器中模拟人类操作，直接在终端层处理 Web 交互更高效、更可编程。这是 Microsoft 在 AI Agent 赛道上的一步重要棋。
+
+来源：[Marktechpost](https://www.marktechpost.com/2026/05/24/microsoft-research-releases-webwright-a-terminal-native-web-agent-framework-that-scores-60-1-on-odysseys-up-from-base-gpt-5-4s-33-5/)
+
+---
+
+## Microsoft 发布 Fara1.5：浏览器计算机使用 Agent 系列
+
+5 月 22 日，Marktechpost 报道 Microsoft 发布 Fara1.5 系列（4B/9B/27B 参数），在 Online-Mind2Web 基准测试中超越 OpenAI Operator 和 Gemini 2.5 Computer Use。
+
+Fara1.5 是 Microsoft 在"计算机使用"（Computer Use）方向的重要布局，提供从轻量到高性能的完整产品矩阵。
+
+> **Awesome AI 观点：** 三个尺寸覆盖不同场景：4B 适合边缘部署，9B 平衡性能和成本，27B 追求极致表现。能同时在多个基准上超越 OpenAI 和 Google 的同类产品，说明 Microsoft 在 Computer Use 方向的投入已经进入了"能打"的阶段。这一赛道的竞争正在白热化。
+
+来源：[Marktechpost](https://www.marktechpost.com/2026/05/22/microsoft-releases-fara1-5-a-family-of-browser-computer-use-agents-4b-9b-27b-that-outperform-openai-operator-and-gemini-2-5-computer-use-on-online-mind2web/)
+
+---
+
+## 研究人员让 Claude Code 自主发现人类可能想不出的 AI 缩放算法
+
+5 月 24 日，The Decoder 报道研究人员让 Claude Code 自主发现了人类可能不会设计的 AI 缩放算法。
+
+这是一个"AI 发现 AI 优化方案"的元场景——用 AI 编码工具来改进 AI 系统本身的训练方法。
+
+> **Awesome AI 观点：** 这是 AI 自我迭代能力的又一个里程碑。当 AI 开始设计 AI 的训练算法时，我们离"AI 自我改进"的闭环又近了一步。关键问题不在于 AI 能不能做到，而在于人类能不能理解和验证这些 AI 设计的算法。可解释性在这个场景下变得更加重要。
+
+来源：[The Decoder](https://the-decoder.com/researchers-let-claude-code-discover-ai-scaling-algorithms-that-humans-probably-wouldnt-have-designed/)
+
+---
+
+## NVIDIA 发布 Gated DeltaNet-2：解构 Delta 规则中的擦除和写入
+
+5 月 24 日，Marktechpost 报道 NVIDIA AI 发布 Gated DeltaNet-2，一种线性注意力层，在 Delta 规则中解耦擦除和写入操作。
+
+这是 NVIDIA 在高效序列建模方向的最新研究进展，旨在提升长序列处理的效率。
+
+> **Awesome AI 观点：** 线性注意力是 Transformer 之外最有希望的序列建模替代方案之一。Gated DeltaNet-2 的核心创新在于将"记忆擦除"和"记忆写入"解耦——这类似于人类大脑中遗忘和学习的分离机制。如果这种架构能在大规模训练中验证效果，可能为下一代高效模型提供新的基础构件。
+
+来源：[Marktechpost](https://www.marktechpost.com/2026/05/24/nvidia-ai-releases-gated-deltanet-2-a-linear-attention-layer-that-decouples-erase-and-write-in-the-delta-rule/)
+
+---
+
+## Google AI 眼镜上手体验："几乎准备好了"
+
+5 月 22 日，TechCrunch 报道了对 Google AI 眼镜的上手体验，结论是产品"几乎准备好了"（almost there）。
+
+Google 在 AI 硬件方向的探索终于有了一个接近成熟的产品形态。
+
+> **Awesome AI 观点：** "Almost there"是一个有趣的定位——说明核心功能已经可用，但还有一些关键体验需要打磨。Google 眼镜的成败很大程度上取决于 AI 功能是否能提供超越手机的独特价值。如果只是把手机屏幕搬到眼前，那意义不大；但如果能在实时翻译、场景理解、环境感知等方面做出差异化，那将是一个全新的交互范式。
+
+来源：[TechCrunch](https://techcrunch.com/2026/05/22/we-tried-googles-ai-glasses-and-theyre-almost-there/)
+
+---
+
+## OpenAI 推出 ChatGPT PowerPoint 插件，同时警告可能意外删除内容
+
+5 月 22 日，The Decoder 报道 OpenAI 推出了 ChatGPT 的 PowerPoint 插件，但同时警告它可能会意外删除用户的内容。
+
+这个坦诚的警告本身就是一个新闻——说明 AI 生成工具在可靠性上仍有明显短板。
+
+> **Awesome AI 观点：** OpenAI 的坦诚值得肯定，但也暴露了 AI 工具在生产力场景中的一个核心问题：用户不能信任 AI 不会搞砸他们的工作。这不仅是技术问题，更是信任问题。在 AI 工具真正进入核心工作流之前，"可撤销性"和"安全保障"是必须解决的前置条件。
+
+来源：[The Decoder](https://the-decoder.com/openai-launches-a-chatgpt-powerpoint-plugin-and-warns-it-might-accidentally-delete-your-content/)
+
+---
+
+## Google CEO 皮查伊重新定义搜索：链接只是搜索的"一部分"
+
+5 月 23 日，The Decoder 报道 Google CEO Sundar Pichai 现在将链接称为搜索的"一部分"，重新定义了网页在其自身产品中的角色。
+
+这可能是 Google 搜索历史上最重要的叙事转变之一——从"组织互联网信息"转向"直接提供答案"。
+
+> **Awesome AI 观点：** 当 Google 开始淡化链接的重要性时，意味着 AI 生成答案正在替代传统的搜索结果页。这对整个互联网生态的影响是深远的：网站流量可能进一步向 Google 集中，内容创作者的分发渠道变得更加依赖于 AI 的"理解"而非搜索引擎的"索引"。
+
+来源：[The Decoder](https://the-decoder.com/google-ceo-pichai-now-calls-links-a-part-of-search-redefining-the-webs-role-in-its-own-product/)
+
+---
+
+## 其他值得关注的
+
+- **Tencent 开源 TencentDB Agent Memory**：一个 4 层本地记忆管线，为 AI Agent 提供结构化记忆能力。来源：[Marktechpost](https://www.marktechpost.com/2026/05/23/tencent-open-sources-tencentdb-agent-memory-a-4-tier-local-memory-pipeline-for-ai-agents/)
+- **Perplexity 开源 Bumblebee**：一个只读的开发者端点供应链扫描器，用于安全审计。来源：[Marktechpost](https://www.marktechpost.com/2026/05/23/perplexity-open-sources-bumblebee-a-read-only-supply-chain-scanner-for-developer-endpoints/)
+- **Nous Research 发布 CNA（对比神经元归因）**：无需 SAE 训练或权重修改的稀疏 MLP 电路引导方法。来源：[Marktechpost](https://www.marktechpost.com/2026/05/23/nous-research-releases-contrastive-neuron-attribution-cna-sparse-mlp-circuit-steering-without-sae-training-or-weight-modification/)
+- **VentureBeat 报道 Google 25 年来首次重新设计搜索框**。来源：[VentureBeat](https://venturebeat.com/technology/google-just-redesigned-the-search-box-for-the-first-time-in-25-years-heres-why-it-matters-more-than-you-think)
+- **TechCrunch 报道 Spotify 的 AI 赌注**：更多内容，但可能不是你想要的。来源：[TechCrunch](https://techcrunch.com/2026/05/22/spotifys-ai-bet-more-of-everything-less-of-what-you-want/)
+- **TechCrunch 报道 Ferrari 使用 IBM AI 打造 F1 超级粉丝**。来源：[TechCrunch](https://techcrunch.com/2026/05/23/ferrari-is-using-ai-to-create-f1-superfans/)
+- **TechCrunch 报道 AI 被用于"复活"已故飞行员的声音**。来源：[TechCrunch](https://techcrunch.com/2026/05/22/ai-is-being-used-to-resurrect-the-voices-of-dead-pilots/)
+- **The Decoder 报道世界顶尖法学院之一对 AI 在法律教育中的使用划下红线**。来源：[The Decoder](https://the-decoder.com/one-of-the-worlds-top-law-schools-draws-a-hard-line-against-ai-in-legal-education/)
+- **36 氪报道 Moka 推出三款 AI HR 工具**，用 AI 来管理公司。来源：[36 氪](https://36kr.com/p/3819979202253189)
+- **36 氪报道对话王小川**：离开通用人工智能的主干道之后。来源：[36 氪](https://36kr.com/p/3821521291038856)
+
+---
+
+## 一句话总结
+
+DeepSeek 把价格战打成了持久战，Anthropic 的 Claude 找 bug 比人修 bug 还快，Microsoft 在 Agent 框架上密集布局，Google 的 AI 硬件和搜索叙事都在发生关键转变。AI 的竞争已经从"谁更强"扩展到了"谁更便宜"和"谁能自主干活"。