Skip to content

Commit 29144e6

Browse files
committed
docs: add weekly news 2026-w21
1 parent 3659431 commit 29144e6

1 file changed

Lines changed: 169 additions & 0 deletions

File tree

src/content/weekly/2026-w21.md

Lines changed: 169 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,169 @@
1+
---
2+
title: "Awesome AI 周报 | 2026-W21"
3+
date: "2026-w21"
4+
tags: ["DeepSeek", "Anthropic", "Claude", "Microsoft", "Alibaba", "Google", "NVIDIA", "AI Agent", "AI 定价"]
5+
summary: "DeepSeek 永久降价 75% 引发价格战,Anthropic 警告 Claude Mythos 找 bug 比修 bug 还快,Microsoft 发布 Webwright 和 Fara1.5 两大 AI Agent 框架,Google AI 眼镜上手体验"
6+
---
7+
8+
# 本周聚焦:AI 价格战全面开打,Agent 框架密集发布,Claude 能力逼近开发者极限
9+
10+
> 从海量 AI 资讯中提取真正有价值的信号
11+
12+
---
13+
14+
这一周的信息量非常大。AI 行业在多个维度同时发生关键变化:DeepSeek 宣布将 75% 的折扣永久化,输出 token 价格至少比 GPT-5.5 低 34 倍,正式把 AI 模型推向价格战时代。Anthropic 的 Claude Mythos Preview 已经能比开发者更快地发现漏洞——这既是能力的证明,也是安全的警报。Microsoft 一口气发布 Webwright 和 Fara1.5 两套 AI Agent 框架,在终端和浏览器两个场景同时布局。Google 的 AI 眼镜上手体验显示产品"几乎准备好了"。
15+
16+
挑几条值得看的,挨个聊聊。
17+
18+
---
19+
20+
## DeepSeek 将 75% 折扣永久化,输出价格至少比 GPT-5.5 低 34 倍
21+
22+
5 月 23 日,The Decoder 报道 DeepSeek 宣布将其 75% 的折扣永久化,输出 token 定价至少比 GPT-5.5 低 34 倍。
23+
24+
这一举措意味着 DeepSeek 不再将低价视为短期获客手段,而是将其作为长期竞争策略。在 GPT-5.5、Claude Mythos 等顶级模型占据性能高地的同时,DeepSeek 选择以极致的性价比来争夺市场份额。
25+
26+
> **Awesome AI 观点:** AI 模型的价格战正式打响。DeepSeek 的逻辑很清晰——当模型性能差距缩小到一定阈值后,价格就成了决定性的竞争因素。对于开发者和企业来说,这意味着 AI 推理成本的持续下降将成为常态。但对于整个行业来说,这也可能压缩利润空间,迫使更多玩家寻找差异化路径。价格战是行业走向成熟的标志,但也可能加速中小玩家的出局。
27+
28+
来源:[The Decoder](https://the-decoder.com/deepseek-makes-its-75-percent-discount-permanent-pricing-output-tokens-at-least-34x-below-gpt-5-5/)
29+
30+
---
31+
32+
## Anthropic 警告 Claude Mythos Preview 找 bug 比开发者修得还快
33+
34+
5 月 23 日,The Decoder 报道 Anthropic 发出警告:Claude Mythos Preview 发现 bug 的速度已经超过了开发者修复它们的速度。
35+
36+
这不是一个营销话术,而是一个真实的工程瓶颈。当 AI 发现漏洞的能力超越了人类的修复能力时,开发流程本身就面临重新设计的问题。
37+
38+
> **Awesome AI 观点:** 这是一个有趣的"能力溢出"时刻。安全扫描工具的发现速度超过修复速度并不新鲜,但当 AI 不仅能发现 bug,还能理解其上下文、提出修复方案时,这个问题的性质就变了。这可能推动"AI 辅助修复"甚至"AI 自动修复"成为标准实践。同时也提出了一个新的安全哲学问题:当 AI 能自主发现漏洞时,谁在控制这把"双刃剑"?
39+
40+
来源:[The Decoder](https://the-decoder.com/anthropic-warns-claude-mythos-preview-finds-bugs-faster-than-developers-can-patch-them/)
41+
42+
---
43+
44+
## Alibaba 最新 AI 模型自主运行 35 小时优化自研芯片代码
45+
46+
5 月 23 日,The Decoder 报道 Alibaba 的最新 AI 模型自主运行了 35 小时,为其自研芯片优化代码。
47+
48+
这标志着 AI 在硬件设计领域的自主化程度正在快速提升。AI 不再只是辅助工具,而是可以长时间自主完成复杂工程任务的"工程师"。
49+
50+
> **Awesome AI 观点:** 35 小时自主运行意味着 AI 可以跨越人类的工作时间限制,持续迭代和优化。这种"昼夜不停"的工程能力是 AI 在芯片设计等高复杂度领域产生实质性影响的关键。Alibaba 选择用 AI 优化自家芯片代码,说明 AI for Engineering 已经从概念走向了实际生产力。
51+
52+
来源:[The Decoder](https://the-decoder.com/alibabas-latest-ai-model-ran-autonomously-for-35-hours-to-optimize-code-for-its-own-custom-chip/)
53+
54+
---
55+
56+
## Anthropic 可能在五角大楼发出风险警告后继续向 NSA 供应 Claude
57+
58+
5 月 24 日,The Decoder 报道尽管五角大楼将 Claude 标记为供应链风险,Anthropic 可能仍会继续向 NSA 供应 Claude 模型。
59+
60+
这反映了 AI 公司在国家安全需求与安全审查之间的复杂平衡。
61+
62+
> **Awesome AI 观点:** 供应链风险标记是一个严肃的安全信号,但 NSA 作为情报机构,对 AI 能力的需求是刚性的。Anthropic 面临的选择是:放弃一个重要的政府客户,还是冒着声誉风险继续合作。这也暴露了一个更大的问题——当 AI 模型成为国家安全基础设施的一部分时,"供应链安全"的定义需要被重新审视。
63+
64+
来源:[The Decoder](https://the-decoder.com/anthropic-may-keep-supplying-claude-to-the-nsa-despite-being-flagged-as-a-supply-chain-risk-by-the-pentagon/)
65+
66+
---
67+
68+
## Microsoft 发布 Webwright:终端原生 Web Agent 框架
69+
70+
5 月 24 日,Marktechpost 报道 Microsoft Research 发布 Webwright,一个终端原生的 Web Agent 框架,在 Odysseys 基准测试中得分 60.1%,远超基础 GPT-5.4 的 33.5%。
71+
72+
Webwright 代表了 Microsoft 在 Web Agent 方向的最新探索——让 AI 直接在终端环境中与 Web 交互,而非依赖浏览器 UI。
73+
74+
> **Awesome AI 观点:** 60.1% vs 33.5% 的提升幅度非常显著,说明专门的 Agent 框架比单纯调用基础模型有效得多。终端原生的设计思路也很有趣——比起在浏览器中模拟人类操作,直接在终端层处理 Web 交互更高效、更可编程。这是 Microsoft 在 AI Agent 赛道上的一步重要棋。
75+
76+
来源:[Marktechpost](https://www.marktechpost.com/2026/05/24/microsoft-research-releases-webwright-a-terminal-native-web-agent-framework-that-scores-60-1-on-odysseys-up-from-base-gpt-5-4s-33-5/)
77+
78+
---
79+
80+
## Microsoft 发布 Fara1.5:浏览器计算机使用 Agent 系列
81+
82+
5 月 22 日,Marktechpost 报道 Microsoft 发布 Fara1.5 系列(4B/9B/27B 参数),在 Online-Mind2Web 基准测试中超越 OpenAI Operator 和 Gemini 2.5 Computer Use。
83+
84+
Fara1.5 是 Microsoft 在"计算机使用"(Computer Use)方向的重要布局,提供从轻量到高性能的完整产品矩阵。
85+
86+
> **Awesome AI 观点:** 三个尺寸覆盖不同场景:4B 适合边缘部署,9B 平衡性能和成本,27B 追求极致表现。能同时在多个基准上超越 OpenAI 和 Google 的同类产品,说明 Microsoft 在 Computer Use 方向的投入已经进入了"能打"的阶段。这一赛道的竞争正在白热化。
87+
88+
来源:[Marktechpost](https://www.marktechpost.com/2026/05/22/microsoft-releases-fara1-5-a-family-of-browser-computer-use-agents-4b-9b-27b-that-outperform-openai-operator-and-gemini-2-5-computer-use-on-online-mind2web/)
89+
90+
---
91+
92+
## 研究人员让 Claude Code 自主发现人类可能想不出的 AI 缩放算法
93+
94+
5 月 24 日,The Decoder 报道研究人员让 Claude Code 自主发现了人类可能不会设计的 AI 缩放算法。
95+
96+
这是一个"AI 发现 AI 优化方案"的元场景——用 AI 编码工具来改进 AI 系统本身的训练方法。
97+
98+
> **Awesome AI 观点:** 这是 AI 自我迭代能力的又一个里程碑。当 AI 开始设计 AI 的训练算法时,我们离"AI 自我改进"的闭环又近了一步。关键问题不在于 AI 能不能做到,而在于人类能不能理解和验证这些 AI 设计的算法。可解释性在这个场景下变得更加重要。
99+
100+
来源:[The Decoder](https://the-decoder.com/researchers-let-claude-code-discover-ai-scaling-algorithms-that-humans-probably-wouldnt-have-designed/)
101+
102+
---
103+
104+
## NVIDIA 发布 Gated DeltaNet-2:解构 Delta 规则中的擦除和写入
105+
106+
5 月 24 日,Marktechpost 报道 NVIDIA AI 发布 Gated DeltaNet-2,一种线性注意力层,在 Delta 规则中解耦擦除和写入操作。
107+
108+
这是 NVIDIA 在高效序列建模方向的最新研究进展,旨在提升长序列处理的效率。
109+
110+
> **Awesome AI 观点:** 线性注意力是 Transformer 之外最有希望的序列建模替代方案之一。Gated DeltaNet-2 的核心创新在于将"记忆擦除"和"记忆写入"解耦——这类似于人类大脑中遗忘和学习的分离机制。如果这种架构能在大规模训练中验证效果,可能为下一代高效模型提供新的基础构件。
111+
112+
来源:[Marktechpost](https://www.marktechpost.com/2026/05/24/nvidia-ai-releases-gated-deltanet-2-a-linear-attention-layer-that-decouples-erase-and-write-in-the-delta-rule/)
113+
114+
---
115+
116+
## Google AI 眼镜上手体验:"几乎准备好了"
117+
118+
5 月 22 日,TechCrunch 报道了对 Google AI 眼镜的上手体验,结论是产品"几乎准备好了"(almost there)。
119+
120+
Google 在 AI 硬件方向的探索终于有了一个接近成熟的产品形态。
121+
122+
> **Awesome AI 观点:** "Almost there"是一个有趣的定位——说明核心功能已经可用,但还有一些关键体验需要打磨。Google 眼镜的成败很大程度上取决于 AI 功能是否能提供超越手机的独特价值。如果只是把手机屏幕搬到眼前,那意义不大;但如果能在实时翻译、场景理解、环境感知等方面做出差异化,那将是一个全新的交互范式。
123+
124+
来源:[TechCrunch](https://techcrunch.com/2026/05/22/we-tried-googles-ai-glasses-and-theyre-almost-there/)
125+
126+
---
127+
128+
## OpenAI 推出 ChatGPT PowerPoint 插件,同时警告可能意外删除内容
129+
130+
5 月 22 日,The Decoder 报道 OpenAI 推出了 ChatGPT 的 PowerPoint 插件,但同时警告它可能会意外删除用户的内容。
131+
132+
这个坦诚的警告本身就是一个新闻——说明 AI 生成工具在可靠性上仍有明显短板。
133+
134+
> **Awesome AI 观点:** OpenAI 的坦诚值得肯定,但也暴露了 AI 工具在生产力场景中的一个核心问题:用户不能信任 AI 不会搞砸他们的工作。这不仅是技术问题,更是信任问题。在 AI 工具真正进入核心工作流之前,"可撤销性"和"安全保障"是必须解决的前置条件。
135+
136+
来源:[The Decoder](https://the-decoder.com/openai-launches-a-chatgpt-powerpoint-plugin-and-warns-it-might-accidentally-delete-your-content/)
137+
138+
---
139+
140+
## Google CEO 皮查伊重新定义搜索:链接只是搜索的"一部分"
141+
142+
5 月 23 日,The Decoder 报道 Google CEO Sundar Pichai 现在将链接称为搜索的"一部分",重新定义了网页在其自身产品中的角色。
143+
144+
这可能是 Google 搜索历史上最重要的叙事转变之一——从"组织互联网信息"转向"直接提供答案"。
145+
146+
> **Awesome AI 观点:** 当 Google 开始淡化链接的重要性时,意味着 AI 生成答案正在替代传统的搜索结果页。这对整个互联网生态的影响是深远的:网站流量可能进一步向 Google 集中,内容创作者的分发渠道变得更加依赖于 AI 的"理解"而非搜索引擎的"索引"。
147+
148+
来源:[The Decoder](https://the-decoder.com/google-ceo-pichai-now-calls-links-a-part-of-search-redefining-the-webs-role-in-its-own-product/)
149+
150+
---
151+
152+
## 其他值得关注的
153+
154+
- **Tencent 开源 TencentDB Agent Memory**:一个 4 层本地记忆管线,为 AI Agent 提供结构化记忆能力。来源:[Marktechpost](https://www.marktechpost.com/2026/05/23/tencent-open-sources-tencentdb-agent-memory-a-4-tier-local-memory-pipeline-for-ai-agents/)
155+
- **Perplexity 开源 Bumblebee**:一个只读的开发者端点供应链扫描器,用于安全审计。来源:[Marktechpost](https://www.marktechpost.com/2026/05/23/perplexity-open-sources-bumblebee-a-read-only-supply-chain-scanner-for-developer-endpoints/)
156+
- **Nous Research 发布 CNA(对比神经元归因)**:无需 SAE 训练或权重修改的稀疏 MLP 电路引导方法。来源:[Marktechpost](https://www.marktechpost.com/2026/05/23/nous-research-releases-contrastive-neuron-attribution-cna-sparse-mlp-circuit-steering-without-sae-training-or-weight-modification/)
157+
- **VentureBeat 报道 Google 25 年来首次重新设计搜索框**。来源:[VentureBeat](https://venturebeat.com/technology/google-just-redesigned-the-search-box-for-the-first-time-in-25-years-heres-why-it-matters-more-than-you-think)
158+
- **TechCrunch 报道 Spotify 的 AI 赌注**:更多内容,但可能不是你想要的。来源:[TechCrunch](https://techcrunch.com/2026/05/22/spotifys-ai-bet-more-of-everything-less-of-what-you-want/)
159+
- **TechCrunch 报道 Ferrari 使用 IBM AI 打造 F1 超级粉丝**。来源:[TechCrunch](https://techcrunch.com/2026/05/23/ferrari-is-using-ai-to-create-f1-superfans/)
160+
- **TechCrunch 报道 AI 被用于"复活"已故飞行员的声音**。来源:[TechCrunch](https://techcrunch.com/2026/05/22/ai-is-being-used-to-resurrect-the-voices-of-dead-pilots/)
161+
- **The Decoder 报道世界顶尖法学院之一对 AI 在法律教育中的使用划下红线**。来源:[The Decoder](https://the-decoder.com/one-of-the-worlds-top-law-schools-draws-a-hard-line-against-ai-in-legal-education/)
162+
- **36 氪报道 Moka 推出三款 AI HR 工具**,用 AI 来管理公司。来源:[36 氪](https://36kr.com/p/3819979202253189)
163+
- **36 氪报道对话王小川**:离开通用人工智能的主干道之后。来源:[36 氪](https://36kr.com/p/3821521291038856)
164+
165+
---
166+
167+
## 一句话总结
168+
169+
DeepSeek 把价格战打成了持久战,Anthropic 的 Claude 找 bug 比人修 bug 还快,Microsoft 在 Agent 框架上密集布局,Google 的 AI 硬件和搜索叙事都在发生关键转变。AI 的竞争已经从"谁更强"扩展到了"谁更便宜"和"谁能自主干活"。

0 commit comments

Comments
 (0)