|
| 1 | +--- |
| 2 | +title: "Awesome AI 周报 | 2026-W21" |
| 3 | +date: "2026-w21" |
| 4 | +tags: ["DeepSeek", "Anthropic", "Claude", "Microsoft", "Alibaba", "Google", "NVIDIA", "AI Agent", "AI 定价"] |
| 5 | +summary: "DeepSeek 永久降价 75% 引发价格战,Anthropic 警告 Claude Mythos 找 bug 比修 bug 还快,Microsoft 发布 Webwright 和 Fara1.5 两大 AI Agent 框架,Google AI 眼镜上手体验" |
| 6 | +--- |
| 7 | + |
| 8 | +# 本周聚焦:AI 价格战全面开打,Agent 框架密集发布,Claude 能力逼近开发者极限 |
| 9 | + |
| 10 | +> 从海量 AI 资讯中提取真正有价值的信号 |
| 11 | +
|
| 12 | +--- |
| 13 | + |
| 14 | +这一周的信息量非常大。AI 行业在多个维度同时发生关键变化:DeepSeek 宣布将 75% 的折扣永久化,输出 token 价格至少比 GPT-5.5 低 34 倍,正式把 AI 模型推向价格战时代。Anthropic 的 Claude Mythos Preview 已经能比开发者更快地发现漏洞——这既是能力的证明,也是安全的警报。Microsoft 一口气发布 Webwright 和 Fara1.5 两套 AI Agent 框架,在终端和浏览器两个场景同时布局。Google 的 AI 眼镜上手体验显示产品"几乎准备好了"。 |
| 15 | + |
| 16 | +挑几条值得看的,挨个聊聊。 |
| 17 | + |
| 18 | +--- |
| 19 | + |
| 20 | +## DeepSeek 将 75% 折扣永久化,输出价格至少比 GPT-5.5 低 34 倍 |
| 21 | + |
| 22 | +5 月 23 日,The Decoder 报道 DeepSeek 宣布将其 75% 的折扣永久化,输出 token 定价至少比 GPT-5.5 低 34 倍。 |
| 23 | + |
| 24 | +这一举措意味着 DeepSeek 不再将低价视为短期获客手段,而是将其作为长期竞争策略。在 GPT-5.5、Claude Mythos 等顶级模型占据性能高地的同时,DeepSeek 选择以极致的性价比来争夺市场份额。 |
| 25 | + |
| 26 | +> **Awesome AI 观点:** AI 模型的价格战正式打响。DeepSeek 的逻辑很清晰——当模型性能差距缩小到一定阈值后,价格就成了决定性的竞争因素。对于开发者和企业来说,这意味着 AI 推理成本的持续下降将成为常态。但对于整个行业来说,这也可能压缩利润空间,迫使更多玩家寻找差异化路径。价格战是行业走向成熟的标志,但也可能加速中小玩家的出局。 |
| 27 | +
|
| 28 | +来源:[The Decoder](https://the-decoder.com/deepseek-makes-its-75-percent-discount-permanent-pricing-output-tokens-at-least-34x-below-gpt-5-5/) |
| 29 | + |
| 30 | +--- |
| 31 | + |
| 32 | +## Anthropic 警告 Claude Mythos Preview 找 bug 比开发者修得还快 |
| 33 | + |
| 34 | +5 月 23 日,The Decoder 报道 Anthropic 发出警告:Claude Mythos Preview 发现 bug 的速度已经超过了开发者修复它们的速度。 |
| 35 | + |
| 36 | +这不是一个营销话术,而是一个真实的工程瓶颈。当 AI 发现漏洞的能力超越了人类的修复能力时,开发流程本身就面临重新设计的问题。 |
| 37 | + |
| 38 | +> **Awesome AI 观点:** 这是一个有趣的"能力溢出"时刻。安全扫描工具的发现速度超过修复速度并不新鲜,但当 AI 不仅能发现 bug,还能理解其上下文、提出修复方案时,这个问题的性质就变了。这可能推动"AI 辅助修复"甚至"AI 自动修复"成为标准实践。同时也提出了一个新的安全哲学问题:当 AI 能自主发现漏洞时,谁在控制这把"双刃剑"? |
| 39 | +
|
| 40 | +来源:[The Decoder](https://the-decoder.com/anthropic-warns-claude-mythos-preview-finds-bugs-faster-than-developers-can-patch-them/) |
| 41 | + |
| 42 | +--- |
| 43 | + |
| 44 | +## Alibaba 最新 AI 模型自主运行 35 小时优化自研芯片代码 |
| 45 | + |
| 46 | +5 月 23 日,The Decoder 报道 Alibaba 的最新 AI 模型自主运行了 35 小时,为其自研芯片优化代码。 |
| 47 | + |
| 48 | +这标志着 AI 在硬件设计领域的自主化程度正在快速提升。AI 不再只是辅助工具,而是可以长时间自主完成复杂工程任务的"工程师"。 |
| 49 | + |
| 50 | +> **Awesome AI 观点:** 35 小时自主运行意味着 AI 可以跨越人类的工作时间限制,持续迭代和优化。这种"昼夜不停"的工程能力是 AI 在芯片设计等高复杂度领域产生实质性影响的关键。Alibaba 选择用 AI 优化自家芯片代码,说明 AI for Engineering 已经从概念走向了实际生产力。 |
| 51 | +
|
| 52 | +来源:[The Decoder](https://the-decoder.com/alibabas-latest-ai-model-ran-autonomously-for-35-hours-to-optimize-code-for-its-own-custom-chip/) |
| 53 | + |
| 54 | +--- |
| 55 | + |
| 56 | +## Anthropic 可能在五角大楼发出风险警告后继续向 NSA 供应 Claude |
| 57 | + |
| 58 | +5 月 24 日,The Decoder 报道尽管五角大楼将 Claude 标记为供应链风险,Anthropic 可能仍会继续向 NSA 供应 Claude 模型。 |
| 59 | + |
| 60 | +这反映了 AI 公司在国家安全需求与安全审查之间的复杂平衡。 |
| 61 | + |
| 62 | +> **Awesome AI 观点:** 供应链风险标记是一个严肃的安全信号,但 NSA 作为情报机构,对 AI 能力的需求是刚性的。Anthropic 面临的选择是:放弃一个重要的政府客户,还是冒着声誉风险继续合作。这也暴露了一个更大的问题——当 AI 模型成为国家安全基础设施的一部分时,"供应链安全"的定义需要被重新审视。 |
| 63 | +
|
| 64 | +来源:[The Decoder](https://the-decoder.com/anthropic-may-keep-supplying-claude-to-the-nsa-despite-being-flagged-as-a-supply-chain-risk-by-the-pentagon/) |
| 65 | + |
| 66 | +--- |
| 67 | + |
| 68 | +## Microsoft 发布 Webwright:终端原生 Web Agent 框架 |
| 69 | + |
| 70 | +5 月 24 日,Marktechpost 报道 Microsoft Research 发布 Webwright,一个终端原生的 Web Agent 框架,在 Odysseys 基准测试中得分 60.1%,远超基础 GPT-5.4 的 33.5%。 |
| 71 | + |
| 72 | +Webwright 代表了 Microsoft 在 Web Agent 方向的最新探索——让 AI 直接在终端环境中与 Web 交互,而非依赖浏览器 UI。 |
| 73 | + |
| 74 | +> **Awesome AI 观点:** 60.1% vs 33.5% 的提升幅度非常显著,说明专门的 Agent 框架比单纯调用基础模型有效得多。终端原生的设计思路也很有趣——比起在浏览器中模拟人类操作,直接在终端层处理 Web 交互更高效、更可编程。这是 Microsoft 在 AI Agent 赛道上的一步重要棋。 |
| 75 | +
|
| 76 | +来源:[Marktechpost](https://www.marktechpost.com/2026/05/24/microsoft-research-releases-webwright-a-terminal-native-web-agent-framework-that-scores-60-1-on-odysseys-up-from-base-gpt-5-4s-33-5/) |
| 77 | + |
| 78 | +--- |
| 79 | + |
| 80 | +## Microsoft 发布 Fara1.5:浏览器计算机使用 Agent 系列 |
| 81 | + |
| 82 | +5 月 22 日,Marktechpost 报道 Microsoft 发布 Fara1.5 系列(4B/9B/27B 参数),在 Online-Mind2Web 基准测试中超越 OpenAI Operator 和 Gemini 2.5 Computer Use。 |
| 83 | + |
| 84 | +Fara1.5 是 Microsoft 在"计算机使用"(Computer Use)方向的重要布局,提供从轻量到高性能的完整产品矩阵。 |
| 85 | + |
| 86 | +> **Awesome AI 观点:** 三个尺寸覆盖不同场景:4B 适合边缘部署,9B 平衡性能和成本,27B 追求极致表现。能同时在多个基准上超越 OpenAI 和 Google 的同类产品,说明 Microsoft 在 Computer Use 方向的投入已经进入了"能打"的阶段。这一赛道的竞争正在白热化。 |
| 87 | +
|
| 88 | +来源:[Marktechpost](https://www.marktechpost.com/2026/05/22/microsoft-releases-fara1-5-a-family-of-browser-computer-use-agents-4b-9b-27b-that-outperform-openai-operator-and-gemini-2-5-computer-use-on-online-mind2web/) |
| 89 | + |
| 90 | +--- |
| 91 | + |
| 92 | +## 研究人员让 Claude Code 自主发现人类可能想不出的 AI 缩放算法 |
| 93 | + |
| 94 | +5 月 24 日,The Decoder 报道研究人员让 Claude Code 自主发现了人类可能不会设计的 AI 缩放算法。 |
| 95 | + |
| 96 | +这是一个"AI 发现 AI 优化方案"的元场景——用 AI 编码工具来改进 AI 系统本身的训练方法。 |
| 97 | + |
| 98 | +> **Awesome AI 观点:** 这是 AI 自我迭代能力的又一个里程碑。当 AI 开始设计 AI 的训练算法时,我们离"AI 自我改进"的闭环又近了一步。关键问题不在于 AI 能不能做到,而在于人类能不能理解和验证这些 AI 设计的算法。可解释性在这个场景下变得更加重要。 |
| 99 | +
|
| 100 | +来源:[The Decoder](https://the-decoder.com/researchers-let-claude-code-discover-ai-scaling-algorithms-that-humans-probably-wouldnt-have-designed/) |
| 101 | + |
| 102 | +--- |
| 103 | + |
| 104 | +## NVIDIA 发布 Gated DeltaNet-2:解构 Delta 规则中的擦除和写入 |
| 105 | + |
| 106 | +5 月 24 日,Marktechpost 报道 NVIDIA AI 发布 Gated DeltaNet-2,一种线性注意力层,在 Delta 规则中解耦擦除和写入操作。 |
| 107 | + |
| 108 | +这是 NVIDIA 在高效序列建模方向的最新研究进展,旨在提升长序列处理的效率。 |
| 109 | + |
| 110 | +> **Awesome AI 观点:** 线性注意力是 Transformer 之外最有希望的序列建模替代方案之一。Gated DeltaNet-2 的核心创新在于将"记忆擦除"和"记忆写入"解耦——这类似于人类大脑中遗忘和学习的分离机制。如果这种架构能在大规模训练中验证效果,可能为下一代高效模型提供新的基础构件。 |
| 111 | +
|
| 112 | +来源:[Marktechpost](https://www.marktechpost.com/2026/05/24/nvidia-ai-releases-gated-deltanet-2-a-linear-attention-layer-that-decouples-erase-and-write-in-the-delta-rule/) |
| 113 | + |
| 114 | +--- |
| 115 | + |
| 116 | +## Google AI 眼镜上手体验:"几乎准备好了" |
| 117 | + |
| 118 | +5 月 22 日,TechCrunch 报道了对 Google AI 眼镜的上手体验,结论是产品"几乎准备好了"(almost there)。 |
| 119 | + |
| 120 | +Google 在 AI 硬件方向的探索终于有了一个接近成熟的产品形态。 |
| 121 | + |
| 122 | +> **Awesome AI 观点:** "Almost there"是一个有趣的定位——说明核心功能已经可用,但还有一些关键体验需要打磨。Google 眼镜的成败很大程度上取决于 AI 功能是否能提供超越手机的独特价值。如果只是把手机屏幕搬到眼前,那意义不大;但如果能在实时翻译、场景理解、环境感知等方面做出差异化,那将是一个全新的交互范式。 |
| 123 | +
|
| 124 | +来源:[TechCrunch](https://techcrunch.com/2026/05/22/we-tried-googles-ai-glasses-and-theyre-almost-there/) |
| 125 | + |
| 126 | +--- |
| 127 | + |
| 128 | +## OpenAI 推出 ChatGPT PowerPoint 插件,同时警告可能意外删除内容 |
| 129 | + |
| 130 | +5 月 22 日,The Decoder 报道 OpenAI 推出了 ChatGPT 的 PowerPoint 插件,但同时警告它可能会意外删除用户的内容。 |
| 131 | + |
| 132 | +这个坦诚的警告本身就是一个新闻——说明 AI 生成工具在可靠性上仍有明显短板。 |
| 133 | + |
| 134 | +> **Awesome AI 观点:** OpenAI 的坦诚值得肯定,但也暴露了 AI 工具在生产力场景中的一个核心问题:用户不能信任 AI 不会搞砸他们的工作。这不仅是技术问题,更是信任问题。在 AI 工具真正进入核心工作流之前,"可撤销性"和"安全保障"是必须解决的前置条件。 |
| 135 | +
|
| 136 | +来源:[The Decoder](https://the-decoder.com/openai-launches-a-chatgpt-powerpoint-plugin-and-warns-it-might-accidentally-delete-your-content/) |
| 137 | + |
| 138 | +--- |
| 139 | + |
| 140 | +## Google CEO 皮查伊重新定义搜索:链接只是搜索的"一部分" |
| 141 | + |
| 142 | +5 月 23 日,The Decoder 报道 Google CEO Sundar Pichai 现在将链接称为搜索的"一部分",重新定义了网页在其自身产品中的角色。 |
| 143 | + |
| 144 | +这可能是 Google 搜索历史上最重要的叙事转变之一——从"组织互联网信息"转向"直接提供答案"。 |
| 145 | + |
| 146 | +> **Awesome AI 观点:** 当 Google 开始淡化链接的重要性时,意味着 AI 生成答案正在替代传统的搜索结果页。这对整个互联网生态的影响是深远的:网站流量可能进一步向 Google 集中,内容创作者的分发渠道变得更加依赖于 AI 的"理解"而非搜索引擎的"索引"。 |
| 147 | +
|
| 148 | +来源:[The Decoder](https://the-decoder.com/google-ceo-pichai-now-calls-links-a-part-of-search-redefining-the-webs-role-in-its-own-product/) |
| 149 | + |
| 150 | +--- |
| 151 | + |
| 152 | +## 其他值得关注的 |
| 153 | + |
| 154 | +- **Tencent 开源 TencentDB Agent Memory**:一个 4 层本地记忆管线,为 AI Agent 提供结构化记忆能力。来源:[Marktechpost](https://www.marktechpost.com/2026/05/23/tencent-open-sources-tencentdb-agent-memory-a-4-tier-local-memory-pipeline-for-ai-agents/) |
| 155 | +- **Perplexity 开源 Bumblebee**:一个只读的开发者端点供应链扫描器,用于安全审计。来源:[Marktechpost](https://www.marktechpost.com/2026/05/23/perplexity-open-sources-bumblebee-a-read-only-supply-chain-scanner-for-developer-endpoints/) |
| 156 | +- **Nous Research 发布 CNA(对比神经元归因)**:无需 SAE 训练或权重修改的稀疏 MLP 电路引导方法。来源:[Marktechpost](https://www.marktechpost.com/2026/05/23/nous-research-releases-contrastive-neuron-attribution-cna-sparse-mlp-circuit-steering-without-sae-training-or-weight-modification/) |
| 157 | +- **VentureBeat 报道 Google 25 年来首次重新设计搜索框**。来源:[VentureBeat](https://venturebeat.com/technology/google-just-redesigned-the-search-box-for-the-first-time-in-25-years-heres-why-it-matters-more-than-you-think) |
| 158 | +- **TechCrunch 报道 Spotify 的 AI 赌注**:更多内容,但可能不是你想要的。来源:[TechCrunch](https://techcrunch.com/2026/05/22/spotifys-ai-bet-more-of-everything-less-of-what-you-want/) |
| 159 | +- **TechCrunch 报道 Ferrari 使用 IBM AI 打造 F1 超级粉丝**。来源:[TechCrunch](https://techcrunch.com/2026/05/23/ferrari-is-using-ai-to-create-f1-superfans/) |
| 160 | +- **TechCrunch 报道 AI 被用于"复活"已故飞行员的声音**。来源:[TechCrunch](https://techcrunch.com/2026/05/22/ai-is-being-used-to-resurrect-the-voices-of-dead-pilots/) |
| 161 | +- **The Decoder 报道世界顶尖法学院之一对 AI 在法律教育中的使用划下红线**。来源:[The Decoder](https://the-decoder.com/one-of-the-worlds-top-law-schools-draws-a-hard-line-against-ai-in-legal-education/) |
| 162 | +- **36 氪报道 Moka 推出三款 AI HR 工具**,用 AI 来管理公司。来源:[36 氪](https://36kr.com/p/3819979202253189) |
| 163 | +- **36 氪报道对话王小川**:离开通用人工智能的主干道之后。来源:[36 氪](https://36kr.com/p/3821521291038856) |
| 164 | + |
| 165 | +--- |
| 166 | + |
| 167 | +## 一句话总结 |
| 168 | + |
| 169 | +DeepSeek 把价格战打成了持久战,Anthropic 的 Claude 找 bug 比人修 bug 还快,Microsoft 在 Agent 框架上密集布局,Google 的 AI 硬件和搜索叙事都在发生关键转变。AI 的竞争已经从"谁更强"扩展到了"谁更便宜"和"谁能自主干活"。 |
0 commit comments