Skip to content

Commit ab98dae

Browse files
committed
docs: add daily news 2026-05-23
1 parent 3828df6 commit ab98dae

1 file changed

Lines changed: 37 additions & 35 deletions

File tree

src/content/daily/2026-05-23.md

Lines changed: 37 additions & 35 deletions
Original file line numberDiff line numberDiff line change
@@ -1,74 +1,76 @@
11
---
22
title: "Awesome AI 日报 | 2026-05-23"
33
date: "2026-05-23"
4-
tags: ["Agent", "大模型", "空间智能", "AI编程", "AI影视", "具身智能", "企业AI"]
5-
summary: "李飞飞团队发布空间智能基准ESI-Bench;DeepSeek Code即将上线,融资额达700亿;360推出安全龙虾云端版与龙虾教练;MovieFlow Studio实现80集短剧3天拍完;三大运营商Token套餐落地参差;研究人员提出DCI技术让AI Agent直接操作终端;兔展智能SkillsUI完成F轮融资"
4+
tags: ["DeepSeek", "OpenAI", "智谱", "具身智能", "ARM", "Codex", "李飞飞"]
5+
summary: "DeepSeek V4-Pro API永久降价至1/4,宁德时代京东网易洽谈参投估值450亿美元;OpenAI工程师发布Codex-maxxing实战指南;智谱GLM-5.1高速版API达400 tokens/s;李飞飞团队发布空间智能基准ESI-Bench;ARM股价暴涨30%进军AI芯片;美团外卖前负责人创立元节智能获千万融资"
66
---
77

8-
## 1. 李飞飞团队发布ESI-Bench:空间智能的「ImageNet」来了
8+
## 1. DeepSeek V4-Pro API永久降价至1/4,宁德时代等洽谈参投估值450亿美元
99

10-
李飞飞团队最新发布ESI-Bench——一个专门用来评测具身空间智能的新基准。与以往空间智能评测默认给模型最优观测不同,ESI-Bench首次把观察者变成行动者,闭合了感知-行动回路。该基准包含10个任务类别、29个子类别、3081个任务实例,覆盖人类核心空间认知能力的四大维度。测试发现当前AI模型存在"动作盲视"和元认知缺陷——模型不知道自己看没看够信息就过早做出判断
10+
DeepSeek官方宣布,DeepSeek-V4-Pro模型API价格将于5月31日结束2.5折优惠后,正式永久调整为原定价的1/4(输入缓存命中0.025元/百万Token,缓存未命中3元,输出6元)。与此同时,据彭博社和The Information报道,DeepSeek正在推进约700亿元融资,估值已达450亿美元。宁德时代、京东、网易等均在洽谈参投,创始人梁文锋明确表示目标是追求AGI而非短期商业化变现
1111

12-
> **Awesome AI 观点:** ESI-Bench的意义在于它揭示了空间智能的真正瓶颈不是视觉感知,而是主动探索策略。这对具身智能和机器人领域的研究方向有重要指导意义——与其继续堆叠视觉模型参数,不如研究如何让AI学会"知道自己不知道"
12+
> **Awesome AI 观点:** 一边向投资者要钱,一边向开发者让利,DeepSeek的"开源普惠"策略正在形成飞轮效应。宁德时代这家全球最大电池厂商入场投资AI公司,标志着AI竞赛已从模型层、芯片层向下蔓延至电力、储能等物理基础设施层
1313
14-
来源:[量子位](https://www.qbitai.com/2026/05/422738.html) | 2026-05-22
14+
来源:[量子位](https://www.qbitai.com/2026/05/423162.html) | 2026-05-23
1515

16-
## 2. DeepSeek Code真要来了,融资额达700亿,ACM金牌大神崔添翼挂帅
16+
## 2. OpenAI Codex周活破400万,工程师发布Codex-maxxing实战指南
1717

18-
DeepSeek融资额已飙升至700亿元,管理层向潜在投资者表示优先考虑突破性AI研究而非短期商业化。同时,DeepSeek资深研究员Deli Chen亲自发帖招聘"从零开始构建Code Harness"的团队,官方招聘网站密集放出10+个Agent Harness相关岗位。今年3月加入DeepSeek的前TSY Capital联合创始人崔添翼或将出任Agent Harness团队负责人
18+
OpenAI Codex团队新成员Jason Liu(13k星开源库Instructor作者)发布"Codex-maxxing"深度使用指南,展示如何让Codex持续接管工作:开跨月存活线程、Heartbeats定时调度、@computer控制网页自动渲染、锁屏后远程干活等。Codex周活用户4月底已突破400万,Goal模式已从实验版转正,用户只需明确目标和验收标准,Codex可自主持续推进数小时到数天
1919

20-
> **Awesome AI 观点:** DeepSeek Code的入局将重塑AI编程工具市场格局。在Claude Code、Codex、Cursor已占据先发优势的情况下,DeepSeek若能以开源策略+高性价比模型切入,可能成为AI编程领域的又一个"DeepSeek时刻"
20+
> **Awesome AI 观点:** Codex从"代码工具"到"AI员工"的转变正在加速。Jason的用法揭示了Agent落地的关键路径:持续工作线程+本地知识管理+验证闭环。当AI可以"你下班它加班"时,人和AI的协作模式将发生根本性变化
2121
22-
来源:[量子位](https://www.qbitai.com/2026/05/422624.html) | 2026-05-22
22+
来源:[量子位](https://www.qbitai.com/2026/05/423179.html) | 2026-05-23
2323

24-
## 3. 360推出安全龙虾云端版+龙虾教练,周鸿祎直言Agent太难太贵不安全
24+
## 3. 美团外卖前负责人入局餐饮具身智能,元节智能获千万级种子轮
2525

26-
360发布安全龙虾云端版,为Agent配备云端主机、云盘、云浏览器等"云端办公室",关机断网也能持续运行。同时推出"龙虾教练"功能,用户通过自然对话即可在2分钟内训出一只专属Agent,无需写配置代码。周鸿祎总结当前Agent落地的三大痛点:太难、太贵、不安全,360的定位是给Agent补基础设施
26+
具身智能初创公司「元节智能(AtomBite.AI)」完成千万级种子轮融资,由英诺科创基金领投。公司创始人王栋博士为前美团外卖事业部技术负责人,师从清华张钹院士。元节智能选择不造人形机器人,专注餐饮后厨场景,核心产品为"世界动作模型(WAM)"——让机器人在执行前先预演动作后果,从外卖打包与接驳切入,最终目标构建数字孪生后厨操作系统
2727

28-
> **Awesome AI 观点:** 360的思路代表了一个重要趋势——Agent的价值已经从框架本身转向执行过程中沉淀的决策经验。云端化和专家化正在成为Agent落地的实际路径,"从装上了到真能用"才是下半场的关键赛点
28+
> **Awesome AI 观点:** 具身智能正在从"通用人形"走向"垂直场景"。餐饮后厨这个看似不性感的赛道,恰恰是最具确定性的商业落地方向——需求全球共通、痛点尖锐、商业模型可验证
2929
30-
来源:[量子位](https://www.qbitai.com/2026/05/422811.html) | 2026-05-22
30+
来源:[量子位](https://www.qbitai.com/2026/05/423159.html) | 2026-05-23
3131

32-
## 4. MovieFlow Studio:80集短剧3天拍完,AI影视工业化新解法
32+
## 4. 智谱GLM-5.1高速版API发布,400 tokens/s顶流最快
3333

34-
由影视行业二十年经验的电影人团队打造的MovieFlow Studio,将剧本解析、分镜、影像生成、时间线剪辑等分散在十几个工具里的流程全部收进一个工作台。实测数据显示:百万字剧本3分钟完成结构化拆解,单日最高可生产20集内容,整部80集剧集全周期仅需3天,Token消耗降低70%以上,角色统一度达95%
34+
智谱发布GLM-5.1-highspeed高速版API,推理速度达400 tokens/s,为当前顶流模型中最快的API。该模型由智谱GLM团队与TileRT团队联合打造,在推理引擎、调度系统和底层基础设施三个层面做了系统优化。实测中,10秒即可完成万字内容多任务处理,AI写代码体验接近实时协作
3535

36-
> **Awesome AI 观点:** AI影视的瓶颈从来不是生成能力,而是工业化生产流程。MovieFlow Studio的全链路闭环思路说明:当技术跨过"能生成"阶段后,真正的竞争壁垒在于资产管理、协作管理和成本控制
36+
> **Awesome AI 观点:** 高速API的意义常被低估。当旗舰模型能力和高速推理系统叠加,AI Agent的体验从"等待-反馈"变为"实时打磨",这将催生一批此前因延迟而无法成立的产品形态,如游戏实时世界状态改变、交互式设计协作等
3737
38-
来源:[量子位](https://www.qbitai.com/2026/05/422455.html) | 2026-05-22
38+
来源:[量子位](https://www.qbitai.com/2026/05/422511.html) | 2026-05-22
3939

40-
## 5. 三大运营商Token套餐:电信全面开售,移动联通暂未落地
40+
## 5. 李飞飞团队发布ESI-Bench:空间智能的「ImageNet」来了
4141

42-
中国电信、中国联通、中国移动集中推出Token套餐,将AI算力以话费账单支付方式推向消费者。记者实地走访发现,电信线下营业厅已备妥价格表并推出限时促销(最低25万Token标价1元),而移动和联通一线工作人员多表示未接到通知,商业化全流程仍待完善
42+
李飞飞团队发布ESI-Bench——首个把"观察者"变成"行动者"的具身空间智能评测基准,包含3081个任务实例。核心发现:当前AI存在"动作盲视"(差动作→差视角→更差动作的级联失败)和元认知缺陷(模型不知道自己看没看够就过早判断)。Gemini在部分遮挡任务上主动探索达88.4%,远超人类87.4%,但物理接触任务中GPT-5仅64.2%(人类88.3%)
4343

44-
> **Awesome AI 观点:** 从卖语音到卖流量再到卖Token,三大运营商正在完成第三次业务范式切换。但宣传声势与一线落地之间的落差表明,Token作为AI时代的基础设施商品,其定价模型、渠道体系和用户教育都还处在极早期
44+
> **Awesome AI 观点:** ESI-Bench揭示了一个关键事实:空间智能的卡点不在于视觉模型不够强,而是行动策略几乎为零。模型缺乏"怀疑机制",无法评估信息是否充分——这是一个仅靠更强视觉编码器无法解决的底层挑战
4545
46-
来源:[36氪](https://36kr.com/p/3820131718402434) | 2026-05-22
46+
来源:[量子位](https://www.qbitai.com/2026/05/422738.html) | 2026-05-22
4747

48-
## 6. DCI技术:让AI Agent直接操作终端,绕过向量数据库
48+
## 6. ARM股价暴涨30%,AGI CPU 6周需求翻倍至20亿美元
4949

50-
多所大学研究人员提出"直接语料库交互"(DCI)技术,让AI Agent绕过嵌入模型,直接使用grep、find等命令行工具搜索原始语料。DCI-Agent-Lite基于GPT-5.4 nano模型,DCI-Agent-CC基于Claude Sonnet 4.6。研究指出语义检索在多步任务中会成为瓶颈,因为"它们过早决定了Agent能看到什么"
50+
ARM股价三周涨27%,5月21日单日暴涨超15%触及259美元新高。核心驱动力是公司35年来首次自己造芯片——AGI CPU专为AI Agent场景设计,首批客户包括Meta、OpenAI、Cerebras等。6周内客户承诺需求从10亿翻倍至20亿美元。Bernstein首次覆盖即给出300美元目标价,预计到2030年服务器CPU市场将扩大4倍至1370亿美元
5151

52-
> **Awesome AI 观点:** DCI的核心洞察是:企业环境中的数据是实时变化的日志、工单和代码提交,而非静态文档集合。向量索引永远是一个快照,而Agent需要的是对当前状态的实时感知。这是一个被长期忽视的关键问题
52+
> **Awesome AI 观点:** Agentic AI正在改写数据中心的底层逻辑。当CPU:GPU配比从1:8变成1:1,CPU从配角变成"调度中心"。ARM从"卖图纸收税"到"造芯片卖基础设施"的转型,本质上是在押注AI Agent时代的到来
5353
54-
来源:[VentureBeat](https://venturebeat.com/orchestration/your-ai-agents-need-a-terminal-not-just-a-vector-database) | 2026-05-22
54+
来源:[极客公园](https://www.geekpark.net/news/364681) | 2026-05-22
5555

56-
## 7. 兔展智能SkillsUI完成F轮融资,4100万用户的企业AI入口层
56+
## 7. OpenAI被曝本周启动IPO,冲刺9月上市
5757

58-
深圳兔展智能发布SkillsUI平台,通过API将企业已有ERP、OA、CRM等系统拆解为可被AI调用的Skill,实现"对话即办事"。用户只需说出需求,AI自动识别意图、路由分发、调用流程、回显卡片。该平台已完成F轮融资,服务超过4100万用户,自研"兔灵"大模型是广东省首个完成备案的视觉空间智能大模型
58+
据极客早知道报道,OpenAI已在本周正式启动IPO流程,目标在9月完成上市。这将是AI行业有史以来规模最大的IPO之一。与此同时,Google宣布在AI模式下加入更多广告,引发用户对AI搜索商业化的讨论
5959

60-
> **Awesome AI 观点:** SkillsUI代表了企业AI落地的正确路径——不替代旧系统,而是给旧系统加一个AI入口层。"人找系统"到"AI替人调系统"的转变,将是企业IT架构在未来三年最大的范式转换
60+
> **Awesome AI 观点:** OpenAI IPO标志着AI行业从"烧钱竞赛"进入"资本回报"阶段。上市后,OpenAI将面临更严格的盈利压力,这可能影响其在AGI研究上的投入节奏
6161
62-
来源:[量子位](https://www.qbitai.com/2026/05/422615.html) | 2026-05-22
62+
来源:[极客公园](https://www.geekpark.net/news/364611) | 2026-05-22
6363

64-
## 8. Kore.ai推出Artemis AI Agent平台,挑战Salesforce和ServiceNow
64+
## 8. 英伟达Vera CPU首批交付Anthropic、OpenAI等,CPU市场战火升级
6565

66-
Kore.ai发布Artemis AI Agent平台,以中立性和专有中间语言为核心策略,押注AI而非人类开发者应承担Agent构建的主要工作。该平台在各大科技厂商竞相成为企业AI Agent默认基础设施的背景下入场,强调让AI完成大部分繁重工作
66+
英伟达副总裁Ian Buck于5月19日将首批Vera CPU系统交付给Anthropic、OpenAI、Oracle和SpaceXAI。Vera CPU基于ARM架构,作为独立产品出售。这与ARM发布AGI CPU形成呼应——GPU巨头和IP授权巨头在同一个月杀入CPU市场,共同验证了"Agentic AI重塑CPU需求"的判断
6767

68-
> **Awesome AI 观点:** 企业AI Agent平台战正在升温。Kore.ai的"中立性"策略直击痛点——企业不希望被单一厂商锁定。但真正的壁垒不在于平台本身,而在于谁能积累最多行业know-how并沉淀为可复用的决策经验
68+
> **Awesome AI 观点:** 当GPU巨头开始卖CPU,说明AI数据中心的瓶颈正在转移。Vera CPU和AGI CPU的双重入场,预示着CPU将在AI Agent时代迎来价值重估
6969
70-
来源:[VentureBeat](https://venturebeat.com/technology/kore-ai-launches-artemis-ai-agent-platform-expands-challenge-to-microsoft-and-salesforce) | 2026-05-22
70+
来源:[极客公园](https://www.geekpark.net/news/364681) | 2026-05-22
7171

7272
## 其他动态
7373

74-
- **Alibaba Qwen3.7-Max** 可在Apex Math Reasoning基准测试中以44.5分超越Claude Opus-4.6 Max(34.5分),支持35小时自主运行和外部Harness集成。(来源:[VentureBeat](https://venturebeat.com/technology/alibabas-proprietary-qwen3-7-max-can-run-for-35-hours-autonomously-and-supports-external-harnesses-like-anthropics-claude-code) | 2026-05-22)
74+
- **周鸿祎"云端龙虾"**:360发布安全龙虾云端版,为Agent配备云端办公室,同时推出"龙虾教练",用户2分钟即可训出专属Agent。(来源:[量子位](https://www.qbitai.com/2026/05/422811.html) | 2026-05-22)
75+
- **DeepSeek Code团队密集招聘**:DeepSeek 1天内放出10+个Agent Harness相关岗位,资深研究员Deli Chen亲自招聘"从零构建Code Harness"团队。(来源:[量子位](https://www.qbitai.com/2026/05/422624.html) | 2026-05-22)
76+
- **马斯克身家或达1.1万亿美元**:人类首个万亿富豪即将诞生。(来源:[极客公园](https://www.geekpark.net/news/364611) | 2026-05-22)

0 commit comments

Comments
 (0)