|
1 | 1 | --- |
2 | 2 | title: "Awesome AI 日报 | 2026-05-23" |
3 | 3 | date: "2026-05-23" |
4 | | -tags: ["Agent", "大模型", "空间智能", "AI编程", "AI影视", "具身智能", "企业AI"] |
5 | | -summary: "李飞飞团队发布空间智能基准ESI-Bench;DeepSeek Code即将上线,融资额达700亿;360推出安全龙虾云端版与龙虾教练;MovieFlow Studio实现80集短剧3天拍完;三大运营商Token套餐落地参差;研究人员提出DCI技术让AI Agent直接操作终端;兔展智能SkillsUI完成F轮融资。" |
| 4 | +tags: ["DeepSeek", "OpenAI", "智谱", "具身智能", "ARM", "Codex", "李飞飞"] |
| 5 | +summary: "DeepSeek V4-Pro API永久降价至1/4,宁德时代京东网易洽谈参投估值450亿美元;OpenAI工程师发布Codex-maxxing实战指南;智谱GLM-5.1高速版API达400 tokens/s;李飞飞团队发布空间智能基准ESI-Bench;ARM股价暴涨30%进军AI芯片;美团外卖前负责人创立元节智能获千万融资。" |
6 | 6 | --- |
7 | 7 |
|
8 | | -## 1. 李飞飞团队发布ESI-Bench:空间智能的「ImageNet」来了 |
| 8 | +## 1. DeepSeek V4-Pro API永久降价至1/4,宁德时代等洽谈参投估值450亿美元 |
9 | 9 |
|
10 | | -李飞飞团队最新发布ESI-Bench——一个专门用来评测具身空间智能的新基准。与以往空间智能评测默认给模型最优观测不同,ESI-Bench首次把观察者变成行动者,闭合了感知-行动回路。该基准包含10个任务类别、29个子类别、3081个任务实例,覆盖人类核心空间认知能力的四大维度。测试发现当前AI模型存在"动作盲视"和元认知缺陷——模型不知道自己看没看够信息就过早做出判断。 |
| 10 | +DeepSeek官方宣布,DeepSeek-V4-Pro模型API价格将于5月31日结束2.5折优惠后,正式永久调整为原定价的1/4(输入缓存命中0.025元/百万Token,缓存未命中3元,输出6元)。与此同时,据彭博社和The Information报道,DeepSeek正在推进约700亿元融资,估值已达450亿美元。宁德时代、京东、网易等均在洽谈参投,创始人梁文锋明确表示目标是追求AGI而非短期商业化变现。 |
11 | 11 |
|
12 | | -> **Awesome AI 观点:** ESI-Bench的意义在于它揭示了空间智能的真正瓶颈不是视觉感知,而是主动探索策略。这对具身智能和机器人领域的研究方向有重要指导意义——与其继续堆叠视觉模型参数,不如研究如何让AI学会"知道自己不知道"。 |
| 12 | +> **Awesome AI 观点:** 一边向投资者要钱,一边向开发者让利,DeepSeek的"开源普惠"策略正在形成飞轮效应。宁德时代这家全球最大电池厂商入场投资AI公司,标志着AI竞赛已从模型层、芯片层向下蔓延至电力、储能等物理基础设施层。 |
13 | 13 |
|
14 | | -来源:[量子位](https://www.qbitai.com/2026/05/422738.html) | 2026-05-22 |
| 14 | +来源:[量子位](https://www.qbitai.com/2026/05/423162.html) | 2026-05-23 |
15 | 15 |
|
16 | | -## 2. DeepSeek Code真要来了,融资额达700亿,ACM金牌大神崔添翼挂帅 |
| 16 | +## 2. OpenAI Codex周活破400万,工程师发布Codex-maxxing实战指南 |
17 | 17 |
|
18 | | -DeepSeek融资额已飙升至700亿元,管理层向潜在投资者表示优先考虑突破性AI研究而非短期商业化。同时,DeepSeek资深研究员Deli Chen亲自发帖招聘"从零开始构建Code Harness"的团队,官方招聘网站密集放出10+个Agent Harness相关岗位。今年3月加入DeepSeek的前TSY Capital联合创始人崔添翼或将出任Agent Harness团队负责人。 |
| 18 | +OpenAI Codex团队新成员Jason Liu(13k星开源库Instructor作者)发布"Codex-maxxing"深度使用指南,展示如何让Codex持续接管工作:开跨月存活线程、Heartbeats定时调度、@computer控制网页自动渲染、锁屏后远程干活等。Codex周活用户4月底已突破400万,Goal模式已从实验版转正,用户只需明确目标和验收标准,Codex可自主持续推进数小时到数天。 |
19 | 19 |
|
20 | | -> **Awesome AI 观点:** DeepSeek Code的入局将重塑AI编程工具市场格局。在Claude Code、Codex、Cursor已占据先发优势的情况下,DeepSeek若能以开源策略+高性价比模型切入,可能成为AI编程领域的又一个"DeepSeek时刻"。 |
| 20 | +> **Awesome AI 观点:** Codex从"代码工具"到"AI员工"的转变正在加速。Jason的用法揭示了Agent落地的关键路径:持续工作线程+本地知识管理+验证闭环。当AI可以"你下班它加班"时,人和AI的协作模式将发生根本性变化。 |
21 | 21 |
|
22 | | -来源:[量子位](https://www.qbitai.com/2026/05/422624.html) | 2026-05-22 |
| 22 | +来源:[量子位](https://www.qbitai.com/2026/05/423179.html) | 2026-05-23 |
23 | 23 |
|
24 | | -## 3. 360推出安全龙虾云端版+龙虾教练,周鸿祎直言Agent太难太贵不安全 |
| 24 | +## 3. 美团外卖前负责人入局餐饮具身智能,元节智能获千万级种子轮 |
25 | 25 |
|
26 | | -360发布安全龙虾云端版,为Agent配备云端主机、云盘、云浏览器等"云端办公室",关机断网也能持续运行。同时推出"龙虾教练"功能,用户通过自然对话即可在2分钟内训出一只专属Agent,无需写配置代码。周鸿祎总结当前Agent落地的三大痛点:太难、太贵、不安全,360的定位是给Agent补基础设施。 |
| 26 | +具身智能初创公司「元节智能(AtomBite.AI)」完成千万级种子轮融资,由英诺科创基金领投。公司创始人王栋博士为前美团外卖事业部技术负责人,师从清华张钹院士。元节智能选择不造人形机器人,专注餐饮后厨场景,核心产品为"世界动作模型(WAM)"——让机器人在执行前先预演动作后果,从外卖打包与接驳切入,最终目标构建数字孪生后厨操作系统。 |
27 | 27 |
|
28 | | -> **Awesome AI 观点:** 360的思路代表了一个重要趋势——Agent的价值已经从框架本身转向执行过程中沉淀的决策经验。云端化和专家化正在成为Agent落地的实际路径,"从装上了到真能用"才是下半场的关键赛点。 |
| 28 | +> **Awesome AI 观点:** 具身智能正在从"通用人形"走向"垂直场景"。餐饮后厨这个看似不性感的赛道,恰恰是最具确定性的商业落地方向——需求全球共通、痛点尖锐、商业模型可验证。 |
29 | 29 |
|
30 | | -来源:[量子位](https://www.qbitai.com/2026/05/422811.html) | 2026-05-22 |
| 30 | +来源:[量子位](https://www.qbitai.com/2026/05/423159.html) | 2026-05-23 |
31 | 31 |
|
32 | | -## 4. MovieFlow Studio:80集短剧3天拍完,AI影视工业化新解法 |
| 32 | +## 4. 智谱GLM-5.1高速版API发布,400 tokens/s顶流最快 |
33 | 33 |
|
34 | | -由影视行业二十年经验的电影人团队打造的MovieFlow Studio,将剧本解析、分镜、影像生成、时间线剪辑等分散在十几个工具里的流程全部收进一个工作台。实测数据显示:百万字剧本3分钟完成结构化拆解,单日最高可生产20集内容,整部80集剧集全周期仅需3天,Token消耗降低70%以上,角色统一度达95%。 |
| 34 | +智谱发布GLM-5.1-highspeed高速版API,推理速度达400 tokens/s,为当前顶流模型中最快的API。该模型由智谱GLM团队与TileRT团队联合打造,在推理引擎、调度系统和底层基础设施三个层面做了系统优化。实测中,10秒即可完成万字内容多任务处理,AI写代码体验接近实时协作。 |
35 | 35 |
|
36 | | -> **Awesome AI 观点:** AI影视的瓶颈从来不是生成能力,而是工业化生产流程。MovieFlow Studio的全链路闭环思路说明:当技术跨过"能生成"阶段后,真正的竞争壁垒在于资产管理、协作管理和成本控制。 |
| 36 | +> **Awesome AI 观点:** 高速API的意义常被低估。当旗舰模型能力和高速推理系统叠加,AI Agent的体验从"等待-反馈"变为"实时打磨",这将催生一批此前因延迟而无法成立的产品形态,如游戏实时世界状态改变、交互式设计协作等。 |
37 | 37 |
|
38 | | -来源:[量子位](https://www.qbitai.com/2026/05/422455.html) | 2026-05-22 |
| 38 | +来源:[量子位](https://www.qbitai.com/2026/05/422511.html) | 2026-05-22 |
39 | 39 |
|
40 | | -## 5. 三大运营商Token套餐:电信全面开售,移动联通暂未落地 |
| 40 | +## 5. 李飞飞团队发布ESI-Bench:空间智能的「ImageNet」来了 |
41 | 41 |
|
42 | | -中国电信、中国联通、中国移动集中推出Token套餐,将AI算力以话费账单支付方式推向消费者。记者实地走访发现,电信线下营业厅已备妥价格表并推出限时促销(最低25万Token标价1元),而移动和联通一线工作人员多表示未接到通知,商业化全流程仍待完善。 |
| 42 | +李飞飞团队发布ESI-Bench——首个把"观察者"变成"行动者"的具身空间智能评测基准,包含3081个任务实例。核心发现:当前AI存在"动作盲视"(差动作→差视角→更差动作的级联失败)和元认知缺陷(模型不知道自己看没看够就过早判断)。Gemini在部分遮挡任务上主动探索达88.4%,远超人类87.4%,但物理接触任务中GPT-5仅64.2%(人类88.3%)。 |
43 | 43 |
|
44 | | -> **Awesome AI 观点:** 从卖语音到卖流量再到卖Token,三大运营商正在完成第三次业务范式切换。但宣传声势与一线落地之间的落差表明,Token作为AI时代的基础设施商品,其定价模型、渠道体系和用户教育都还处在极早期。 |
| 44 | +> **Awesome AI 观点:** ESI-Bench揭示了一个关键事实:空间智能的卡点不在于视觉模型不够强,而是行动策略几乎为零。模型缺乏"怀疑机制",无法评估信息是否充分——这是一个仅靠更强视觉编码器无法解决的底层挑战。 |
45 | 45 |
|
46 | | -来源:[36氪](https://36kr.com/p/3820131718402434) | 2026-05-22 |
| 46 | +来源:[量子位](https://www.qbitai.com/2026/05/422738.html) | 2026-05-22 |
47 | 47 |
|
48 | | -## 6. DCI技术:让AI Agent直接操作终端,绕过向量数据库 |
| 48 | +## 6. ARM股价暴涨30%,AGI CPU 6周需求翻倍至20亿美元 |
49 | 49 |
|
50 | | -多所大学研究人员提出"直接语料库交互"(DCI)技术,让AI Agent绕过嵌入模型,直接使用grep、find等命令行工具搜索原始语料。DCI-Agent-Lite基于GPT-5.4 nano模型,DCI-Agent-CC基于Claude Sonnet 4.6。研究指出语义检索在多步任务中会成为瓶颈,因为"它们过早决定了Agent能看到什么"。 |
| 50 | +ARM股价三周涨27%,5月21日单日暴涨超15%触及259美元新高。核心驱动力是公司35年来首次自己造芯片——AGI CPU专为AI Agent场景设计,首批客户包括Meta、OpenAI、Cerebras等。6周内客户承诺需求从10亿翻倍至20亿美元。Bernstein首次覆盖即给出300美元目标价,预计到2030年服务器CPU市场将扩大4倍至1370亿美元。 |
51 | 51 |
|
52 | | -> **Awesome AI 观点:** DCI的核心洞察是:企业环境中的数据是实时变化的日志、工单和代码提交,而非静态文档集合。向量索引永远是一个快照,而Agent需要的是对当前状态的实时感知。这是一个被长期忽视的关键问题。 |
| 52 | +> **Awesome AI 观点:** Agentic AI正在改写数据中心的底层逻辑。当CPU:GPU配比从1:8变成1:1,CPU从配角变成"调度中心"。ARM从"卖图纸收税"到"造芯片卖基础设施"的转型,本质上是在押注AI Agent时代的到来。 |
53 | 53 |
|
54 | | -来源:[VentureBeat](https://venturebeat.com/orchestration/your-ai-agents-need-a-terminal-not-just-a-vector-database) | 2026-05-22 |
| 54 | +来源:[极客公园](https://www.geekpark.net/news/364681) | 2026-05-22 |
55 | 55 |
|
56 | | -## 7. 兔展智能SkillsUI完成F轮融资,4100万用户的企业AI入口层 |
| 56 | +## 7. OpenAI被曝本周启动IPO,冲刺9月上市 |
57 | 57 |
|
58 | | -深圳兔展智能发布SkillsUI平台,通过API将企业已有ERP、OA、CRM等系统拆解为可被AI调用的Skill,实现"对话即办事"。用户只需说出需求,AI自动识别意图、路由分发、调用流程、回显卡片。该平台已完成F轮融资,服务超过4100万用户,自研"兔灵"大模型是广东省首个完成备案的视觉空间智能大模型。 |
| 58 | +据极客早知道报道,OpenAI已在本周正式启动IPO流程,目标在9月完成上市。这将是AI行业有史以来规模最大的IPO之一。与此同时,Google宣布在AI模式下加入更多广告,引发用户对AI搜索商业化的讨论。 |
59 | 59 |
|
60 | | -> **Awesome AI 观点:** SkillsUI代表了企业AI落地的正确路径——不替代旧系统,而是给旧系统加一个AI入口层。"人找系统"到"AI替人调系统"的转变,将是企业IT架构在未来三年最大的范式转换。 |
| 60 | +> **Awesome AI 观点:** OpenAI IPO标志着AI行业从"烧钱竞赛"进入"资本回报"阶段。上市后,OpenAI将面临更严格的盈利压力,这可能影响其在AGI研究上的投入节奏。 |
61 | 61 |
|
62 | | -来源:[量子位](https://www.qbitai.com/2026/05/422615.html) | 2026-05-22 |
| 62 | +来源:[极客公园](https://www.geekpark.net/news/364611) | 2026-05-22 |
63 | 63 |
|
64 | | -## 8. Kore.ai推出Artemis AI Agent平台,挑战Salesforce和ServiceNow |
| 64 | +## 8. 英伟达Vera CPU首批交付Anthropic、OpenAI等,CPU市场战火升级 |
65 | 65 |
|
66 | | -Kore.ai发布Artemis AI Agent平台,以中立性和专有中间语言为核心策略,押注AI而非人类开发者应承担Agent构建的主要工作。该平台在各大科技厂商竞相成为企业AI Agent默认基础设施的背景下入场,强调让AI完成大部分繁重工作。 |
| 66 | +英伟达副总裁Ian Buck于5月19日将首批Vera CPU系统交付给Anthropic、OpenAI、Oracle和SpaceXAI。Vera CPU基于ARM架构,作为独立产品出售。这与ARM发布AGI CPU形成呼应——GPU巨头和IP授权巨头在同一个月杀入CPU市场,共同验证了"Agentic AI重塑CPU需求"的判断。 |
67 | 67 |
|
68 | | -> **Awesome AI 观点:** 企业AI Agent平台战正在升温。Kore.ai的"中立性"策略直击痛点——企业不希望被单一厂商锁定。但真正的壁垒不在于平台本身,而在于谁能积累最多行业know-how并沉淀为可复用的决策经验。 |
| 68 | +> **Awesome AI 观点:** 当GPU巨头开始卖CPU,说明AI数据中心的瓶颈正在转移。Vera CPU和AGI CPU的双重入场,预示着CPU将在AI Agent时代迎来价值重估。 |
69 | 69 |
|
70 | | -来源:[VentureBeat](https://venturebeat.com/technology/kore-ai-launches-artemis-ai-agent-platform-expands-challenge-to-microsoft-and-salesforce) | 2026-05-22 |
| 70 | +来源:[极客公园](https://www.geekpark.net/news/364681) | 2026-05-22 |
71 | 71 |
|
72 | 72 | ## 其他动态 |
73 | 73 |
|
74 | | -- **Alibaba Qwen3.7-Max** 可在Apex Math Reasoning基准测试中以44.5分超越Claude Opus-4.6 Max(34.5分),支持35小时自主运行和外部Harness集成。(来源:[VentureBeat](https://venturebeat.com/technology/alibabas-proprietary-qwen3-7-max-can-run-for-35-hours-autonomously-and-supports-external-harnesses-like-anthropics-claude-code) | 2026-05-22) |
| 74 | +- **周鸿祎"云端龙虾"**:360发布安全龙虾云端版,为Agent配备云端办公室,同时推出"龙虾教练",用户2分钟即可训出专属Agent。(来源:[量子位](https://www.qbitai.com/2026/05/422811.html) | 2026-05-22) |
| 75 | +- **DeepSeek Code团队密集招聘**:DeepSeek 1天内放出10+个Agent Harness相关岗位,资深研究员Deli Chen亲自招聘"从零构建Code Harness"团队。(来源:[量子位](https://www.qbitai.com/2026/05/422624.html) | 2026-05-22) |
| 76 | +- **马斯克身家或达1.1万亿美元**:人类首个万亿富豪即将诞生。(来源:[极客公园](https://www.geekpark.net/news/364611) | 2026-05-22) |
0 commit comments