Skip to content

Commit 3d61341

Browse files
committed
docs: add daily news 2026-05-23
1 parent 75d99c1 commit 3d61341

1 file changed

Lines changed: 74 additions & 0 deletions

File tree

src/content/daily/2026-05-23.md

Lines changed: 74 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,74 @@
1+
---
2+
title: "Awesome AI 日报 | 2026-05-23"
3+
date: "2026-05-23"
4+
tags: ["Agent", "大模型", "空间智能", "AI编程", "AI影视", "具身智能", "企业AI"]
5+
summary: "李飞飞团队发布空间智能基准ESI-Bench;DeepSeek Code即将上线,融资额达700亿;360推出安全龙虾云端版与龙虾教练;MovieFlow Studio实现80集短剧3天拍完;三大运营商Token套餐落地参差;研究人员提出DCI技术让AI Agent直接操作终端;兔展智能SkillsUI完成F轮融资。"
6+
---
7+
8+
## 1. 李飞飞团队发布ESI-Bench:空间智能的「ImageNet」来了
9+
10+
李飞飞团队最新发布ESI-Bench——一个专门用来评测具身空间智能的新基准。与以往空间智能评测默认给模型最优观测不同,ESI-Bench首次把观察者变成行动者,闭合了感知-行动回路。该基准包含10个任务类别、29个子类别、3081个任务实例,覆盖人类核心空间认知能力的四大维度。测试发现当前AI模型存在"动作盲视"和元认知缺陷——模型不知道自己看没看够信息就过早做出判断。
11+
12+
> **Awesome AI 观点:** ESI-Bench的意义在于它揭示了空间智能的真正瓶颈不是视觉感知,而是主动探索策略。这对具身智能和机器人领域的研究方向有重要指导意义——与其继续堆叠视觉模型参数,不如研究如何让AI学会"知道自己不知道"。
13+
14+
来源:[量子位](https://www.qbitai.com/2026/05/422738.html) | 2026-05-22
15+
16+
## 2. DeepSeek Code真要来了,融资额达700亿,ACM金牌大神崔添翼挂帅
17+
18+
DeepSeek融资额已飙升至700亿元,管理层向潜在投资者表示优先考虑突破性AI研究而非短期商业化。同时,DeepSeek资深研究员Deli Chen亲自发帖招聘"从零开始构建Code Harness"的团队,官方招聘网站密集放出10+个Agent Harness相关岗位。今年3月加入DeepSeek的前TSY Capital联合创始人崔添翼或将出任Agent Harness团队负责人。
19+
20+
> **Awesome AI 观点:** DeepSeek Code的入局将重塑AI编程工具市场格局。在Claude Code、Codex、Cursor已占据先发优势的情况下,DeepSeek若能以开源策略+高性价比模型切入,可能成为AI编程领域的又一个"DeepSeek时刻"。
21+
22+
来源:[量子位](https://www.qbitai.com/2026/05/422624.html) | 2026-05-22
23+
24+
## 3. 360推出安全龙虾云端版+龙虾教练,周鸿祎直言Agent太难太贵不安全
25+
26+
360发布安全龙虾云端版,为Agent配备云端主机、云盘、云浏览器等"云端办公室",关机断网也能持续运行。同时推出"龙虾教练"功能,用户通过自然对话即可在2分钟内训出一只专属Agent,无需写配置代码。周鸿祎总结当前Agent落地的三大痛点:太难、太贵、不安全,360的定位是给Agent补基础设施。
27+
28+
> **Awesome AI 观点:** 360的思路代表了一个重要趋势——Agent的价值已经从框架本身转向执行过程中沉淀的决策经验。云端化和专家化正在成为Agent落地的实际路径,"从装上了到真能用"才是下半场的关键赛点。
29+
30+
来源:[量子位](https://www.qbitai.com/2026/05/422811.html) | 2026-05-22
31+
32+
## 4. MovieFlow Studio:80集短剧3天拍完,AI影视工业化新解法
33+
34+
由影视行业二十年经验的电影人团队打造的MovieFlow Studio,将剧本解析、分镜、影像生成、时间线剪辑等分散在十几个工具里的流程全部收进一个工作台。实测数据显示:百万字剧本3分钟完成结构化拆解,单日最高可生产20集内容,整部80集剧集全周期仅需3天,Token消耗降低70%以上,角色统一度达95%。
35+
36+
> **Awesome AI 观点:** AI影视的瓶颈从来不是生成能力,而是工业化生产流程。MovieFlow Studio的全链路闭环思路说明:当技术跨过"能生成"阶段后,真正的竞争壁垒在于资产管理、协作管理和成本控制。
37+
38+
来源:[量子位](https://www.qbitai.com/2026/05/422455.html) | 2026-05-22
39+
40+
## 5. 三大运营商Token套餐:电信全面开售,移动联通暂未落地
41+
42+
中国电信、中国联通、中国移动集中推出Token套餐,将AI算力以话费账单支付方式推向消费者。记者实地走访发现,电信线下营业厅已备妥价格表并推出限时促销(最低25万Token标价1元),而移动和联通一线工作人员多表示未接到通知,商业化全流程仍待完善。
43+
44+
> **Awesome AI 观点:** 从卖语音到卖流量再到卖Token,三大运营商正在完成第三次业务范式切换。但宣传声势与一线落地之间的落差表明,Token作为AI时代的基础设施商品,其定价模型、渠道体系和用户教育都还处在极早期。
45+
46+
来源:[36氪](https://36kr.com/p/3820131718402434) | 2026-05-22
47+
48+
## 6. DCI技术:让AI Agent直接操作终端,绕过向量数据库
49+
50+
多所大学研究人员提出"直接语料库交互"(DCI)技术,让AI Agent绕过嵌入模型,直接使用grep、find等命令行工具搜索原始语料。DCI-Agent-Lite基于GPT-5.4 nano模型,DCI-Agent-CC基于Claude Sonnet 4.6。研究指出语义检索在多步任务中会成为瓶颈,因为"它们过早决定了Agent能看到什么"。
51+
52+
> **Awesome AI 观点:** DCI的核心洞察是:企业环境中的数据是实时变化的日志、工单和代码提交,而非静态文档集合。向量索引永远是一个快照,而Agent需要的是对当前状态的实时感知。这是一个被长期忽视的关键问题。
53+
54+
来源:[VentureBeat](https://venturebeat.com/orchestration/your-ai-agents-need-a-terminal-not-just-a-vector-database) | 2026-05-22
55+
56+
## 7. 兔展智能SkillsUI完成F轮融资,4100万用户的企业AI入口层
57+
58+
深圳兔展智能发布SkillsUI平台,通过API将企业已有ERP、OA、CRM等系统拆解为可被AI调用的Skill,实现"对话即办事"。用户只需说出需求,AI自动识别意图、路由分发、调用流程、回显卡片。该平台已完成F轮融资,服务超过4100万用户,自研"兔灵"大模型是广东省首个完成备案的视觉空间智能大模型。
59+
60+
> **Awesome AI 观点:** SkillsUI代表了企业AI落地的正确路径——不替代旧系统,而是给旧系统加一个AI入口层。"人找系统"到"AI替人调系统"的转变,将是企业IT架构在未来三年最大的范式转换。
61+
62+
来源:[量子位](https://www.qbitai.com/2026/05/422615.html) | 2026-05-22
63+
64+
## 8. Kore.ai推出Artemis AI Agent平台,挑战Salesforce和ServiceNow
65+
66+
Kore.ai发布Artemis AI Agent平台,以中立性和专有中间语言为核心策略,押注AI而非人类开发者应承担Agent构建的主要工作。该平台在各大科技厂商竞相成为企业AI Agent默认基础设施的背景下入场,强调让AI完成大部分繁重工作。
67+
68+
> **Awesome AI 观点:** 企业AI Agent平台战正在升温。Kore.ai的"中立性"策略直击痛点——企业不希望被单一厂商锁定。但真正的壁垒不在于平台本身,而在于谁能积累最多行业know-how并沉淀为可复用的决策经验。
69+
70+
来源:[VentureBeat](https://venturebeat.com/technology/kore-ai-launches-artemis-ai-agent-platform-expands-challenge-to-microsoft-and-salesforce) | 2026-05-22
71+
72+
## 其他动态
73+
74+
- **Alibaba Qwen3.7-Max** 可在Apex Math Reasoning基准测试中以44.5分超越Claude Opus-4.6 Max(34.5分),支持35小时自主运行和外部Harness集成。(来源:[VentureBeat](https://venturebeat.com/technology/alibabas-proprietary-qwen3-7-max-can-run-for-35-hours-autonomously-and-supports-external-harnesses-like-anthropics-claude-code) | 2026-05-22)

0 commit comments

Comments
 (0)