|
| 1 | +--- |
| 2 | +title: "Awesome AI 日报 | 2026-05-23" |
| 3 | +date: "2026-05-23" |
| 4 | +tags: ["Agent", "大模型", "空间智能", "AI编程", "AI影视", "具身智能", "企业AI"] |
| 5 | +summary: "李飞飞团队发布空间智能基准ESI-Bench;DeepSeek Code即将上线,融资额达700亿;360推出安全龙虾云端版与龙虾教练;MovieFlow Studio实现80集短剧3天拍完;三大运营商Token套餐落地参差;研究人员提出DCI技术让AI Agent直接操作终端;兔展智能SkillsUI完成F轮融资。" |
| 6 | +--- |
| 7 | + |
| 8 | +## 1. 李飞飞团队发布ESI-Bench:空间智能的「ImageNet」来了 |
| 9 | + |
| 10 | +李飞飞团队最新发布ESI-Bench——一个专门用来评测具身空间智能的新基准。与以往空间智能评测默认给模型最优观测不同,ESI-Bench首次把观察者变成行动者,闭合了感知-行动回路。该基准包含10个任务类别、29个子类别、3081个任务实例,覆盖人类核心空间认知能力的四大维度。测试发现当前AI模型存在"动作盲视"和元认知缺陷——模型不知道自己看没看够信息就过早做出判断。 |
| 11 | + |
| 12 | +> **Awesome AI 观点:** ESI-Bench的意义在于它揭示了空间智能的真正瓶颈不是视觉感知,而是主动探索策略。这对具身智能和机器人领域的研究方向有重要指导意义——与其继续堆叠视觉模型参数,不如研究如何让AI学会"知道自己不知道"。 |
| 13 | +
|
| 14 | +来源:[量子位](https://www.qbitai.com/2026/05/422738.html) | 2026-05-22 |
| 15 | + |
| 16 | +## 2. DeepSeek Code真要来了,融资额达700亿,ACM金牌大神崔添翼挂帅 |
| 17 | + |
| 18 | +DeepSeek融资额已飙升至700亿元,管理层向潜在投资者表示优先考虑突破性AI研究而非短期商业化。同时,DeepSeek资深研究员Deli Chen亲自发帖招聘"从零开始构建Code Harness"的团队,官方招聘网站密集放出10+个Agent Harness相关岗位。今年3月加入DeepSeek的前TSY Capital联合创始人崔添翼或将出任Agent Harness团队负责人。 |
| 19 | + |
| 20 | +> **Awesome AI 观点:** DeepSeek Code的入局将重塑AI编程工具市场格局。在Claude Code、Codex、Cursor已占据先发优势的情况下,DeepSeek若能以开源策略+高性价比模型切入,可能成为AI编程领域的又一个"DeepSeek时刻"。 |
| 21 | +
|
| 22 | +来源:[量子位](https://www.qbitai.com/2026/05/422624.html) | 2026-05-22 |
| 23 | + |
| 24 | +## 3. 360推出安全龙虾云端版+龙虾教练,周鸿祎直言Agent太难太贵不安全 |
| 25 | + |
| 26 | +360发布安全龙虾云端版,为Agent配备云端主机、云盘、云浏览器等"云端办公室",关机断网也能持续运行。同时推出"龙虾教练"功能,用户通过自然对话即可在2分钟内训出一只专属Agent,无需写配置代码。周鸿祎总结当前Agent落地的三大痛点:太难、太贵、不安全,360的定位是给Agent补基础设施。 |
| 27 | + |
| 28 | +> **Awesome AI 观点:** 360的思路代表了一个重要趋势——Agent的价值已经从框架本身转向执行过程中沉淀的决策经验。云端化和专家化正在成为Agent落地的实际路径,"从装上了到真能用"才是下半场的关键赛点。 |
| 29 | +
|
| 30 | +来源:[量子位](https://www.qbitai.com/2026/05/422811.html) | 2026-05-22 |
| 31 | + |
| 32 | +## 4. MovieFlow Studio:80集短剧3天拍完,AI影视工业化新解法 |
| 33 | + |
| 34 | +由影视行业二十年经验的电影人团队打造的MovieFlow Studio,将剧本解析、分镜、影像生成、时间线剪辑等分散在十几个工具里的流程全部收进一个工作台。实测数据显示:百万字剧本3分钟完成结构化拆解,单日最高可生产20集内容,整部80集剧集全周期仅需3天,Token消耗降低70%以上,角色统一度达95%。 |
| 35 | + |
| 36 | +> **Awesome AI 观点:** AI影视的瓶颈从来不是生成能力,而是工业化生产流程。MovieFlow Studio的全链路闭环思路说明:当技术跨过"能生成"阶段后,真正的竞争壁垒在于资产管理、协作管理和成本控制。 |
| 37 | +
|
| 38 | +来源:[量子位](https://www.qbitai.com/2026/05/422455.html) | 2026-05-22 |
| 39 | + |
| 40 | +## 5. 三大运营商Token套餐:电信全面开售,移动联通暂未落地 |
| 41 | + |
| 42 | +中国电信、中国联通、中国移动集中推出Token套餐,将AI算力以话费账单支付方式推向消费者。记者实地走访发现,电信线下营业厅已备妥价格表并推出限时促销(最低25万Token标价1元),而移动和联通一线工作人员多表示未接到通知,商业化全流程仍待完善。 |
| 43 | + |
| 44 | +> **Awesome AI 观点:** 从卖语音到卖流量再到卖Token,三大运营商正在完成第三次业务范式切换。但宣传声势与一线落地之间的落差表明,Token作为AI时代的基础设施商品,其定价模型、渠道体系和用户教育都还处在极早期。 |
| 45 | +
|
| 46 | +来源:[36氪](https://36kr.com/p/3820131718402434) | 2026-05-22 |
| 47 | + |
| 48 | +## 6. DCI技术:让AI Agent直接操作终端,绕过向量数据库 |
| 49 | + |
| 50 | +多所大学研究人员提出"直接语料库交互"(DCI)技术,让AI Agent绕过嵌入模型,直接使用grep、find等命令行工具搜索原始语料。DCI-Agent-Lite基于GPT-5.4 nano模型,DCI-Agent-CC基于Claude Sonnet 4.6。研究指出语义检索在多步任务中会成为瓶颈,因为"它们过早决定了Agent能看到什么"。 |
| 51 | + |
| 52 | +> **Awesome AI 观点:** DCI的核心洞察是:企业环境中的数据是实时变化的日志、工单和代码提交,而非静态文档集合。向量索引永远是一个快照,而Agent需要的是对当前状态的实时感知。这是一个被长期忽视的关键问题。 |
| 53 | +
|
| 54 | +来源:[VentureBeat](https://venturebeat.com/orchestration/your-ai-agents-need-a-terminal-not-just-a-vector-database) | 2026-05-22 |
| 55 | + |
| 56 | +## 7. 兔展智能SkillsUI完成F轮融资,4100万用户的企业AI入口层 |
| 57 | + |
| 58 | +深圳兔展智能发布SkillsUI平台,通过API将企业已有ERP、OA、CRM等系统拆解为可被AI调用的Skill,实现"对话即办事"。用户只需说出需求,AI自动识别意图、路由分发、调用流程、回显卡片。该平台已完成F轮融资,服务超过4100万用户,自研"兔灵"大模型是广东省首个完成备案的视觉空间智能大模型。 |
| 59 | + |
| 60 | +> **Awesome AI 观点:** SkillsUI代表了企业AI落地的正确路径——不替代旧系统,而是给旧系统加一个AI入口层。"人找系统"到"AI替人调系统"的转变,将是企业IT架构在未来三年最大的范式转换。 |
| 61 | +
|
| 62 | +来源:[量子位](https://www.qbitai.com/2026/05/422615.html) | 2026-05-22 |
| 63 | + |
| 64 | +## 8. Kore.ai推出Artemis AI Agent平台,挑战Salesforce和ServiceNow |
| 65 | + |
| 66 | +Kore.ai发布Artemis AI Agent平台,以中立性和专有中间语言为核心策略,押注AI而非人类开发者应承担Agent构建的主要工作。该平台在各大科技厂商竞相成为企业AI Agent默认基础设施的背景下入场,强调让AI完成大部分繁重工作。 |
| 67 | + |
| 68 | +> **Awesome AI 观点:** 企业AI Agent平台战正在升温。Kore.ai的"中立性"策略直击痛点——企业不希望被单一厂商锁定。但真正的壁垒不在于平台本身,而在于谁能积累最多行业know-how并沉淀为可复用的决策经验。 |
| 69 | +
|
| 70 | +来源:[VentureBeat](https://venturebeat.com/technology/kore-ai-launches-artemis-ai-agent-platform-expands-challenge-to-microsoft-and-salesforce) | 2026-05-22 |
| 71 | + |
| 72 | +## 其他动态 |
| 73 | + |
| 74 | +- **Alibaba Qwen3.7-Max** 可在Apex Math Reasoning基准测试中以44.5分超越Claude Opus-4.6 Max(34.5分),支持35小时自主运行和外部Harness集成。(来源:[VentureBeat](https://venturebeat.com/technology/alibabas-proprietary-qwen3-7-max-can-run-for-35-hours-autonomously-and-supports-external-harnesses-like-anthropics-claude-code) | 2026-05-22) |
0 commit comments