Skip to content

Commit 01c1c9d

Browse files
authored
Merge pull request d-run#470 from windsonsea/infra05
update several text in ai-infra.md
2 parents 5701aab + 207a8f8 commit 01c1c9d

File tree

1 file changed

+9
-13
lines changed

1 file changed

+9
-13
lines changed

docs/zh/docs/blogs/2025/ai-infra.md

Lines changed: 9 additions & 13 deletions
Original file line numberDiff line numberDiff line change
@@ -120,21 +120,19 @@
120120

121121
## DaoCloud 在这条主线里站的位置
122122

123-
DaoCloud 作为 AI Infra 领域的重要参与者,其发展历程犹如一部不断创新与突破的奋斗史,见证了其在技术浪潮中的坚定前行与卓越贡献。自 2014 年成立以来,DaoCloud 就敏锐地捕捉到了云计算领域的发展机遇,尤其是 Kubernetes 生态技术所蕴含的巨大潜力,迅速投身其中,成为推广 Kubernetes 生态技术的先锋力量
123+
AI Infra 赛道,DaoCloud 并非 “新入局者”,而是拥有十年技术积累的 “老兵”。自 2014 年起,DaoCloud 就深耕云原生领域,推广 Kubernetes 生态技术,为企业提供容器化、微服务等底层支撑 —— 这些技术,正是 AI Infra 的核心基础
124124

125-
随着 AI 浪潮的汹涌袭来,DaoCloud 再次展现出其敏锐的洞察力和前瞻性的战略眼光,毫不犹豫地紧跟这一时代潮流,深度参与到 AI 领域的技术研发与创新中。在推理引擎核心代码贡献方面,DaoCloud 表现出色,积极参与 vLLM、SGLang 等推理引擎的开发工作
125+
随着 AI 浪潮来袭,DaoCloud 迅速将云原生技术与 AI 推理需求结合,不仅紧跟 **vLLM、SGLang** 等主流推理引擎的发展,更成为 **llm-d、Dynamo 等关键开源仓库的积极贡献者** :在 llm-d 仓库中,参与了长上下文推理的性能优化代码开发,提升了大模型处理 128K+ Token 的效率;在 Dynamo 仓库中,贡献了异构算力调度模块的核心逻辑,让 GPU、CPU、NPU 的协同更流畅。这些代码贡献,不仅提升了开源社区的技术水平,也让 DaoCloud 对推理技术的理解更深入、更贴近工业需求
126126

127-
DaoCloud **中国第一代云原生“工具厂”** 的重要成员。这不是后知后觉,是 **十年连线正确**
127+
DaoCloud **是中国第一代云原生 “工具厂” 的重要成员** ,其在 AI Infra 领域的布局,不是 “后知后觉” 的跟风,而是 “十年技术连线” 的必然结果 —— 从云原生底层调度到 AI 推理上层,DaoCloud 构建了完整的技术链路,能够为企业提供从 “算力调度” 到 “推理优化” 的全栈支撑
128128

129-
除了在推理引擎核心代码上的深入耕耘,DaoCloud 还积极参与行业标准的制定,联合中国信通院以及数十家企业和机构,共同编写
130-
**《AI 云操作系统大模型推理加速能力要求》标准** 。写标准这件事象征意义很明确:
131-
**DaoCloud 站在这条“推理 OS 层”的地基位上**
129+
近期,DaoCloud 还联合中国信通院,以及数十家 AI 企业、科研机构,[共同编写《AI 云操作系统大模型推理加速能力要求》标准](https://mp.weixin.qq.com/s/CL0mdE3UQyv4D2l6469kug)。“写标准” 这件事的象征意义尤为明确:它标志着 DaoCloud 不仅是推理技术的 “实践者”,更是行业规则的 “共建者”,站在了 “推理 OS 层” 的地基位置,为行业提供标准化的技术指引。
132130

133131
DaoCloud 研发的 [d.run 算力调度服务平台](https://docs.d.run/),以全球领先的云原生调度引擎,为异构算力的高效管理提供了强大的支持。该平台能够充分发挥各种计算资源的优势,根据不同的任务需求和资源状况,实现动态的资源分配和调度,从而大幅提高 GPU 利用率,降低企业的算力成本。在面对大规模的深度学习任务时,d.run 能够快速响应,合理分配 GPU 资源,确保模型训练和推理任务的高效执行,为企业的 AI 应用开发提供了坚实的基础支撑。
134132

135133
DaoCloud 推出的 DeepSeek 一体机,更是其在 AI 推理领域的又一力作。这是一款面向企业私有化部署需求的软硬一体产品,它将硬件设备与软件系统深度融合,打通了从算力通电到模型生产力的全流程。DeepSeek 一体机内置行业前沿大模型,并与社区保持同步更新,确保企业能够始终使用到最新、最先进的模型技术。通过软硬协同的优化设计,能够一键开启高效模型推理,为企业提供便捷、高效的 AI 解决方案。无论是在金融领域的风险预测、医疗行业的疾病诊断,还是制造业的质量检测等场景中,DeepSeek 一体机都能够凭借其出色的性能和稳定性,为企业提供精准、快速的推理服务,助力企业实现智能化转型和业务创新。​
136134

137-
在全球开源领域,DaoCloud 同样拥有卓越的领导力,自主开源并参与了人工智能时代的众多重要项目,如 HAMi、KWOK、Kueue 等。
135+
在全球开源领域,DaoCloud 同样拥有卓越的领导力,自主开源并参与了人工智能时代的众多重要项目,例如:
138136

139137
- [HAMi](https://project-hami.io/) 提供了将算力切分至 1% 的异构算力设备管理方案,有效提升了算力利用率,为解决异构算力资源共享的难题提供了创新思路;
140138
- [KWOK](https://kwok.sigs.k8s.io/) 以轻量化的方式完成大规模集群的仿真模拟及调度器压测,被 NVIDIA、OpenAI 等全球 AI 科技巨头广泛采用,成为验证和优化大规模集群性能的重要工具;
@@ -144,9 +142,9 @@ DaoCloud 推出的 DeepSeek 一体机,更是其在 AI 推理领域的又一力
144142

145143
![daocloud 开源项目](./images/ai-infra01.jpg)
146144

147-
## 为什么推理赛道能产生 100B+ 公司
145+
## 为什么推理赛道能产生百亿级独角兽
148146

149-
在 AI 产业的发展进程中,推理赛道正展现出前所未有的潜力,成为孕育 100B + 公司的肥沃土壤。其商业吸引力不仅体现在对企业成本和性能的显著改善上,更得益于各类先进技术路线的强力支撑。
147+
在 AI 产业的发展进程中,推理赛道正展现出前所未有的潜力,成为孕育 100B+ 独角兽公司的肥沃土壤。其商业吸引力不仅体现在对企业成本和性能的显著改善上,更得益于各类先进技术路线的强力支撑。
150148

151149
推理不是华丽的 PPT,推理是真实发生的计算结算层。你只要能给客户:
152150

@@ -166,10 +164,8 @@ DaoCloud 推出的 DeepSeek 一体机,更是其在 AI 推理领域的又一力
166164
一句更直接的话:
167165
“只要 AI 应用流量起来了,底层推理 Infra 就能开始变现。”
168166

169-
自 2024 下半年起,
170-
国内智能体、金融客服、AI 智能化供应链等场景,
171-
流量数据开始真实体现 QPS。同时,
172-
**豆包、可灵、即梦** 等 AI 应用产品,正在迅速被市场和大众接受。
167+
自 2024 下半年起,国内智能体、金融客服、AI 智能化供应链等场景,
168+
流量数据开始真实体现 QPS。同时,豆包、可灵、即梦等 C 端 AI 应用产品,正在迅速被市场和大众所接受。
173169

174170
这意味着:
175171
**推理 Infra 的货币化窗口期打开了**

0 commit comments

Comments
 (0)