| 简称 | 全称 | 含义 |
|---|---|---|
| VGM | Video Generation Model | 视频生成模型(最常见的通用简称) |
| VLM | Video Language Model | 结合语言理解的视频模型(如 OpenAI Sora) |
| VDM | Video Diffusion Model | 采用扩散模型的视频生成(如 Stable Video Diffusion) |
| GVM | Generative Video Model | 生成式视频模型(泛指 AI 生成视频) |
-
Sora (OpenAI)
- 主要特点: 被认为是最先进的文本到视频生成模型,生成的视频具有高度的真实感和复杂性。
- 在线使用链接: 暂无公开使用链接
-
Kling AI (Kuaishou)
- 主要特点: 以其生成高分辨率(1080p)长达两分钟的视频而著称,提供了更广泛的视频制作工作流程。
- 在线使用链接: Kling AI
-
Luma Dream Machine (Luma Labs)
- 主要特点: 专注于生成短时间的高质量视频片段,具有流畅的运动和电影般的感觉。
- 在线使用链接: Luma Dream Machine
-
Runway Gen-3 Alpha
- 主要特点: 提供高保真视频生成,支持从文本和图像提示生成视频,并允许使用图像作为视频的起始或结束点。
- 在线使用链接: Runway
-
MiniMax (Hailuo AI)
- 主要特点: 因其生成的高质量视频而获得认可,但网站的稳定性可能是一个问题。
- 在线使用链接: MiniMax (Hailuo AI)
-
CogVideoX
- 主要特点: 作为一个开源模型,它允许用户在本地运行,提供对生成过程的高度控制。
- 在线使用链接: CogVideoX on GitHub
- 在线使用 https://chatglm.cn/video
-
可灵AI
- 简介: 由快手推出的 AI 视频生成工具,基于自研的可灵大模型,可模拟真实世界的物理特性,生成符合物理规律的视频。
- 特点: 支持文本生成视频、图像生成视频,提供首尾帧添加、负面关键词过滤及镜头效果控制等功能。
- 详情: 可灵AI
-
Pika
-
Runway Gen-3
- 简介: Runway 推出的 AI 视频生成工具,用户可通过文本提示或图像输入创建视频。
- 特点: 支持文本生成视频、图像生成视频、视频风格转换,并提供文本转语音、人物口型同步等功能。
- 详情: Runway Gen-3
- 官方网站: runwayml.com
-
豆包
- 简介: 在文生视频领域表现出色,生成的视频在画面构图、色调等方面表现优异。
- 特点: 大场景生成能力突出,能细腻刻画场景细节。
- 详情: 豆包
- 官方网站: bytedance.com
-
通义万相
- 简介: 在文本理解能力上表现较强,生成的视频内容与提示词描述高度一致。
- 特点: 细节刻画表现出色,但在真实性方面略显不足。
- 详情: 通义万相
- 官方网站: wanxiang.aliyun.com
-
海螺AI
- 简介: 在写实能力上较强,生成的视频画面真实感较高。
- 特点: 角度和构图有待提升,整体美感略显不足。
- 详情: 海螺AI
| 排名 | 模型名称 | 开发者/机构 | 核心优势 | 适用场景 | 使用链接 |
|---|---|---|---|---|---|
| 1 | OpenAI Sora | OpenAI | 高质量、连贯性、长视频生成 | 影视、广告、教育 | OpenAI Sora |
| 2 | Runway Gen-2 | Runway | 用户友好、风格多样 | 创意视频、广告 | Runway Gen-2 |
| 3 | Pika Labs | Pika Labs | 短视频生成速度快、效果流畅 | 社交媒体、营销 | Pika Labs |
| 4 | Stable Video Diffusion | Stability AI | 开源、可定制性强 | 创意视频、影视特效 | Stable Video Diffusion |
| 5 | Make-A-Video | Meta | 连贯性、真实性 | 社交媒体、广告 | Make-A-Video |
| 6 | Phenaki | Google Research | 长视频生成、故事性强 | 影视、广告、教育 | Phenaki |
| 7 | Imagen Video | Google Research | 高分辨率、逼真效果 | 影视特效、广告 | Imagen Video |
| 8 | CogVideo | 清华大学 & ModelBest | 中文场景适配性强 | 中文内容创作、教育 | CogVideo |
| 9 | Video LDM | Heidelberg University | 技术架构先进、生成稳定 | 创意视频、影视特效 | Video LDM |
| 10 | NUWA | 微软亚洲研究院 | 多模态生成能力强大 | 影视、广告、教育 | NUWA |