-
Notifications
You must be signed in to change notification settings - Fork 38
Open
Labels
Description
背景
当前图片/视频/文案生成与博客流程强耦合,无法独立使用。缺少音频生成(TTS)和统一的素材管理中心。
目标
将生成能力解耦为独立的 AssetGeneratorService,支持文案/图片/视频/音频独立生成,新增素材库管理页面。
方案概要(详见 115.00.素材生成方案.md)
核心架构
素材生成请求 → AssetGeneratorService
├── TextGenerator(复用 WriterAgent)
├── ImageGenerator(复用 ArtistAgent)
├── VideoGenerator(复用 VideoService)
├── AudioGenerator(新增 TTS)
└── CodeGenerator(复用 CoderAgent)
→ AssetStorage(统一存储 + 元数据)
关键模块
- Asset 模型:统一素材实体(type/title/content/url/metadata/tags)
- 各类 Generator:从现有 Agent 抽离,支持独立调用
- AudioGenerator(新增):TTS 集成,支持 OpenAI TTS / Edge TTS / Fish Audio / MiniMax TTS
- 素材库 AssetLibrary.vue:分类浏览、搜索、批量操作
API
POST /api/assets/generate # 生成素材
GET /api/assets # 素材列表
GET /api/assets/search?q=xxx # 搜索
POST /api/assets/batch/generate # 批量生成
实现路径
| 阶段 | 内容 | 工作量 |
|---|---|---|
| P1 | Asset 模型 + SQLite 持久化 | 1d |
| P2 | 抽离 Text/Image/Video Generator | 3d |
| P3 | 新增 AudioGenerator(TTS) | 2d |
| P4 | API + 前端素材库页面 | 3d |
| P5 | 批量生成 + 工作流 Action 集成 | 2d |
可行性
高。图片/视频/文案生成能力已有,核心是解耦 + 统一 Asset 模型 + 新增 TTS。
Reactions are currently unavailable