为视频制作者设计的虚拟形象口播软件
本项目(T.T.S.)是猫娘计划(Project N.E.K.O.)的衍生项目,专注于虚拟形象口播场景。用户输入文本后,虚拟形象将直接朗读该文本,无需LLM参与。
uv sync
python main_server.py启动后通过 http://localhost:48911 访问网页版。
Details
当你想要通过配置自己的API来获得额外功能时,您可以配置一个第三方AI服务(核心必须支持 Realtime API)。本项目目前推荐使用 阶跃星辰 或 阿里云。通过访问http://localhost:48911/api_key可以在Web界面中直接配置。
获取 阿里云API。在阿里云的百炼平台官网注册账号。新用户实名认证后可以获取大量免费额度。注册完成后,请访问控制台获取API Key。
-
网页版访问
http://localhost:48911/chara_manager即可进入人设编辑页面。 -
进阶人设主要包括Live2D模型设置(live2d)和声音设置(voice_id)。如果你想要更改Live2D模型,请先将模型目录复制到本项目中的
static文件夹下。从进阶设置中可以进入Live2D模型管理界面,可以更换模型,并通过拖拽和鼠标滚轮调整模型的位置和大小。如果你想要更改角色声音,请准备一段5秒左右的连贯、干净的语音录音。通过进阶设置进入语音设置页面,上传录音即可完成自定义语音。
- 通过访问
http://localhost:48911/memory_browser可以浏览和校对近期记忆与摘要,一定程度上缓解模型复读、认知错误等问题。
Details
项目架构
T.T.S/
├── 📁 config/ # ⚙️ 配置管理模块
│ ├── api_providers.json # API服务商配置
│ ├── prompts_chara.py # 角色提示词
│ └── prompts_sys.py # 系统提示词
├── 📁 main_logic/ # 🔧 核心逻辑模块(负责对话)
│ ├── core.py # 核心对话模块
│ ├── cross_server.py # 跨服务器通信
│ ├── omni_realtime_client.py # 实时API客户端(Relatime API)
│ ├── omni_offline_client.py # 文本API客户端(Response API)
│ └── tts_client.py # 🔊 TTS引擎适配器
├── 📁 main_routers/ # 🌐 前端网页路由模块
├── 📁 memory/ # 🧠 记忆管理系统
│ ├── store/ # 记忆数据存储
├── 📁 static/ # 🌐 前端静态资源
├── 📁 templates/ # 📄 前端HTML模板
├── 📁 utils/ # 🛠️ 工具模块
├── main_server.py # 🌐 主服务器
└── memory_server.py # 🧠 记忆服务器
数据流向
本项目环境依赖非常简单,请执行uv sync即可。开发者建议加入QQ群1048307485。
本项目(T.T.S.)是猫娘计划(Project N.E.K.O.)的衍生项目。
