54 lines (37 loc) · 2.07 KB

Fish-TTS Text-to-Speech Model Management Tool

这是一套基于 CustomTkinter 开发的桌面端工具，旨在通过 Fish Audio 官方提供的 API 接口，让用户能够更便捷地通过上传自定义音频文件来训练独有的 TTS 模型。

✨ 核心特性

现代化的 GUI 界面: 采用 CustomTkinter 构建，支持暗色模式，比传统的命令行工具更直观。
多文件批量上传：支持一次性选择并上传多个 .wav, .mp3 或 .flac 文件，自动处理 multipart/form-data 请求。
多线程异步处理：上传过程在独立线程运行，确保在处理大文件时界面不会卡死。
参数自定义：支持设置模型名称（Title）、描述（Description）以及可见性（Visibility）。
针对官方 API 优化：自动配置 train_mode: fast 和 type: tts 等必填参数，简化用户操作。

🛠️ 安装与准备

克隆仓库

git clone https://github.com/your-username/ModelTrainingTool.git
cd ModelTrainingTool

安装依赖项

本项目需要 requests 和 customtkinter 库：

pip install requests customtkinter

🚀 使用方法

运行主程序：
```
python main.py
```
在界面中输入你的 fish-audio API key。
输入你想给模型起的名字（Model Title）。
点击 Select Audio Files 选择用于训练的音频样本。
点击 Start Training 开始上传并训练。训练成功后，你将获得一个 Model ID，你可以将其用于支持 Fish-audio 的项目。

📦 打包为独立程序 (.exe)

如果你想在没有 Python 环境的电脑上运行，可以使用 PyInstaller 将其打包：

pip install pyinstaller
pyinstaller --noconsole --onefile --collect-all customtkinter ModelTrainingTool.py

打包完成后，可在 dist/ 文件夹中找到生成的执行文件。

📝 开发计划 (Roadmap)

[ ] 增加 Model List 标签页，用于查看和管理已创建的音色。

[ ] 增加音色更新（Update Voice）和删除（Delete Voice）功能。

[ ] 训练进度实时反馈增强。