一款运行在CPU上的本地语音转文字(TTS)的GUI工具。
- 支持单条转写/多条批量转写
- 支持两款模型
- 支持API调用(Beta)
- 使用
python -m venv ./venv创建虚拟环境 - Windows下使用
cd .\venv\Scripts定位到虚拟环境位置,.\activate激活虚拟环境,cd ../../回到项目目录;Linux下使用source ./venv/bin/activate激活虚拟环境 - 使用
pip install -r requirements.txt安装依赖 - 使用
python main_window.py打开软件
在设置中启用API服务,GET 127.0.0.1:5000/health检测服务状态,POST 127.0.0.1:5000/transcribe转录
API调用格式
| 参数名 | 类型 | 必填 | 默认值 | 说明 |
|---|---|---|---|---|
| file | File | 是 | - | 音频文件 |
| model_size | string | 否 | "small" | 模型大小 |
| language | string | 否 | "zh" | 语言代码 |
| stream | string | 否 | "false" | 是否流式返回 |
owo