Releases: TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
v1.7
🎙️ Faster Whisper 转录工具 - 发行说明
⚠️ 重要声明
本软件为开源软件
🔗 开源地址: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
👥 开发团队: AI汉化组 (https://t.me/transWithAI)
📦 发行包说明
本发行版包含多个变体版本,请根据您的显卡型号选择合适的版本:
🎯 版本类型说明
基础版(Base Package)
- 下载大小:约 2.2GB
- 包含内容:
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD(语音活动检测)ONNX 模型
- ❌ 不含 Whisper 模型(需自行下载)
- 适用场景:需要使用自定义模型的用户
海南鸡版(Chickenrice Edition)
- 下载大小:约 4.4GB
- 包含内容:
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD(语音活动检测)ONNX 模型
- ✅ "海南鸡v2 5000小时" 日文转中文优化模型
- 适用场景:开箱即用的日文转中文翻译
- 模型说明:包含经过5000小时音频数据训练的海南鸡v2版本模型,专门优化日文转中文翻译
📌 文件命名规则
| 文件名后缀 | CUDA/ROCm | 模型类型 |
|---|---|---|
*_cu118.zip |
CUDA 11.8 | 基础版 |
*_cu118-chickenrice.zip |
CUDA 11.8 | 海南鸡版 |
*_cu122.zip |
CUDA 12.2 | 基础版 |
*_cu122-chickenrice.zip |
CUDA 12.2 | 海南鸡版 |
*_cu128.zip |
CUDA 12.8 | 基础版 |
*_cu128-chickenrice.zip |
CUDA 12.8 | 海南鸡版 |
*_gfx101x_dgpu.zip |
AMD ROCm/HIP (gfx101X) | 基础版 |
*_gfx101x_dgpu-chickenrice.zip |
AMD ROCm/HIP (gfx101X) | 海南鸡版 |
*_gfx103x_dgpu.zip |
AMD ROCm/HIP (gfx103X) | 基础版 |
*_gfx103x_dgpu-chickenrice.zip |
AMD ROCm/HIP (gfx103X) | 海南鸡版 |
*_gfx110x_all.zip |
AMD ROCm/HIP (gfx110X) | 基础版 |
*_gfx110x_all-chickenrice.zip |
AMD ROCm/HIP (gfx110X) | 海南鸡版 |
*_gfx120x_all.zip |
AMD ROCm/HIP (gfx120X) | 基础版 |
*_gfx120x_all-chickenrice.zip |
AMD ROCm/HIP (gfx120X) | 海南鸡版 |
AMD 版本仍然使用
--device=cuda(这是 CTranslate2 在 HIP/ROCm 后端下的公开 API 约定)。命令行也可使用--device=amd(等同于--device=cuda)。
暂不提供gfx115xiGPU/mobile 版本(请使用 CPU 版或 Modal 云端推理)。
🔍 如何选择正确的版本
NVIDIA 显卡 —— 选择 CUDA 版本
方法一:通过 nvidia-smi 查询
- 打开命令提示符或终端
- 输入命令:
nvidia-smi - 查看输出中的 Driver Version 和 CUDA Version
+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00 Driver Version: 570.00 CUDA Version: 12.8|
+-------------------------------------------------------------------------+
方法二:通过显卡型号和驱动版本对照表
📊 NVIDIA 驱动版本与 CUDA 版本兼容性表
| CUDA 版本 | 最低驱动要求(Windows) | 最低驱动要求(Linux) | 推荐使用场景 |
|---|---|---|---|
| CUDA 11.8 | ≥452.39 | ≥450.80.02 | 较旧的显卡(GTX 10系列、RTX 20/30系列) |
| CUDA 12.2 | ≥525.60.13 | ≥525.60.13 | RTX 30/40系列,较新的驱动 |
| CUDA 12.8 | ≥570.65 | ≥570.26 | RTX 40/50系列,最新驱动 |
🎮 显卡型号推荐表
| 显卡系列 | 推荐 CUDA 版本 | 说明 |
|---|---|---|
| GTX 10系列(1060/1070/1080等) | CUDA 11.8 | 兼容性最好 |
| GTX 16系列(1650/1660等) | CUDA 11.8 | 兼容性最好 |
| RTX 20系列(2060/2070/2080等) | CUDA 11.8 或 12.2 | 根据驱动版本选择 |
| RTX 30系列(3060/3070/3080/3090等) | CUDA 12.2 | 推荐使用 |
| RTX 40系列(4060/4070/4080/4090等) | CUDA 12.2 或 12.8 | 最新驱动用12.8 |
| RTX 50系列(5090/5080/5070等) | 🔴 必须使用 CUDA 12.8 |
⚠️ 重要提示
- RTX 50系列用户:由于新架构要求,必须使用 CUDA 12.8 版本,驱动版本必须 ≥570.00
- 驱动版本查询:在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
- 向下兼容:高版本驱动可以运行低版本CUDA程序(例如:570驱动可以运行CUDA 11.8程序)
- 性能考虑:使用与驱动匹配的CUDA版本可获得最佳性能
AMD 显卡 —— 选择 ROCm/HIP 版本
AMD 显卡用户请下载带有 gfx*** 后缀的版本。AMD 版本已内置 ROCm/HIP 运行时 DLL,一般无需单独安装 ROCm。
快速自查:
| 显卡型号 | 下载后缀 |
|---|---|
| RX 5300 / RX 5500 / RX 5600 / RX 5700 系列 | gfx101x_dgpu |
| RX 6400 / RX 6500 XT / RX 6600 / RX 6700 / RX 6800 / RX 6900 系列 | gfx103x_dgpu |
| RX 7600 / RX 7700 XT / RX 7800 XT / RX 7900 系列 | gfx110x_all |
| RX 9060 / RX 9060 XT / RX 9070(含 GRE/XT) | gfx120x_all |
| iGPU: Radeon 890M / 8060S / 860M (gfx115x) |
不知道自己的显卡型号?打开 "任务管理器 -> 性能 -> GPU" 或 "设备管理器 -> 显示适配器"
📥 模型下载说明
基础版用户(需自行下载模型)
基础版包含VAD模型,但不包含Whisper语音识别模型。您需要:
-
从 Hugging Face 下载模型
- 示例模型地址:https://huggingface.co/chickenrice0721/whisper-large-v2-translate-zh-v0.2-st
- 这是"海南鸡v2 5000小时"版本的日文转中文优化模型
-
放置模型文件
将下载的模型文件放入: faster_whisper_transwithai_chickenrice/ └── models/ └── [您下载的模型文件夹]/ -
其他可用模型
- OpenAI Whisper官方模型
- 其他社区优化模型
海南鸡版用户(开箱即用)
海南鸡版已包含:
- ✅ 音声优化 VAD 语音活动检测模型
- ✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
- ✅ 所有必要的配置文件
无需额外下载,解压后直接运行即可使用!
🚀 快速开始指南
1. 选择版本
根据上述表格,选择适合您显卡的CUDA版本
2. 下载对应版本
- 仅转录/翻译:下载基础版 + 自行下载模型
- 日文转中文优化:下载海南鸡版(推荐)
3. 解压并运行
# GPU模式(推荐)
将音视频文件拖放到 "运行(GPU).bat"
# CPU模式(无显卡用户)
将音视频文件拖放到 "运行(CPU).bat"
# 低显存模式(4GB显存)
将音视频文件拖放到 "运行(GPU,低显存模式).bat"💡 常见问题
Q: 我应该选择哪个CUDA版本?
A: 运行 nvidia-smi 查看您的驱动版本,然后对照上表选择。
Q: 海南鸡版和基础版有什么区别?
A: 海南鸡版包含预训练的日文转中文优化模型(5000小时训练),基础版需要自行下载模型。
Q: RTX 4090 应该用哪个版本?
A: 推荐使用 CUDA 12.2 或 12.8 版本,取决于您的驱动版本。
Q: 显存不足怎么办?
A: 使用"低显存模式"批处理文件,或切换到CPU模式。
📝 更新日志
v1.7 (2026-02-24)
- 🔴 AMD ROCm/HIP GPU 支持:新增 AMD 显卡支持(RDNA1–RDNA4),覆盖 RX 5000 / 6000 / 7000 / 9000 系列
- 📦 多架构构建:提供 gfx101x(RDNA1)、gfx103x(RDNA2)、gfx110x(RDNA3)、gfx120x(RDNA4)四种架构的打包版本
- 🔧 ROCm 运行时内置:AMD 版本内置 ROCm/HIP 运行时 DLL,无需单独安装 ROCm
- 🎮 设备别名:命令行支持
--device=amd(等同于--device=cuda,CTranslate2 HIP 后端约定) - ⚡ 自动设备检测增强:改进 GPU 检测逻辑,支持 AMD HIP 设备自动识别
📋 AMD 版本选择:参考上方 "AMD 显卡 —— 选择 ROCm/HIP 版本" 或 README 中的完整型号列表。
v1.6 (2026-01-12)
- ☁️ Modal 云端推理支持:新增
modal_infer.exe,无需本地 GPU 也能使用云端 GPU 进行推理(感谢 @Randomless 贡献) - 🎮 多 GPU 选择:支持 T4、L4、A10G、A100、H100 等多种云端 GPU
- 💰 新用户福利:Modal 新用户每月 $30 免费额度,T4 GPU 推荐性价比最高
- 🔧 交互式配置:通过命令行交互选择 GPU 类型、模型、批处理等参数
- 📤 自动文件传输:自动上传本地音频、下载生成的字幕到本地
- 🗃️ 模型缓存:模型文件在 Modal Volume 中缓存,后续运行更快
- 📦 环境整合:Modal 依赖已集成到主环境文件,无需单独安装
☁️ 使用方法:
- 注册 Modal 账号:https://modal.com/
- 配置 Token:运行
modal token new - 运行推理:
modal_infer.exe或python modal_infer.py
💡 使用建议:
- 本地无 GPU 或显存不足时使用云端推理
- T4 GPU 性价比最高,适合一般转录任务
- 大量任务可选择 A10G/A100 加速处理
v1.5 (2025-12-26)
- 🔧 字幕合并后处理:新增
segment_merge配置选项,智能合并重复/重叠的字幕片段 - ⚙️ 灵活配置:在
generation_config.json5中配置合并参数(启用/禁用、最大间隔、最大时长) - 🎛️ 命令行覆盖:支持通过命令行参数覆盖配置文件设置
--merge_segments/--no_merge_segments:启用/禁用合并--merge_max_gap_ms:设置允许合并的最大片段间隔(毫秒)--merge_max_duration_ms:设置合并后单条字幕的最大时长(毫秒)
- 🚀 算法优化:改进合并算法,通过间隔和时长限制避免产生过长的字幕
💡 使用建议:
- 如遇到"单条字幕持续时间异常过长"的情况,可调小
max_gap_ms或max_duration_ms - 如需完全禁用合并功能,将
enabled设为false或使用--no_merge_segments参数
v1.4 (2025-11-25)
- 🚀 批处理推理支持:新增批处理推理模式(--enable_batching),大幅提升处理速度
- ⚡ 智能批次大小自动检测:程序启动时自动测试不同批次大小(1-8),找到显存允许的最大批次
- 🎯 手动批次大小控制:支持通过 --batch_size 参数手动指定批次大小,跳过自动检测
- 🔧 运行时自适应调整:处理过程中如遇到显存不足(OOM),自动降低批次大小(每次减少20%)继续处理
- 📈 最大批次大小配置:通过 --max_batch_size 参数控制自动检测的上限(默认8,可根据显存调整)
- 📦 新增高显存加速模式:提供 "运行(GPU,高显存加速模式).bat" 专门为8GB+显存用户优化
- 🔨 修复批处理兼容性:应用补丁修复faster-whisper批处理的max_initial_timestamp参数传递问题
- 🌐 批处理日志国际化:为批处理功能添加完整的中英文本地化消息,便于调试和使用
📊 批处理模式说明:
- 并行处理优势:批处理模式下,多个音频片段并行转录,每个片段独立处理,不依赖前面片段的结果
- 精度权衡:批处理可能略微降低转录精度(由于失去了条件生成的上下文信息)
- 特殊场景优化:在某些场景下批处理反而效果更好,因为避免了条件生成可能带来的错误传播
- 噪声较多的音频:避免噪声片段影响后续转录
- 多说话人场景:减少不同说话人之间的相互干扰
- 长音频文件:防止错误累积效应
🎮 使用建议:
- 8GB+ 显存:使用 "运行(GPU,高显存加速模式).bat",自动检测最优批次大小
- 4-8GB 显存:手动设置较小批次大小,如 --batch_size=2 或 4
- 追求最高精度:使用常规模式(不加 --enable_batching 参数)
- 追求处理速度:启用批处理模式,接受轻微的精度权衡
v1.3 (2025-11-17)
- 🤖 智能计算类型选择:自动检测设备并选择最优计算类型(bfloat16 > float16 > int8 > float32)
- 🔍 增强设备自动检测:改进CUDA可用性检测,支持CUDA_VISIBLE_DEVICES环境变量
- 🔇 抑制警告信息:添加TRANSFORMERS_NO_ADVISORY_WARNINGS环境变量,减少日志噪音
- 🎯 简化批处理文件:移除硬编码的计算类型设置,全部使用自动检测模式
- 📊 改进日志记录:添加自动检测设备和计算类型的详细日志信息
- 🐛 修复日志重复问题:移除重复的根日志处理器,避免日志重复输出
- 🌐 增强国际化支持:为自动检测功能添加完整的中英文本地化消息
v1.2 (2025-11-15)
- ⚡ CPU模式性能优化:添加 int16 计算类型支持,提升CPU处理速度
- 🎮 GPU兼容性改进:强制使用 float16 替代模型精度 bfloat16,提升显卡兼容性
- 🔧 精简批处理文件:合并视频翻译功能到主批处理文件中
- 📝 新增日志记录功能:自动保存运行日志到 latest.log 文件,方便问题反馈
v1.1 (2025-11-14)
- 🌐 离线支持改进:预下载 whisper-base 模型文件,实现完全离线运行
- 📥 自动模型管理:WhisperFeatureExtractor 优先使用本地模型,避免网络超时
- 🔧 优化下载流程:支持从已有模型文件夹复制,减少重复下载
- 🚀 提升稳定性:解决网络不稳定环境下的 HuggingFace 连接超时问题
v1.0 (2025-11-13)
- 🎯 支持多CUDA版本(11.8/12.2/12.8)
- 🚀 优化的日文转中文翻译效果(海南鸡v2版本)
- 🔊 音声优化的VAD语音活动检测
- 💾 改进的缓存机制,加快CI/CD构建速度
- 📦 分离的基础版和完整版,满足不同需求
- 🔧 自动VAD模型下载和管理
📞 技术支持
如遇到问题,请:
- 检查显卡驱动是否为最新版本
- 确认选择了正确的CUDA版本
- 查看控制台输出的错误信息
- 提交Issue到项目仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
🔗 官方链接
- GitHub仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
- 音声优化 VAD 模型: https://huggingface.co/TransWithAI/Whisper-Vad-EncDec-ASMR-onnx
- Telegram群组: https://t.me/transWithAI
- 开发团队: AI汉化组
🙏 致谢
- 🚀 基于 SYSTRAN/faster-whisper 开发
- 🐔 使用 chickenrice0721/whisper-large-v2-translate-zh-v0.2-st 日文转中文优化模型
- 🔊 使用 TransWithAI/Whisper-Vad-EncDec-ASMR-onnx 音声优化 VAD 模型
- 🎙️ OpenAI Whisper 原始项目
- ☁️ 感谢 @Randomless 贡献 Modal 云端推理功能
- 💪 感谢某匿名群友的算力和技术支持
本工具基于 Faster Whisper 开发,海南鸡模型经过5000小时音频数据优化训练,专门针对日文转中文翻译场景。
由AI汉化组开源维护,永久免费。
Release files generated with ading2210/gh-large-releases.
| File Name | Size | SHA-256 Hash |
|---|---|---|
| faster_whisper_transwithai_windows_cu118-chickenrice.zip | 4.54 GiB | 60fd157293d7d5033dab3c013ce3d4a083d1af6460157f1303a622f4f931715f |
| faster_whisper_transwithai_windows_cu118.zip | 2.26 GiB | d581dd2bc84f0ed8d3082f396324285127ae12053e29fa02ea12a1fd25bafd20 |
| [faster_whisper_transwithai_windows_cu122-chickenrice.zip](https://gh-releases.ading2210.w... |
v1.6
🎙️ Faster Whisper 转录工具 - 发行说明
⚠️ 重要声明
本软件为开源软件
🔗 开源地址: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
👥 开发团队: AI汉化组 (https://t.me/transWithAI)
📦 发行包说明
本发行版包含多个变体版本,请根据您的显卡型号选择合适的版本:
🎯 版本类型说明
基础版(Base Package)
- 下载大小:约 2.2GB
- 包含内容:
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD(语音活动检测)ONNX 模型
- ❌ 不含 Whisper 模型(需自行下载)
- 适用场景:需要使用自定义模型的用户
海南鸡版(Chickenrice Edition)
- 下载大小:约 4.4GB
- 包含内容:
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD(语音活动检测)ONNX 模型
- ✅ "海南鸡v2 5000小时" 日文转中文优化模型
- 适用场景:开箱即用的日文转中文翻译
- 模型说明:包含经过5000小时音频数据训练的海南鸡v2版本模型,专门优化日文转中文翻译
📌 文件命名规则
| 文件名后缀 | CUDA版本 | 模型类型 |
|---|---|---|
*_cu118.zip |
CUDA 11.8 | 基础版 |
*_cu118-chickenrice.zip |
CUDA 11.8 | 海南鸡版 |
*_cu122.zip |
CUDA 12.2 | 基础版 |
*_cu122-chickenrice.zip |
CUDA 12.2 | 海南鸡版 |
*_cu128.zip |
CUDA 12.8 | 基础版 |
*_cu128-chickenrice.zip |
CUDA 12.8 | 海南鸡版 |
🔍 如何选择正确的 CUDA 版本
方法一:通过 nvidia-smi 查询
- 打开命令提示符或终端
- 输入命令:
nvidia-smi - 查看输出中的 Driver Version 和 CUDA Version
+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00 Driver Version: 570.00 CUDA Version: 12.8|
+-------------------------------------------------------------------------+
方法二:通过显卡型号和驱动版本对照表
📊 NVIDIA 驱动版本与 CUDA 版本兼容性表
| CUDA 版本 | 最低驱动要求(Windows) | 最低驱动要求(Linux) | 推荐使用场景 |
|---|---|---|---|
| CUDA 11.8 | ≥452.39 | ≥450.80.02 | 较旧的显卡(GTX 10系列、RTX 20/30系列) |
| CUDA 12.2 | ≥525.60.13 | ≥525.60.13 | RTX 30/40系列,较新的驱动 |
| CUDA 12.8 | ≥570.65 | ≥570.26 | RTX 40/50系列,最新驱动 |
🎮 显卡型号推荐表
| 显卡系列 | 推荐 CUDA 版本 | 说明 |
|---|---|---|
| GTX 10系列(1060/1070/1080等) | CUDA 11.8 | 兼容性最好 |
| GTX 16系列(1650/1660等) | CUDA 11.8 | 兼容性最好 |
| RTX 20系列(2060/2070/2080等) | CUDA 11.8 或 12.2 | 根据驱动版本选择 |
| RTX 30系列(3060/3070/3080/3090等) | CUDA 12.2 | 推荐使用 |
| RTX 40系列(4060/4070/4080/4090等) | CUDA 12.2 或 12.8 | 最新驱动用12.8 |
| RTX 50系列(5090/5080/5070等) | 🔴 必须使用 CUDA 12.8 |
⚠️ 重要提示
- RTX 50系列用户:由于新架构要求,必须使用 CUDA 12.8 版本,驱动版本必须 ≥570.00
- 驱动版本查询:在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
- 向下兼容:高版本驱动可以运行低版本CUDA程序(例如:570驱动可以运行CUDA 11.8程序)
- 性能考虑:使用与驱动匹配的CUDA版本可获得最佳性能
📥 模型下载说明
基础版用户(需自行下载模型)
基础版包含VAD模型,但不包含Whisper语音识别模型。您需要:
-
从 Hugging Face 下载模型
- 示例模型地址:https://huggingface.co/chickenrice0721/whisper-large-v2-translate-zh-v0.2-st
- 这是"海南鸡v2 5000小时"版本的日文转中文优化模型
-
放置模型文件
将下载的模型文件放入: faster_whisper_transwithai_chickenrice/ └── models/ └── [您下载的模型文件夹]/ -
其他可用模型
- OpenAI Whisper官方模型
- 其他社区优化模型
海南鸡版用户(开箱即用)
海南鸡版已包含:
- ✅ 音声优化 VAD 语音活动检测模型
- ✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
- ✅ 所有必要的配置文件
无需额外下载,解压后直接运行即可使用!
🚀 快速开始指南
1. 选择版本
根据上述表格,选择适合您显卡的CUDA版本
2. 下载对应版本
- 仅转录/翻译:下载基础版 + 自行下载模型
- 日文转中文优化:下载海南鸡版(推荐)
3. 解压并运行
# GPU模式(推荐)
将音视频文件拖放到 "运行(GPU).bat"
# CPU模式(无显卡用户)
将音视频文件拖放到 "运行(CPU).bat"
# 低显存模式(4GB显存)
将音视频文件拖放到 "运行(GPU,低显存模式).bat"💡 常见问题
Q: 我应该选择哪个CUDA版本?
A: 运行 nvidia-smi 查看您的驱动版本,然后对照上表选择。
Q: 海南鸡版和基础版有什么区别?
A: 海南鸡版包含预训练的日文转中文优化模型(5000小时训练),基础版需要自行下载模型。
Q: RTX 4090 应该用哪个版本?
A: 推荐使用 CUDA 12.2 或 12.8 版本,取决于您的驱动版本。
Q: 显存不足怎么办?
A: 使用"低显存模式"批处理文件,或切换到CPU模式。
📝 更新日志
v1.6 (2026-01-12)
- ☁️ Modal 云端推理支持:新增
modal_infer.exe,无需本地 GPU 也能使用云端 GPU 进行推理(感谢 @Randomless 贡献) - 🎮 多 GPU 选择:支持 T4、L4、A10G、A100、H100 等多种云端 GPU
- 💰 新用户福利:Modal 新用户每月 $30 免费额度,T4 GPU 推荐性价比最高
- 🔧 交互式配置:通过命令行交互选择 GPU 类型、模型、批处理等参数
- 📤 自动文件传输:自动上传本地音频、下载生成的字幕到本地
- 🗃️ 模型缓存:模型文件在 Modal Volume 中缓存,后续运行更快
- 📦 环境整合:Modal 依赖已集成到主环境文件,无需单独安装
☁️ 使用方法:
- 注册 Modal 账号:https://modal.com/
- 配置 Token:运行
modal token new - 运行推理:
modal_infer.exe或python modal_infer.py
💡 使用建议:
- 本地无 GPU 或显存不足时使用云端推理
- T4 GPU 性价比最高,适合一般转录任务
- 大量任务可选择 A10G/A100 加速处理
v1.5 (2025-12-26)
- 🔧 字幕合并后处理:新增
segment_merge配置选项,智能合并重复/重叠的字幕片段 - ⚙️ 灵活配置:在
generation_config.json5中配置合并参数(启用/禁用、最大间隔、最大时长) - 🎛️ 命令行覆盖:支持通过命令行参数覆盖配置文件设置
--merge_segments/--no_merge_segments:启用/禁用合并--merge_max_gap_ms:设置允许合并的最大片段间隔(毫秒)--merge_max_duration_ms:设置合并后单条字幕的最大时长(毫秒)
- 🚀 算法优化:改进合并算法,通过间隔和时长限制避免产生过长的字幕
💡 使用建议:
- 如遇到"单条字幕持续时间异常过长"的情况,可调小
max_gap_ms或max_duration_ms - 如需完全禁用合并功能,将
enabled设为false或使用--no_merge_segments参数
v1.4 (2025-11-25)
- 🚀 批处理推理支持:新增批处理推理模式(--enable_batching),大幅提升处理速度
- ⚡ 智能批次大小自动检测:程序启动时自动测试不同批次大小(1-8),找到显存允许的最大批次
- 🎯 手动批次大小控制:支持通过 --batch_size 参数手动指定批次大小,跳过自动检测
- 🔧 运行时自适应调整:处理过程中如遇到显存不足(OOM),自动降低批次大小(每次减少20%)继续处理
- 📈 最大批次大小配置:通过 --max_batch_size 参数控制自动检测的上限(默认8,可根据显存调整)
- 📦 新增高显存加速模式:提供 "运行(GPU,高显存加速模式).bat" 专门为8GB+显存用户优化
- 🔨 修复批处理兼容性:应用补丁修复faster-whisper批处理的max_initial_timestamp参数传递问题
- 🌐 批处理日志国际化:为批处理功能添加完整的中英文本地化消息,便于调试和使用
📊 批处理模式说明:
- 并行处理优势:批处理模式下,多个音频片段并行转录,每个片段独立处理,不依赖前面片段的结果
- 精度权衡:批处理可能略微降低转录精度(由于失去了条件生成的上下文信息)
- 特殊场景优化:在某些场景下批处理反而效果更好,因为避免了条件生成可能带来的错误传播
- 噪声较多的音频:避免噪声片段影响后续转录
- 多说话人场景:减少不同说话人之间的相互干扰
- 长音频文件:防止错误累积效应
🎮 使用建议:
- 8GB+ 显存:使用 "运行(GPU,高显存加速模式).bat",自动检测最优批次大小
- 4-8GB 显存:手动设置较小批次大小,如 --batch_size=2 或 4
- 追求最高精度:使用常规模式(不加 --enable_batching 参数)
- 追求处理速度:启用批处理模式,接受轻微的精度权衡
v1.3 (2025-11-17)
- 🤖 智能计算类型选择:自动检测设备并选择最优计算类型(bfloat16 > float16 > int8 > float32)
- 🔍 增强设备自动检测:改进CUDA可用性检测,支持CUDA_VISIBLE_DEVICES环境变量
- 🔇 抑制警告信息:添加TRANSFORMERS_NO_ADVISORY_WARNINGS环境变量,减少日志噪音
- 🎯 简化批处理文件:移除硬编码的计算类型设置,全部使用自动检测模式
- 📊 改进日志记录:添加自动检测设备和计算类型的详细日志信息
- 🐛 修复日志重复问题:移除重复的根日志处理器,避免日志重复输出
- 🌐 增强国际化支持:为自动检测功能添加完整的中英文本地化消息
v1.2 (2025-11-15)
- ⚡ CPU模式性能优化:添加 int16 计算类型支持,提升CPU处理速度
- 🎮 GPU兼容性改进:强制使用 float16 替代模型精度 bfloat16,提升显卡兼容性
- 🔧 精简批处理文件:合并视频翻译功能到主批处理文件中
- 📝 新增日志记录功能:自动保存运行日志到 latest.log 文件,方便问题反馈
v1.1 (2025-11-14)
- 🌐 离线支持改进:预下载 whisper-base 模型文件,实现完全离线运行
- 📥 自动模型管理:WhisperFeatureExtractor 优先使用本地模型,避免网络超时
- 🔧 优化下载流程:支持从已有模型文件夹复制,减少重复下载
- 🚀 提升稳定性:解决网络不稳定环境下的 HuggingFace 连接超时问题
v1.0 (2025-11-13)
- 🎯 支持多CUDA版本(11.8/12.2/12.8)
- 🚀 优化的日文转中文翻译效果(海南鸡v2版本)
- 🔊 音声优化的VAD语音活动检测
- 💾 改进的缓存机制,加快CI/CD构建速度
- 📦 分离的基础版和完整版,满足不同需求
- 🔧 自动VAD模型下载和管理
📞 技术支持
如遇到问题,请:
- 检查显卡驱动是否为最新版本
- 确认选择了正确的CUDA版本
- 查看控制台输出的错误信息
- 提交Issue到项目仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
🔗 官方链接
- GitHub仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
- 音声优化 VAD 模型: https://huggingface.co/TransWithAI/Whisper-Vad-EncDec-ASMR-onnx
- Telegram群组: https://t.me/transWithAI
- 开发团队: AI汉化组
🙏 致谢
- 🚀 基于 SYSTRAN/faster-whisper 开发
- 🐔 使用 chickenrice0721/whisper-large-v2-translate-zh-v0.2-st 日文转中文优化模型
- 🔊 使用 TransWithAI/Whisper-Vad-EncDec-ASMR-onnx 音声优化 VAD 模型
- 🎙️ OpenAI Whisper 原始项目
- ☁️ 感谢 @Randomless 贡献 Modal 云端推理功能
- 💪 感谢某匿名群友的算力和技术支持
本工具基于 Faster Whisper 开发,海南鸡模型经过5000小时音频数据优化训练,专门针对日文转中文翻译场景。
由AI汉化组开源维护,永久免费。
Release files generated with ading2210/gh-large-releases.
| File Name | Size | SHA-256 Hash |
|---|---|---|
| faster_whisper_transwithai_windows_cu118-chickenrice.zip | 4.54 GiB | ab1a5af3c0cbfa822eb93050c07f5a8a60607485f5eb20e9e899e67cf6c7a943 |
| faster_whisper_transwithai_windows_cu118.zip | 2.25 GiB | bdc9b987d679c765c18ccb988af43dd0dc2bce6dc469d9d3817c62de5d49e67c |
| faster_whisper_transwithai_windows_cu122-chickenrice.zip | 4.89 GiB | 408e93141206ba48b8a979064f60457aadc94963666958e6ba5d58a87e0b7c3a |
| faster_whisper_transwithai_windows_cu122.zip | 2.61 GiB | c1aefb0df71c60829470553e59e7f4f15c3fee9439d43943d3c362abd61f6cfc |
| faster_whisper_transwithai_windows_cu128-chickenrice.zip | 5.50 GiB | 334fd8bda9f846659d45d599b44273bf30cfc069e1f675105b35eda4fca79c61 |
| faster_whisper_transwithai_windows_cu128.zip | 3.22 GiB | cd470e8084843207e7e19d287b6b5fb4179f7a0eab5a3d12ea92a23850dbefce |
| placeholder.txt | 70.00 B | 527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b |
Important
Download files from the links in the table above, instead of the assets list.
v1.5
🎙️ Faster Whisper 转录工具 - 发行说明
⚠️ 重要声明
本软件为开源软件
🔗 开源地址: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
👥 开发团队: AI汉化组 (https://t.me/transWithAI)
📦 发行包说明
本发行版包含多个变体版本,请根据您的显卡型号选择合适的版本:
🎯 版本类型说明
基础版(Base Package)
- 下载大小:约 2.2GB
- 包含内容:
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD(语音活动检测)ONNX 模型
- ❌ 不含 Whisper 模型(需自行下载)
- 适用场景:需要使用自定义模型的用户
海南鸡版(Chickenrice Edition)
- 下载大小:约 4.4GB
- 包含内容:
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD(语音活动检测)ONNX 模型
- ✅ "海南鸡v2 5000小时" 日文转中文优化模型
- 适用场景:开箱即用的日文转中文翻译
- 模型说明:包含经过5000小时音频数据训练的海南鸡v2版本模型,专门优化日文转中文翻译
📌 文件命名规则
| 文件名后缀 | CUDA版本 | 模型类型 |
|---|---|---|
*_cu118.zip |
CUDA 11.8 | 基础版 |
*_cu118-chickenrice.zip |
CUDA 11.8 | 海南鸡版 |
*_cu122.zip |
CUDA 12.2 | 基础版 |
*_cu122-chickenrice.zip |
CUDA 12.2 | 海南鸡版 |
*_cu128.zip |
CUDA 12.8 | 基础版 |
*_cu128-chickenrice.zip |
CUDA 12.8 | 海南鸡版 |
🔍 如何选择正确的 CUDA 版本
方法一:通过 nvidia-smi 查询
- 打开命令提示符或终端
- 输入命令:
nvidia-smi - 查看输出中的 Driver Version 和 CUDA Version
+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00 Driver Version: 570.00 CUDA Version: 12.8|
+-------------------------------------------------------------------------+
方法二:通过显卡型号和驱动版本对照表
📊 NVIDIA 驱动版本与 CUDA 版本兼容性表
| CUDA 版本 | 最低驱动要求(Windows) | 最低驱动要求(Linux) | 推荐使用场景 |
|---|---|---|---|
| CUDA 11.8 | ≥452.39 | ≥450.80.02 | 较旧的显卡(GTX 10系列、RTX 20/30系列) |
| CUDA 12.2 | ≥525.60.13 | ≥525.60.13 | RTX 30/40系列,较新的驱动 |
| CUDA 12.8 | ≥570.65 | ≥570.26 | RTX 40/50系列,最新驱动 |
🎮 显卡型号推荐表
| 显卡系列 | 推荐 CUDA 版本 | 说明 |
|---|---|---|
| GTX 10系列(1060/1070/1080等) | CUDA 11.8 | 兼容性最好 |
| GTX 16系列(1650/1660等) | CUDA 11.8 | 兼容性最好 |
| RTX 20系列(2060/2070/2080等) | CUDA 11.8 或 12.2 | 根据驱动版本选择 |
| RTX 30系列(3060/3070/3080/3090等) | CUDA 12.2 | 推荐使用 |
| RTX 40系列(4060/4070/4080/4090等) | CUDA 12.2 或 12.8 | 最新驱动用12.8 |
| RTX 50系列(5090/5080/5070等) | 🔴 必须使用 CUDA 12.8 |
⚠️ 重要提示
- RTX 50系列用户:由于新架构要求,必须使用 CUDA 12.8 版本,驱动版本必须 ≥570.00
- 驱动版本查询:在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
- 向下兼容:高版本驱动可以运行低版本CUDA程序(例如:570驱动可以运行CUDA 11.8程序)
- 性能考虑:使用与驱动匹配的CUDA版本可获得最佳性能
📥 模型下载说明
基础版用户(需自行下载模型)
基础版包含VAD模型,但不包含Whisper语音识别模型。您需要:
-
从 Hugging Face 下载模型
- 示例模型地址:https://huggingface.co/chickenrice0721/whisper-large-v2-translate-zh-v0.2-st
- 这是"海南鸡v2 5000小时"版本的日文转中文优化模型
-
放置模型文件
将下载的模型文件放入: faster_whisper_transwithai_chickenrice/ └── models/ └── [您下载的模型文件夹]/ -
其他可用模型
- OpenAI Whisper官方模型
- 其他社区优化模型
海南鸡版用户(开箱即用)
海南鸡版已包含:
- ✅ 音声优化 VAD 语音活动检测模型
- ✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
- ✅ 所有必要的配置文件
无需额外下载,解压后直接运行即可使用!
🚀 快速开始指南
1. 选择版本
根据上述表格,选择适合您显卡的CUDA版本
2. 下载对应版本
- 仅转录/翻译:下载基础版 + 自行下载模型
- 日文转中文优化:下载海南鸡版(推荐)
3. 解压并运行
# GPU模式(推荐)
将音视频文件拖放到 "运行(GPU).bat"
# CPU模式(无显卡用户)
将音视频文件拖放到 "运行(CPU).bat"
# 低显存模式(4GB显存)
将音视频文件拖放到 "运行(GPU,低显存模式).bat"💡 常见问题
Q: 我应该选择哪个CUDA版本?
A: 运行 nvidia-smi 查看您的驱动版本,然后对照上表选择。
Q: 海南鸡版和基础版有什么区别?
A: 海南鸡版包含预训练的日文转中文优化模型(5000小时训练),基础版需要自行下载模型。
Q: RTX 4090 应该用哪个版本?
A: 推荐使用 CUDA 12.2 或 12.8 版本,取决于您的驱动版本。
Q: 显存不足怎么办?
A: 使用"低显存模式"批处理文件,或切换到CPU模式。
📝 更新日志
v1.5 (2025-12-26)
- 🔧 字幕合并后处理:新增
segment_merge配置选项,智能合并重复/重叠的字幕片段 - ⚙️ 灵活配置:在
generation_config.json5中配置合并参数(启用/禁用、最大间隔、最大时长) - 🎛️ 命令行覆盖:支持通过命令行参数覆盖配置文件设置
--merge_segments/--no_merge_segments:启用/禁用合并--merge_max_gap_ms:设置允许合并的最大片段间隔(毫秒)--merge_max_duration_ms:设置合并后单条字幕的最大时长(毫秒)
- 🚀 算法优化:改进合并算法,通过间隔和时长限制避免产生过长的字幕
💡 使用建议:
- 如遇到"单条字幕持续时间异常过长"的情况,可调小
max_gap_ms或max_duration_ms - 如需完全禁用合并功能,将
enabled设为false或使用--no_merge_segments参数
v1.4 (2025-11-25)
- 🚀 批处理推理支持:新增批处理推理模式(--enable_batching),大幅提升处理速度
- ⚡ 智能批次大小自动检测:程序启动时自动测试不同批次大小(1-8),找到显存允许的最大批次
- 🎯 手动批次大小控制:支持通过 --batch_size 参数手动指定批次大小,跳过自动检测
- 🔧 运行时自适应调整:处理过程中如遇到显存不足(OOM),自动降低批次大小(每次减少20%)继续处理
- 📈 最大批次大小配置:通过 --max_batch_size 参数控制自动检测的上限(默认8,可根据显存调整)
- 📦 新增高显存加速模式:提供 "运行(GPU,高显存加速模式).bat" 专门为8GB+显存用户优化
- 🔨 修复批处理兼容性:应用补丁修复faster-whisper批处理的max_initial_timestamp参数传递问题
- 🌐 批处理日志国际化:为批处理功能添加完整的中英文本地化消息,便于调试和使用
📊 批处理模式说明:
- 并行处理优势:批处理模式下,多个音频片段并行转录,每个片段独立处理,不依赖前面片段的结果
- 精度权衡:批处理可能略微降低转录精度(由于失去了条件生成的上下文信息)
- 特殊场景优化:在某些场景下批处理反而效果更好,因为避免了条件生成可能带来的错误传播
- 噪声较多的音频:避免噪声片段影响后续转录
- 多说话人场景:减少不同说话人之间的相互干扰
- 长音频文件:防止错误累积效应
🎮 使用建议:
- 8GB+ 显存:使用 "运行(GPU,高显存加速模式).bat",自动检测最优批次大小
- 4-8GB 显存:手动设置较小批次大小,如 --batch_size=2 或 4
- 追求最高精度:使用常规模式(不加 --enable_batching 参数)
- 追求处理速度:启用批处理模式,接受轻微的精度权衡
v1.3 (2025-11-17)
- 🤖 智能计算类型选择:自动检测设备并选择最优计算类型(bfloat16 > float16 > int8 > float32)
- 🔍 增强设备自动检测:改进CUDA可用性检测,支持CUDA_VISIBLE_DEVICES环境变量
- 🔇 抑制警告信息:添加TRANSFORMERS_NO_ADVISORY_WARNINGS环境变量,减少日志噪音
- 🎯 简化批处理文件:移除硬编码的计算类型设置,全部使用自动检测模式
- 📊 改进日志记录:添加自动检测设备和计算类型的详细日志信息
- 🐛 修复日志重复问题:移除重复的根日志处理器,避免日志重复输出
- 🌐 增强国际化支持:为自动检测功能添加完整的中英文本地化消息
v1.2 (2025-11-15)
- ⚡ CPU模式性能优化:添加 int16 计算类型支持,提升CPU处理速度
- 🎮 GPU兼容性改进:强制使用 float16 替代模型精度 bfloat16,提升显卡兼容性
- 🔧 精简批处理文件:合并视频翻译功能到主批处理文件中
- 📝 新增日志记录功能:自动保存运行日志到 latest.log 文件,方便问题反馈
v1.1 (2025-11-14)
- 🌐 离线支持改进:预下载 whisper-base 模型文件,实现完全离线运行
- 📥 自动模型管理:WhisperFeatureExtractor 优先使用本地模型,避免网络超时
- 🔧 优化下载流程:支持从已有模型文件夹复制,减少重复下载
- 🚀 提升稳定性:解决网络不稳定环境下的 HuggingFace 连接超时问题
v1.0 (2025-11-13)
- 🎯 支持多CUDA版本(11.8/12.2/12.8)
- 🚀 优化的日文转中文翻译效果(海南鸡v2版本)
- 🔊 音声优化的VAD语音活动检测
- 💾 改进的缓存机制,加快CI/CD构建速度
- 📦 分离的基础版和完整版,满足不同需求
- 🔧 自动VAD模型下载和管理
📞 技术支持
如遇到问题,请:
- 检查显卡驱动是否为最新版本
- 确认选择了正确的CUDA版本
- 查看控制台输出的错误信息
- 提交Issue到项目仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
🔗 官方链接
- GitHub仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
- 音声优化 VAD 模型: https://huggingface.co/TransWithAI/Whisper-Vad-EncDec-ASMR-onnx
- Telegram群组: https://t.me/transWithAI
- 开发团队: AI汉化组
🙏 致谢
- 🚀 基于 SYSTRAN/faster-whisper 开发
- 🐔 使用 chickenrice0721/whisper-large-v2-translate-zh-v0.2-st 日文转中文优化模型
- 🔊 使用 TransWithAI/Whisper-Vad-EncDec-ASMR-onnx 音声优化 VAD 模型
- 🎙️ OpenAI Whisper 原始项目
- 💪 感谢某匿名群友的算力和技术支持
本工具基于 Faster Whisper 开发,海南鸡模型经过5000小时音频数据优化训练,专门针对日文转中文翻译场景。
由AI汉化组开源维护,永久免费。
Release files generated with ading2210/gh-large-releases.
| File Name | Size | SHA-256 Hash |
|---|---|---|
| faster_whisper_transwithai_windows_cu118-chickenrice.zip | 4.50 GiB | 81de7976144908e0994eecad439d2a2b4df5b13840a6afe4840b67e8ff26b070 |
| faster_whisper_transwithai_windows_cu118.zip | 2.22 GiB | 701dfd9e5b512e408773276e333213328114f7c3c9f9fceabcd34a97e749cbbd |
| faster_whisper_transwithai_windows_cu122-chickenrice.zip | 4.70 GiB | 17da33f6534f5491580c0a4a4b950eb0152db92cbb820d84d93288d38c896f92 |
| faster_whisper_transwithai_windows_cu122.zip | 2.42 GiB | 86c741ae195db1db829710b094dfbd996ef3b60d76d612f6461647d862a7f170 |
| faster_whisper_transwithai_windows_cu128-chickenrice.zip | 5.32 GiB | 0fd924f87f5d6df4e074162e44a8c73c4cd3cfb38ee8d2a48806d1939a23bb49 |
| faster_whisper_transwithai_windows_cu128.zip | 3.04 GiB | b2d9dbfc2e4116a9b0c2762b8bea158206b8b183c4148ee7b6d6435ac47a6bcb |
| placeholder.txt | 70.00 B | 527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b |
Important
Download files from the links in the table above, instead of the assets list.
v1.4
🎙️ Faster Whisper 转录工具 - 发行说明
⚠️ 重要声明
本软件为开源软件
🔗 开源地址: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
👥 开发团队: AI汉化组 (https://t.me/transWithAI)
📦 发行包说明
本发行版包含多个变体版本,请根据您的显卡型号选择合适的版本:
🎯 版本类型说明
基础版(Base Package)
- 下载大小:约 2.2GB
- 包含内容:
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD(语音活动检测)ONNX 模型
- ❌ 不含 Whisper 模型(需自行下载)
- 适用场景:需要使用自定义模型的用户
海南鸡版(Chickenrice Edition)
- 下载大小:约 4.4GB
- 包含内容:
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD(语音活动检测)ONNX 模型
- ✅ "海南鸡v2 5000小时" 日文转中文优化模型
- 适用场景:开箱即用的日文转中文翻译
- 模型说明:包含经过5000小时音频数据训练的海南鸡v2版本模型,专门优化日文转中文翻译
📌 文件命名规则
| 文件名后缀 | CUDA版本 | 模型类型 |
|---|---|---|
*_cu118.zip |
CUDA 11.8 | 基础版 |
*_cu118-chickenrice.zip |
CUDA 11.8 | 海南鸡版 |
*_cu122.zip |
CUDA 12.2 | 基础版 |
*_cu122-chickenrice.zip |
CUDA 12.2 | 海南鸡版 |
*_cu128.zip |
CUDA 12.8 | 基础版 |
*_cu128-chickenrice.zip |
CUDA 12.8 | 海南鸡版 |
🔍 如何选择正确的 CUDA 版本
方法一:通过 nvidia-smi 查询
- 打开命令提示符或终端
- 输入命令:
nvidia-smi - 查看输出中的 Driver Version 和 CUDA Version
+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00 Driver Version: 570.00 CUDA Version: 12.8|
+-------------------------------------------------------------------------+
方法二:通过显卡型号和驱动版本对照表
📊 NVIDIA 驱动版本与 CUDA 版本兼容性表
| CUDA 版本 | 最低驱动要求(Windows) | 最低驱动要求(Linux) | 推荐使用场景 |
|---|---|---|---|
| CUDA 11.8 | ≥452.39 | ≥450.80.02 | 较旧的显卡(GTX 10系列、RTX 20/30系列) |
| CUDA 12.2 | ≥525.60.13 | ≥525.60.13 | RTX 30/40系列,较新的驱动 |
| CUDA 12.8 | ≥570.65 | ≥570.26 | RTX 40/50系列,最新驱动 |
🎮 显卡型号推荐表
| 显卡系列 | 推荐 CUDA 版本 | 说明 |
|---|---|---|
| GTX 10系列(1060/1070/1080等) | CUDA 11.8 | 兼容性最好 |
| GTX 16系列(1650/1660等) | CUDA 11.8 | 兼容性最好 |
| RTX 20系列(2060/2070/2080等) | CUDA 11.8 或 12.2 | 根据驱动版本选择 |
| RTX 30系列(3060/3070/3080/3090等) | CUDA 12.2 | 推荐使用 |
| RTX 40系列(4060/4070/4080/4090等) | CUDA 12.2 或 12.8 | 最新驱动用12.8 |
| RTX 50系列(5090/5080/5070等) | 🔴 必须使用 CUDA 12.8 |
⚠️ 重要提示
- RTX 50系列用户:由于新架构要求,必须使用 CUDA 12.8 版本,驱动版本必须 ≥570.00
- 驱动版本查询:在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
- 向下兼容:高版本驱动可以运行低版本CUDA程序(例如:570驱动可以运行CUDA 11.8程序)
- 性能考虑:使用与驱动匹配的CUDA版本可获得最佳性能
📥 模型下载说明
基础版用户(需自行下载模型)
基础版包含VAD模型,但不包含Whisper语音识别模型。您需要:
-
从 Hugging Face 下载模型
- 示例模型地址:https://huggingface.co/chickenrice0721/whisper-large-v2-translate-zh-v0.2-st
- 这是"海南鸡v2 5000小时"版本的日文转中文优化模型
-
放置模型文件
将下载的模型文件放入: faster_whisper_transwithai_chickenrice/ └── models/ └── [您下载的模型文件夹]/ -
其他可用模型
- OpenAI Whisper官方模型
- 其他社区优化模型
海南鸡版用户(开箱即用)
海南鸡版已包含:
- ✅ 音声优化 VAD 语音活动检测模型
- ✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
- ✅ 所有必要的配置文件
无需额外下载,解压后直接运行即可使用!
🚀 快速开始指南
1. 选择版本
根据上述表格,选择适合您显卡的CUDA版本
2. 下载对应版本
- 仅转录/翻译:下载基础版 + 自行下载模型
- 日文转中文优化:下载海南鸡版(推荐)
3. 解压并运行
# GPU模式(推荐)
将音视频文件拖放到 "运行(GPU).bat"
# CPU模式(无显卡用户)
将音视频文件拖放到 "运行(CPU).bat"
# 低显存模式(4GB显存)
将音视频文件拖放到 "运行(GPU,低显存模式).bat"💡 常见问题
Q: 我应该选择哪个CUDA版本?
A: 运行 nvidia-smi 查看您的驱动版本,然后对照上表选择。
Q: 海南鸡版和基础版有什么区别?
A: 海南鸡版包含预训练的日文转中文优化模型(5000小时训练),基础版需要自行下载模型。
Q: RTX 4090 应该用哪个版本?
A: 推荐使用 CUDA 12.2 或 12.8 版本,取决于您的驱动版本。
Q: 显存不足怎么办?
A: 使用"低显存模式"批处理文件,或切换到CPU模式。
📝 更新日志
v1.4 (2025-11-25)
- 🚀 批处理推理支持:新增批处理推理模式(--enable_batching),大幅提升处理速度
- ⚡ 智能批次大小自动检测:程序启动时自动测试不同批次大小(1-8),找到显存允许的最大批次
- 🎯 手动批次大小控制:支持通过 --batch_size 参数手动指定批次大小,跳过自动检测
- 🔧 运行时自适应调整:处理过程中如遇到显存不足(OOM),自动降低批次大小(每次减少20%)继续处理
- 📈 最大批次大小配置:通过 --max_batch_size 参数控制自动检测的上限(默认8,可根据显存调整)
- 📦 新增高显存加速模式:提供 "运行(GPU,高显存加速模式).bat" 专门为8GB+显存用户优化
- 🔨 修复批处理兼容性:应用补丁修复faster-whisper批处理的max_initial_timestamp参数传递问题
- 🌐 批处理日志国际化:为批处理功能添加完整的中英文本地化消息,便于调试和使用
📊 批处理模式说明:
- 并行处理优势:批处理模式下,多个音频片段并行转录,每个片段独立处理,不依赖前面片段的结果
- 精度权衡:批处理可能略微降低转录精度(由于失去了条件生成的上下文信息)
- 特殊场景优化:在某些场景下批处理反而效果更好,因为避免了条件生成可能带来的错误传播
- 噪声较多的音频:避免噪声片段影响后续转录
- 多说话人场景:减少不同说话人之间的相互干扰
- 长音频文件:防止错误累积效应
🎮 使用建议:
- 8GB+ 显存:使用 "运行(GPU,高显存加速模式).bat",自动检测最优批次大小
- 4-8GB 显存:手动设置较小批次大小,如 --batch_size=2 或 4
- 追求最高精度:使用常规模式(不加 --enable_batching 参数)
- 追求处理速度:启用批处理模式,接受轻微的精度权衡
v1.3 (2025-11-17)
- 🤖 智能计算类型选择:自动检测设备并选择最优计算类型(bfloat16 > float16 > int8 > float32)
- 🔍 增强设备自动检测:改进CUDA可用性检测,支持CUDA_VISIBLE_DEVICES环境变量
- 🔇 抑制警告信息:添加TRANSFORMERS_NO_ADVISORY_WARNINGS环境变量,减少日志噪音
- 🎯 简化批处理文件:移除硬编码的计算类型设置,全部使用自动检测模式
- 📊 改进日志记录:添加自动检测设备和计算类型的详细日志信息
- 🐛 修复日志重复问题:移除重复的根日志处理器,避免日志重复输出
- 🌐 增强国际化支持:为自动检测功能添加完整的中英文本地化消息
v1.2 (2025-11-15)
- ⚡ CPU模式性能优化:添加 int16 计算类型支持,提升CPU处理速度
- 🎮 GPU兼容性改进:强制使用 float16 替代模型精度 bfloat16,提升显卡兼容性
- 🔧 精简批处理文件:合并视频翻译功能到主批处理文件中
- 📝 新增日志记录功能:自动保存运行日志到 latest.log 文件,方便问题反馈
v1.1 (2025-11-14)
- 🌐 离线支持改进:预下载 whisper-base 模型文件,实现完全离线运行
- 📥 自动模型管理:WhisperFeatureExtractor 优先使用本地模型,避免网络超时
- 🔧 优化下载流程:支持从已有模型文件夹复制,减少重复下载
- 🚀 提升稳定性:解决网络不稳定环境下的 HuggingFace 连接超时问题
v1.0 (2025-11-13)
- 🎯 支持多CUDA版本(11.8/12.2/12.8)
- 🚀 优化的日文转中文翻译效果(海南鸡v2版本)
- 🔊 音声优化的VAD语音活动检测
- 💾 改进的缓存机制,加快CI/CD构建速度
- 📦 分离的基础版和完整版,满足不同需求
- 🔧 自动VAD模型下载和管理
📞 技术支持
如遇到问题,请:
- 检查显卡驱动是否为最新版本
- 确认选择了正确的CUDA版本
- 查看控制台输出的错误信息
- 提交Issue到项目仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
🔗 官方链接
- GitHub仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
- 音声优化 VAD 模型: https://huggingface.co/TransWithAI/Whisper-Vad-EncDec-ASMR-onnx
- Telegram群组: https://t.me/transWithAI
- 开发团队: AI汉化组
🙏 致谢
- 🚀 基于 SYSTRAN/faster-whisper 开发
- 🐔 使用 chickenrice0721/whisper-large-v2-translate-zh-v0.2-st 日文转中文优化模型
- 🔊 使用 TransWithAI/Whisper-Vad-EncDec-ASMR-onnx 音声优化 VAD 模型
- 🎙️ OpenAI Whisper 原始项目
- 💪 感谢某匿名群友的算力和技术支持
本工具基于 Faster Whisper 开发,海南鸡模型经过5000小时音频数据优化训练,专门针对日文转中文翻译场景。
由AI汉化组开源维护,永久免费。
Release files generated with ading2210/gh-large-releases.
| File Name | Size | SHA-256 Hash |
|---|---|---|
| faster_whisper_transwithai_windows_cu118-chickenrice.zip | 4.50 GiB | 2bdf9f8a94db199afc7e5bede90d17d3b076616bc3a9d8ec6d1643d31dabe159 |
| faster_whisper_transwithai_windows_cu118.zip | 2.22 GiB | 25b48144f1d442f21b4a5730612dc0e8e76ea61100768a602369560429c952aa |
| faster_whisper_transwithai_windows_cu122-chickenrice.zip | 4.70 GiB | 470d4c0c39a5c6aa99e820897404bb91462fbe19cb56ec4124e672251c6cd4cd |
| faster_whisper_transwithai_windows_cu122.zip | 2.42 GiB | 699bb13edbc16db5fd89a1bcbabc8fd50da949425bc0c6c95af3244942020e65 |
| faster_whisper_transwithai_windows_cu128-chickenrice.zip | 5.32 GiB | eb662f0db10999a7734abdf133de7d603dcbe27fe8fd5b27c3265ccfa48723af |
| faster_whisper_transwithai_windows_cu128.zip | 3.04 GiB | 6d046904bb9d5fa2a2b53b7c561659876b93a92e6c048db28769e8bc73a36ac1 |
| placeholder.txt | 70.00 B | 527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b |
Important
Download files from the links in the table above, instead of the assets list.
v1.3
🎙️ Faster Whisper 转录工具 - 发行说明
⚠️ 重要声明
本软件为开源软件
🔗 开源地址: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
👥 开发团队: AI汉化组 (https://t.me/transWithAI)
📦 发行包说明
本发行版包含多个变体版本,请根据您的显卡型号选择合适的版本:
🎯 版本类型说明
基础版(Base Package)
- 下载大小:约 2.2GB
- 包含内容:
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD(语音活动检测)ONNX 模型
- ❌ 不含 Whisper 模型(需自行下载)
- 适用场景:需要使用自定义模型的用户
海南鸡版(Chickenrice Edition)
- 下载大小:约 4.4GB
- 包含内容:
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD(语音活动检测)ONNX 模型
- ✅ "海南鸡v2 5000小时" 日文转中文优化模型
- 适用场景:开箱即用的日文转中文翻译
- 模型说明:包含经过5000小时音频数据训练的海南鸡v2版本模型,专门优化日文转中文翻译
📌 文件命名规则
| 文件名后缀 | CUDA版本 | 模型类型 |
|---|---|---|
*_cu118.zip |
CUDA 11.8 | 基础版 |
*_cu118-chickenrice.zip |
CUDA 11.8 | 海南鸡版 |
*_cu122.zip |
CUDA 12.2 | 基础版 |
*_cu122-chickenrice.zip |
CUDA 12.2 | 海南鸡版 |
*_cu128.zip |
CUDA 12.8 | 基础版 |
*_cu128-chickenrice.zip |
CUDA 12.8 | 海南鸡版 |
🔍 如何选择正确的 CUDA 版本
方法一:通过 nvidia-smi 查询
- 打开命令提示符或终端
- 输入命令:
nvidia-smi - 查看输出中的 Driver Version 和 CUDA Version
+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00 Driver Version: 570.00 CUDA Version: 12.8|
+-------------------------------------------------------------------------+
方法二:通过显卡型号和驱动版本对照表
📊 NVIDIA 驱动版本与 CUDA 版本兼容性表
| CUDA 版本 | 最低驱动要求(Windows) | 最低驱动要求(Linux) | 推荐使用场景 |
|---|---|---|---|
| CUDA 11.8 | ≥452.39 | ≥450.80.02 | 较旧的显卡(GTX 10系列、RTX 20/30系列) |
| CUDA 12.2 | ≥525.60.13 | ≥525.60.13 | RTX 30/40系列,较新的驱动 |
| CUDA 12.8 | ≥570.65 | ≥570.26 | RTX 40/50系列,最新驱动 |
🎮 显卡型号推荐表
| 显卡系列 | 推荐 CUDA 版本 | 说明 |
|---|---|---|
| GTX 10系列(1060/1070/1080等) | CUDA 11.8 | 兼容性最好 |
| GTX 16系列(1650/1660等) | CUDA 11.8 | 兼容性最好 |
| RTX 20系列(2060/2070/2080等) | CUDA 11.8 或 12.2 | 根据驱动版本选择 |
| RTX 30系列(3060/3070/3080/3090等) | CUDA 12.2 | 推荐使用 |
| RTX 40系列(4060/4070/4080/4090等) | CUDA 12.2 或 12.8 | 最新驱动用12.8 |
| RTX 50系列(5090/5080/5070等) | 🔴 必须使用 CUDA 12.8 |
⚠️ 重要提示
- RTX 50系列用户:由于新架构要求,必须使用 CUDA 12.8 版本,驱动版本必须 ≥570.00
- 驱动版本查询:在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
- 向下兼容:高版本驱动可以运行低版本CUDA程序(例如:570驱动可以运行CUDA 11.8程序)
- 性能考虑:使用与驱动匹配的CUDA版本可获得最佳性能
📥 模型下载说明
基础版用户(需自行下载模型)
基础版包含VAD模型,但不包含Whisper语音识别模型。您需要:
-
从 Hugging Face 下载模型
- 示例模型地址:https://huggingface.co/chickenrice0721/whisper-large-v2-translate-zh-v0.2-st
- 这是"海南鸡v2 5000小时"版本的日文转中文优化模型
-
放置模型文件
将下载的模型文件放入: faster_whisper_transwithai_chickenrice/ └── models/ └── [您下载的模型文件夹]/ -
其他可用模型
- OpenAI Whisper官方模型
- 其他社区优化模型
海南鸡版用户(开箱即用)
海南鸡版已包含:
- ✅ 音声优化 VAD 语音活动检测模型
- ✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
- ✅ 所有必要的配置文件
无需额外下载,解压后直接运行即可使用!
🚀 快速开始指南
1. 选择版本
根据上述表格,选择适合您显卡的CUDA版本
2. 下载对应版本
- 仅转录/翻译:下载基础版 + 自行下载模型
- 日文转中文优化:下载海南鸡版(推荐)
3. 解压并运行
# GPU模式(推荐)
将音视频文件拖放到 "运行(GPU).bat"
# CPU模式(无显卡用户)
将音视频文件拖放到 "运行(CPU).bat"
# 低显存模式(4GB显存)
将音视频文件拖放到 "运行(GPU,低显存模式).bat"💡 常见问题
Q: 我应该选择哪个CUDA版本?
A: 运行 nvidia-smi 查看您的驱动版本,然后对照上表选择。
Q: 海南鸡版和基础版有什么区别?
A: 海南鸡版包含预训练的日文转中文优化模型(5000小时训练),基础版需要自行下载模型。
Q: RTX 4090 应该用哪个版本?
A: 推荐使用 CUDA 12.2 或 12.8 版本,取决于您的驱动版本。
Q: 显存不足怎么办?
A: 使用"低显存模式"批处理文件,或切换到CPU模式。
📝 更新日志
v1.3 (2025-11-17)
- 🤖 智能计算类型选择:自动检测设备并选择最优计算类型(bfloat16 > float16 > int8 > float32)
- 🔍 增强设备自动检测:改进CUDA可用性检测,支持CUDA_VISIBLE_DEVICES环境变量
- 🔇 抑制警告信息:添加TRANSFORMERS_NO_ADVISORY_WARNINGS环境变量,减少日志噪音
- 🎯 简化批处理文件:移除硬编码的计算类型设置,全部使用自动检测模式
- 📊 改进日志记录:添加自动检测设备和计算类型的详细日志信息
- 🐛 修复日志重复问题:移除重复的根日志处理器,避免日志重复输出
- 🌐 增强国际化支持:为自动检测功能添加完整的中英文本地化消息
v1.2 (2025-11-15)
- ⚡ CPU模式性能优化:添加 int16 计算类型支持,提升CPU处理速度
- 🎮 GPU兼容性改进:强制使用 float16 替代模型精度 bfloat16,提升显卡兼容性
- 🔧 精简批处理文件:合并视频翻译功能到主批处理文件中
- 📝 新增日志记录功能:自动保存运行日志到 latest.log 文件,方便问题反馈
v1.1 (2025-11-14)
- 🌐 离线支持改进:预下载 whisper-base 模型文件,实现完全离线运行
- 📥 自动模型管理:WhisperFeatureExtractor 优先使用本地模型,避免网络超时
- 🔧 优化下载流程:支持从已有模型文件夹复制,减少重复下载
- 🚀 提升稳定性:解决网络不稳定环境下的 HuggingFace 连接超时问题
v1.0 (2025-11-13)
- 🎯 支持多CUDA版本(11.8/12.2/12.8)
- 🚀 优化的日文转中文翻译效果(海南鸡v2版本)
- 🔊 音声优化的VAD语音活动检测
- 💾 改进的缓存机制,加快CI/CD构建速度
- 📦 分离的基础版和完整版,满足不同需求
- 🔧 自动VAD模型下载和管理
📞 技术支持
如遇到问题,请:
- 检查显卡驱动是否为最新版本
- 确认选择了正确的CUDA版本
- 查看控制台输出的错误信息
- 提交Issue到项目仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
🔗 官方链接
- GitHub仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
- 音声优化 VAD 模型: https://huggingface.co/TransWithAI/Whisper-Vad-EncDec-ASMR-onnx
- Telegram群组: https://t.me/transWithAI
- 开发团队: AI汉化组
🙏 致谢
- 🚀 基于 SYSTRAN/faster-whisper 开发
- 🐔 使用 chickenrice0721/whisper-large-v2-translate-zh-v0.2-st 日文转中文优化模型
- 🔊 使用 TransWithAI/Whisper-Vad-EncDec-ASMR-onnx 音声优化 VAD 模型
- 🎙️ OpenAI Whisper 原始项目
- 💪 感谢某匿名群友的算力和技术支持
本工具基于 Faster Whisper 开发,海南鸡模型经过5000小时音频数据优化训练,专门针对日文转中文翻译场景。
由AI汉化组开源维护,永久免费。
Release files generated with ading2210/gh-large-releases.
| File Name | Size | SHA-256 Hash |
|---|---|---|
| faster_whisper_transwithai_windows_cu118-chickenrice.zip | 4.50 GiB | ba5085c3c8d1870bc88392783d9b06d62df305c2bf77d53a8210cea8992571c3 |
| faster_whisper_transwithai_windows_cu118.zip | 2.22 GiB | 30d314fe658a182c267a056965d1028c60c66489a43d662f42bca70fe7050bbc |
| faster_whisper_transwithai_windows_cu122-chickenrice.zip | 4.70 GiB | ee0bbf0cf35e0ee1624de504731056fb012495b55c046271dcba5d448ba293d1 |
| faster_whisper_transwithai_windows_cu122.zip | 2.42 GiB | 35fdc61c374bc3fac22fc0396a2b4cb01570feea53ffc6ce10099a6830f96ed1 |
| faster_whisper_transwithai_windows_cu128-chickenrice.zip | 5.32 GiB | 43b1317561ea95390d2cd90f8264090c3e61f726bb81951fdc6e6e37322b0586 |
| faster_whisper_transwithai_windows_cu128.zip | 3.04 GiB | ca5fb064a8bfdf795a6741dfc2c255373be367d84db49a066a5fdd638ed5542f |
| placeholder.txt | 70.00 B | 527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b |
Important
Download files from the links in the table above, instead of the assets list.
v1.2
🎙️ Faster Whisper 转录工具 - 发行说明
⚠️ 重要声明
本软件为开源软件
🔗 开源地址: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
👥 开发团队: AI汉化组 (https://t.me/transWithAI)
📦 发行包说明
本发行版包含多个变体版本,请根据您的显卡型号选择合适的版本:
🎯 版本类型说明
基础版(Base Package)
- 下载大小:约 2.2GB
- 包含内容:
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD(语音活动检测)ONNX 模型
- ❌ 不含 Whisper 模型(需自行下载)
- 适用场景:需要使用自定义模型的用户
海南鸡版(Chickenrice Edition)
- 下载大小:约 4.4GB
- 包含内容:
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD(语音活动检测)ONNX 模型
- ✅ "海南鸡v2 5000小时" 日文转中文优化模型
- 适用场景:开箱即用的日文转中文翻译
- 模型说明:包含经过5000小时音频数据训练的海南鸡v2版本模型,专门优化日文转中文翻译
📌 文件命名规则
| 文件名后缀 | CUDA版本 | 模型类型 |
|---|---|---|
*_cu118.zip |
CUDA 11.8 | 基础版 |
*_cu118-chickenrice.zip |
CUDA 11.8 | 海南鸡版 |
*_cu122.zip |
CUDA 12.2 | 基础版 |
*_cu122-chickenrice.zip |
CUDA 12.2 | 海南鸡版 |
*_cu128.zip |
CUDA 12.8 | 基础版 |
*_cu128-chickenrice.zip |
CUDA 12.8 | 海南鸡版 |
🔍 如何选择正确的 CUDA 版本
方法一:通过 nvidia-smi 查询
- 打开命令提示符或终端
- 输入命令:
nvidia-smi - 查看输出中的 Driver Version 和 CUDA Version
+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00 Driver Version: 570.00 CUDA Version: 12.8|
+-------------------------------------------------------------------------+
方法二:通过显卡型号和驱动版本对照表
📊 NVIDIA 驱动版本与 CUDA 版本兼容性表
| CUDA 版本 | 最低驱动要求(Windows) | 最低驱动要求(Linux) | 推荐使用场景 |
|---|---|---|---|
| CUDA 11.8 | ≥452.39 | ≥450.80.02 | 较旧的显卡(GTX 10系列、RTX 20/30系列) |
| CUDA 12.2 | ≥525.60.13 | ≥525.60.13 | RTX 30/40系列,较新的驱动 |
| CUDA 12.8 | ≥570.65 | ≥570.26 | RTX 40/50系列,最新驱动 |
🎮 显卡型号推荐表
| 显卡系列 | 推荐 CUDA 版本 | 说明 |
|---|---|---|
| GTX 10系列(1060/1070/1080等) | CUDA 11.8 | 兼容性最好 |
| GTX 16系列(1650/1660等) | CUDA 11.8 | 兼容性最好 |
| RTX 20系列(2060/2070/2080等) | CUDA 11.8 或 12.2 | 根据驱动版本选择 |
| RTX 30系列(3060/3070/3080/3090等) | CUDA 12.2 | 推荐使用 |
| RTX 40系列(4060/4070/4080/4090等) | CUDA 12.2 或 12.8 | 最新驱动用12.8 |
| RTX 50系列(5090/5080/5070等) | 🔴 必须使用 CUDA 12.8 |
⚠️ 重要提示
- RTX 50系列用户:由于新架构要求,必须使用 CUDA 12.8 版本,驱动版本必须 ≥570.00
- 驱动版本查询:在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
- 向下兼容:高版本驱动可以运行低版本CUDA程序(例如:570驱动可以运行CUDA 11.8程序)
- 性能考虑:使用与驱动匹配的CUDA版本可获得最佳性能
📥 模型下载说明
基础版用户(需自行下载模型)
基础版包含VAD模型,但不包含Whisper语音识别模型。您需要:
-
从 Hugging Face 下载模型
- 示例模型地址:https://huggingface.co/chickenrice0721/whisper-large-v2-translate-zh-v0.2-st
- 这是"海南鸡v2 5000小时"版本的日文转中文优化模型
-
放置模型文件
将下载的模型文件放入: faster_whisper_transwithai_chickenrice/ └── models/ └── [您下载的模型文件夹]/ -
其他可用模型
- OpenAI Whisper官方模型
- 其他社区优化模型
海南鸡版用户(开箱即用)
海南鸡版已包含:
- ✅ 音声优化 VAD 语音活动检测模型
- ✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
- ✅ 所有必要的配置文件
无需额外下载,解压后直接运行即可使用!
🚀 快速开始指南
1. 选择版本
根据上述表格,选择适合您显卡的CUDA版本
2. 下载对应版本
- 仅转录/翻译:下载基础版 + 自行下载模型
- 日文转中文优化:下载海南鸡版(推荐)
3. 解压并运行
# GPU模式(推荐)
将音视频文件拖放到 "运行(GPU).bat"
# CPU模式(无显卡用户)
将音视频文件拖放到 "运行(CPU).bat"
# 低显存模式(4GB显存)
将音视频文件拖放到 "运行(GPU,低显存模式).bat"💡 常见问题
Q: 我应该选择哪个CUDA版本?
A: 运行 nvidia-smi 查看您的驱动版本,然后对照上表选择。
Q: 海南鸡版和基础版有什么区别?
A: 海南鸡版包含预训练的日文转中文优化模型(5000小时训练),基础版需要自行下载模型。
Q: RTX 4090 应该用哪个版本?
A: 推荐使用 CUDA 12.2 或 12.8 版本,取决于您的驱动版本。
Q: 显存不足怎么办?
A: 使用"低显存模式"批处理文件,或切换到CPU模式。
📝 更新日志
v1.2 (2025-11-15)
- ⚡ CPU模式性能优化:添加 int16 计算类型支持,提升CPU处理速度
- 🎮 GPU兼容性改进:强制使用 float16 替代模型精度 bfloat16,提升显卡兼容性
- 🔧 精简批处理文件:合并视频翻译功能到主批处理文件中
- 📝 新增日志记录功能:自动保存运行日志到 latest.log 文件,方便问题反馈
v1.1 (2025-11-14)
- 🌐 离线支持改进:预下载 whisper-base 模型文件,实现完全离线运行
- 📥 自动模型管理:WhisperFeatureExtractor 优先使用本地模型,避免网络超时
- 🔧 优化下载流程:支持从已有模型文件夹复制,减少重复下载
- 🚀 提升稳定性:解决网络不稳定环境下的 HuggingFace 连接超时问题
v1.0 (2025-11-13)
- 🎯 支持多CUDA版本(11.8/12.2/12.8)
- 🚀 优化的日文转中文翻译效果(海南鸡v2版本)
- 🔊 音声优化的VAD语音活动检测
- 💾 改进的缓存机制,加快CI/CD构建速度
- 📦 分离的基础版和完整版,满足不同需求
- 🔧 自动VAD模型下载和管理
📞 技术支持
如遇到问题,请:
- 检查显卡驱动是否为最新版本
- 确认选择了正确的CUDA版本
- 查看控制台输出的错误信息
- 提交Issue到项目仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
🔗 官方链接
- GitHub仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
- 音声优化 VAD 模型: https://huggingface.co/TransWithAI/Whisper-Vad-EncDec-ASMR-onnx
- Telegram群组: https://t.me/transWithAI
- 开发团队: AI汉化组
🙏 致谢
- 🚀 基于 SYSTRAN/faster-whisper 开发
- 🐔 使用 chickenrice0721/whisper-large-v2-translate-zh-v0.2-st 日文转中文优化模型
- 🔊 使用 TransWithAI/Whisper-Vad-EncDec-ASMR-onnx 音声优化 VAD 模型
- 🎙️ OpenAI Whisper 原始项目
- 💪 感谢某匿名群友的算力和技术支持
本工具基于 Faster Whisper 开发,海南鸡模型经过5000小时音频数据优化训练,专门针对日文转中文翻译场景。
由AI汉化组开源维护,永久免费。
Release files generated with ading2210/gh-large-releases.
| File Name | Size | SHA-256 Hash |
|---|---|---|
| faster_whisper_transwithai_windows_cu118-chickenrice.zip | 4.50 GiB | 0ea6142efef1449ae4e777948b7302b9c008b8f3eb98357039c8954bed3713f3 |
| faster_whisper_transwithai_windows_cu118.zip | 2.22 GiB | 050d4aaeb451813b397a7325eeb0b232017e495392a3bfed20b6c3a7b183fbde |
| faster_whisper_transwithai_windows_cu122-chickenrice.zip | 4.70 GiB | 7dafdfadbc60363952be5754079ad47ef048519a85b07a232939e5dd98290208 |
| faster_whisper_transwithai_windows_cu122.zip | 2.42 GiB | 16571b127332f5cebee223051fc0871c29649c08d06babc729d5c1a74b300769 |
| faster_whisper_transwithai_windows_cu128-chickenrice.zip | 5.32 GiB | 9bcbf6d3ea0e28a92be56ffb1be939b27b800cd619bf94c6e771409ee553943a |
| faster_whisper_transwithai_windows_cu128.zip | 3.04 GiB | a1e089b9bea7245fc7570d46a51fc7c85018e8392c488a525fde204c5f78b2f8 |
| placeholder.txt | 70.00 B | 527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b |
Important
Download files from the links in the table above, instead of the assets list.
v1.1
🎙️ Faster Whisper 转录工具 - 发行说明
⚠️ 重要声明
本软件为开源软件
🔗 开源地址: https://github.com/haaswiiliammowsigf/Faster-Whisper-TransWithAI-ChickenRice
👥 开发团队: AI汉化组 (https://t.me/transWithAI)
📦 发行包说明
本发行版包含多个变体版本,请根据您的显卡型号选择合适的版本:
🎯 版本类型说明
基础版(Base Package)
- 下载大小:约 2.2GB
- 包含内容:
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD(语音活动检测)ONNX 模型
- ❌ 不含 Whisper 模型(需自行下载)
- 适用场景:需要使用自定义模型的用户
海南鸡版(Chickenrice Edition)
- 下载大小:约 4.4GB
- 包含内容:
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD(语音活动检测)ONNX 模型
- ✅ "海南鸡v2 5000小时" 日文转中文优化模型
- 适用场景:开箱即用的日文转中文翻译
- 模型说明:包含经过5000小时音频数据训练的海南鸡v2版本模型,专门优化日文转中文翻译
📌 文件命名规则
| 文件名后缀 | CUDA版本 | 模型类型 |
|---|---|---|
*_cu118.zip |
CUDA 11.8 | 基础版 |
*_cu118-chickenrice.zip |
CUDA 11.8 | 海南鸡版 |
*_cu122.zip |
CUDA 12.2 | 基础版 |
*_cu122-chickenrice.zip |
CUDA 12.2 | 海南鸡版 |
*_cu128.zip |
CUDA 12.8 | 基础版 |
*_cu128-chickenrice.zip |
CUDA 12.8 | 海南鸡版 |
🔍 如何选择正确的 CUDA 版本
方法一:通过 nvidia-smi 查询
- 打开命令提示符或终端
- 输入命令:
nvidia-smi - 查看输出中的 Driver Version 和 CUDA Version
+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00 Driver Version: 570.00 CUDA Version: 12.8|
+-------------------------------------------------------------------------+
方法二:通过显卡型号和驱动版本对照表
📊 NVIDIA 驱动版本与 CUDA 版本兼容性表
| CUDA 版本 | 最低驱动要求(Windows) | 最低驱动要求(Linux) | 推荐使用场景 |
|---|---|---|---|
| CUDA 11.8 | ≥452.39 | ≥450.80.02 | 较旧的显卡(GTX 10系列、RTX 20/30系列) |
| CUDA 12.2 | ≥525.60.13 | ≥525.60.13 | RTX 30/40系列,较新的驱动 |
| CUDA 12.8 | ≥570.65 | ≥570.26 | RTX 40/50系列,最新驱动 |
🎮 显卡型号推荐表
| 显卡系列 | 推荐 CUDA 版本 | 说明 |
|---|---|---|
| GTX 10系列(1060/1070/1080等) | CUDA 11.8 | 兼容性最好 |
| GTX 16系列(1650/1660等) | CUDA 11.8 | 兼容性最好 |
| RTX 20系列(2060/2070/2080等) | CUDA 11.8 或 12.2 | 根据驱动版本选择 |
| RTX 30系列(3060/3070/3080/3090等) | CUDA 12.2 | 推荐使用 |
| RTX 40系列(4060/4070/4080/4090等) | CUDA 12.2 或 12.8 | 最新驱动用12.8 |
| RTX 50系列(5090/5080/5070等) | 🔴 必须使用 CUDA 12.8 |
⚠️ 重要提示
- RTX 50系列用户:由于新架构要求,必须使用 CUDA 12.8 版本,驱动版本必须 ≥570.00
- 驱动版本查询:在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
- 向下兼容:高版本驱动可以运行低版本CUDA程序(例如:570驱动可以运行CUDA 11.8程序)
- 性能考虑:使用与驱动匹配的CUDA版本可获得最佳性能
📥 模型下载说明
基础版用户(需自行下载模型)
基础版包含VAD模型,但不包含Whisper语音识别模型。您需要:
-
从 Hugging Face 下载模型
- 示例模型地址:https://huggingface.co/chickenrice0721/whisper-large-v2-translate-zh-v0.2-st
- 这是"海南鸡v2 5000小时"版本的日文转中文优化模型
-
放置模型文件
将下载的模型文件放入: faster_whisper_transwithai_chickenrice/ └── models/ └── [您下载的模型文件夹]/ -
其他可用模型
- OpenAI Whisper官方模型
- 其他社区优化模型
海南鸡版用户(开箱即用)
海南鸡版已包含:
- ✅ 音声优化 VAD 语音活动检测模型
- ✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
- ✅ 所有必要的配置文件
无需额外下载,解压后直接运行即可使用!
🚀 快速开始指南
1. 选择版本
根据上述表格,选择适合您显卡的CUDA版本
2. 下载对应版本
- 仅转录/翻译:下载基础版 + 自行下载模型
- 日文转中文优化:下载海南鸡版(推荐)
3. 解压并运行
# GPU模式(推荐)
将音视频文件拖放到 "运行(GPU).bat"
# CPU模式(无显卡用户)
将音视频文件拖放到 "运行(CPU).bat"
# 低显存模式(4GB显存)
将音视频文件拖放到 "运行(GPU,低显存模式).bat"💡 常见问题
Q: 我应该选择哪个CUDA版本?
A: 运行 nvidia-smi 查看您的驱动版本,然后对照上表选择。
Q: 海南鸡版和基础版有什么区别?
A: 海南鸡版包含预训练的日文转中文优化模型(5000小时训练),基础版需要自行下载模型。
Q: RTX 4090 应该用哪个版本?
A: 推荐使用 CUDA 12.2 或 12.8 版本,取决于您的驱动版本。
Q: 显存不足怎么办?
A: 使用"低显存模式"批处理文件,或切换到CPU模式。
📝 更新日志
当前版本特性
- 🎯 支持多CUDA版本(11.8/12.2/12.8)
- 🚀 优化的日文转中文翻译效果(海南鸡v2版本)
- 🔊 音声优化的VAD语音活动检测
- 💾 改进的缓存机制,加快CI/CD构建速度
- 📦 分离的基础版和完整版,满足不同需求
- 🔧 自动VAD模型下载和管理
📞 技术支持
如遇到问题,请:
- 检查显卡驱动是否为最新版本
- 确认选择了正确的CUDA版本
- 查看控制台输出的错误信息
- 提交Issue到项目仓库: https://github.com/haaswiiliammowsigf/Faster-Whisper-TransWithAI-ChickenRice
🔗 官方链接
- GitHub仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
- 音声优化 VAD 模型: https://huggingface.co/TransWithAI/Whisper-Vad-EncDec-ASMR-onnx
- Telegram群组: https://t.me/transWithAI
- 开发团队: AI汉化组
🙏 致谢
- 🚀 基于 SYSTRAN/faster-whisper 开发
- 🐔 使用 chickenrice0721/whisper-large-v2-translate-zh-v0.2-st 日文转中文优化模型
- 🔊 使用 TransWithAI/Whisper-Vad-EncDec-ASMR-onnx 音声优化 VAD 模型
- 🎙️ OpenAI Whisper 原始项目
- 💪 感谢某匿名群友的算力和技术支持
本工具基于 Faster Whisper 开发,海南鸡模型经过5000小时音频数据优化训练,专门针对日文转中文翻译场景。
由AI汉化组开源维护,永久免费。
Release files generated with ading2210/gh-large-releases.
| File Name | Size | SHA-256 Hash |
|---|---|---|
| faster_whisper_transwithai_windows_cu118-chickenrice.zip | 4.50 GiB | 38ddc143c8471655f607ecff3071f1bf81ee7edc0fb962ad5b29ebd6c27b495e |
| faster_whisper_transwithai_windows_cu118.zip | 2.22 GiB | f8d1eff4367d05a123d93627a81b3f54a3ab905aa99dea8ad18449cf010352a5 |
| faster_whisper_transwithai_windows_cu122-chickenrice.zip | 4.70 GiB | 55253da240480ca5ff0f6193fff4df8f05447326519bda37f4133d2ae1e16f7e |
| faster_whisper_transwithai_windows_cu122.zip | 2.42 GiB | 41891bdd70c1a9a7f81371fbd4b5c7885dcc1301bec846fad9e0e41795028607 |
| faster_whisper_transwithai_windows_cu128-chickenrice.zip | 5.32 GiB | f002c5252b33b582ecaa97b8e2d80d0e5d52526c49014db0c92ce71ff733f3e2 |
| faster_whisper_transwithai_windows_cu128.zip | 3.04 GiB | d4459bb699f0c0d2bb6530c69dee7b8712bcc997bcdd5a8c1c4d214880c42352 |
| placeholder.txt | 70.00 B | 527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b |
Important
Download files from the links in the table above, instead of the assets list.
v1.0
🎙️ Faster Whisper 转录工具 - 发行说明
⚠️ 重要声明
本软件为开源软件
🔗 开源地址: https://github.com/haaswiiliammowsigf/Faster-Whisper-TransWithAI-ChickenRice
👥 开发团队: AI汉化组 (https://t.me/transWithAI)
📦 发行包说明
本发行版包含多个变体版本,请根据您的显卡型号选择合适的版本:
🎯 版本类型说明
基础版(Base Package)
- 下载大小:约 2.2GB
- 包含内容:
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD(语音活动检测)ONNX 模型
- ❌ 不含 Whisper 模型(需自行下载)
- 适用场景:需要使用自定义模型的用户
海南鸡版(Chickenrice Edition)
- 下载大小:约 4.4GB
- 包含内容:
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD(语音活动检测)ONNX 模型
- ✅ "海南鸡v2 5000小时" 日文转中文优化模型
- 适用场景:开箱即用的日文转中文翻译
- 模型说明:包含经过5000小时音频数据训练的海南鸡v2版本模型,专门优化日文转中文翻译
📌 文件命名规则
| 文件名后缀 | CUDA版本 | 模型类型 |
|---|---|---|
*_cu118.zip |
CUDA 11.8 | 基础版 |
*_cu118-chickenrice.zip |
CUDA 11.8 | 海南鸡版 |
*_cu122.zip |
CUDA 12.2 | 基础版 |
*_cu122-chickenrice.zip |
CUDA 12.2 | 海南鸡版 |
*_cu128.zip |
CUDA 12.8 | 基础版 |
*_cu128-chickenrice.zip |
CUDA 12.8 | 海南鸡版 |
🔍 如何选择正确的 CUDA 版本
方法一:通过 nvidia-smi 查询
- 打开命令提示符或终端
- 输入命令:
nvidia-smi - 查看输出中的 Driver Version 和 CUDA Version
+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00 Driver Version: 570.00 CUDA Version: 12.8|
+-------------------------------------------------------------------------+
方法二:通过显卡型号和驱动版本对照表
📊 NVIDIA 驱动版本与 CUDA 版本兼容性表
| CUDA 版本 | 最低驱动要求(Windows) | 最低驱动要求(Linux) | 推荐使用场景 |
|---|---|---|---|
| CUDA 11.8 | ≥452.39 | ≥450.80.02 | 较旧的显卡(GTX 10系列、RTX 20/30系列) |
| CUDA 12.2 | ≥525.60.13 | ≥525.60.13 | RTX 30/40系列,较新的驱动 |
| CUDA 12.8 | ≥570.65 | ≥570.26 | RTX 40/50系列,最新驱动 |
🎮 显卡型号推荐表
| 显卡系列 | 推荐 CUDA 版本 | 说明 |
|---|---|---|
| GTX 10系列(1060/1070/1080等) | CUDA 11.8 | 兼容性最好 |
| GTX 16系列(1650/1660等) | CUDA 11.8 | 兼容性最好 |
| RTX 20系列(2060/2070/2080等) | CUDA 11.8 或 12.2 | 根据驱动版本选择 |
| RTX 30系列(3060/3070/3080/3090等) | CUDA 12.2 | 推荐使用 |
| RTX 40系列(4060/4070/4080/4090等) | CUDA 12.2 或 12.8 | 最新驱动用12.8 |
| RTX 50系列(5090/5080/5070等) | 🔴 必须使用 CUDA 12.8 |
⚠️ 重要提示
- RTX 50系列用户:由于新架构要求,必须使用 CUDA 12.8 版本,驱动版本必须 ≥570.00
- 驱动版本查询:在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
- 向下兼容:高版本驱动可以运行低版本CUDA程序(例如:570驱动可以运行CUDA 11.8程序)
- 性能考虑:使用与驱动匹配的CUDA版本可获得最佳性能
📥 模型下载说明
基础版用户(需自行下载模型)
基础版包含VAD模型,但不包含Whisper语音识别模型。您需要:
-
从 Hugging Face 下载模型
- 示例模型地址:https://huggingface.co/chickenrice0721/whisper-large-v2-translate-zh-v0.2-st
- 这是"海南鸡v2 5000小时"版本的日文转中文优化模型
-
放置模型文件
将下载的模型文件放入: faster_whisper_transwithai_chickenrice/ └── models/ └── [您下载的模型文件夹]/ -
其他可用模型
- OpenAI Whisper官方模型
- 其他社区优化模型
海南鸡版用户(开箱即用)
海南鸡版已包含:
- ✅ 音声优化 VAD 语音活动检测模型
- ✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
- ✅ 所有必要的配置文件
无需额外下载,解压后直接运行即可使用!
🚀 快速开始指南
1. 选择版本
根据上述表格,选择适合您显卡的CUDA版本
2. 下载对应版本
- 仅转录/翻译:下载基础版 + 自行下载模型
- 日文转中文优化:下载海南鸡版(推荐)
3. 解压并运行
# GPU模式(推荐)
将音视频文件拖放到 "运行(GPU).bat"
# CPU模式(无显卡用户)
将音视频文件拖放到 "运行(CPU).bat"
# 低显存模式(4GB显存)
将音视频文件拖放到 "运行(GPU,低显存模式).bat"💡 常见问题
Q: 我应该选择哪个CUDA版本?
A: 运行 nvidia-smi 查看您的驱动版本,然后对照上表选择。
Q: 海南鸡版和基础版有什么区别?
A: 海南鸡版包含预训练的日文转中文优化模型(5000小时训练),基础版需要自行下载模型。
Q: RTX 4090 应该用哪个版本?
A: 推荐使用 CUDA 12.2 或 12.8 版本,取决于您的驱动版本。
Q: 显存不足怎么办?
A: 使用"低显存模式"批处理文件,或切换到CPU模式。
📝 更新日志
当前版本特性
- 🎯 支持多CUDA版本(11.8/12.2/12.8)
- 🚀 优化的日文转中文翻译效果(海南鸡v2版本)
- 🔊 音声优化的VAD语音活动检测
- 💾 改进的缓存机制,加快CI/CD构建速度
- 📦 分离的基础版和完整版,满足不同需求
- 🔧 自动VAD模型下载和管理
📞 技术支持
如遇到问题,请:
- 检查显卡驱动是否为最新版本
- 确认选择了正确的CUDA版本
- 查看控制台输出的错误信息
- 提交Issue到项目仓库: https://github.com/haaswiiliammowsigf/Faster-Whisper-TransWithAI-ChickenRice
🔗 官方链接
- GitHub仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
- 音声优化 VAD 模型: https://huggingface.co/TransWithAI/Whisper-Vad-EncDec-ASMR-onnx
- Telegram群组: https://t.me/transWithAI
- 开发团队: AI汉化组
🙏 致谢
- 🚀 基于 SYSTRAN/faster-whisper 开发
- 🐔 使用 chickenrice0721/whisper-large-v2-translate-zh-v0.2-st 日文转中文优化模型
- 🔊 使用 TransWithAI/Whisper-Vad-EncDec-ASMR-onnx 音声优化 VAD 模型
- 🎙️ OpenAI Whisper 原始项目
- 💪 感谢某匿名群友的算力和技术支持
本工具基于 Faster Whisper 开发,海南鸡模型经过5000小时音频数据优化训练,专门针对日文转中文翻译场景。
由AI汉化组开源维护,永久免费。
Release files generated with ading2210/gh-large-releases.
| File Name | Size | SHA-256 Hash |
|---|---|---|
| faster_whisper_transwithai_windows_cu118-chickenrice.zip | 4.50 GiB | c14e6c4a2e6e42a14fbfb7def2d17013ddd1af51e53bad81b03cbcb76b464fd0 |
| faster_whisper_transwithai_windows_cu118.zip | 2.22 GiB | 62c328b6d3cdc703b24127ef3557188bdd9f67453b4acce1429e57cf3d29c1cd |
| faster_whisper_transwithai_windows_cu122-chickenrice.zip | 4.70 GiB | 16044808c80cb5195faa7d56ef15018674504421eafaa9853500b19ef93a1a20 |
| faster_whisper_transwithai_windows_cu122.zip | 2.42 GiB | 7a04b7bd6794d0d02c7d196aa60353e4680ce8cb12bae90070cee098699a5776 |
| faster_whisper_transwithai_windows_cu128-chickenrice.zip | 5.31 GiB | a3d5b297e5291937640116826c51f301d0d78a25e025dcbb03b71ac80d27698a |
| faster_whisper_transwithai_windows_cu128.zip | 3.03 GiB | 2b3af9655d1f1c7fbe31a7cc9c31395062f33461ae50c7a1c23207a75cbb6b87 |
| placeholder.txt | 70.00 B | 527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b |
Important
Download files from the links in the table above, instead of the assets list.