Skip to content

Releases: TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

v1.7

25 Feb 19:15

Choose a tag to compare

🎙️ Faster Whisper 转录工具 - 发行说明

⚠️ 重要声明

本软件为开源软件

🔗 开源地址: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

👥 开发团队: AI汉化组 (https://t.me/transWithAI)


📦 发行包说明

本发行版包含多个变体版本,请根据您的显卡型号选择合适的版本:

🎯 版本类型说明

基础版(Base Package)

  • 下载大小:约 2.2GB
  • 包含内容
    • ✅ 所有 GPU 依赖项
    • ✅ 音声优化 VAD(语音活动检测)ONNX 模型
    • ❌ 不含 Whisper 模型(需自行下载)
  • 适用场景:需要使用自定义模型的用户

海南鸡版(Chickenrice Edition)

  • 下载大小:约 4.4GB
  • 包含内容
    • ✅ 所有 GPU 依赖项
    • ✅ 音声优化 VAD(语音活动检测)ONNX 模型
    • "海南鸡v2 5000小时" 日文转中文优化模型
  • 适用场景:开箱即用的日文转中文翻译
  • 模型说明:包含经过5000小时音频数据训练的海南鸡v2版本模型,专门优化日文转中文翻译

📌 文件命名规则

文件名后缀 CUDA/ROCm 模型类型
*_cu118.zip CUDA 11.8 基础版
*_cu118-chickenrice.zip CUDA 11.8 海南鸡版
*_cu122.zip CUDA 12.2 基础版
*_cu122-chickenrice.zip CUDA 12.2 海南鸡版
*_cu128.zip CUDA 12.8 基础版
*_cu128-chickenrice.zip CUDA 12.8 海南鸡版
*_gfx101x_dgpu.zip AMD ROCm/HIP (gfx101X) 基础版
*_gfx101x_dgpu-chickenrice.zip AMD ROCm/HIP (gfx101X) 海南鸡版
*_gfx103x_dgpu.zip AMD ROCm/HIP (gfx103X) 基础版
*_gfx103x_dgpu-chickenrice.zip AMD ROCm/HIP (gfx103X) 海南鸡版
*_gfx110x_all.zip AMD ROCm/HIP (gfx110X) 基础版
*_gfx110x_all-chickenrice.zip AMD ROCm/HIP (gfx110X) 海南鸡版
*_gfx120x_all.zip AMD ROCm/HIP (gfx120X) 基础版
*_gfx120x_all-chickenrice.zip AMD ROCm/HIP (gfx120X) 海南鸡版

AMD 版本仍然使用 --device=cuda(这是 CTranslate2 在 HIP/ROCm 后端下的公开 API 约定)。命令行也可使用 --device=amd(等同于 --device=cuda)。
暂不提供 gfx115x iGPU/mobile 版本(请使用 CPU 版或 Modal 云端推理)。


🔍 如何选择正确的版本

NVIDIA 显卡 —— 选择 CUDA 版本

方法一:通过 nvidia-smi 查询

  1. 打开命令提示符或终端
  2. 输入命令:nvidia-smi
  3. 查看输出中的 Driver VersionCUDA Version
+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00       Driver Version: 570.00       CUDA Version: 12.8|
+-------------------------------------------------------------------------+

方法二:通过显卡型号和驱动版本对照表

📊 NVIDIA 驱动版本与 CUDA 版本兼容性表

CUDA 版本 最低驱动要求(Windows) 最低驱动要求(Linux) 推荐使用场景
CUDA 11.8 ≥452.39 ≥450.80.02 较旧的显卡(GTX 10系列、RTX 20/30系列)
CUDA 12.2 ≥525.60.13 ≥525.60.13 RTX 30/40系列,较新的驱动
CUDA 12.8 ≥570.65 ≥570.26 RTX 40/50系列,最新驱动

🎮 显卡型号推荐表

显卡系列 推荐 CUDA 版本 说明
GTX 10系列(1060/1070/1080等) CUDA 11.8 兼容性最好
GTX 16系列(1650/1660等) CUDA 11.8 兼容性最好
RTX 20系列(2060/2070/2080等) CUDA 11.812.2 根据驱动版本选择
RTX 30系列(3060/3070/3080/3090等) CUDA 12.2 推荐使用
RTX 40系列(4060/4070/4080/4090等) CUDA 12.212.8 最新驱动用12.8
RTX 50系列(5090/5080/5070等) 🔴 必须使用 CUDA 12.8 ⚠️ 注意:RTX 50系列必须使用CUDA 12.8版本

⚠️ 重要提示

  • RTX 50系列用户:由于新架构要求,必须使用 CUDA 12.8 版本,驱动版本必须 ≥570.00
  • 驱动版本查询:在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
  • 向下兼容:高版本驱动可以运行低版本CUDA程序(例如:570驱动可以运行CUDA 11.8程序)
  • 性能考虑:使用与驱动匹配的CUDA版本可获得最佳性能

AMD 显卡 —— 选择 ROCm/HIP 版本

AMD 显卡用户请下载带有 gfx*** 后缀的版本。AMD 版本已内置 ROCm/HIP 运行时 DLL,一般无需单独安装 ROCm。

快速自查:

显卡型号 下载后缀
RX 5300 / RX 5500 / RX 5600 / RX 5700 系列 gfx101x_dgpu
RX 6400 / RX 6500 XT / RX 6600 / RX 6700 / RX 6800 / RX 6900 系列 gfx103x_dgpu
RX 7600 / RX 7700 XT / RX 7800 XT / RX 7900 系列 gfx110x_all
RX 9060 / RX 9060 XT / RX 9070(含 GRE/XT) gfx120x_all
iGPU: Radeon 890M / 8060S / 860M (gfx115x) ⚠️ 暂不支持

不知道自己的显卡型号?打开 "任务管理器 -> 性能 -> GPU" 或 "设备管理器 -> 显示适配器"


📥 模型下载说明

基础版用户(需自行下载模型)

基础版包含VAD模型,但不包含Whisper语音识别模型。您需要:

  1. 从 Hugging Face 下载模型

  2. 放置模型文件

    将下载的模型文件放入:
    faster_whisper_transwithai_chickenrice/
    └── models/
        └── [您下载的模型文件夹]/
    
  3. 其他可用模型

    • OpenAI Whisper官方模型
    • 其他社区优化模型

海南鸡版用户(开箱即用)

海南鸡版已包含:

  • ✅ 音声优化 VAD 语音活动检测模型
  • ✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
  • ✅ 所有必要的配置文件

无需额外下载,解压后直接运行即可使用!


🚀 快速开始指南

1. 选择版本

根据上述表格,选择适合您显卡的CUDA版本

2. 下载对应版本

  • 仅转录/翻译:下载基础版 + 自行下载模型
  • 日文转中文优化:下载海南鸡版(推荐)

3. 解压并运行

# GPU模式(推荐)
将音视频文件拖放到 "运行(GPU).bat"

# CPU模式(无显卡用户)
将音视频文件拖放到 "运行(CPU).bat"

# 低显存模式(4GB显存)
将音视频文件拖放到 "运行(GPU,低显存模式).bat"

💡 常见问题

Q: 我应该选择哪个CUDA版本?
A: 运行 nvidia-smi 查看您的驱动版本,然后对照上表选择。

Q: 海南鸡版和基础版有什么区别?
A: 海南鸡版包含预训练的日文转中文优化模型(5000小时训练),基础版需要自行下载模型。

Q: RTX 4090 应该用哪个版本?
A: 推荐使用 CUDA 12.2 或 12.8 版本,取决于您的驱动版本。

Q: 显存不足怎么办?
A: 使用"低显存模式"批处理文件,或切换到CPU模式。


📝 更新日志

v1.7 (2026-02-24)

  • 🔴 AMD ROCm/HIP GPU 支持:新增 AMD 显卡支持(RDNA1–RDNA4),覆盖 RX 5000 / 6000 / 7000 / 9000 系列
  • 📦 多架构构建:提供 gfx101x(RDNA1)、gfx103x(RDNA2)、gfx110x(RDNA3)、gfx120x(RDNA4)四种架构的打包版本
  • 🔧 ROCm 运行时内置:AMD 版本内置 ROCm/HIP 运行时 DLL,无需单独安装 ROCm
  • 🎮 设备别名:命令行支持 --device=amd(等同于 --device=cuda,CTranslate2 HIP 后端约定)
  • 自动设备检测增强:改进 GPU 检测逻辑,支持 AMD HIP 设备自动识别

📋 AMD 版本选择:参考上方 "AMD 显卡 —— 选择 ROCm/HIP 版本" 或 README 中的完整型号列表。

v1.6 (2026-01-12)

  • ☁️ Modal 云端推理支持:新增 modal_infer.exe,无需本地 GPU 也能使用云端 GPU 进行推理(感谢 @Randomless 贡献)
  • 🎮 多 GPU 选择:支持 T4、L4、A10G、A100、H100 等多种云端 GPU
  • 💰 新用户福利:Modal 新用户每月 $30 免费额度,T4 GPU 推荐性价比最高
  • 🔧 交互式配置:通过命令行交互选择 GPU 类型、模型、批处理等参数
  • 📤 自动文件传输:自动上传本地音频、下载生成的字幕到本地
  • 🗃️ 模型缓存:模型文件在 Modal Volume 中缓存,后续运行更快
  • 📦 环境整合:Modal 依赖已集成到主环境文件,无需单独安装

☁️ 使用方法

  1. 注册 Modal 账号:https://modal.com/
  2. 配置 Token:运行 modal token new
  3. 运行推理:modal_infer.exepython modal_infer.py

💡 使用建议

  • 本地无 GPU 或显存不足时使用云端推理
  • T4 GPU 性价比最高,适合一般转录任务
  • 大量任务可选择 A10G/A100 加速处理

v1.5 (2025-12-26)

  • 🔧 字幕合并后处理:新增 segment_merge 配置选项,智能合并重复/重叠的字幕片段
  • ⚙️ 灵活配置:在 generation_config.json5 中配置合并参数(启用/禁用、最大间隔、最大时长)
  • 🎛️ 命令行覆盖:支持通过命令行参数覆盖配置文件设置
    • --merge_segments / --no_merge_segments:启用/禁用合并
    • --merge_max_gap_ms:设置允许合并的最大片段间隔(毫秒)
    • --merge_max_duration_ms:设置合并后单条字幕的最大时长(毫秒)
  • 🚀 算法优化:改进合并算法,通过间隔和时长限制避免产生过长的字幕

💡 使用建议

  • 如遇到"单条字幕持续时间异常过长"的情况,可调小 max_gap_msmax_duration_ms
  • 如需完全禁用合并功能,将 enabled 设为 false 或使用 --no_merge_segments 参数

v1.4 (2025-11-25)

  • 🚀 批处理推理支持:新增批处理推理模式(--enable_batching),大幅提升处理速度
  • 智能批次大小自动检测:程序启动时自动测试不同批次大小(1-8),找到显存允许的最大批次
  • 🎯 手动批次大小控制:支持通过 --batch_size 参数手动指定批次大小,跳过自动检测
  • 🔧 运行时自适应调整:处理过程中如遇到显存不足(OOM),自动降低批次大小(每次减少20%)继续处理
  • 📈 最大批次大小配置:通过 --max_batch_size 参数控制自动检测的上限(默认8,可根据显存调整)
  • 📦 新增高显存加速模式:提供 "运行(GPU,高显存加速模式).bat" 专门为8GB+显存用户优化
  • 🔨 修复批处理兼容性:应用补丁修复faster-whisper批处理的max_initial_timestamp参数传递问题
  • 🌐 批处理日志国际化:为批处理功能添加完整的中英文本地化消息,便于调试和使用

📊 批处理模式说明

  • 并行处理优势:批处理模式下,多个音频片段并行转录,每个片段独立处理,不依赖前面片段的结果
  • 精度权衡:批处理可能略微降低转录精度(由于失去了条件生成的上下文信息)
  • 特殊场景优化:在某些场景下批处理反而效果更好,因为避免了条件生成可能带来的错误传播
    • 噪声较多的音频:避免噪声片段影响后续转录
    • 多说话人场景:减少不同说话人之间的相互干扰
    • 长音频文件:防止错误累积效应

🎮 使用建议

  • 8GB+ 显存:使用 "运行(GPU,高显存加速模式).bat",自动检测最优批次大小
  • 4-8GB 显存:手动设置较小批次大小,如 --batch_size=2 或 4
  • 追求最高精度:使用常规模式(不加 --enable_batching 参数)
  • 追求处理速度:启用批处理模式,接受轻微的精度权衡

v1.3 (2025-11-17)

  • 🤖 智能计算类型选择:自动检测设备并选择最优计算类型(bfloat16 > float16 > int8 > float32)
  • 🔍 增强设备自动检测:改进CUDA可用性检测,支持CUDA_VISIBLE_DEVICES环境变量
  • 🔇 抑制警告信息:添加TRANSFORMERS_NO_ADVISORY_WARNINGS环境变量,减少日志噪音
  • 🎯 简化批处理文件:移除硬编码的计算类型设置,全部使用自动检测模式
  • 📊 改进日志记录:添加自动检测设备和计算类型的详细日志信息
  • 🐛 修复日志重复问题:移除重复的根日志处理器,避免日志重复输出
  • 🌐 增强国际化支持:为自动检测功能添加完整的中英文本地化消息

v1.2 (2025-11-15)

  • ⚡ CPU模式性能优化:添加 int16 计算类型支持,提升CPU处理速度
  • 🎮 GPU兼容性改进:强制使用 float16 替代模型精度 bfloat16,提升显卡兼容性
  • 🔧 精简批处理文件:合并视频翻译功能到主批处理文件中
  • 📝 新增日志记录功能:自动保存运行日志到 latest.log 文件,方便问题反馈

v1.1 (2025-11-14)

  • 🌐 离线支持改进:预下载 whisper-base 模型文件,实现完全离线运行
  • 📥 自动模型管理:WhisperFeatureExtractor 优先使用本地模型,避免网络超时
  • 🔧 优化下载流程:支持从已有模型文件夹复制,减少重复下载
  • 🚀 提升稳定性:解决网络不稳定环境下的 HuggingFace 连接超时问题

v1.0 (2025-11-13)

  • 🎯 支持多CUDA版本(11.8/12.2/12.8)
  • 🚀 优化的日文转中文翻译效果(海南鸡v2版本)
  • 🔊 音声优化的VAD语音活动检测
  • 💾 改进的缓存机制,加快CI/CD构建速度
  • 📦 分离的基础版和完整版,满足不同需求
  • 🔧 自动VAD模型下载和管理

📞 技术支持

如遇到问题,请:

  1. 检查显卡驱动是否为最新版本
  2. 确认选择了正确的CUDA版本
  3. 查看控制台输出的错误信息
  4. 提交Issue到项目仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

🔗 官方链接


🙏 致谢


本工具基于 Faster Whisper 开发,海南鸡模型经过5000小时音频数据优化训练,专门针对日文转中文翻译场景。
由AI汉化组开源维护,永久免费。

Release files generated with ading2210/gh-large-releases.

File Name Size SHA-256 Hash
faster_whisper_transwithai_windows_cu118-chickenrice.zip 4.54 GiB 60fd157293d7d5033dab3c013ce3d4a083d1af6460157f1303a622f4f931715f
faster_whisper_transwithai_windows_cu118.zip 2.26 GiB d581dd2bc84f0ed8d3082f396324285127ae12053e29fa02ea12a1fd25bafd20
[faster_whisper_transwithai_windows_cu122-chickenrice.zip](https://gh-releases.ading2210.w...
Read more

v1.6

15 Jan 15:42

Choose a tag to compare

🎙️ Faster Whisper 转录工具 - 发行说明

⚠️ 重要声明

本软件为开源软件

🔗 开源地址: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

👥 开发团队: AI汉化组 (https://t.me/transWithAI)


📦 发行包说明

本发行版包含多个变体版本,请根据您的显卡型号选择合适的版本:

🎯 版本类型说明

基础版(Base Package)

  • 下载大小:约 2.2GB
  • 包含内容
    • ✅ 所有 GPU 依赖项
    • ✅ 音声优化 VAD(语音活动检测)ONNX 模型
    • ❌ 不含 Whisper 模型(需自行下载)
  • 适用场景:需要使用自定义模型的用户

海南鸡版(Chickenrice Edition)

  • 下载大小:约 4.4GB
  • 包含内容
    • ✅ 所有 GPU 依赖项
    • ✅ 音声优化 VAD(语音活动检测)ONNX 模型
    • "海南鸡v2 5000小时" 日文转中文优化模型
  • 适用场景:开箱即用的日文转中文翻译
  • 模型说明:包含经过5000小时音频数据训练的海南鸡v2版本模型,专门优化日文转中文翻译

📌 文件命名规则

文件名后缀 CUDA版本 模型类型
*_cu118.zip CUDA 11.8 基础版
*_cu118-chickenrice.zip CUDA 11.8 海南鸡版
*_cu122.zip CUDA 12.2 基础版
*_cu122-chickenrice.zip CUDA 12.2 海南鸡版
*_cu128.zip CUDA 12.8 基础版
*_cu128-chickenrice.zip CUDA 12.8 海南鸡版

🔍 如何选择正确的 CUDA 版本

方法一:通过 nvidia-smi 查询

  1. 打开命令提示符或终端
  2. 输入命令:nvidia-smi
  3. 查看输出中的 Driver VersionCUDA Version
+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00       Driver Version: 570.00       CUDA Version: 12.8|
+-------------------------------------------------------------------------+

方法二:通过显卡型号和驱动版本对照表

📊 NVIDIA 驱动版本与 CUDA 版本兼容性表

CUDA 版本 最低驱动要求(Windows) 最低驱动要求(Linux) 推荐使用场景
CUDA 11.8 ≥452.39 ≥450.80.02 较旧的显卡(GTX 10系列、RTX 20/30系列)
CUDA 12.2 ≥525.60.13 ≥525.60.13 RTX 30/40系列,较新的驱动
CUDA 12.8 ≥570.65 ≥570.26 RTX 40/50系列,最新驱动

🎮 显卡型号推荐表

显卡系列 推荐 CUDA 版本 说明
GTX 10系列(1060/1070/1080等) CUDA 11.8 兼容性最好
GTX 16系列(1650/1660等) CUDA 11.8 兼容性最好
RTX 20系列(2060/2070/2080等) CUDA 11.812.2 根据驱动版本选择
RTX 30系列(3060/3070/3080/3090等) CUDA 12.2 推荐使用
RTX 40系列(4060/4070/4080/4090等) CUDA 12.212.8 最新驱动用12.8
RTX 50系列(5090/5080/5070等) 🔴 必须使用 CUDA 12.8 ⚠️ 注意:RTX 50系列必须使用CUDA 12.8版本

⚠️ 重要提示

  • RTX 50系列用户:由于新架构要求,必须使用 CUDA 12.8 版本,驱动版本必须 ≥570.00
  • 驱动版本查询:在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
  • 向下兼容:高版本驱动可以运行低版本CUDA程序(例如:570驱动可以运行CUDA 11.8程序)
  • 性能考虑:使用与驱动匹配的CUDA版本可获得最佳性能

📥 模型下载说明

基础版用户(需自行下载模型)

基础版包含VAD模型,但不包含Whisper语音识别模型。您需要:

  1. 从 Hugging Face 下载模型

  2. 放置模型文件

    将下载的模型文件放入:
    faster_whisper_transwithai_chickenrice/
    └── models/
        └── [您下载的模型文件夹]/
    
  3. 其他可用模型

    • OpenAI Whisper官方模型
    • 其他社区优化模型

海南鸡版用户(开箱即用)

海南鸡版已包含:

  • ✅ 音声优化 VAD 语音活动检测模型
  • ✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
  • ✅ 所有必要的配置文件

无需额外下载,解压后直接运行即可使用!


🚀 快速开始指南

1. 选择版本

根据上述表格,选择适合您显卡的CUDA版本

2. 下载对应版本

  • 仅转录/翻译:下载基础版 + 自行下载模型
  • 日文转中文优化:下载海南鸡版(推荐)

3. 解压并运行

# GPU模式(推荐)
将音视频文件拖放到 "运行(GPU).bat"

# CPU模式(无显卡用户)
将音视频文件拖放到 "运行(CPU).bat"

# 低显存模式(4GB显存)
将音视频文件拖放到 "运行(GPU,低显存模式).bat"

💡 常见问题

Q: 我应该选择哪个CUDA版本?
A: 运行 nvidia-smi 查看您的驱动版本,然后对照上表选择。

Q: 海南鸡版和基础版有什么区别?
A: 海南鸡版包含预训练的日文转中文优化模型(5000小时训练),基础版需要自行下载模型。

Q: RTX 4090 应该用哪个版本?
A: 推荐使用 CUDA 12.2 或 12.8 版本,取决于您的驱动版本。

Q: 显存不足怎么办?
A: 使用"低显存模式"批处理文件,或切换到CPU模式。


📝 更新日志

v1.6 (2026-01-12)

  • ☁️ Modal 云端推理支持:新增 modal_infer.exe,无需本地 GPU 也能使用云端 GPU 进行推理(感谢 @Randomless 贡献)
  • 🎮 多 GPU 选择:支持 T4、L4、A10G、A100、H100 等多种云端 GPU
  • 💰 新用户福利:Modal 新用户每月 $30 免费额度,T4 GPU 推荐性价比最高
  • 🔧 交互式配置:通过命令行交互选择 GPU 类型、模型、批处理等参数
  • 📤 自动文件传输:自动上传本地音频、下载生成的字幕到本地
  • 🗃️ 模型缓存:模型文件在 Modal Volume 中缓存,后续运行更快
  • 📦 环境整合:Modal 依赖已集成到主环境文件,无需单独安装

☁️ 使用方法

  1. 注册 Modal 账号:https://modal.com/
  2. 配置 Token:运行 modal token new
  3. 运行推理:modal_infer.exepython modal_infer.py

💡 使用建议

  • 本地无 GPU 或显存不足时使用云端推理
  • T4 GPU 性价比最高,适合一般转录任务
  • 大量任务可选择 A10G/A100 加速处理

v1.5 (2025-12-26)

  • 🔧 字幕合并后处理:新增 segment_merge 配置选项,智能合并重复/重叠的字幕片段
  • ⚙️ 灵活配置:在 generation_config.json5 中配置合并参数(启用/禁用、最大间隔、最大时长)
  • 🎛️ 命令行覆盖:支持通过命令行参数覆盖配置文件设置
    • --merge_segments / --no_merge_segments:启用/禁用合并
    • --merge_max_gap_ms:设置允许合并的最大片段间隔(毫秒)
    • --merge_max_duration_ms:设置合并后单条字幕的最大时长(毫秒)
  • 🚀 算法优化:改进合并算法,通过间隔和时长限制避免产生过长的字幕

💡 使用建议

  • 如遇到"单条字幕持续时间异常过长"的情况,可调小 max_gap_msmax_duration_ms
  • 如需完全禁用合并功能,将 enabled 设为 false 或使用 --no_merge_segments 参数

v1.4 (2025-11-25)

  • 🚀 批处理推理支持:新增批处理推理模式(--enable_batching),大幅提升处理速度
  • 智能批次大小自动检测:程序启动时自动测试不同批次大小(1-8),找到显存允许的最大批次
  • 🎯 手动批次大小控制:支持通过 --batch_size 参数手动指定批次大小,跳过自动检测
  • 🔧 运行时自适应调整:处理过程中如遇到显存不足(OOM),自动降低批次大小(每次减少20%)继续处理
  • 📈 最大批次大小配置:通过 --max_batch_size 参数控制自动检测的上限(默认8,可根据显存调整)
  • 📦 新增高显存加速模式:提供 "运行(GPU,高显存加速模式).bat" 专门为8GB+显存用户优化
  • 🔨 修复批处理兼容性:应用补丁修复faster-whisper批处理的max_initial_timestamp参数传递问题
  • 🌐 批处理日志国际化:为批处理功能添加完整的中英文本地化消息,便于调试和使用

📊 批处理模式说明

  • 并行处理优势:批处理模式下,多个音频片段并行转录,每个片段独立处理,不依赖前面片段的结果
  • 精度权衡:批处理可能略微降低转录精度(由于失去了条件生成的上下文信息)
  • 特殊场景优化:在某些场景下批处理反而效果更好,因为避免了条件生成可能带来的错误传播
    • 噪声较多的音频:避免噪声片段影响后续转录
    • 多说话人场景:减少不同说话人之间的相互干扰
    • 长音频文件:防止错误累积效应

🎮 使用建议

  • 8GB+ 显存:使用 "运行(GPU,高显存加速模式).bat",自动检测最优批次大小
  • 4-8GB 显存:手动设置较小批次大小,如 --batch_size=2 或 4
  • 追求最高精度:使用常规模式(不加 --enable_batching 参数)
  • 追求处理速度:启用批处理模式,接受轻微的精度权衡

v1.3 (2025-11-17)

  • 🤖 智能计算类型选择:自动检测设备并选择最优计算类型(bfloat16 > float16 > int8 > float32)
  • 🔍 增强设备自动检测:改进CUDA可用性检测,支持CUDA_VISIBLE_DEVICES环境变量
  • 🔇 抑制警告信息:添加TRANSFORMERS_NO_ADVISORY_WARNINGS环境变量,减少日志噪音
  • 🎯 简化批处理文件:移除硬编码的计算类型设置,全部使用自动检测模式
  • 📊 改进日志记录:添加自动检测设备和计算类型的详细日志信息
  • 🐛 修复日志重复问题:移除重复的根日志处理器,避免日志重复输出
  • 🌐 增强国际化支持:为自动检测功能添加完整的中英文本地化消息

v1.2 (2025-11-15)

  • ⚡ CPU模式性能优化:添加 int16 计算类型支持,提升CPU处理速度
  • 🎮 GPU兼容性改进:强制使用 float16 替代模型精度 bfloat16,提升显卡兼容性
  • 🔧 精简批处理文件:合并视频翻译功能到主批处理文件中
  • 📝 新增日志记录功能:自动保存运行日志到 latest.log 文件,方便问题反馈

v1.1 (2025-11-14)

  • 🌐 离线支持改进:预下载 whisper-base 模型文件,实现完全离线运行
  • 📥 自动模型管理:WhisperFeatureExtractor 优先使用本地模型,避免网络超时
  • 🔧 优化下载流程:支持从已有模型文件夹复制,减少重复下载
  • 🚀 提升稳定性:解决网络不稳定环境下的 HuggingFace 连接超时问题

v1.0 (2025-11-13)

  • 🎯 支持多CUDA版本(11.8/12.2/12.8)
  • 🚀 优化的日文转中文翻译效果(海南鸡v2版本)
  • 🔊 音声优化的VAD语音活动检测
  • 💾 改进的缓存机制,加快CI/CD构建速度
  • 📦 分离的基础版和完整版,满足不同需求
  • 🔧 自动VAD模型下载和管理

📞 技术支持

如遇到问题,请:

  1. 检查显卡驱动是否为最新版本
  2. 确认选择了正确的CUDA版本
  3. 查看控制台输出的错误信息
  4. 提交Issue到项目仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

🔗 官方链接


🙏 致谢


本工具基于 Faster Whisper 开发,海南鸡模型经过5000小时音频数据优化训练,专门针对日文转中文翻译场景。
由AI汉化组开源维护,永久免费。

Release files generated with ading2210/gh-large-releases.

File Name Size SHA-256 Hash
faster_whisper_transwithai_windows_cu118-chickenrice.zip 4.54 GiB ab1a5af3c0cbfa822eb93050c07f5a8a60607485f5eb20e9e899e67cf6c7a943
faster_whisper_transwithai_windows_cu118.zip 2.25 GiB bdc9b987d679c765c18ccb988af43dd0dc2bce6dc469d9d3817c62de5d49e67c
faster_whisper_transwithai_windows_cu122-chickenrice.zip 4.89 GiB 408e93141206ba48b8a979064f60457aadc94963666958e6ba5d58a87e0b7c3a
faster_whisper_transwithai_windows_cu122.zip 2.61 GiB c1aefb0df71c60829470553e59e7f4f15c3fee9439d43943d3c362abd61f6cfc
faster_whisper_transwithai_windows_cu128-chickenrice.zip 5.50 GiB 334fd8bda9f846659d45d599b44273bf30cfc069e1f675105b35eda4fca79c61
faster_whisper_transwithai_windows_cu128.zip 3.22 GiB cd470e8084843207e7e19d287b6b5fb4179f7a0eab5a3d12ea92a23850dbefce
placeholder.txt 70.00 B 527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b

Important

Download files from the links in the table above, instead of the assets list.

v1.5

10 Jan 19:52

Choose a tag to compare

🎙️ Faster Whisper 转录工具 - 发行说明

⚠️ 重要声明

本软件为开源软件

🔗 开源地址: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

👥 开发团队: AI汉化组 (https://t.me/transWithAI)


📦 发行包说明

本发行版包含多个变体版本,请根据您的显卡型号选择合适的版本:

🎯 版本类型说明

基础版(Base Package)

  • 下载大小:约 2.2GB
  • 包含内容
    • ✅ 所有 GPU 依赖项
    • ✅ 音声优化 VAD(语音活动检测)ONNX 模型
    • ❌ 不含 Whisper 模型(需自行下载)
  • 适用场景:需要使用自定义模型的用户

海南鸡版(Chickenrice Edition)

  • 下载大小:约 4.4GB
  • 包含内容
    • ✅ 所有 GPU 依赖项
    • ✅ 音声优化 VAD(语音活动检测)ONNX 模型
    • "海南鸡v2 5000小时" 日文转中文优化模型
  • 适用场景:开箱即用的日文转中文翻译
  • 模型说明:包含经过5000小时音频数据训练的海南鸡v2版本模型,专门优化日文转中文翻译

📌 文件命名规则

文件名后缀 CUDA版本 模型类型
*_cu118.zip CUDA 11.8 基础版
*_cu118-chickenrice.zip CUDA 11.8 海南鸡版
*_cu122.zip CUDA 12.2 基础版
*_cu122-chickenrice.zip CUDA 12.2 海南鸡版
*_cu128.zip CUDA 12.8 基础版
*_cu128-chickenrice.zip CUDA 12.8 海南鸡版

🔍 如何选择正确的 CUDA 版本

方法一:通过 nvidia-smi 查询

  1. 打开命令提示符或终端
  2. 输入命令:nvidia-smi
  3. 查看输出中的 Driver VersionCUDA Version
+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00       Driver Version: 570.00       CUDA Version: 12.8|
+-------------------------------------------------------------------------+

方法二:通过显卡型号和驱动版本对照表

📊 NVIDIA 驱动版本与 CUDA 版本兼容性表

CUDA 版本 最低驱动要求(Windows) 最低驱动要求(Linux) 推荐使用场景
CUDA 11.8 ≥452.39 ≥450.80.02 较旧的显卡(GTX 10系列、RTX 20/30系列)
CUDA 12.2 ≥525.60.13 ≥525.60.13 RTX 30/40系列,较新的驱动
CUDA 12.8 ≥570.65 ≥570.26 RTX 40/50系列,最新驱动

🎮 显卡型号推荐表

显卡系列 推荐 CUDA 版本 说明
GTX 10系列(1060/1070/1080等) CUDA 11.8 兼容性最好
GTX 16系列(1650/1660等) CUDA 11.8 兼容性最好
RTX 20系列(2060/2070/2080等) CUDA 11.812.2 根据驱动版本选择
RTX 30系列(3060/3070/3080/3090等) CUDA 12.2 推荐使用
RTX 40系列(4060/4070/4080/4090等) CUDA 12.212.8 最新驱动用12.8
RTX 50系列(5090/5080/5070等) 🔴 必须使用 CUDA 12.8 ⚠️ 注意:RTX 50系列必须使用CUDA 12.8版本

⚠️ 重要提示

  • RTX 50系列用户:由于新架构要求,必须使用 CUDA 12.8 版本,驱动版本必须 ≥570.00
  • 驱动版本查询:在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
  • 向下兼容:高版本驱动可以运行低版本CUDA程序(例如:570驱动可以运行CUDA 11.8程序)
  • 性能考虑:使用与驱动匹配的CUDA版本可获得最佳性能

📥 模型下载说明

基础版用户(需自行下载模型)

基础版包含VAD模型,但不包含Whisper语音识别模型。您需要:

  1. 从 Hugging Face 下载模型

  2. 放置模型文件

    将下载的模型文件放入:
    faster_whisper_transwithai_chickenrice/
    └── models/
        └── [您下载的模型文件夹]/
    
  3. 其他可用模型

    • OpenAI Whisper官方模型
    • 其他社区优化模型

海南鸡版用户(开箱即用)

海南鸡版已包含:

  • ✅ 音声优化 VAD 语音活动检测模型
  • ✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
  • ✅ 所有必要的配置文件

无需额外下载,解压后直接运行即可使用!


🚀 快速开始指南

1. 选择版本

根据上述表格,选择适合您显卡的CUDA版本

2. 下载对应版本

  • 仅转录/翻译:下载基础版 + 自行下载模型
  • 日文转中文优化:下载海南鸡版(推荐)

3. 解压并运行

# GPU模式(推荐)
将音视频文件拖放到 "运行(GPU).bat"

# CPU模式(无显卡用户)
将音视频文件拖放到 "运行(CPU).bat"

# 低显存模式(4GB显存)
将音视频文件拖放到 "运行(GPU,低显存模式).bat"

💡 常见问题

Q: 我应该选择哪个CUDA版本?
A: 运行 nvidia-smi 查看您的驱动版本,然后对照上表选择。

Q: 海南鸡版和基础版有什么区别?
A: 海南鸡版包含预训练的日文转中文优化模型(5000小时训练),基础版需要自行下载模型。

Q: RTX 4090 应该用哪个版本?
A: 推荐使用 CUDA 12.2 或 12.8 版本,取决于您的驱动版本。

Q: 显存不足怎么办?
A: 使用"低显存模式"批处理文件,或切换到CPU模式。


📝 更新日志

v1.5 (2025-12-26)

  • 🔧 字幕合并后处理:新增 segment_merge 配置选项,智能合并重复/重叠的字幕片段
  • ⚙️ 灵活配置:在 generation_config.json5 中配置合并参数(启用/禁用、最大间隔、最大时长)
  • 🎛️ 命令行覆盖:支持通过命令行参数覆盖配置文件设置
    • --merge_segments / --no_merge_segments:启用/禁用合并
    • --merge_max_gap_ms:设置允许合并的最大片段间隔(毫秒)
    • --merge_max_duration_ms:设置合并后单条字幕的最大时长(毫秒)
  • 🚀 算法优化:改进合并算法,通过间隔和时长限制避免产生过长的字幕

💡 使用建议

  • 如遇到"单条字幕持续时间异常过长"的情况,可调小 max_gap_msmax_duration_ms
  • 如需完全禁用合并功能,将 enabled 设为 false 或使用 --no_merge_segments 参数

v1.4 (2025-11-25)

  • 🚀 批处理推理支持:新增批处理推理模式(--enable_batching),大幅提升处理速度
  • 智能批次大小自动检测:程序启动时自动测试不同批次大小(1-8),找到显存允许的最大批次
  • 🎯 手动批次大小控制:支持通过 --batch_size 参数手动指定批次大小,跳过自动检测
  • 🔧 运行时自适应调整:处理过程中如遇到显存不足(OOM),自动降低批次大小(每次减少20%)继续处理
  • 📈 最大批次大小配置:通过 --max_batch_size 参数控制自动检测的上限(默认8,可根据显存调整)
  • 📦 新增高显存加速模式:提供 "运行(GPU,高显存加速模式).bat" 专门为8GB+显存用户优化
  • 🔨 修复批处理兼容性:应用补丁修复faster-whisper批处理的max_initial_timestamp参数传递问题
  • 🌐 批处理日志国际化:为批处理功能添加完整的中英文本地化消息,便于调试和使用

📊 批处理模式说明

  • 并行处理优势:批处理模式下,多个音频片段并行转录,每个片段独立处理,不依赖前面片段的结果
  • 精度权衡:批处理可能略微降低转录精度(由于失去了条件生成的上下文信息)
  • 特殊场景优化:在某些场景下批处理反而效果更好,因为避免了条件生成可能带来的错误传播
    • 噪声较多的音频:避免噪声片段影响后续转录
    • 多说话人场景:减少不同说话人之间的相互干扰
    • 长音频文件:防止错误累积效应

🎮 使用建议

  • 8GB+ 显存:使用 "运行(GPU,高显存加速模式).bat",自动检测最优批次大小
  • 4-8GB 显存:手动设置较小批次大小,如 --batch_size=2 或 4
  • 追求最高精度:使用常规模式(不加 --enable_batching 参数)
  • 追求处理速度:启用批处理模式,接受轻微的精度权衡

v1.3 (2025-11-17)

  • 🤖 智能计算类型选择:自动检测设备并选择最优计算类型(bfloat16 > float16 > int8 > float32)
  • 🔍 增强设备自动检测:改进CUDA可用性检测,支持CUDA_VISIBLE_DEVICES环境变量
  • 🔇 抑制警告信息:添加TRANSFORMERS_NO_ADVISORY_WARNINGS环境变量,减少日志噪音
  • 🎯 简化批处理文件:移除硬编码的计算类型设置,全部使用自动检测模式
  • 📊 改进日志记录:添加自动检测设备和计算类型的详细日志信息
  • 🐛 修复日志重复问题:移除重复的根日志处理器,避免日志重复输出
  • 🌐 增强国际化支持:为自动检测功能添加完整的中英文本地化消息

v1.2 (2025-11-15)

  • ⚡ CPU模式性能优化:添加 int16 计算类型支持,提升CPU处理速度
  • 🎮 GPU兼容性改进:强制使用 float16 替代模型精度 bfloat16,提升显卡兼容性
  • 🔧 精简批处理文件:合并视频翻译功能到主批处理文件中
  • 📝 新增日志记录功能:自动保存运行日志到 latest.log 文件,方便问题反馈

v1.1 (2025-11-14)

  • 🌐 离线支持改进:预下载 whisper-base 模型文件,实现完全离线运行
  • 📥 自动模型管理:WhisperFeatureExtractor 优先使用本地模型,避免网络超时
  • 🔧 优化下载流程:支持从已有模型文件夹复制,减少重复下载
  • 🚀 提升稳定性:解决网络不稳定环境下的 HuggingFace 连接超时问题

v1.0 (2025-11-13)

  • 🎯 支持多CUDA版本(11.8/12.2/12.8)
  • 🚀 优化的日文转中文翻译效果(海南鸡v2版本)
  • 🔊 音声优化的VAD语音活动检测
  • 💾 改进的缓存机制,加快CI/CD构建速度
  • 📦 分离的基础版和完整版,满足不同需求
  • 🔧 自动VAD模型下载和管理

📞 技术支持

如遇到问题,请:

  1. 检查显卡驱动是否为最新版本
  2. 确认选择了正确的CUDA版本
  3. 查看控制台输出的错误信息
  4. 提交Issue到项目仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

🔗 官方链接


🙏 致谢


本工具基于 Faster Whisper 开发,海南鸡模型经过5000小时音频数据优化训练,专门针对日文转中文翻译场景。
由AI汉化组开源维护,永久免费。

Release files generated with ading2210/gh-large-releases.

File Name Size SHA-256 Hash
faster_whisper_transwithai_windows_cu118-chickenrice.zip 4.50 GiB 81de7976144908e0994eecad439d2a2b4df5b13840a6afe4840b67e8ff26b070
faster_whisper_transwithai_windows_cu118.zip 2.22 GiB 701dfd9e5b512e408773276e333213328114f7c3c9f9fceabcd34a97e749cbbd
faster_whisper_transwithai_windows_cu122-chickenrice.zip 4.70 GiB 17da33f6534f5491580c0a4a4b950eb0152db92cbb820d84d93288d38c896f92
faster_whisper_transwithai_windows_cu122.zip 2.42 GiB 86c741ae195db1db829710b094dfbd996ef3b60d76d612f6461647d862a7f170
faster_whisper_transwithai_windows_cu128-chickenrice.zip 5.32 GiB 0fd924f87f5d6df4e074162e44a8c73c4cd3cfb38ee8d2a48806d1939a23bb49
faster_whisper_transwithai_windows_cu128.zip 3.04 GiB b2d9dbfc2e4116a9b0c2762b8bea158206b8b183c4148ee7b6d6435ac47a6bcb
placeholder.txt 70.00 B 527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b

Important

Download files from the links in the table above, instead of the assets list.

v1.4

24 Nov 18:23

Choose a tag to compare

🎙️ Faster Whisper 转录工具 - 发行说明

⚠️ 重要声明

本软件为开源软件

🔗 开源地址: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

👥 开发团队: AI汉化组 (https://t.me/transWithAI)


📦 发行包说明

本发行版包含多个变体版本,请根据您的显卡型号选择合适的版本:

🎯 版本类型说明

基础版(Base Package)

  • 下载大小:约 2.2GB
  • 包含内容
    • ✅ 所有 GPU 依赖项
    • ✅ 音声优化 VAD(语音活动检测)ONNX 模型
    • ❌ 不含 Whisper 模型(需自行下载)
  • 适用场景:需要使用自定义模型的用户

海南鸡版(Chickenrice Edition)

  • 下载大小:约 4.4GB
  • 包含内容
    • ✅ 所有 GPU 依赖项
    • ✅ 音声优化 VAD(语音活动检测)ONNX 模型
    • "海南鸡v2 5000小时" 日文转中文优化模型
  • 适用场景:开箱即用的日文转中文翻译
  • 模型说明:包含经过5000小时音频数据训练的海南鸡v2版本模型,专门优化日文转中文翻译

📌 文件命名规则

文件名后缀 CUDA版本 模型类型
*_cu118.zip CUDA 11.8 基础版
*_cu118-chickenrice.zip CUDA 11.8 海南鸡版
*_cu122.zip CUDA 12.2 基础版
*_cu122-chickenrice.zip CUDA 12.2 海南鸡版
*_cu128.zip CUDA 12.8 基础版
*_cu128-chickenrice.zip CUDA 12.8 海南鸡版

🔍 如何选择正确的 CUDA 版本

方法一:通过 nvidia-smi 查询

  1. 打开命令提示符或终端
  2. 输入命令:nvidia-smi
  3. 查看输出中的 Driver VersionCUDA Version
+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00       Driver Version: 570.00       CUDA Version: 12.8|
+-------------------------------------------------------------------------+

方法二:通过显卡型号和驱动版本对照表

📊 NVIDIA 驱动版本与 CUDA 版本兼容性表

CUDA 版本 最低驱动要求(Windows) 最低驱动要求(Linux) 推荐使用场景
CUDA 11.8 ≥452.39 ≥450.80.02 较旧的显卡(GTX 10系列、RTX 20/30系列)
CUDA 12.2 ≥525.60.13 ≥525.60.13 RTX 30/40系列,较新的驱动
CUDA 12.8 ≥570.65 ≥570.26 RTX 40/50系列,最新驱动

🎮 显卡型号推荐表

显卡系列 推荐 CUDA 版本 说明
GTX 10系列(1060/1070/1080等) CUDA 11.8 兼容性最好
GTX 16系列(1650/1660等) CUDA 11.8 兼容性最好
RTX 20系列(2060/2070/2080等) CUDA 11.812.2 根据驱动版本选择
RTX 30系列(3060/3070/3080/3090等) CUDA 12.2 推荐使用
RTX 40系列(4060/4070/4080/4090等) CUDA 12.212.8 最新驱动用12.8
RTX 50系列(5090/5080/5070等) 🔴 必须使用 CUDA 12.8 ⚠️ 注意:RTX 50系列必须使用CUDA 12.8版本

⚠️ 重要提示

  • RTX 50系列用户:由于新架构要求,必须使用 CUDA 12.8 版本,驱动版本必须 ≥570.00
  • 驱动版本查询:在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
  • 向下兼容:高版本驱动可以运行低版本CUDA程序(例如:570驱动可以运行CUDA 11.8程序)
  • 性能考虑:使用与驱动匹配的CUDA版本可获得最佳性能

📥 模型下载说明

基础版用户(需自行下载模型)

基础版包含VAD模型,但不包含Whisper语音识别模型。您需要:

  1. 从 Hugging Face 下载模型

  2. 放置模型文件

    将下载的模型文件放入:
    faster_whisper_transwithai_chickenrice/
    └── models/
        └── [您下载的模型文件夹]/
    
  3. 其他可用模型

    • OpenAI Whisper官方模型
    • 其他社区优化模型

海南鸡版用户(开箱即用)

海南鸡版已包含:

  • ✅ 音声优化 VAD 语音活动检测模型
  • ✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
  • ✅ 所有必要的配置文件

无需额外下载,解压后直接运行即可使用!


🚀 快速开始指南

1. 选择版本

根据上述表格,选择适合您显卡的CUDA版本

2. 下载对应版本

  • 仅转录/翻译:下载基础版 + 自行下载模型
  • 日文转中文优化:下载海南鸡版(推荐)

3. 解压并运行

# GPU模式(推荐)
将音视频文件拖放到 "运行(GPU).bat"

# CPU模式(无显卡用户)
将音视频文件拖放到 "运行(CPU).bat"

# 低显存模式(4GB显存)
将音视频文件拖放到 "运行(GPU,低显存模式).bat"

💡 常见问题

Q: 我应该选择哪个CUDA版本?
A: 运行 nvidia-smi 查看您的驱动版本,然后对照上表选择。

Q: 海南鸡版和基础版有什么区别?
A: 海南鸡版包含预训练的日文转中文优化模型(5000小时训练),基础版需要自行下载模型。

Q: RTX 4090 应该用哪个版本?
A: 推荐使用 CUDA 12.2 或 12.8 版本,取决于您的驱动版本。

Q: 显存不足怎么办?
A: 使用"低显存模式"批处理文件,或切换到CPU模式。


📝 更新日志

v1.4 (2025-11-25)

  • 🚀 批处理推理支持:新增批处理推理模式(--enable_batching),大幅提升处理速度
  • 智能批次大小自动检测:程序启动时自动测试不同批次大小(1-8),找到显存允许的最大批次
  • 🎯 手动批次大小控制:支持通过 --batch_size 参数手动指定批次大小,跳过自动检测
  • 🔧 运行时自适应调整:处理过程中如遇到显存不足(OOM),自动降低批次大小(每次减少20%)继续处理
  • 📈 最大批次大小配置:通过 --max_batch_size 参数控制自动检测的上限(默认8,可根据显存调整)
  • 📦 新增高显存加速模式:提供 "运行(GPU,高显存加速模式).bat" 专门为8GB+显存用户优化
  • 🔨 修复批处理兼容性:应用补丁修复faster-whisper批处理的max_initial_timestamp参数传递问题
  • 🌐 批处理日志国际化:为批处理功能添加完整的中英文本地化消息,便于调试和使用

📊 批处理模式说明

  • 并行处理优势:批处理模式下,多个音频片段并行转录,每个片段独立处理,不依赖前面片段的结果
  • 精度权衡:批处理可能略微降低转录精度(由于失去了条件生成的上下文信息)
  • 特殊场景优化:在某些场景下批处理反而效果更好,因为避免了条件生成可能带来的错误传播
    • 噪声较多的音频:避免噪声片段影响后续转录
    • 多说话人场景:减少不同说话人之间的相互干扰
    • 长音频文件:防止错误累积效应

🎮 使用建议

  • 8GB+ 显存:使用 "运行(GPU,高显存加速模式).bat",自动检测最优批次大小
  • 4-8GB 显存:手动设置较小批次大小,如 --batch_size=2 或 4
  • 追求最高精度:使用常规模式(不加 --enable_batching 参数)
  • 追求处理速度:启用批处理模式,接受轻微的精度权衡

v1.3 (2025-11-17)

  • 🤖 智能计算类型选择:自动检测设备并选择最优计算类型(bfloat16 > float16 > int8 > float32)
  • 🔍 增强设备自动检测:改进CUDA可用性检测,支持CUDA_VISIBLE_DEVICES环境变量
  • 🔇 抑制警告信息:添加TRANSFORMERS_NO_ADVISORY_WARNINGS环境变量,减少日志噪音
  • 🎯 简化批处理文件:移除硬编码的计算类型设置,全部使用自动检测模式
  • 📊 改进日志记录:添加自动检测设备和计算类型的详细日志信息
  • 🐛 修复日志重复问题:移除重复的根日志处理器,避免日志重复输出
  • 🌐 增强国际化支持:为自动检测功能添加完整的中英文本地化消息

v1.2 (2025-11-15)

  • ⚡ CPU模式性能优化:添加 int16 计算类型支持,提升CPU处理速度
  • 🎮 GPU兼容性改进:强制使用 float16 替代模型精度 bfloat16,提升显卡兼容性
  • 🔧 精简批处理文件:合并视频翻译功能到主批处理文件中
  • 📝 新增日志记录功能:自动保存运行日志到 latest.log 文件,方便问题反馈

v1.1 (2025-11-14)

  • 🌐 离线支持改进:预下载 whisper-base 模型文件,实现完全离线运行
  • 📥 自动模型管理:WhisperFeatureExtractor 优先使用本地模型,避免网络超时
  • 🔧 优化下载流程:支持从已有模型文件夹复制,减少重复下载
  • 🚀 提升稳定性:解决网络不稳定环境下的 HuggingFace 连接超时问题

v1.0 (2025-11-13)

  • 🎯 支持多CUDA版本(11.8/12.2/12.8)
  • 🚀 优化的日文转中文翻译效果(海南鸡v2版本)
  • 🔊 音声优化的VAD语音活动检测
  • 💾 改进的缓存机制,加快CI/CD构建速度
  • 📦 分离的基础版和完整版,满足不同需求
  • 🔧 自动VAD模型下载和管理

📞 技术支持

如遇到问题,请:

  1. 检查显卡驱动是否为最新版本
  2. 确认选择了正确的CUDA版本
  3. 查看控制台输出的错误信息
  4. 提交Issue到项目仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

🔗 官方链接


🙏 致谢


本工具基于 Faster Whisper 开发,海南鸡模型经过5000小时音频数据优化训练,专门针对日文转中文翻译场景。
由AI汉化组开源维护,永久免费。

Release files generated with ading2210/gh-large-releases.

File Name Size SHA-256 Hash
faster_whisper_transwithai_windows_cu118-chickenrice.zip 4.50 GiB 2bdf9f8a94db199afc7e5bede90d17d3b076616bc3a9d8ec6d1643d31dabe159
faster_whisper_transwithai_windows_cu118.zip 2.22 GiB 25b48144f1d442f21b4a5730612dc0e8e76ea61100768a602369560429c952aa
faster_whisper_transwithai_windows_cu122-chickenrice.zip 4.70 GiB 470d4c0c39a5c6aa99e820897404bb91462fbe19cb56ec4124e672251c6cd4cd
faster_whisper_transwithai_windows_cu122.zip 2.42 GiB 699bb13edbc16db5fd89a1bcbabc8fd50da949425bc0c6c95af3244942020e65
faster_whisper_transwithai_windows_cu128-chickenrice.zip 5.32 GiB eb662f0db10999a7734abdf133de7d603dcbe27fe8fd5b27c3265ccfa48723af
faster_whisper_transwithai_windows_cu128.zip 3.04 GiB 6d046904bb9d5fa2a2b53b7c561659876b93a92e6c048db28769e8bc73a36ac1
placeholder.txt 70.00 B 527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b

Important

Download files from the links in the table above, instead of the assets list.

v1.3

17 Nov 16:23

Choose a tag to compare

🎙️ Faster Whisper 转录工具 - 发行说明

⚠️ 重要声明

本软件为开源软件

🔗 开源地址: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

👥 开发团队: AI汉化组 (https://t.me/transWithAI)


📦 发行包说明

本发行版包含多个变体版本,请根据您的显卡型号选择合适的版本:

🎯 版本类型说明

基础版(Base Package)

  • 下载大小:约 2.2GB
  • 包含内容
    • ✅ 所有 GPU 依赖项
    • ✅ 音声优化 VAD(语音活动检测)ONNX 模型
    • ❌ 不含 Whisper 模型(需自行下载)
  • 适用场景:需要使用自定义模型的用户

海南鸡版(Chickenrice Edition)

  • 下载大小:约 4.4GB
  • 包含内容
    • ✅ 所有 GPU 依赖项
    • ✅ 音声优化 VAD(语音活动检测)ONNX 模型
    • "海南鸡v2 5000小时" 日文转中文优化模型
  • 适用场景:开箱即用的日文转中文翻译
  • 模型说明:包含经过5000小时音频数据训练的海南鸡v2版本模型,专门优化日文转中文翻译

📌 文件命名规则

文件名后缀 CUDA版本 模型类型
*_cu118.zip CUDA 11.8 基础版
*_cu118-chickenrice.zip CUDA 11.8 海南鸡版
*_cu122.zip CUDA 12.2 基础版
*_cu122-chickenrice.zip CUDA 12.2 海南鸡版
*_cu128.zip CUDA 12.8 基础版
*_cu128-chickenrice.zip CUDA 12.8 海南鸡版

🔍 如何选择正确的 CUDA 版本

方法一:通过 nvidia-smi 查询

  1. 打开命令提示符或终端
  2. 输入命令:nvidia-smi
  3. 查看输出中的 Driver VersionCUDA Version
+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00       Driver Version: 570.00       CUDA Version: 12.8|
+-------------------------------------------------------------------------+

方法二:通过显卡型号和驱动版本对照表

📊 NVIDIA 驱动版本与 CUDA 版本兼容性表

CUDA 版本 最低驱动要求(Windows) 最低驱动要求(Linux) 推荐使用场景
CUDA 11.8 ≥452.39 ≥450.80.02 较旧的显卡(GTX 10系列、RTX 20/30系列)
CUDA 12.2 ≥525.60.13 ≥525.60.13 RTX 30/40系列,较新的驱动
CUDA 12.8 ≥570.65 ≥570.26 RTX 40/50系列,最新驱动

🎮 显卡型号推荐表

显卡系列 推荐 CUDA 版本 说明
GTX 10系列(1060/1070/1080等) CUDA 11.8 兼容性最好
GTX 16系列(1650/1660等) CUDA 11.8 兼容性最好
RTX 20系列(2060/2070/2080等) CUDA 11.812.2 根据驱动版本选择
RTX 30系列(3060/3070/3080/3090等) CUDA 12.2 推荐使用
RTX 40系列(4060/4070/4080/4090等) CUDA 12.212.8 最新驱动用12.8
RTX 50系列(5090/5080/5070等) 🔴 必须使用 CUDA 12.8 ⚠️ 注意:RTX 50系列必须使用CUDA 12.8版本

⚠️ 重要提示

  • RTX 50系列用户:由于新架构要求,必须使用 CUDA 12.8 版本,驱动版本必须 ≥570.00
  • 驱动版本查询:在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
  • 向下兼容:高版本驱动可以运行低版本CUDA程序(例如:570驱动可以运行CUDA 11.8程序)
  • 性能考虑:使用与驱动匹配的CUDA版本可获得最佳性能

📥 模型下载说明

基础版用户(需自行下载模型)

基础版包含VAD模型,但不包含Whisper语音识别模型。您需要:

  1. 从 Hugging Face 下载模型

  2. 放置模型文件

    将下载的模型文件放入:
    faster_whisper_transwithai_chickenrice/
    └── models/
        └── [您下载的模型文件夹]/
    
  3. 其他可用模型

    • OpenAI Whisper官方模型
    • 其他社区优化模型

海南鸡版用户(开箱即用)

海南鸡版已包含:

  • ✅ 音声优化 VAD 语音活动检测模型
  • ✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
  • ✅ 所有必要的配置文件

无需额外下载,解压后直接运行即可使用!


🚀 快速开始指南

1. 选择版本

根据上述表格,选择适合您显卡的CUDA版本

2. 下载对应版本

  • 仅转录/翻译:下载基础版 + 自行下载模型
  • 日文转中文优化:下载海南鸡版(推荐)

3. 解压并运行

# GPU模式(推荐)
将音视频文件拖放到 "运行(GPU).bat"

# CPU模式(无显卡用户)
将音视频文件拖放到 "运行(CPU).bat"

# 低显存模式(4GB显存)
将音视频文件拖放到 "运行(GPU,低显存模式).bat"

💡 常见问题

Q: 我应该选择哪个CUDA版本?
A: 运行 nvidia-smi 查看您的驱动版本,然后对照上表选择。

Q: 海南鸡版和基础版有什么区别?
A: 海南鸡版包含预训练的日文转中文优化模型(5000小时训练),基础版需要自行下载模型。

Q: RTX 4090 应该用哪个版本?
A: 推荐使用 CUDA 12.2 或 12.8 版本,取决于您的驱动版本。

Q: 显存不足怎么办?
A: 使用"低显存模式"批处理文件,或切换到CPU模式。


📝 更新日志

v1.3 (2025-11-17)

  • 🤖 智能计算类型选择:自动检测设备并选择最优计算类型(bfloat16 > float16 > int8 > float32)
  • 🔍 增强设备自动检测:改进CUDA可用性检测,支持CUDA_VISIBLE_DEVICES环境变量
  • 🔇 抑制警告信息:添加TRANSFORMERS_NO_ADVISORY_WARNINGS环境变量,减少日志噪音
  • 🎯 简化批处理文件:移除硬编码的计算类型设置,全部使用自动检测模式
  • 📊 改进日志记录:添加自动检测设备和计算类型的详细日志信息
  • 🐛 修复日志重复问题:移除重复的根日志处理器,避免日志重复输出
  • 🌐 增强国际化支持:为自动检测功能添加完整的中英文本地化消息

v1.2 (2025-11-15)

  • ⚡ CPU模式性能优化:添加 int16 计算类型支持,提升CPU处理速度
  • 🎮 GPU兼容性改进:强制使用 float16 替代模型精度 bfloat16,提升显卡兼容性
  • 🔧 精简批处理文件:合并视频翻译功能到主批处理文件中
  • 📝 新增日志记录功能:自动保存运行日志到 latest.log 文件,方便问题反馈

v1.1 (2025-11-14)

  • 🌐 离线支持改进:预下载 whisper-base 模型文件,实现完全离线运行
  • 📥 自动模型管理:WhisperFeatureExtractor 优先使用本地模型,避免网络超时
  • 🔧 优化下载流程:支持从已有模型文件夹复制,减少重复下载
  • 🚀 提升稳定性:解决网络不稳定环境下的 HuggingFace 连接超时问题

v1.0 (2025-11-13)

  • 🎯 支持多CUDA版本(11.8/12.2/12.8)
  • 🚀 优化的日文转中文翻译效果(海南鸡v2版本)
  • 🔊 音声优化的VAD语音活动检测
  • 💾 改进的缓存机制,加快CI/CD构建速度
  • 📦 分离的基础版和完整版,满足不同需求
  • 🔧 自动VAD模型下载和管理

📞 技术支持

如遇到问题,请:

  1. 检查显卡驱动是否为最新版本
  2. 确认选择了正确的CUDA版本
  3. 查看控制台输出的错误信息
  4. 提交Issue到项目仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

🔗 官方链接


🙏 致谢


本工具基于 Faster Whisper 开发,海南鸡模型经过5000小时音频数据优化训练,专门针对日文转中文翻译场景。
由AI汉化组开源维护,永久免费。

Release files generated with ading2210/gh-large-releases.

File Name Size SHA-256 Hash
faster_whisper_transwithai_windows_cu118-chickenrice.zip 4.50 GiB ba5085c3c8d1870bc88392783d9b06d62df305c2bf77d53a8210cea8992571c3
faster_whisper_transwithai_windows_cu118.zip 2.22 GiB 30d314fe658a182c267a056965d1028c60c66489a43d662f42bca70fe7050bbc
faster_whisper_transwithai_windows_cu122-chickenrice.zip 4.70 GiB ee0bbf0cf35e0ee1624de504731056fb012495b55c046271dcba5d448ba293d1
faster_whisper_transwithai_windows_cu122.zip 2.42 GiB 35fdc61c374bc3fac22fc0396a2b4cb01570feea53ffc6ce10099a6830f96ed1
faster_whisper_transwithai_windows_cu128-chickenrice.zip 5.32 GiB 43b1317561ea95390d2cd90f8264090c3e61f726bb81951fdc6e6e37322b0586
faster_whisper_transwithai_windows_cu128.zip 3.04 GiB ca5fb064a8bfdf795a6741dfc2c255373be367d84db49a066a5fdd638ed5542f
placeholder.txt 70.00 B 527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b

Important

Download files from the links in the table above, instead of the assets list.

v1.2

15 Nov 06:36

Choose a tag to compare

🎙️ Faster Whisper 转录工具 - 发行说明

⚠️ 重要声明

本软件为开源软件

🔗 开源地址: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

👥 开发团队: AI汉化组 (https://t.me/transWithAI)


📦 发行包说明

本发行版包含多个变体版本,请根据您的显卡型号选择合适的版本:

🎯 版本类型说明

基础版(Base Package)

  • 下载大小:约 2.2GB
  • 包含内容
    • ✅ 所有 GPU 依赖项
    • ✅ 音声优化 VAD(语音活动检测)ONNX 模型
    • ❌ 不含 Whisper 模型(需自行下载)
  • 适用场景:需要使用自定义模型的用户

海南鸡版(Chickenrice Edition)

  • 下载大小:约 4.4GB
  • 包含内容
    • ✅ 所有 GPU 依赖项
    • ✅ 音声优化 VAD(语音活动检测)ONNX 模型
    • "海南鸡v2 5000小时" 日文转中文优化模型
  • 适用场景:开箱即用的日文转中文翻译
  • 模型说明:包含经过5000小时音频数据训练的海南鸡v2版本模型,专门优化日文转中文翻译

📌 文件命名规则

文件名后缀 CUDA版本 模型类型
*_cu118.zip CUDA 11.8 基础版
*_cu118-chickenrice.zip CUDA 11.8 海南鸡版
*_cu122.zip CUDA 12.2 基础版
*_cu122-chickenrice.zip CUDA 12.2 海南鸡版
*_cu128.zip CUDA 12.8 基础版
*_cu128-chickenrice.zip CUDA 12.8 海南鸡版

🔍 如何选择正确的 CUDA 版本

方法一:通过 nvidia-smi 查询

  1. 打开命令提示符或终端
  2. 输入命令:nvidia-smi
  3. 查看输出中的 Driver VersionCUDA Version
+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00       Driver Version: 570.00       CUDA Version: 12.8|
+-------------------------------------------------------------------------+

方法二:通过显卡型号和驱动版本对照表

📊 NVIDIA 驱动版本与 CUDA 版本兼容性表

CUDA 版本 最低驱动要求(Windows) 最低驱动要求(Linux) 推荐使用场景
CUDA 11.8 ≥452.39 ≥450.80.02 较旧的显卡(GTX 10系列、RTX 20/30系列)
CUDA 12.2 ≥525.60.13 ≥525.60.13 RTX 30/40系列,较新的驱动
CUDA 12.8 ≥570.65 ≥570.26 RTX 40/50系列,最新驱动

🎮 显卡型号推荐表

显卡系列 推荐 CUDA 版本 说明
GTX 10系列(1060/1070/1080等) CUDA 11.8 兼容性最好
GTX 16系列(1650/1660等) CUDA 11.8 兼容性最好
RTX 20系列(2060/2070/2080等) CUDA 11.812.2 根据驱动版本选择
RTX 30系列(3060/3070/3080/3090等) CUDA 12.2 推荐使用
RTX 40系列(4060/4070/4080/4090等) CUDA 12.212.8 最新驱动用12.8
RTX 50系列(5090/5080/5070等) 🔴 必须使用 CUDA 12.8 ⚠️ 注意:RTX 50系列必须使用CUDA 12.8版本

⚠️ 重要提示

  • RTX 50系列用户:由于新架构要求,必须使用 CUDA 12.8 版本,驱动版本必须 ≥570.00
  • 驱动版本查询:在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
  • 向下兼容:高版本驱动可以运行低版本CUDA程序(例如:570驱动可以运行CUDA 11.8程序)
  • 性能考虑:使用与驱动匹配的CUDA版本可获得最佳性能

📥 模型下载说明

基础版用户(需自行下载模型)

基础版包含VAD模型,但不包含Whisper语音识别模型。您需要:

  1. 从 Hugging Face 下载模型

  2. 放置模型文件

    将下载的模型文件放入:
    faster_whisper_transwithai_chickenrice/
    └── models/
        └── [您下载的模型文件夹]/
    
  3. 其他可用模型

    • OpenAI Whisper官方模型
    • 其他社区优化模型

海南鸡版用户(开箱即用)

海南鸡版已包含:

  • ✅ 音声优化 VAD 语音活动检测模型
  • ✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
  • ✅ 所有必要的配置文件

无需额外下载,解压后直接运行即可使用!


🚀 快速开始指南

1. 选择版本

根据上述表格,选择适合您显卡的CUDA版本

2. 下载对应版本

  • 仅转录/翻译:下载基础版 + 自行下载模型
  • 日文转中文优化:下载海南鸡版(推荐)

3. 解压并运行

# GPU模式(推荐)
将音视频文件拖放到 "运行(GPU).bat"

# CPU模式(无显卡用户)
将音视频文件拖放到 "运行(CPU).bat"

# 低显存模式(4GB显存)
将音视频文件拖放到 "运行(GPU,低显存模式).bat"

💡 常见问题

Q: 我应该选择哪个CUDA版本?
A: 运行 nvidia-smi 查看您的驱动版本,然后对照上表选择。

Q: 海南鸡版和基础版有什么区别?
A: 海南鸡版包含预训练的日文转中文优化模型(5000小时训练),基础版需要自行下载模型。

Q: RTX 4090 应该用哪个版本?
A: 推荐使用 CUDA 12.2 或 12.8 版本,取决于您的驱动版本。

Q: 显存不足怎么办?
A: 使用"低显存模式"批处理文件,或切换到CPU模式。


📝 更新日志

v1.2 (2025-11-15)

  • ⚡ CPU模式性能优化:添加 int16 计算类型支持,提升CPU处理速度
  • 🎮 GPU兼容性改进:强制使用 float16 替代模型精度 bfloat16,提升显卡兼容性
  • 🔧 精简批处理文件:合并视频翻译功能到主批处理文件中
  • 📝 新增日志记录功能:自动保存运行日志到 latest.log 文件,方便问题反馈

v1.1 (2025-11-14)

  • 🌐 离线支持改进:预下载 whisper-base 模型文件,实现完全离线运行
  • 📥 自动模型管理:WhisperFeatureExtractor 优先使用本地模型,避免网络超时
  • 🔧 优化下载流程:支持从已有模型文件夹复制,减少重复下载
  • 🚀 提升稳定性:解决网络不稳定环境下的 HuggingFace 连接超时问题

v1.0 (2025-11-13)

  • 🎯 支持多CUDA版本(11.8/12.2/12.8)
  • 🚀 优化的日文转中文翻译效果(海南鸡v2版本)
  • 🔊 音声优化的VAD语音活动检测
  • 💾 改进的缓存机制,加快CI/CD构建速度
  • 📦 分离的基础版和完整版,满足不同需求
  • 🔧 自动VAD模型下载和管理

📞 技术支持

如遇到问题,请:

  1. 检查显卡驱动是否为最新版本
  2. 确认选择了正确的CUDA版本
  3. 查看控制台输出的错误信息
  4. 提交Issue到项目仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

🔗 官方链接


🙏 致谢


本工具基于 Faster Whisper 开发,海南鸡模型经过5000小时音频数据优化训练,专门针对日文转中文翻译场景。
由AI汉化组开源维护,永久免费。

Release files generated with ading2210/gh-large-releases.

File Name Size SHA-256 Hash
faster_whisper_transwithai_windows_cu118-chickenrice.zip 4.50 GiB 0ea6142efef1449ae4e777948b7302b9c008b8f3eb98357039c8954bed3713f3
faster_whisper_transwithai_windows_cu118.zip 2.22 GiB 050d4aaeb451813b397a7325eeb0b232017e495392a3bfed20b6c3a7b183fbde
faster_whisper_transwithai_windows_cu122-chickenrice.zip 4.70 GiB 7dafdfadbc60363952be5754079ad47ef048519a85b07a232939e5dd98290208
faster_whisper_transwithai_windows_cu122.zip 2.42 GiB 16571b127332f5cebee223051fc0871c29649c08d06babc729d5c1a74b300769
faster_whisper_transwithai_windows_cu128-chickenrice.zip 5.32 GiB 9bcbf6d3ea0e28a92be56ffb1be939b27b800cd619bf94c6e771409ee553943a
faster_whisper_transwithai_windows_cu128.zip 3.04 GiB a1e089b9bea7245fc7570d46a51fc7c85018e8392c488a525fde204c5f78b2f8
placeholder.txt 70.00 B 527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b

Important

Download files from the links in the table above, instead of the assets list.

v1.1

15 Nov 06:27

Choose a tag to compare

🎙️ Faster Whisper 转录工具 - 发行说明

⚠️ 重要声明

本软件为开源软件

🔗 开源地址: https://github.com/haaswiiliammowsigf/Faster-Whisper-TransWithAI-ChickenRice

👥 开发团队: AI汉化组 (https://t.me/transWithAI)


📦 发行包说明

本发行版包含多个变体版本,请根据您的显卡型号选择合适的版本:

🎯 版本类型说明

基础版(Base Package)

  • 下载大小:约 2.2GB
  • 包含内容
    • ✅ 所有 GPU 依赖项
    • ✅ 音声优化 VAD(语音活动检测)ONNX 模型
    • ❌ 不含 Whisper 模型(需自行下载)
  • 适用场景:需要使用自定义模型的用户

海南鸡版(Chickenrice Edition)

  • 下载大小:约 4.4GB
  • 包含内容
    • ✅ 所有 GPU 依赖项
    • ✅ 音声优化 VAD(语音活动检测)ONNX 模型
    • "海南鸡v2 5000小时" 日文转中文优化模型
  • 适用场景:开箱即用的日文转中文翻译
  • 模型说明:包含经过5000小时音频数据训练的海南鸡v2版本模型,专门优化日文转中文翻译

📌 文件命名规则

文件名后缀 CUDA版本 模型类型
*_cu118.zip CUDA 11.8 基础版
*_cu118-chickenrice.zip CUDA 11.8 海南鸡版
*_cu122.zip CUDA 12.2 基础版
*_cu122-chickenrice.zip CUDA 12.2 海南鸡版
*_cu128.zip CUDA 12.8 基础版
*_cu128-chickenrice.zip CUDA 12.8 海南鸡版

🔍 如何选择正确的 CUDA 版本

方法一:通过 nvidia-smi 查询

  1. 打开命令提示符或终端
  2. 输入命令:nvidia-smi
  3. 查看输出中的 Driver VersionCUDA Version
+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00       Driver Version: 570.00       CUDA Version: 12.8|
+-------------------------------------------------------------------------+

方法二:通过显卡型号和驱动版本对照表

📊 NVIDIA 驱动版本与 CUDA 版本兼容性表

CUDA 版本 最低驱动要求(Windows) 最低驱动要求(Linux) 推荐使用场景
CUDA 11.8 ≥452.39 ≥450.80.02 较旧的显卡(GTX 10系列、RTX 20/30系列)
CUDA 12.2 ≥525.60.13 ≥525.60.13 RTX 30/40系列,较新的驱动
CUDA 12.8 ≥570.65 ≥570.26 RTX 40/50系列,最新驱动

🎮 显卡型号推荐表

显卡系列 推荐 CUDA 版本 说明
GTX 10系列(1060/1070/1080等) CUDA 11.8 兼容性最好
GTX 16系列(1650/1660等) CUDA 11.8 兼容性最好
RTX 20系列(2060/2070/2080等) CUDA 11.812.2 根据驱动版本选择
RTX 30系列(3060/3070/3080/3090等) CUDA 12.2 推荐使用
RTX 40系列(4060/4070/4080/4090等) CUDA 12.212.8 最新驱动用12.8
RTX 50系列(5090/5080/5070等) 🔴 必须使用 CUDA 12.8 ⚠️ 注意:RTX 50系列必须使用CUDA 12.8版本

⚠️ 重要提示

  • RTX 50系列用户:由于新架构要求,必须使用 CUDA 12.8 版本,驱动版本必须 ≥570.00
  • 驱动版本查询:在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
  • 向下兼容:高版本驱动可以运行低版本CUDA程序(例如:570驱动可以运行CUDA 11.8程序)
  • 性能考虑:使用与驱动匹配的CUDA版本可获得最佳性能

📥 模型下载说明

基础版用户(需自行下载模型)

基础版包含VAD模型,但不包含Whisper语音识别模型。您需要:

  1. 从 Hugging Face 下载模型

  2. 放置模型文件

    将下载的模型文件放入:
    faster_whisper_transwithai_chickenrice/
    └── models/
        └── [您下载的模型文件夹]/
    
  3. 其他可用模型

    • OpenAI Whisper官方模型
    • 其他社区优化模型

海南鸡版用户(开箱即用)

海南鸡版已包含:

  • ✅ 音声优化 VAD 语音活动检测模型
  • ✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
  • ✅ 所有必要的配置文件

无需额外下载,解压后直接运行即可使用!


🚀 快速开始指南

1. 选择版本

根据上述表格,选择适合您显卡的CUDA版本

2. 下载对应版本

  • 仅转录/翻译:下载基础版 + 自行下载模型
  • 日文转中文优化:下载海南鸡版(推荐)

3. 解压并运行

# GPU模式(推荐)
将音视频文件拖放到 "运行(GPU).bat"

# CPU模式(无显卡用户)
将音视频文件拖放到 "运行(CPU).bat"

# 低显存模式(4GB显存)
将音视频文件拖放到 "运行(GPU,低显存模式).bat"

💡 常见问题

Q: 我应该选择哪个CUDA版本?
A: 运行 nvidia-smi 查看您的驱动版本,然后对照上表选择。

Q: 海南鸡版和基础版有什么区别?
A: 海南鸡版包含预训练的日文转中文优化模型(5000小时训练),基础版需要自行下载模型。

Q: RTX 4090 应该用哪个版本?
A: 推荐使用 CUDA 12.2 或 12.8 版本,取决于您的驱动版本。

Q: 显存不足怎么办?
A: 使用"低显存模式"批处理文件,或切换到CPU模式。


📝 更新日志

当前版本特性

  • 🎯 支持多CUDA版本(11.8/12.2/12.8)
  • 🚀 优化的日文转中文翻译效果(海南鸡v2版本)
  • 🔊 音声优化的VAD语音活动检测
  • 💾 改进的缓存机制,加快CI/CD构建速度
  • 📦 分离的基础版和完整版,满足不同需求
  • 🔧 自动VAD模型下载和管理

📞 技术支持

如遇到问题,请:

  1. 检查显卡驱动是否为最新版本
  2. 确认选择了正确的CUDA版本
  3. 查看控制台输出的错误信息
  4. 提交Issue到项目仓库: https://github.com/haaswiiliammowsigf/Faster-Whisper-TransWithAI-ChickenRice

🔗 官方链接


🙏 致谢


本工具基于 Faster Whisper 开发,海南鸡模型经过5000小时音频数据优化训练,专门针对日文转中文翻译场景。
由AI汉化组开源维护,永久免费。

Release files generated with ading2210/gh-large-releases.

File Name Size SHA-256 Hash
faster_whisper_transwithai_windows_cu118-chickenrice.zip 4.50 GiB 38ddc143c8471655f607ecff3071f1bf81ee7edc0fb962ad5b29ebd6c27b495e
faster_whisper_transwithai_windows_cu118.zip 2.22 GiB f8d1eff4367d05a123d93627a81b3f54a3ab905aa99dea8ad18449cf010352a5
faster_whisper_transwithai_windows_cu122-chickenrice.zip 4.70 GiB 55253da240480ca5ff0f6193fff4df8f05447326519bda37f4133d2ae1e16f7e
faster_whisper_transwithai_windows_cu122.zip 2.42 GiB 41891bdd70c1a9a7f81371fbd4b5c7885dcc1301bec846fad9e0e41795028607
faster_whisper_transwithai_windows_cu128-chickenrice.zip 5.32 GiB f002c5252b33b582ecaa97b8e2d80d0e5d52526c49014db0c92ce71ff733f3e2
faster_whisper_transwithai_windows_cu128.zip 3.04 GiB d4459bb699f0c0d2bb6530c69dee7b8712bcc997bcdd5a8c1c4d214880c42352
placeholder.txt 70.00 B 527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b

Important

Download files from the links in the table above, instead of the assets list.

v1.0

15 Nov 06:24

Choose a tag to compare

🎙️ Faster Whisper 转录工具 - 发行说明

⚠️ 重要声明

本软件为开源软件

🔗 开源地址: https://github.com/haaswiiliammowsigf/Faster-Whisper-TransWithAI-ChickenRice

👥 开发团队: AI汉化组 (https://t.me/transWithAI)


📦 发行包说明

本发行版包含多个变体版本,请根据您的显卡型号选择合适的版本:

🎯 版本类型说明

基础版(Base Package)

  • 下载大小:约 2.2GB
  • 包含内容
    • ✅ 所有 GPU 依赖项
    • ✅ 音声优化 VAD(语音活动检测)ONNX 模型
    • ❌ 不含 Whisper 模型(需自行下载)
  • 适用场景:需要使用自定义模型的用户

海南鸡版(Chickenrice Edition)

  • 下载大小:约 4.4GB
  • 包含内容
    • ✅ 所有 GPU 依赖项
    • ✅ 音声优化 VAD(语音活动检测)ONNX 模型
    • "海南鸡v2 5000小时" 日文转中文优化模型
  • 适用场景:开箱即用的日文转中文翻译
  • 模型说明:包含经过5000小时音频数据训练的海南鸡v2版本模型,专门优化日文转中文翻译

📌 文件命名规则

文件名后缀 CUDA版本 模型类型
*_cu118.zip CUDA 11.8 基础版
*_cu118-chickenrice.zip CUDA 11.8 海南鸡版
*_cu122.zip CUDA 12.2 基础版
*_cu122-chickenrice.zip CUDA 12.2 海南鸡版
*_cu128.zip CUDA 12.8 基础版
*_cu128-chickenrice.zip CUDA 12.8 海南鸡版

🔍 如何选择正确的 CUDA 版本

方法一:通过 nvidia-smi 查询

  1. 打开命令提示符或终端
  2. 输入命令:nvidia-smi
  3. 查看输出中的 Driver VersionCUDA Version
+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00       Driver Version: 570.00       CUDA Version: 12.8|
+-------------------------------------------------------------------------+

方法二:通过显卡型号和驱动版本对照表

📊 NVIDIA 驱动版本与 CUDA 版本兼容性表

CUDA 版本 最低驱动要求(Windows) 最低驱动要求(Linux) 推荐使用场景
CUDA 11.8 ≥452.39 ≥450.80.02 较旧的显卡(GTX 10系列、RTX 20/30系列)
CUDA 12.2 ≥525.60.13 ≥525.60.13 RTX 30/40系列,较新的驱动
CUDA 12.8 ≥570.65 ≥570.26 RTX 40/50系列,最新驱动

🎮 显卡型号推荐表

显卡系列 推荐 CUDA 版本 说明
GTX 10系列(1060/1070/1080等) CUDA 11.8 兼容性最好
GTX 16系列(1650/1660等) CUDA 11.8 兼容性最好
RTX 20系列(2060/2070/2080等) CUDA 11.812.2 根据驱动版本选择
RTX 30系列(3060/3070/3080/3090等) CUDA 12.2 推荐使用
RTX 40系列(4060/4070/4080/4090等) CUDA 12.212.8 最新驱动用12.8
RTX 50系列(5090/5080/5070等) 🔴 必须使用 CUDA 12.8 ⚠️ 注意:RTX 50系列必须使用CUDA 12.8版本

⚠️ 重要提示

  • RTX 50系列用户:由于新架构要求,必须使用 CUDA 12.8 版本,驱动版本必须 ≥570.00
  • 驱动版本查询:在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
  • 向下兼容:高版本驱动可以运行低版本CUDA程序(例如:570驱动可以运行CUDA 11.8程序)
  • 性能考虑:使用与驱动匹配的CUDA版本可获得最佳性能

📥 模型下载说明

基础版用户(需自行下载模型)

基础版包含VAD模型,但不包含Whisper语音识别模型。您需要:

  1. 从 Hugging Face 下载模型

  2. 放置模型文件

    将下载的模型文件放入:
    faster_whisper_transwithai_chickenrice/
    └── models/
        └── [您下载的模型文件夹]/
    
  3. 其他可用模型

    • OpenAI Whisper官方模型
    • 其他社区优化模型

海南鸡版用户(开箱即用)

海南鸡版已包含:

  • ✅ 音声优化 VAD 语音活动检测模型
  • ✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
  • ✅ 所有必要的配置文件

无需额外下载,解压后直接运行即可使用!


🚀 快速开始指南

1. 选择版本

根据上述表格,选择适合您显卡的CUDA版本

2. 下载对应版本

  • 仅转录/翻译:下载基础版 + 自行下载模型
  • 日文转中文优化:下载海南鸡版(推荐)

3. 解压并运行

# GPU模式(推荐)
将音视频文件拖放到 "运行(GPU).bat"

# CPU模式(无显卡用户)
将音视频文件拖放到 "运行(CPU).bat"

# 低显存模式(4GB显存)
将音视频文件拖放到 "运行(GPU,低显存模式).bat"

💡 常见问题

Q: 我应该选择哪个CUDA版本?
A: 运行 nvidia-smi 查看您的驱动版本,然后对照上表选择。

Q: 海南鸡版和基础版有什么区别?
A: 海南鸡版包含预训练的日文转中文优化模型(5000小时训练),基础版需要自行下载模型。

Q: RTX 4090 应该用哪个版本?
A: 推荐使用 CUDA 12.2 或 12.8 版本,取决于您的驱动版本。

Q: 显存不足怎么办?
A: 使用"低显存模式"批处理文件,或切换到CPU模式。


📝 更新日志

当前版本特性

  • 🎯 支持多CUDA版本(11.8/12.2/12.8)
  • 🚀 优化的日文转中文翻译效果(海南鸡v2版本)
  • 🔊 音声优化的VAD语音活动检测
  • 💾 改进的缓存机制,加快CI/CD构建速度
  • 📦 分离的基础版和完整版,满足不同需求
  • 🔧 自动VAD模型下载和管理

📞 技术支持

如遇到问题,请:

  1. 检查显卡驱动是否为最新版本
  2. 确认选择了正确的CUDA版本
  3. 查看控制台输出的错误信息
  4. 提交Issue到项目仓库: https://github.com/haaswiiliammowsigf/Faster-Whisper-TransWithAI-ChickenRice

🔗 官方链接


🙏 致谢


本工具基于 Faster Whisper 开发,海南鸡模型经过5000小时音频数据优化训练,专门针对日文转中文翻译场景。
由AI汉化组开源维护,永久免费。

Release files generated with ading2210/gh-large-releases.

File Name Size SHA-256 Hash
faster_whisper_transwithai_windows_cu118-chickenrice.zip 4.50 GiB c14e6c4a2e6e42a14fbfb7def2d17013ddd1af51e53bad81b03cbcb76b464fd0
faster_whisper_transwithai_windows_cu118.zip 2.22 GiB 62c328b6d3cdc703b24127ef3557188bdd9f67453b4acce1429e57cf3d29c1cd
faster_whisper_transwithai_windows_cu122-chickenrice.zip 4.70 GiB 16044808c80cb5195faa7d56ef15018674504421eafaa9853500b19ef93a1a20
faster_whisper_transwithai_windows_cu122.zip 2.42 GiB 7a04b7bd6794d0d02c7d196aa60353e4680ce8cb12bae90070cee098699a5776
faster_whisper_transwithai_windows_cu128-chickenrice.zip 5.31 GiB a3d5b297e5291937640116826c51f301d0d78a25e025dcbb03b71ac80d27698a
faster_whisper_transwithai_windows_cu128.zip 3.03 GiB 2b3af9655d1f1c7fbe31a7cc9c31395062f33461ae50c7a1c23207a75cbb6b87
placeholder.txt 70.00 B 527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b

Important

Download files from the links in the table above, instead of the assets list.