25 Feb 19:15

bec3d22

v1.7 Latest

Latest

🎙️ Faster Whisper 转录工具 - 发行说明

⚠️ 重要声明

📦 发行包说明

本发行版包含多个变体版本，请根据您的显卡型号选择合适的版本：

🎯 版本类型说明

基础版（Base Package）

下载大小：约 2.2GB
包含内容：
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD（语音活动检测）ONNX 模型
- ❌ 不含 Whisper 模型（需自行下载）
适用场景：需要使用自定义模型的用户

海南鸡版（Chickenrice Edition）

下载大小：约 4.4GB
包含内容：
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD（语音活动检测）ONNX 模型
- ✅ "海南鸡v2 5000小时" 日文转中文优化模型
适用场景：开箱即用的日文转中文翻译
模型说明：包含经过5000小时音频数据训练的海南鸡v2版本模型，专门优化日文转中文翻译

📌 文件命名规则

文件名后缀	CUDA/ROCm	模型类型
`*_cu118.zip`	CUDA 11.8	基础版
`*_cu118-chickenrice.zip`	CUDA 11.8	海南鸡版
`*_cu122.zip`	CUDA 12.2	基础版
`*_cu122-chickenrice.zip`	CUDA 12.2	海南鸡版
`*_cu128.zip`	CUDA 12.8	基础版
`*_cu128-chickenrice.zip`	CUDA 12.8	海南鸡版
`*_gfx101x_dgpu.zip`	AMD ROCm/HIP (gfx101X)	基础版
`*_gfx101x_dgpu-chickenrice.zip`	AMD ROCm/HIP (gfx101X)	海南鸡版
`*_gfx103x_dgpu.zip`	AMD ROCm/HIP (gfx103X)	基础版
`*_gfx103x_dgpu-chickenrice.zip`	AMD ROCm/HIP (gfx103X)	海南鸡版
`*_gfx110x_all.zip`	AMD ROCm/HIP (gfx110X)	基础版
`*_gfx110x_all-chickenrice.zip`	AMD ROCm/HIP (gfx110X)	海南鸡版
`*_gfx120x_all.zip`	AMD ROCm/HIP (gfx120X)	基础版
`*_gfx120x_all-chickenrice.zip`	AMD ROCm/HIP (gfx120X)	海南鸡版

🔍 如何选择正确的版本

NVIDIA 显卡 —— 选择 CUDA 版本

方法一：通过 nvidia-smi 查询

打开命令提示符或终端
输入命令：nvidia-smi
查看输出中的 Driver Version 和 CUDA Version

+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00       Driver Version: 570.00       CUDA Version: 12.8|
+-------------------------------------------------------------------------+

方法二：通过显卡型号和驱动版本对照表

📊 NVIDIA 驱动版本与 CUDA 版本兼容性表

CUDA 版本	最低驱动要求（Windows）	最低驱动要求（Linux）	推荐使用场景
CUDA 11.8	≥452.39	≥450.80.02	较旧的显卡（GTX 10系列、RTX 20/30系列）
CUDA 12.2	≥525.60.13	≥525.60.13	RTX 30/40系列，较新的驱动
CUDA 12.8	≥570.65	≥570.26	RTX 40/50系列，最新驱动

🎮 显卡型号推荐表

显卡系列	推荐 CUDA 版本	说明
GTX 10系列（1060/1070/1080等）	CUDA 11.8	兼容性最好
GTX 16系列（1650/1660等）	CUDA 11.8	兼容性最好
RTX 20系列（2060/2070/2080等）	CUDA 11.8 或 12.2	根据驱动版本选择
RTX 30系列（3060/3070/3080/3090等）	CUDA 12.2	推荐使用
RTX 40系列（4060/4070/4080/4090等）	CUDA 12.2 或 12.8	最新驱动用12.8
RTX 50系列（5090/5080/5070等）	🔴 必须使用 CUDA 12.8	⚠️ 注意：RTX 50系列必须使用CUDA 12.8版本

⚠️ 重要提示

RTX 50系列用户：由于新架构要求，必须使用 CUDA 12.8 版本，驱动版本必须 ≥570.00
驱动版本查询：在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
向下兼容：高版本驱动可以运行低版本CUDA程序（例如：570驱动可以运行CUDA 11.8程序）
性能考虑：使用与驱动匹配的CUDA版本可获得最佳性能

AMD 显卡 —— 选择 ROCm/HIP 版本

AMD 显卡用户请下载带有 gfx*** 后缀的版本。AMD 版本已内置 ROCm/HIP 运行时 DLL，一般无需单独安装 ROCm。

快速自查：

显卡型号	下载后缀
RX 5300 / RX 5500 / RX 5600 / RX 5700 系列	`gfx101x_dgpu`
RX 6400 / RX 6500 XT / RX 6600 / RX 6700 / RX 6800 / RX 6900 系列	`gfx103x_dgpu`
RX 7600 / RX 7700 XT / RX 7800 XT / RX 7900 系列	`gfx110x_all`
RX 9060 / RX 9060 XT / RX 9070（含 GRE/XT）	`gfx120x_all`
iGPU: Radeon 890M / 8060S / 860M (gfx115x)	⚠️ 暂不支持

📥 模型下载说明

基础版用户（需自行下载模型）

基础版包含VAD模型，但不包含Whisper语音识别模型。您需要：

从 Hugging Face 下载模型
- 示例模型地址：https://huggingface.co/chickenrice0721/whisper-large-v2-translate-zh-v0.2-st
- 这是"海南鸡v2 5000小时"版本的日文转中文优化模型

放置模型文件

将下载的模型文件放入：
faster_whisper_transwithai_chickenrice/
└── models/
    └── [您下载的模型文件夹]/

其他可用模型
- OpenAI Whisper官方模型
- 其他社区优化模型

海南鸡版用户（开箱即用）

海南鸡版已包含：

✅ 音声优化 VAD 语音活动检测模型
✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
✅ 所有必要的配置文件

无需额外下载，解压后直接运行即可使用！

🚀 快速开始指南

1. 选择版本

根据上述表格，选择适合您显卡的CUDA版本

2. 下载对应版本

仅转录/翻译：下载基础版 + 自行下载模型
日文转中文优化：下载海南鸡版（推荐）

3. 解压并运行

# GPU模式（推荐）
将音视频文件拖放到 "运行(GPU).bat"

# CPU模式（无显卡用户）
将音视频文件拖放到 "运行(CPU).bat"

# 低显存模式（4GB显存）
将音视频文件拖放到 "运行(GPU,低显存模式).bat"

💡 常见问题

Q: 我应该选择哪个CUDA版本？
A: 运行 nvidia-smi 查看您的驱动版本，然后对照上表选择。

Q: 海南鸡版和基础版有什么区别？
A: 海南鸡版包含预训练的日文转中文优化模型（5000小时训练），基础版需要自行下载模型。

Q: RTX 4090 应该用哪个版本？
A: 推荐使用 CUDA 12.2 或 12.8 版本，取决于您的驱动版本。

Q: 显存不足怎么办？
A: 使用"低显存模式"批处理文件，或切换到CPU模式。

📝 更新日志

v1.7 (2026-02-24)

🔴 AMD ROCm/HIP GPU 支持：新增 AMD 显卡支持（RDNA1–RDNA4），覆盖 RX 5000 / 6000 / 7000 / 9000 系列
📦 多架构构建：提供 gfx101x（RDNA1）、gfx103x（RDNA2）、gfx110x（RDNA3）、gfx120x（RDNA4）四种架构的打包版本
🔧 ROCm 运行时内置：AMD 版本内置 ROCm/HIP 运行时 DLL，无需单独安装 ROCm
🎮 设备别名：命令行支持 --device=amd（等同于 --device=cuda，CTranslate2 HIP 后端约定）
⚡ 自动设备检测增强：改进 GPU 检测逻辑，支持 AMD HIP 设备自动识别

📋 AMD 版本选择：参考上方 "AMD 显卡 —— 选择 ROCm/HIP 版本" 或 README 中的完整型号列表。

v1.6 (2026-01-12)

☁️ Modal 云端推理支持：新增 modal_infer.exe，无需本地 GPU 也能使用云端 GPU 进行推理（感谢 @Randomless 贡献）
🎮 多 GPU 选择：支持 T4、L4、A10G、A100、H100 等多种云端 GPU
💰 新用户福利：Modal 新用户每月 $30 免费额度，T4 GPU 推荐性价比最高
🔧 交互式配置：通过命令行交互选择 GPU 类型、模型、批处理等参数
📤 自动文件传输：自动上传本地音频、下载生成的字幕到本地
🗃️ 模型缓存：模型文件在 Modal Volume 中缓存，后续运行更快
📦 环境整合：Modal 依赖已集成到主环境文件，无需单独安装

☁️ 使用方法：

注册 Modal 账号：https://modal.com/
配置 Token：运行 modal token new
运行推理：modal_infer.exe 或 python modal_infer.py

💡 使用建议：

本地无 GPU 或显存不足时使用云端推理
T4 GPU 性价比最高，适合一般转录任务
大量任务可选择 A10G/A100 加速处理

v1.5 (2025-12-26)

🔧 字幕合并后处理：新增 segment_merge 配置选项，智能合并重复/重叠的字幕片段
⚙️ 灵活配置：在 generation_config.json5 中配置合并参数（启用/禁用、最大间隔、最大时长）
🎛️ 命令行覆盖：支持通过命令行参数覆盖配置文件设置
- --merge_segments / --no_merge_segments：启用/禁用合并
- --merge_max_gap_ms：设置允许合并的最大片段间隔（毫秒）
- --merge_max_duration_ms：设置合并后单条字幕的最大时长（毫秒）
🚀 算法优化：改进合并算法，通过间隔和时长限制避免产生过长的字幕

💡 使用建议：

如遇到"单条字幕持续时间异常过长"的情况，可调小 max_gap_ms 或 max_duration_ms
如需完全禁用合并功能，将 enabled 设为 false 或使用 --no_merge_segments 参数

v1.4 (2025-11-25)

🚀 批处理推理支持：新增批处理推理模式（--enable_batching），大幅提升处理速度
⚡ 智能批次大小自动检测：程序启动时自动测试不同批次大小（1-8），找到显存允许的最大批次
🎯 手动批次大小控制：支持通过 --batch_size 参数手动指定批次大小，跳过自动检测
🔧 运行时自适应调整：处理过程中如遇到显存不足（OOM），自动降低批次大小（每次减少20%）继续处理
📈 最大批次大小配置：通过 --max_batch_size 参数控制自动检测的上限（默认8，可根据显存调整）
📦 新增高显存加速模式：提供 "运行(GPU,高显存加速模式).bat" 专门为8GB+显存用户优化
🔨 修复批处理兼容性：应用补丁修复faster-whisper批处理的max_initial_timestamp参数传递问题
🌐 批处理日志国际化：为批处理功能添加完整的中英文本地化消息，便于调试和使用

📊 批处理模式说明：

并行处理优势：批处理模式下，多个音频片段并行转录，每个片段独立处理，不依赖前面片段的结果
精度权衡：批处理可能略微降低转录精度（由于失去了条件生成的上下文信息）
特殊场景优化：在某些场景下批处理反而效果更好，因为避免了条件生成可能带来的错误传播
- 噪声较多的音频：避免噪声片段影响后续转录
- 多说话人场景：减少不同说话人之间的相互干扰
- 长音频文件：防止错误累积效应

🎮 使用建议：

8GB+ 显存：使用 "运行(GPU,高显存加速模式).bat"，自动检测最优批次大小
4-8GB 显存：手动设置较小批次大小，如 --batch_size=2 或 4
追求最高精度：使用常规模式（不加 --enable_batching 参数）
追求处理速度：启用批处理模式，接受轻微的精度权衡

v1.3 (2025-11-17)

🤖 智能计算类型选择：自动检测设备并选择最优计算类型（bfloat16 > float16 > int8 > float32）
🔍 增强设备自动检测：改进CUDA可用性检测，支持CUDA_VISIBLE_DEVICES环境变量
🔇 抑制警告信息：添加TRANSFORMERS_NO_ADVISORY_WARNINGS环境变量，减少日志噪音
🎯 简化批处理文件：移除硬编码的计算类型设置，全部使用自动检测模式
📊 改进日志记录：添加自动检测设备和计算类型的详细日志信息
🐛 修复日志重复问题：移除重复的根日志处理器，避免日志重复输出
🌐 增强国际化支持：为自动检测功能添加完整的中英文本地化消息

v1.2 (2025-11-15)

⚡ CPU模式性能优化：添加 int16 计算类型支持，提升CPU处理速度
🎮 GPU兼容性改进：强制使用 float16 替代模型精度 bfloat16，提升显卡兼容性
🔧 精简批处理文件：合并视频翻译功能到主批处理文件中
📝 新增日志记录功能：自动保存运行日志到 latest.log 文件，方便问题反馈

v1.1 (2025-11-14)

🌐 离线支持改进：预下载 whisper-base 模型文件，实现完全离线运行
📥 自动模型管理：WhisperFeatureExtractor 优先使用本地模型，避免网络超时
🔧 优化下载流程：支持从已有模型文件夹复制，减少重复下载
🚀 提升稳定性：解决网络不稳定环境下的 HuggingFace 连接超时问题

v1.0 (2025-11-13)

🎯 支持多CUDA版本（11.8/12.2/12.8）
🚀 优化的日文转中文翻译效果（海南鸡v2版本）
🔊 音声优化的VAD语音活动检测
💾 改进的缓存机制，加快CI/CD构建速度
📦 分离的基础版和完整版，满足不同需求
🔧 自动VAD模型下载和管理

📞 技术支持

如遇到问题，请：

检查显卡驱动是否为最新版本
确认选择了正确的CUDA版本
查看控制台输出的错误信息
提交Issue到项目仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

🔗 官方链接

GitHub仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
音声优化 VAD 模型: https://huggingface.co/TransWithAI/Whisper-Vad-EncDec-ASMR-onnx
Telegram群组: https://t.me/transWithAI
开发团队: AI汉化组

🙏 致谢

🚀 基于 SYSTRAN/faster-whisper 开发
🐔 使用 chickenrice0721/whisper-large-v2-translate-zh-v0.2-st 日文转中文优化模型
🔊 使用 TransWithAI/Whisper-Vad-EncDec-ASMR-onnx 音声优化 VAD 模型
🎙️ OpenAI Whisper 原始项目
☁️ 感谢 @Randomless 贡献 Modal 云端推理功能
💪 感谢某匿名群友的算力和技术支持

本工具基于 Faster Whisper 开发，海南鸡模型经过5000小时音频数据优化训练，专门针对日文转中文翻译场景。
由AI汉化组开源维护，永久免费。

Release files generated with ading2210/gh-large-releases.

File Name	Size	SHA-256 Hash
faster_whisper_transwithai_windows_cu118-chickenrice.zip	4.54 GiB	_{^{60fd157293d7d5033dab3c013ce3d4a083d1af6460157f1303a622f4f931715f}}
faster_whisper_transwithai_windows_cu118.zip	2.26 GiB	_{^{d581dd2bc84f0ed8d3082f396324285127ae12053e29fa02ea12a1fd25bafd20}}
[faster_whisper_transwithai_windows_cu122-chickenrice.zip](https://gh-releases.ading2210.w...

Assets 45

faster_whisper_transwithai_windows_cu118-chickenrice.zip.0000

sha256:6ea55b996a35a0b465735149d76ef3b42f6ce1898cbb02fb9294856bdbdc9044

1.95 GB 2026-02-25T19:26:20Z
faster_whisper_transwithai_windows_cu118-chickenrice.zip.0001

sha256:835b4049fa75624b23d8f3387133b338f1b1f6ab6135541b4239d95c5dbbc2cc

1.95 GB 2026-02-25T19:27:49Z
faster_whisper_transwithai_windows_cu118-chickenrice.zip.0002

sha256:ef3dd48927923b2d0e1557b62c3f04effbbb08bc63dcddcb93383b95f96f69bd

645 MB 2026-02-25T19:29:17Z
faster_whisper_transwithai_windows_cu118-chickenrice.zip.manifest

sha256:558890ca2e3feb3044dc3cfe8338c973c9192d6f3f4dee1c75133996c3205c4e

425 Bytes 2026-02-25T19:29:48Z
faster_whisper_transwithai_windows_cu118.zip.0000

sha256:76ad998098e000452d357d91657de57c5ddde509826d94346350d74fb42084b6

1.95 GB 2026-02-25T19:18:53Z
faster_whisper_transwithai_windows_cu118.zip.0001

sha256:fc616933a05cd25adc1e94e88e8817b3492428933c5061e956391b000e338884

309 MB 2026-02-25T19:19:45Z
faster_whisper_transwithai_windows_cu118.zip.manifest

sha256:bf31842dfd712e12b268a434589bb38f193a6ad6fb65e890ca791cf457d7dde7

320 Bytes 2026-02-25T19:19:55Z
faster_whisper_transwithai_windows_cu122-chickenrice.zip.0000

sha256:92c16323c7ae33fe1feb078e6b20e8f7f82bba034049f98af07b1b7c2b480950

1.95 GB 2026-02-25T19:26:19Z
faster_whisper_transwithai_windows_cu122-chickenrice.zip.0001

sha256:b651dac0d0992fd07a052c4cc16ffe2418f20bb542bdceb60e839d71a7643e56

1.95 GB 2026-02-25T19:27:40Z
faster_whisper_transwithai_windows_cu122-chickenrice.zip.0002

sha256:955e91db7a9bfee7727101488bff95635c69bc46712bfc7a859229237d739993

1010 MB 2026-02-25T19:29:12Z
Source code (zip)

2026-02-25T18:27:33Z
Source code (tar.gz)

2026-02-25T18:27:33Z

15 Jan 15:42

github-actions

v1.6

3069cd5

v1.6

🎙️ Faster Whisper 转录工具 - 发行说明

⚠️ 重要声明

📦 发行包说明

本发行版包含多个变体版本，请根据您的显卡型号选择合适的版本：

🎯 版本类型说明

基础版（Base Package）

下载大小：约 2.2GB
包含内容：
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD（语音活动检测）ONNX 模型
- ❌ 不含 Whisper 模型（需自行下载）
适用场景：需要使用自定义模型的用户

海南鸡版（Chickenrice Edition）

下载大小：约 4.4GB
包含内容：
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD（语音活动检测）ONNX 模型
- ✅ "海南鸡v2 5000小时" 日文转中文优化模型
适用场景：开箱即用的日文转中文翻译
模型说明：包含经过5000小时音频数据训练的海南鸡v2版本模型，专门优化日文转中文翻译

📌 文件命名规则

文件名后缀	CUDA版本	模型类型
`*_cu118.zip`	CUDA 11.8	基础版
`*_cu118-chickenrice.zip`	CUDA 11.8	海南鸡版
`*_cu122.zip`	CUDA 12.2	基础版
`*_cu122-chickenrice.zip`	CUDA 12.2	海南鸡版
`*_cu128.zip`	CUDA 12.8	基础版
`*_cu128-chickenrice.zip`	CUDA 12.8	海南鸡版

🔍 如何选择正确的 CUDA 版本

方法一：通过 nvidia-smi 查询

打开命令提示符或终端
输入命令：nvidia-smi
查看输出中的 Driver Version 和 CUDA Version

+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00       Driver Version: 570.00       CUDA Version: 12.8|
+-------------------------------------------------------------------------+

方法二：通过显卡型号和驱动版本对照表

📊 NVIDIA 驱动版本与 CUDA 版本兼容性表

CUDA 版本	最低驱动要求（Windows）	最低驱动要求（Linux）	推荐使用场景
CUDA 11.8	≥452.39	≥450.80.02	较旧的显卡（GTX 10系列、RTX 20/30系列）
CUDA 12.2	≥525.60.13	≥525.60.13	RTX 30/40系列，较新的驱动
CUDA 12.8	≥570.65	≥570.26	RTX 40/50系列，最新驱动

🎮 显卡型号推荐表

显卡系列	推荐 CUDA 版本	说明
GTX 10系列（1060/1070/1080等）	CUDA 11.8	兼容性最好
GTX 16系列（1650/1660等）	CUDA 11.8	兼容性最好
RTX 20系列（2060/2070/2080等）	CUDA 11.8 或 12.2	根据驱动版本选择
RTX 30系列（3060/3070/3080/3090等）	CUDA 12.2	推荐使用
RTX 40系列（4060/4070/4080/4090等）	CUDA 12.2 或 12.8	最新驱动用12.8
RTX 50系列（5090/5080/5070等）	🔴 必须使用 CUDA 12.8	⚠️ 注意：RTX 50系列必须使用CUDA 12.8版本

⚠️ 重要提示

RTX 50系列用户：由于新架构要求，必须使用 CUDA 12.8 版本，驱动版本必须 ≥570.00
驱动版本查询：在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
向下兼容：高版本驱动可以运行低版本CUDA程序（例如：570驱动可以运行CUDA 11.8程序）
性能考虑：使用与驱动匹配的CUDA版本可获得最佳性能

📥 模型下载说明

基础版用户（需自行下载模型）

基础版包含VAD模型，但不包含Whisper语音识别模型。您需要：

从 Hugging Face 下载模型
- 示例模型地址：https://huggingface.co/chickenrice0721/whisper-large-v2-translate-zh-v0.2-st
- 这是"海南鸡v2 5000小时"版本的日文转中文优化模型

放置模型文件

将下载的模型文件放入：
faster_whisper_transwithai_chickenrice/
└── models/
    └── [您下载的模型文件夹]/

其他可用模型
- OpenAI Whisper官方模型
- 其他社区优化模型

海南鸡版用户（开箱即用）

海南鸡版已包含：

✅ 音声优化 VAD 语音活动检测模型
✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
✅ 所有必要的配置文件

无需额外下载，解压后直接运行即可使用！

🚀 快速开始指南

1. 选择版本

根据上述表格，选择适合您显卡的CUDA版本

2. 下载对应版本

仅转录/翻译：下载基础版 + 自行下载模型
日文转中文优化：下载海南鸡版（推荐）

3. 解压并运行

# GPU模式（推荐）
将音视频文件拖放到 "运行(GPU).bat"

# CPU模式（无显卡用户）
将音视频文件拖放到 "运行(CPU).bat"

# 低显存模式（4GB显存）
将音视频文件拖放到 "运行(GPU,低显存模式).bat"

💡 常见问题

Q: 我应该选择哪个CUDA版本？
A: 运行 nvidia-smi 查看您的驱动版本，然后对照上表选择。

Q: 海南鸡版和基础版有什么区别？
A: 海南鸡版包含预训练的日文转中文优化模型（5000小时训练），基础版需要自行下载模型。

Q: RTX 4090 应该用哪个版本？
A: 推荐使用 CUDA 12.2 或 12.8 版本，取决于您的驱动版本。

Q: 显存不足怎么办？
A: 使用"低显存模式"批处理文件，或切换到CPU模式。

📝 更新日志

v1.6 (2026-01-12)

☁️ Modal 云端推理支持：新增 modal_infer.exe，无需本地 GPU 也能使用云端 GPU 进行推理（感谢 @Randomless 贡献）
🎮 多 GPU 选择：支持 T4、L4、A10G、A100、H100 等多种云端 GPU
💰 新用户福利：Modal 新用户每月 $30 免费额度，T4 GPU 推荐性价比最高
🔧 交互式配置：通过命令行交互选择 GPU 类型、模型、批处理等参数
📤 自动文件传输：自动上传本地音频、下载生成的字幕到本地
🗃️ 模型缓存：模型文件在 Modal Volume 中缓存，后续运行更快
📦 环境整合：Modal 依赖已集成到主环境文件，无需单独安装

☁️ 使用方法：

注册 Modal 账号：https://modal.com/
配置 Token：运行 modal token new
运行推理：modal_infer.exe 或 python modal_infer.py

💡 使用建议：

本地无 GPU 或显存不足时使用云端推理
T4 GPU 性价比最高，适合一般转录任务
大量任务可选择 A10G/A100 加速处理

v1.5 (2025-12-26)

🔧 字幕合并后处理：新增 segment_merge 配置选项，智能合并重复/重叠的字幕片段
⚙️ 灵活配置：在 generation_config.json5 中配置合并参数（启用/禁用、最大间隔、最大时长）
🎛️ 命令行覆盖：支持通过命令行参数覆盖配置文件设置
- --merge_segments / --no_merge_segments：启用/禁用合并
- --merge_max_gap_ms：设置允许合并的最大片段间隔（毫秒）
- --merge_max_duration_ms：设置合并后单条字幕的最大时长（毫秒）
🚀 算法优化：改进合并算法，通过间隔和时长限制避免产生过长的字幕

💡 使用建议：

如遇到"单条字幕持续时间异常过长"的情况，可调小 max_gap_ms 或 max_duration_ms
如需完全禁用合并功能，将 enabled 设为 false 或使用 --no_merge_segments 参数

v1.4 (2025-11-25)

🚀 批处理推理支持：新增批处理推理模式（--enable_batching），大幅提升处理速度
⚡ 智能批次大小自动检测：程序启动时自动测试不同批次大小（1-8），找到显存允许的最大批次
🎯 手动批次大小控制：支持通过 --batch_size 参数手动指定批次大小，跳过自动检测
🔧 运行时自适应调整：处理过程中如遇到显存不足（OOM），自动降低批次大小（每次减少20%）继续处理
📈 最大批次大小配置：通过 --max_batch_size 参数控制自动检测的上限（默认8，可根据显存调整）
📦 新增高显存加速模式：提供 "运行(GPU,高显存加速模式).bat" 专门为8GB+显存用户优化
🔨 修复批处理兼容性：应用补丁修复faster-whisper批处理的max_initial_timestamp参数传递问题
🌐 批处理日志国际化：为批处理功能添加完整的中英文本地化消息，便于调试和使用

📊 批处理模式说明：

并行处理优势：批处理模式下，多个音频片段并行转录，每个片段独立处理，不依赖前面片段的结果
精度权衡：批处理可能略微降低转录精度（由于失去了条件生成的上下文信息）
特殊场景优化：在某些场景下批处理反而效果更好，因为避免了条件生成可能带来的错误传播
- 噪声较多的音频：避免噪声片段影响后续转录
- 多说话人场景：减少不同说话人之间的相互干扰
- 长音频文件：防止错误累积效应

🎮 使用建议：

8GB+ 显存：使用 "运行(GPU,高显存加速模式).bat"，自动检测最优批次大小
4-8GB 显存：手动设置较小批次大小，如 --batch_size=2 或 4
追求最高精度：使用常规模式（不加 --enable_batching 参数）
追求处理速度：启用批处理模式，接受轻微的精度权衡

v1.3 (2025-11-17)

🤖 智能计算类型选择：自动检测设备并选择最优计算类型（bfloat16 > float16 > int8 > float32）
🔍 增强设备自动检测：改进CUDA可用性检测，支持CUDA_VISIBLE_DEVICES环境变量
🔇 抑制警告信息：添加TRANSFORMERS_NO_ADVISORY_WARNINGS环境变量，减少日志噪音
🎯 简化批处理文件：移除硬编码的计算类型设置，全部使用自动检测模式
📊 改进日志记录：添加自动检测设备和计算类型的详细日志信息
🐛 修复日志重复问题：移除重复的根日志处理器，避免日志重复输出
🌐 增强国际化支持：为自动检测功能添加完整的中英文本地化消息

v1.2 (2025-11-15)

⚡ CPU模式性能优化：添加 int16 计算类型支持，提升CPU处理速度
🎮 GPU兼容性改进：强制使用 float16 替代模型精度 bfloat16，提升显卡兼容性
🔧 精简批处理文件：合并视频翻译功能到主批处理文件中
📝 新增日志记录功能：自动保存运行日志到 latest.log 文件，方便问题反馈

v1.1 (2025-11-14)

🌐 离线支持改进：预下载 whisper-base 模型文件，实现完全离线运行
📥 自动模型管理：WhisperFeatureExtractor 优先使用本地模型，避免网络超时
🔧 优化下载流程：支持从已有模型文件夹复制，减少重复下载
🚀 提升稳定性：解决网络不稳定环境下的 HuggingFace 连接超时问题

v1.0 (2025-11-13)

🎯 支持多CUDA版本（11.8/12.2/12.8）
🚀 优化的日文转中文翻译效果（海南鸡v2版本）
🔊 音声优化的VAD语音活动检测
💾 改进的缓存机制，加快CI/CD构建速度
📦 分离的基础版和完整版，满足不同需求
🔧 自动VAD模型下载和管理

📞 技术支持

如遇到问题，请：

检查显卡驱动是否为最新版本
确认选择了正确的CUDA版本
查看控制台输出的错误信息
提交Issue到项目仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

🔗 官方链接

GitHub仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
音声优化 VAD 模型: https://huggingface.co/TransWithAI/Whisper-Vad-EncDec-ASMR-onnx
Telegram群组: https://t.me/transWithAI
开发团队: AI汉化组

🙏 致谢

🚀 基于 SYSTRAN/faster-whisper 开发
🐔 使用 chickenrice0721/whisper-large-v2-translate-zh-v0.2-st 日文转中文优化模型
🔊 使用 TransWithAI/Whisper-Vad-EncDec-ASMR-onnx 音声优化 VAD 模型
🎙️ OpenAI Whisper 原始项目
☁️ 感谢 @Randomless 贡献 Modal 云端推理功能
💪 感谢某匿名群友的算力和技术支持

本工具基于 Faster Whisper 开发，海南鸡模型经过5000小时音频数据优化训练，专门针对日文转中文翻译场景。
由AI汉化组开源维护，永久免费。

Release files generated with ading2210/gh-large-releases.

File Name	Size	SHA-256 Hash
faster_whisper_transwithai_windows_cu118-chickenrice.zip	4.54 GiB	_{^{ab1a5af3c0cbfa822eb93050c07f5a8a60607485f5eb20e9e899e67cf6c7a943}}
faster_whisper_transwithai_windows_cu118.zip	2.25 GiB	_{^{bdc9b987d679c765c18ccb988af43dd0dc2bce6dc469d9d3817c62de5d49e67c}}
faster_whisper_transwithai_windows_cu122-chickenrice.zip	4.89 GiB	_{^{408e93141206ba48b8a979064f60457aadc94963666958e6ba5d58a87e0b7c3a}}
faster_whisper_transwithai_windows_cu122.zip	2.61 GiB	_{^{c1aefb0df71c60829470553e59e7f4f15c3fee9439d43943d3c362abd61f6cfc}}
faster_whisper_transwithai_windows_cu128-chickenrice.zip	5.50 GiB	_{^{334fd8bda9f846659d45d599b44273bf30cfc069e1f675105b35eda4fca79c61}}
faster_whisper_transwithai_windows_cu128.zip	3.22 GiB	_{^{cd470e8084843207e7e19d287b6b5fb4179f7a0eab5a3d12ea92a23850dbefce}}
placeholder.txt	70.00 B	_{^{527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b}}

Important

Download files from the links in the table above, instead of the assets list.

Assets 25

10 Jan 19:52

github-actions

v1.5

48034b8

v1.5

🎙️ Faster Whisper 转录工具 - 发行说明

⚠️ 重要声明

📦 发行包说明

本发行版包含多个变体版本，请根据您的显卡型号选择合适的版本：

🎯 版本类型说明

基础版（Base Package）

下载大小：约 2.2GB
包含内容：
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD（语音活动检测）ONNX 模型
- ❌ 不含 Whisper 模型（需自行下载）
适用场景：需要使用自定义模型的用户

海南鸡版（Chickenrice Edition）

下载大小：约 4.4GB
包含内容：
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD（语音活动检测）ONNX 模型
- ✅ "海南鸡v2 5000小时" 日文转中文优化模型
适用场景：开箱即用的日文转中文翻译
模型说明：包含经过5000小时音频数据训练的海南鸡v2版本模型，专门优化日文转中文翻译

📌 文件命名规则

文件名后缀	CUDA版本	模型类型
`*_cu118.zip`	CUDA 11.8	基础版
`*_cu118-chickenrice.zip`	CUDA 11.8	海南鸡版
`*_cu122.zip`	CUDA 12.2	基础版
`*_cu122-chickenrice.zip`	CUDA 12.2	海南鸡版
`*_cu128.zip`	CUDA 12.8	基础版
`*_cu128-chickenrice.zip`	CUDA 12.8	海南鸡版

🔍 如何选择正确的 CUDA 版本

方法一：通过 nvidia-smi 查询

打开命令提示符或终端
输入命令：nvidia-smi
查看输出中的 Driver Version 和 CUDA Version

+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00       Driver Version: 570.00       CUDA Version: 12.8|
+-------------------------------------------------------------------------+

方法二：通过显卡型号和驱动版本对照表

📊 NVIDIA 驱动版本与 CUDA 版本兼容性表

CUDA 版本	最低驱动要求（Windows）	最低驱动要求（Linux）	推荐使用场景
CUDA 11.8	≥452.39	≥450.80.02	较旧的显卡（GTX 10系列、RTX 20/30系列）
CUDA 12.2	≥525.60.13	≥525.60.13	RTX 30/40系列，较新的驱动
CUDA 12.8	≥570.65	≥570.26	RTX 40/50系列，最新驱动

🎮 显卡型号推荐表

显卡系列	推荐 CUDA 版本	说明
GTX 10系列（1060/1070/1080等）	CUDA 11.8	兼容性最好
GTX 16系列（1650/1660等）	CUDA 11.8	兼容性最好
RTX 20系列（2060/2070/2080等）	CUDA 11.8 或 12.2	根据驱动版本选择
RTX 30系列（3060/3070/3080/3090等）	CUDA 12.2	推荐使用
RTX 40系列（4060/4070/4080/4090等）	CUDA 12.2 或 12.8	最新驱动用12.8
RTX 50系列（5090/5080/5070等）	🔴 必须使用 CUDA 12.8	⚠️ 注意：RTX 50系列必须使用CUDA 12.8版本

⚠️ 重要提示

RTX 50系列用户：由于新架构要求，必须使用 CUDA 12.8 版本，驱动版本必须 ≥570.00
驱动版本查询：在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
向下兼容：高版本驱动可以运行低版本CUDA程序（例如：570驱动可以运行CUDA 11.8程序）
性能考虑：使用与驱动匹配的CUDA版本可获得最佳性能

📥 模型下载说明

基础版用户（需自行下载模型）

基础版包含VAD模型，但不包含Whisper语音识别模型。您需要：

从 Hugging Face 下载模型
- 示例模型地址：https://huggingface.co/chickenrice0721/whisper-large-v2-translate-zh-v0.2-st
- 这是"海南鸡v2 5000小时"版本的日文转中文优化模型

放置模型文件

将下载的模型文件放入：
faster_whisper_transwithai_chickenrice/
└── models/
    └── [您下载的模型文件夹]/

其他可用模型
- OpenAI Whisper官方模型
- 其他社区优化模型

海南鸡版用户（开箱即用）

海南鸡版已包含：

✅ 音声优化 VAD 语音活动检测模型
✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
✅ 所有必要的配置文件

无需额外下载，解压后直接运行即可使用！

🚀 快速开始指南

1. 选择版本

根据上述表格，选择适合您显卡的CUDA版本

2. 下载对应版本

仅转录/翻译：下载基础版 + 自行下载模型
日文转中文优化：下载海南鸡版（推荐）

3. 解压并运行

# GPU模式（推荐）
将音视频文件拖放到 "运行(GPU).bat"

# CPU模式（无显卡用户）
将音视频文件拖放到 "运行(CPU).bat"

# 低显存模式（4GB显存）
将音视频文件拖放到 "运行(GPU,低显存模式).bat"

💡 常见问题

Q: 我应该选择哪个CUDA版本？
A: 运行 nvidia-smi 查看您的驱动版本，然后对照上表选择。

Q: 海南鸡版和基础版有什么区别？
A: 海南鸡版包含预训练的日文转中文优化模型（5000小时训练），基础版需要自行下载模型。

Q: RTX 4090 应该用哪个版本？
A: 推荐使用 CUDA 12.2 或 12.8 版本，取决于您的驱动版本。

Q: 显存不足怎么办？
A: 使用"低显存模式"批处理文件，或切换到CPU模式。

📝 更新日志

v1.5 (2025-12-26)

🔧 字幕合并后处理：新增 segment_merge 配置选项，智能合并重复/重叠的字幕片段
⚙️ 灵活配置：在 generation_config.json5 中配置合并参数（启用/禁用、最大间隔、最大时长）
🎛️ 命令行覆盖：支持通过命令行参数覆盖配置文件设置
- --merge_segments / --no_merge_segments：启用/禁用合并
- --merge_max_gap_ms：设置允许合并的最大片段间隔（毫秒）
- --merge_max_duration_ms：设置合并后单条字幕的最大时长（毫秒）
🚀 算法优化：改进合并算法，通过间隔和时长限制避免产生过长的字幕

💡 使用建议：

如遇到"单条字幕持续时间异常过长"的情况，可调小 max_gap_ms 或 max_duration_ms
如需完全禁用合并功能，将 enabled 设为 false 或使用 --no_merge_segments 参数

v1.4 (2025-11-25)

🚀 批处理推理支持：新增批处理推理模式（--enable_batching），大幅提升处理速度
⚡ 智能批次大小自动检测：程序启动时自动测试不同批次大小（1-8），找到显存允许的最大批次
🎯 手动批次大小控制：支持通过 --batch_size 参数手动指定批次大小，跳过自动检测
🔧 运行时自适应调整：处理过程中如遇到显存不足（OOM），自动降低批次大小（每次减少20%）继续处理
📈 最大批次大小配置：通过 --max_batch_size 参数控制自动检测的上限（默认8，可根据显存调整）
📦 新增高显存加速模式：提供 "运行(GPU,高显存加速模式).bat" 专门为8GB+显存用户优化
🔨 修复批处理兼容性：应用补丁修复faster-whisper批处理的max_initial_timestamp参数传递问题
🌐 批处理日志国际化：为批处理功能添加完整的中英文本地化消息，便于调试和使用

📊 批处理模式说明：

并行处理优势：批处理模式下，多个音频片段并行转录，每个片段独立处理，不依赖前面片段的结果
精度权衡：批处理可能略微降低转录精度（由于失去了条件生成的上下文信息）
特殊场景优化：在某些场景下批处理反而效果更好，因为避免了条件生成可能带来的错误传播
- 噪声较多的音频：避免噪声片段影响后续转录
- 多说话人场景：减少不同说话人之间的相互干扰
- 长音频文件：防止错误累积效应

🎮 使用建议：

8GB+ 显存：使用 "运行(GPU,高显存加速模式).bat"，自动检测最优批次大小
4-8GB 显存：手动设置较小批次大小，如 --batch_size=2 或 4
追求最高精度：使用常规模式（不加 --enable_batching 参数）
追求处理速度：启用批处理模式，接受轻微的精度权衡

v1.3 (2025-11-17)

🤖 智能计算类型选择：自动检测设备并选择最优计算类型（bfloat16 > float16 > int8 > float32）
🔍 增强设备自动检测：改进CUDA可用性检测，支持CUDA_VISIBLE_DEVICES环境变量
🔇 抑制警告信息：添加TRANSFORMERS_NO_ADVISORY_WARNINGS环境变量，减少日志噪音
🎯 简化批处理文件：移除硬编码的计算类型设置，全部使用自动检测模式
📊 改进日志记录：添加自动检测设备和计算类型的详细日志信息
🐛 修复日志重复问题：移除重复的根日志处理器，避免日志重复输出
🌐 增强国际化支持：为自动检测功能添加完整的中英文本地化消息

v1.2 (2025-11-15)

⚡ CPU模式性能优化：添加 int16 计算类型支持，提升CPU处理速度
🎮 GPU兼容性改进：强制使用 float16 替代模型精度 bfloat16，提升显卡兼容性
🔧 精简批处理文件：合并视频翻译功能到主批处理文件中
📝 新增日志记录功能：自动保存运行日志到 latest.log 文件，方便问题反馈

v1.1 (2025-11-14)

🌐 离线支持改进：预下载 whisper-base 模型文件，实现完全离线运行
📥 自动模型管理：WhisperFeatureExtractor 优先使用本地模型，避免网络超时
🔧 优化下载流程：支持从已有模型文件夹复制，减少重复下载
🚀 提升稳定性：解决网络不稳定环境下的 HuggingFace 连接超时问题

v1.0 (2025-11-13)

🎯 支持多CUDA版本（11.8/12.2/12.8）
🚀 优化的日文转中文翻译效果（海南鸡v2版本）
🔊 音声优化的VAD语音活动检测
💾 改进的缓存机制，加快CI/CD构建速度
📦 分离的基础版和完整版，满足不同需求
🔧 自动VAD模型下载和管理

📞 技术支持

如遇到问题，请：

检查显卡驱动是否为最新版本
确认选择了正确的CUDA版本
查看控制台输出的错误信息
提交Issue到项目仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

🔗 官方链接

GitHub仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
音声优化 VAD 模型: https://huggingface.co/TransWithAI/Whisper-Vad-EncDec-ASMR-onnx
Telegram群组: https://t.me/transWithAI
开发团队: AI汉化组

🙏 致谢

🚀 基于 SYSTRAN/faster-whisper 开发
🐔 使用 chickenrice0721/whisper-large-v2-translate-zh-v0.2-st 日文转中文优化模型
🔊 使用 TransWithAI/Whisper-Vad-EncDec-ASMR-onnx 音声优化 VAD 模型
🎙️ OpenAI Whisper 原始项目
💪 感谢某匿名群友的算力和技术支持

本工具基于 Faster Whisper 开发，海南鸡模型经过5000小时音频数据优化训练，专门针对日文转中文翻译场景。
由AI汉化组开源维护，永久免费。

Release files generated with ading2210/gh-large-releases.

File Name	Size	SHA-256 Hash
faster_whisper_transwithai_windows_cu118-chickenrice.zip	4.50 GiB	_{^{81de7976144908e0994eecad439d2a2b4df5b13840a6afe4840b67e8ff26b070}}
faster_whisper_transwithai_windows_cu118.zip	2.22 GiB	_{^{701dfd9e5b512e408773276e333213328114f7c3c9f9fceabcd34a97e749cbbd}}
faster_whisper_transwithai_windows_cu122-chickenrice.zip	4.70 GiB	_{^{17da33f6534f5491580c0a4a4b950eb0152db92cbb820d84d93288d38c896f92}}
faster_whisper_transwithai_windows_cu122.zip	2.42 GiB	_{^{86c741ae195db1db829710b094dfbd996ef3b60d76d612f6461647d862a7f170}}
faster_whisper_transwithai_windows_cu128-chickenrice.zip	5.32 GiB	_{^{0fd924f87f5d6df4e074162e44a8c73c4cd3cfb38ee8d2a48806d1939a23bb49}}
faster_whisper_transwithai_windows_cu128.zip	3.04 GiB	_{^{b2d9dbfc2e4116a9b0c2762b8bea158206b8b183c4148ee7b6d6435ac47a6bcb}}
placeholder.txt	70.00 B	_{^{527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b}}

Important

Download files from the links in the table above, instead of the assets list.

Assets 25

24 Nov 18:23

github-actions

v1.4

2c0c15c

v1.4

🎙️ Faster Whisper 转录工具 - 发行说明

⚠️ 重要声明

📦 发行包说明

本发行版包含多个变体版本，请根据您的显卡型号选择合适的版本：

🎯 版本类型说明

基础版（Base Package）

下载大小：约 2.2GB
包含内容：
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD（语音活动检测）ONNX 模型
- ❌ 不含 Whisper 模型（需自行下载）
适用场景：需要使用自定义模型的用户

海南鸡版（Chickenrice Edition）

下载大小：约 4.4GB
包含内容：
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD（语音活动检测）ONNX 模型
- ✅ "海南鸡v2 5000小时" 日文转中文优化模型
适用场景：开箱即用的日文转中文翻译
模型说明：包含经过5000小时音频数据训练的海南鸡v2版本模型，专门优化日文转中文翻译

📌 文件命名规则

文件名后缀	CUDA版本	模型类型
`*_cu118.zip`	CUDA 11.8	基础版
`*_cu118-chickenrice.zip`	CUDA 11.8	海南鸡版
`*_cu122.zip`	CUDA 12.2	基础版
`*_cu122-chickenrice.zip`	CUDA 12.2	海南鸡版
`*_cu128.zip`	CUDA 12.8	基础版
`*_cu128-chickenrice.zip`	CUDA 12.8	海南鸡版

🔍 如何选择正确的 CUDA 版本

方法一：通过 nvidia-smi 查询

打开命令提示符或终端
输入命令：nvidia-smi
查看输出中的 Driver Version 和 CUDA Version

+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00       Driver Version: 570.00       CUDA Version: 12.8|
+-------------------------------------------------------------------------+

方法二：通过显卡型号和驱动版本对照表

📊 NVIDIA 驱动版本与 CUDA 版本兼容性表

CUDA 版本	最低驱动要求（Windows）	最低驱动要求（Linux）	推荐使用场景
CUDA 11.8	≥452.39	≥450.80.02	较旧的显卡（GTX 10系列、RTX 20/30系列）
CUDA 12.2	≥525.60.13	≥525.60.13	RTX 30/40系列，较新的驱动
CUDA 12.8	≥570.65	≥570.26	RTX 40/50系列，最新驱动

🎮 显卡型号推荐表

显卡系列	推荐 CUDA 版本	说明
GTX 10系列（1060/1070/1080等）	CUDA 11.8	兼容性最好
GTX 16系列（1650/1660等）	CUDA 11.8	兼容性最好
RTX 20系列（2060/2070/2080等）	CUDA 11.8 或 12.2	根据驱动版本选择
RTX 30系列（3060/3070/3080/3090等）	CUDA 12.2	推荐使用
RTX 40系列（4060/4070/4080/4090等）	CUDA 12.2 或 12.8	最新驱动用12.8
RTX 50系列（5090/5080/5070等）	🔴 必须使用 CUDA 12.8	⚠️ 注意：RTX 50系列必须使用CUDA 12.8版本

⚠️ 重要提示

RTX 50系列用户：由于新架构要求，必须使用 CUDA 12.8 版本，驱动版本必须 ≥570.00
驱动版本查询：在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
向下兼容：高版本驱动可以运行低版本CUDA程序（例如：570驱动可以运行CUDA 11.8程序）
性能考虑：使用与驱动匹配的CUDA版本可获得最佳性能

📥 模型下载说明

基础版用户（需自行下载模型）

基础版包含VAD模型，但不包含Whisper语音识别模型。您需要：

从 Hugging Face 下载模型
- 示例模型地址：https://huggingface.co/chickenrice0721/whisper-large-v2-translate-zh-v0.2-st
- 这是"海南鸡v2 5000小时"版本的日文转中文优化模型

放置模型文件

将下载的模型文件放入：
faster_whisper_transwithai_chickenrice/
└── models/
    └── [您下载的模型文件夹]/

其他可用模型
- OpenAI Whisper官方模型
- 其他社区优化模型

海南鸡版用户（开箱即用）

海南鸡版已包含：

✅ 音声优化 VAD 语音活动检测模型
✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
✅ 所有必要的配置文件

无需额外下载，解压后直接运行即可使用！

🚀 快速开始指南

1. 选择版本

根据上述表格，选择适合您显卡的CUDA版本

2. 下载对应版本

仅转录/翻译：下载基础版 + 自行下载模型
日文转中文优化：下载海南鸡版（推荐）

3. 解压并运行

# GPU模式（推荐）
将音视频文件拖放到 "运行(GPU).bat"

# CPU模式（无显卡用户）
将音视频文件拖放到 "运行(CPU).bat"

# 低显存模式（4GB显存）
将音视频文件拖放到 "运行(GPU,低显存模式).bat"

💡 常见问题

Q: 我应该选择哪个CUDA版本？
A: 运行 nvidia-smi 查看您的驱动版本，然后对照上表选择。

Q: 海南鸡版和基础版有什么区别？
A: 海南鸡版包含预训练的日文转中文优化模型（5000小时训练），基础版需要自行下载模型。

Q: RTX 4090 应该用哪个版本？
A: 推荐使用 CUDA 12.2 或 12.8 版本，取决于您的驱动版本。

Q: 显存不足怎么办？
A: 使用"低显存模式"批处理文件，或切换到CPU模式。

📝 更新日志

v1.4 (2025-11-25)

🚀 批处理推理支持：新增批处理推理模式（--enable_batching），大幅提升处理速度
⚡ 智能批次大小自动检测：程序启动时自动测试不同批次大小（1-8），找到显存允许的最大批次
🎯 手动批次大小控制：支持通过 --batch_size 参数手动指定批次大小，跳过自动检测
🔧 运行时自适应调整：处理过程中如遇到显存不足（OOM），自动降低批次大小（每次减少20%）继续处理
📈 最大批次大小配置：通过 --max_batch_size 参数控制自动检测的上限（默认8，可根据显存调整）
📦 新增高显存加速模式：提供 "运行(GPU,高显存加速模式).bat" 专门为8GB+显存用户优化
🔨 修复批处理兼容性：应用补丁修复faster-whisper批处理的max_initial_timestamp参数传递问题
🌐 批处理日志国际化：为批处理功能添加完整的中英文本地化消息，便于调试和使用

📊 批处理模式说明：

并行处理优势：批处理模式下，多个音频片段并行转录，每个片段独立处理，不依赖前面片段的结果
精度权衡：批处理可能略微降低转录精度（由于失去了条件生成的上下文信息）
特殊场景优化：在某些场景下批处理反而效果更好，因为避免了条件生成可能带来的错误传播
- 噪声较多的音频：避免噪声片段影响后续转录
- 多说话人场景：减少不同说话人之间的相互干扰
- 长音频文件：防止错误累积效应

🎮 使用建议：

8GB+ 显存：使用 "运行(GPU,高显存加速模式).bat"，自动检测最优批次大小
4-8GB 显存：手动设置较小批次大小，如 --batch_size=2 或 4
追求最高精度：使用常规模式（不加 --enable_batching 参数）
追求处理速度：启用批处理模式，接受轻微的精度权衡

v1.3 (2025-11-17)

🤖 智能计算类型选择：自动检测设备并选择最优计算类型（bfloat16 > float16 > int8 > float32）
🔍 增强设备自动检测：改进CUDA可用性检测，支持CUDA_VISIBLE_DEVICES环境变量
🔇 抑制警告信息：添加TRANSFORMERS_NO_ADVISORY_WARNINGS环境变量，减少日志噪音
🎯 简化批处理文件：移除硬编码的计算类型设置，全部使用自动检测模式
📊 改进日志记录：添加自动检测设备和计算类型的详细日志信息
🐛 修复日志重复问题：移除重复的根日志处理器，避免日志重复输出
🌐 增强国际化支持：为自动检测功能添加完整的中英文本地化消息

v1.2 (2025-11-15)

⚡ CPU模式性能优化：添加 int16 计算类型支持，提升CPU处理速度
🎮 GPU兼容性改进：强制使用 float16 替代模型精度 bfloat16，提升显卡兼容性
🔧 精简批处理文件：合并视频翻译功能到主批处理文件中
📝 新增日志记录功能：自动保存运行日志到 latest.log 文件，方便问题反馈

v1.1 (2025-11-14)

🌐 离线支持改进：预下载 whisper-base 模型文件，实现完全离线运行
📥 自动模型管理：WhisperFeatureExtractor 优先使用本地模型，避免网络超时
🔧 优化下载流程：支持从已有模型文件夹复制，减少重复下载
🚀 提升稳定性：解决网络不稳定环境下的 HuggingFace 连接超时问题

v1.0 (2025-11-13)

🎯 支持多CUDA版本（11.8/12.2/12.8）
🚀 优化的日文转中文翻译效果（海南鸡v2版本）
🔊 音声优化的VAD语音活动检测
💾 改进的缓存机制，加快CI/CD构建速度
📦 分离的基础版和完整版，满足不同需求
🔧 自动VAD模型下载和管理

📞 技术支持

如遇到问题，请：

检查显卡驱动是否为最新版本
确认选择了正确的CUDA版本
查看控制台输出的错误信息
提交Issue到项目仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

🔗 官方链接

GitHub仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
音声优化 VAD 模型: https://huggingface.co/TransWithAI/Whisper-Vad-EncDec-ASMR-onnx
Telegram群组: https://t.me/transWithAI
开发团队: AI汉化组

🙏 致谢

🚀 基于 SYSTRAN/faster-whisper 开发
🐔 使用 chickenrice0721/whisper-large-v2-translate-zh-v0.2-st 日文转中文优化模型
🔊 使用 TransWithAI/Whisper-Vad-EncDec-ASMR-onnx 音声优化 VAD 模型
🎙️ OpenAI Whisper 原始项目
💪 感谢某匿名群友的算力和技术支持

本工具基于 Faster Whisper 开发，海南鸡模型经过5000小时音频数据优化训练，专门针对日文转中文翻译场景。
由AI汉化组开源维护，永久免费。

Release files generated with ading2210/gh-large-releases.

File Name	Size	SHA-256 Hash
faster_whisper_transwithai_windows_cu118-chickenrice.zip	4.50 GiB	_{^{2bdf9f8a94db199afc7e5bede90d17d3b076616bc3a9d8ec6d1643d31dabe159}}
faster_whisper_transwithai_windows_cu118.zip	2.22 GiB	_{^{25b48144f1d442f21b4a5730612dc0e8e76ea61100768a602369560429c952aa}}
faster_whisper_transwithai_windows_cu122-chickenrice.zip	4.70 GiB	_{^{470d4c0c39a5c6aa99e820897404bb91462fbe19cb56ec4124e672251c6cd4cd}}
faster_whisper_transwithai_windows_cu122.zip	2.42 GiB	_{^{699bb13edbc16db5fd89a1bcbabc8fd50da949425bc0c6c95af3244942020e65}}
faster_whisper_transwithai_windows_cu128-chickenrice.zip	5.32 GiB	_{^{eb662f0db10999a7734abdf133de7d603dcbe27fe8fd5b27c3265ccfa48723af}}
faster_whisper_transwithai_windows_cu128.zip	3.04 GiB	_{^{6d046904bb9d5fa2a2b53b7c561659876b93a92e6c048db28769e8bc73a36ac1}}
placeholder.txt	70.00 B	_{^{527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b}}

Important

Download files from the links in the table above, instead of the assets list.

Assets 25

17 Nov 16:23

github-actions

v1.3

a1404b7

v1.3

🎙️ Faster Whisper 转录工具 - 发行说明

⚠️ 重要声明

📦 发行包说明

本发行版包含多个变体版本，请根据您的显卡型号选择合适的版本：

🎯 版本类型说明

基础版（Base Package）

下载大小：约 2.2GB
包含内容：
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD（语音活动检测）ONNX 模型
- ❌ 不含 Whisper 模型（需自行下载）
适用场景：需要使用自定义模型的用户

海南鸡版（Chickenrice Edition）

下载大小：约 4.4GB
包含内容：
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD（语音活动检测）ONNX 模型
- ✅ "海南鸡v2 5000小时" 日文转中文优化模型
适用场景：开箱即用的日文转中文翻译
模型说明：包含经过5000小时音频数据训练的海南鸡v2版本模型，专门优化日文转中文翻译

📌 文件命名规则

文件名后缀	CUDA版本	模型类型
`*_cu118.zip`	CUDA 11.8	基础版
`*_cu118-chickenrice.zip`	CUDA 11.8	海南鸡版
`*_cu122.zip`	CUDA 12.2	基础版
`*_cu122-chickenrice.zip`	CUDA 12.2	海南鸡版
`*_cu128.zip`	CUDA 12.8	基础版
`*_cu128-chickenrice.zip`	CUDA 12.8	海南鸡版

🔍 如何选择正确的 CUDA 版本

方法一：通过 nvidia-smi 查询

打开命令提示符或终端
输入命令：nvidia-smi
查看输出中的 Driver Version 和 CUDA Version

+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00       Driver Version: 570.00       CUDA Version: 12.8|
+-------------------------------------------------------------------------+

方法二：通过显卡型号和驱动版本对照表

📊 NVIDIA 驱动版本与 CUDA 版本兼容性表

CUDA 版本	最低驱动要求（Windows）	最低驱动要求（Linux）	推荐使用场景
CUDA 11.8	≥452.39	≥450.80.02	较旧的显卡（GTX 10系列、RTX 20/30系列）
CUDA 12.2	≥525.60.13	≥525.60.13	RTX 30/40系列，较新的驱动
CUDA 12.8	≥570.65	≥570.26	RTX 40/50系列，最新驱动

🎮 显卡型号推荐表

显卡系列	推荐 CUDA 版本	说明
GTX 10系列（1060/1070/1080等）	CUDA 11.8	兼容性最好
GTX 16系列（1650/1660等）	CUDA 11.8	兼容性最好
RTX 20系列（2060/2070/2080等）	CUDA 11.8 或 12.2	根据驱动版本选择
RTX 30系列（3060/3070/3080/3090等）	CUDA 12.2	推荐使用
RTX 40系列（4060/4070/4080/4090等）	CUDA 12.2 或 12.8	最新驱动用12.8
RTX 50系列（5090/5080/5070等）	🔴 必须使用 CUDA 12.8	⚠️ 注意：RTX 50系列必须使用CUDA 12.8版本

⚠️ 重要提示

RTX 50系列用户：由于新架构要求，必须使用 CUDA 12.8 版本，驱动版本必须 ≥570.00
驱动版本查询：在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
向下兼容：高版本驱动可以运行低版本CUDA程序（例如：570驱动可以运行CUDA 11.8程序）
性能考虑：使用与驱动匹配的CUDA版本可获得最佳性能

📥 模型下载说明

基础版用户（需自行下载模型）

基础版包含VAD模型，但不包含Whisper语音识别模型。您需要：

从 Hugging Face 下载模型
- 示例模型地址：https://huggingface.co/chickenrice0721/whisper-large-v2-translate-zh-v0.2-st
- 这是"海南鸡v2 5000小时"版本的日文转中文优化模型

放置模型文件

将下载的模型文件放入：
faster_whisper_transwithai_chickenrice/
└── models/
    └── [您下载的模型文件夹]/

其他可用模型
- OpenAI Whisper官方模型
- 其他社区优化模型

海南鸡版用户（开箱即用）

海南鸡版已包含：

✅ 音声优化 VAD 语音活动检测模型
✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
✅ 所有必要的配置文件

无需额外下载，解压后直接运行即可使用！

🚀 快速开始指南

1. 选择版本

根据上述表格，选择适合您显卡的CUDA版本

2. 下载对应版本

仅转录/翻译：下载基础版 + 自行下载模型
日文转中文优化：下载海南鸡版（推荐）

3. 解压并运行

# GPU模式（推荐）
将音视频文件拖放到 "运行(GPU).bat"

# CPU模式（无显卡用户）
将音视频文件拖放到 "运行(CPU).bat"

# 低显存模式（4GB显存）
将音视频文件拖放到 "运行(GPU,低显存模式).bat"

💡 常见问题

Q: 我应该选择哪个CUDA版本？
A: 运行 nvidia-smi 查看您的驱动版本，然后对照上表选择。

Q: 海南鸡版和基础版有什么区别？
A: 海南鸡版包含预训练的日文转中文优化模型（5000小时训练），基础版需要自行下载模型。

Q: RTX 4090 应该用哪个版本？
A: 推荐使用 CUDA 12.2 或 12.8 版本，取决于您的驱动版本。

Q: 显存不足怎么办？
A: 使用"低显存模式"批处理文件，或切换到CPU模式。

📝 更新日志

v1.3 (2025-11-17)

🤖 智能计算类型选择：自动检测设备并选择最优计算类型（bfloat16 > float16 > int8 > float32）
🔍 增强设备自动检测：改进CUDA可用性检测，支持CUDA_VISIBLE_DEVICES环境变量
🔇 抑制警告信息：添加TRANSFORMERS_NO_ADVISORY_WARNINGS环境变量，减少日志噪音
🎯 简化批处理文件：移除硬编码的计算类型设置，全部使用自动检测模式
📊 改进日志记录：添加自动检测设备和计算类型的详细日志信息
🐛 修复日志重复问题：移除重复的根日志处理器，避免日志重复输出
🌐 增强国际化支持：为自动检测功能添加完整的中英文本地化消息

v1.2 (2025-11-15)

⚡ CPU模式性能优化：添加 int16 计算类型支持，提升CPU处理速度
🎮 GPU兼容性改进：强制使用 float16 替代模型精度 bfloat16，提升显卡兼容性
🔧 精简批处理文件：合并视频翻译功能到主批处理文件中
📝 新增日志记录功能：自动保存运行日志到 latest.log 文件，方便问题反馈

v1.1 (2025-11-14)

🌐 离线支持改进：预下载 whisper-base 模型文件，实现完全离线运行
📥 自动模型管理：WhisperFeatureExtractor 优先使用本地模型，避免网络超时
🔧 优化下载流程：支持从已有模型文件夹复制，减少重复下载
🚀 提升稳定性：解决网络不稳定环境下的 HuggingFace 连接超时问题

v1.0 (2025-11-13)

🎯 支持多CUDA版本（11.8/12.2/12.8）
🚀 优化的日文转中文翻译效果（海南鸡v2版本）
🔊 音声优化的VAD语音活动检测
💾 改进的缓存机制，加快CI/CD构建速度
📦 分离的基础版和完整版，满足不同需求
🔧 自动VAD模型下载和管理

📞 技术支持

如遇到问题，请：

检查显卡驱动是否为最新版本
确认选择了正确的CUDA版本
查看控制台输出的错误信息
提交Issue到项目仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

🔗 官方链接

GitHub仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
音声优化 VAD 模型: https://huggingface.co/TransWithAI/Whisper-Vad-EncDec-ASMR-onnx
Telegram群组: https://t.me/transWithAI
开发团队: AI汉化组

🙏 致谢

🚀 基于 SYSTRAN/faster-whisper 开发
🐔 使用 chickenrice0721/whisper-large-v2-translate-zh-v0.2-st 日文转中文优化模型
🔊 使用 TransWithAI/Whisper-Vad-EncDec-ASMR-onnx 音声优化 VAD 模型
🎙️ OpenAI Whisper 原始项目
💪 感谢某匿名群友的算力和技术支持

本工具基于 Faster Whisper 开发，海南鸡模型经过5000小时音频数据优化训练，专门针对日文转中文翻译场景。
由AI汉化组开源维护，永久免费。

Release files generated with ading2210/gh-large-releases.

File Name	Size	SHA-256 Hash
faster_whisper_transwithai_windows_cu118-chickenrice.zip	4.50 GiB	_{^{ba5085c3c8d1870bc88392783d9b06d62df305c2bf77d53a8210cea8992571c3}}
faster_whisper_transwithai_windows_cu118.zip	2.22 GiB	_{^{30d314fe658a182c267a056965d1028c60c66489a43d662f42bca70fe7050bbc}}
faster_whisper_transwithai_windows_cu122-chickenrice.zip	4.70 GiB	_{^{ee0bbf0cf35e0ee1624de504731056fb012495b55c046271dcba5d448ba293d1}}
faster_whisper_transwithai_windows_cu122.zip	2.42 GiB	_{^{35fdc61c374bc3fac22fc0396a2b4cb01570feea53ffc6ce10099a6830f96ed1}}
faster_whisper_transwithai_windows_cu128-chickenrice.zip	5.32 GiB	_{^{43b1317561ea95390d2cd90f8264090c3e61f726bb81951fdc6e6e37322b0586}}
faster_whisper_transwithai_windows_cu128.zip	3.04 GiB	_{^{ca5fb064a8bfdf795a6741dfc2c255373be367d84db49a066a5fdd638ed5542f}}
placeholder.txt	70.00 B	_{^{527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b}}

Important

Download files from the links in the table above, instead of the assets list.

Assets 25

15 Nov 06:36

github-actions

v1.2

930ec15

v1.2

🎙️ Faster Whisper 转录工具 - 发行说明

⚠️ 重要声明

📦 发行包说明

本发行版包含多个变体版本，请根据您的显卡型号选择合适的版本：

🎯 版本类型说明

基础版（Base Package）

下载大小：约 2.2GB
包含内容：
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD（语音活动检测）ONNX 模型
- ❌ 不含 Whisper 模型（需自行下载）
适用场景：需要使用自定义模型的用户

海南鸡版（Chickenrice Edition）

下载大小：约 4.4GB
包含内容：
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD（语音活动检测）ONNX 模型
- ✅ "海南鸡v2 5000小时" 日文转中文优化模型
适用场景：开箱即用的日文转中文翻译
模型说明：包含经过5000小时音频数据训练的海南鸡v2版本模型，专门优化日文转中文翻译

📌 文件命名规则

文件名后缀	CUDA版本	模型类型
`*_cu118.zip`	CUDA 11.8	基础版
`*_cu118-chickenrice.zip`	CUDA 11.8	海南鸡版
`*_cu122.zip`	CUDA 12.2	基础版
`*_cu122-chickenrice.zip`	CUDA 12.2	海南鸡版
`*_cu128.zip`	CUDA 12.8	基础版
`*_cu128-chickenrice.zip`	CUDA 12.8	海南鸡版

🔍 如何选择正确的 CUDA 版本

方法一：通过 nvidia-smi 查询

打开命令提示符或终端
输入命令：nvidia-smi
查看输出中的 Driver Version 和 CUDA Version

+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00       Driver Version: 570.00       CUDA Version: 12.8|
+-------------------------------------------------------------------------+

方法二：通过显卡型号和驱动版本对照表

📊 NVIDIA 驱动版本与 CUDA 版本兼容性表

CUDA 版本	最低驱动要求（Windows）	最低驱动要求（Linux）	推荐使用场景
CUDA 11.8	≥452.39	≥450.80.02	较旧的显卡（GTX 10系列、RTX 20/30系列）
CUDA 12.2	≥525.60.13	≥525.60.13	RTX 30/40系列，较新的驱动
CUDA 12.8	≥570.65	≥570.26	RTX 40/50系列，最新驱动

🎮 显卡型号推荐表

显卡系列	推荐 CUDA 版本	说明
GTX 10系列（1060/1070/1080等）	CUDA 11.8	兼容性最好
GTX 16系列（1650/1660等）	CUDA 11.8	兼容性最好
RTX 20系列（2060/2070/2080等）	CUDA 11.8 或 12.2	根据驱动版本选择
RTX 30系列（3060/3070/3080/3090等）	CUDA 12.2	推荐使用
RTX 40系列（4060/4070/4080/4090等）	CUDA 12.2 或 12.8	最新驱动用12.8
RTX 50系列（5090/5080/5070等）	🔴 必须使用 CUDA 12.8	⚠️ 注意：RTX 50系列必须使用CUDA 12.8版本

⚠️ 重要提示

RTX 50系列用户：由于新架构要求，必须使用 CUDA 12.8 版本，驱动版本必须 ≥570.00
驱动版本查询：在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
向下兼容：高版本驱动可以运行低版本CUDA程序（例如：570驱动可以运行CUDA 11.8程序）
性能考虑：使用与驱动匹配的CUDA版本可获得最佳性能

📥 模型下载说明

基础版用户（需自行下载模型）

基础版包含VAD模型，但不包含Whisper语音识别模型。您需要：

从 Hugging Face 下载模型
- 示例模型地址：https://huggingface.co/chickenrice0721/whisper-large-v2-translate-zh-v0.2-st
- 这是"海南鸡v2 5000小时"版本的日文转中文优化模型

放置模型文件

将下载的模型文件放入：
faster_whisper_transwithai_chickenrice/
└── models/
    └── [您下载的模型文件夹]/

其他可用模型
- OpenAI Whisper官方模型
- 其他社区优化模型

海南鸡版用户（开箱即用）

海南鸡版已包含：

✅ 音声优化 VAD 语音活动检测模型
✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
✅ 所有必要的配置文件

无需额外下载，解压后直接运行即可使用！

🚀 快速开始指南

1. 选择版本

根据上述表格，选择适合您显卡的CUDA版本

2. 下载对应版本

仅转录/翻译：下载基础版 + 自行下载模型
日文转中文优化：下载海南鸡版（推荐）

3. 解压并运行

# GPU模式（推荐）
将音视频文件拖放到 "运行(GPU).bat"

# CPU模式（无显卡用户）
将音视频文件拖放到 "运行(CPU).bat"

# 低显存模式（4GB显存）
将音视频文件拖放到 "运行(GPU,低显存模式).bat"

💡 常见问题

Q: 我应该选择哪个CUDA版本？
A: 运行 nvidia-smi 查看您的驱动版本，然后对照上表选择。

Q: 海南鸡版和基础版有什么区别？
A: 海南鸡版包含预训练的日文转中文优化模型（5000小时训练），基础版需要自行下载模型。

Q: RTX 4090 应该用哪个版本？
A: 推荐使用 CUDA 12.2 或 12.8 版本，取决于您的驱动版本。

Q: 显存不足怎么办？
A: 使用"低显存模式"批处理文件，或切换到CPU模式。

📝 更新日志

v1.2 (2025-11-15)

⚡ CPU模式性能优化：添加 int16 计算类型支持，提升CPU处理速度
🎮 GPU兼容性改进：强制使用 float16 替代模型精度 bfloat16，提升显卡兼容性
🔧 精简批处理文件：合并视频翻译功能到主批处理文件中
📝 新增日志记录功能：自动保存运行日志到 latest.log 文件，方便问题反馈

v1.1 (2025-11-14)

🌐 离线支持改进：预下载 whisper-base 模型文件，实现完全离线运行
📥 自动模型管理：WhisperFeatureExtractor 优先使用本地模型，避免网络超时
🔧 优化下载流程：支持从已有模型文件夹复制，减少重复下载
🚀 提升稳定性：解决网络不稳定环境下的 HuggingFace 连接超时问题

v1.0 (2025-11-13)

🎯 支持多CUDA版本（11.8/12.2/12.8）
🚀 优化的日文转中文翻译效果（海南鸡v2版本）
🔊 音声优化的VAD语音活动检测
💾 改进的缓存机制，加快CI/CD构建速度
📦 分离的基础版和完整版，满足不同需求
🔧 自动VAD模型下载和管理

📞 技术支持

如遇到问题，请：

检查显卡驱动是否为最新版本
确认选择了正确的CUDA版本
查看控制台输出的错误信息
提交Issue到项目仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

🔗 官方链接

GitHub仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
音声优化 VAD 模型: https://huggingface.co/TransWithAI/Whisper-Vad-EncDec-ASMR-onnx
Telegram群组: https://t.me/transWithAI
开发团队: AI汉化组

🙏 致谢

🚀 基于 SYSTRAN/faster-whisper 开发
🐔 使用 chickenrice0721/whisper-large-v2-translate-zh-v0.2-st 日文转中文优化模型
🔊 使用 TransWithAI/Whisper-Vad-EncDec-ASMR-onnx 音声优化 VAD 模型
🎙️ OpenAI Whisper 原始项目
💪 感谢某匿名群友的算力和技术支持

本工具基于 Faster Whisper 开发，海南鸡模型经过5000小时音频数据优化训练，专门针对日文转中文翻译场景。
由AI汉化组开源维护，永久免费。

Release files generated with ading2210/gh-large-releases.

File Name	Size	SHA-256 Hash
faster_whisper_transwithai_windows_cu118-chickenrice.zip	4.50 GiB	_{^{0ea6142efef1449ae4e777948b7302b9c008b8f3eb98357039c8954bed3713f3}}
faster_whisper_transwithai_windows_cu118.zip	2.22 GiB	_{^{050d4aaeb451813b397a7325eeb0b232017e495392a3bfed20b6c3a7b183fbde}}
faster_whisper_transwithai_windows_cu122-chickenrice.zip	4.70 GiB	_{^{7dafdfadbc60363952be5754079ad47ef048519a85b07a232939e5dd98290208}}
faster_whisper_transwithai_windows_cu122.zip	2.42 GiB	_{^{16571b127332f5cebee223051fc0871c29649c08d06babc729d5c1a74b300769}}
faster_whisper_transwithai_windows_cu128-chickenrice.zip	5.32 GiB	_{^{9bcbf6d3ea0e28a92be56ffb1be939b27b800cd619bf94c6e771409ee553943a}}
faster_whisper_transwithai_windows_cu128.zip	3.04 GiB	_{^{a1e089b9bea7245fc7570d46a51fc7c85018e8392c488a525fde204c5f78b2f8}}
placeholder.txt	70.00 B	_{^{527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b}}

Important

Download files from the links in the table above, instead of the assets list.

Assets 25

15 Nov 06:27

github-actions

v1.1

1e831d8

v1.1

🎙️ Faster Whisper 转录工具 - 发行说明

⚠️ 重要声明

📦 发行包说明

本发行版包含多个变体版本，请根据您的显卡型号选择合适的版本：

🎯 版本类型说明

基础版（Base Package）

下载大小：约 2.2GB
包含内容：
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD（语音活动检测）ONNX 模型
- ❌ 不含 Whisper 模型（需自行下载）
适用场景：需要使用自定义模型的用户

海南鸡版（Chickenrice Edition）

下载大小：约 4.4GB
包含内容：
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD（语音活动检测）ONNX 模型
- ✅ "海南鸡v2 5000小时" 日文转中文优化模型
适用场景：开箱即用的日文转中文翻译
模型说明：包含经过5000小时音频数据训练的海南鸡v2版本模型，专门优化日文转中文翻译

📌 文件命名规则

文件名后缀	CUDA版本	模型类型
`*_cu118.zip`	CUDA 11.8	基础版
`*_cu118-chickenrice.zip`	CUDA 11.8	海南鸡版
`*_cu122.zip`	CUDA 12.2	基础版
`*_cu122-chickenrice.zip`	CUDA 12.2	海南鸡版
`*_cu128.zip`	CUDA 12.8	基础版
`*_cu128-chickenrice.zip`	CUDA 12.8	海南鸡版

🔍 如何选择正确的 CUDA 版本

方法一：通过 nvidia-smi 查询

打开命令提示符或终端
输入命令：nvidia-smi
查看输出中的 Driver Version 和 CUDA Version

+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00       Driver Version: 570.00       CUDA Version: 12.8|
+-------------------------------------------------------------------------+

方法二：通过显卡型号和驱动版本对照表

📊 NVIDIA 驱动版本与 CUDA 版本兼容性表

CUDA 版本	最低驱动要求（Windows）	最低驱动要求（Linux）	推荐使用场景
CUDA 11.8	≥452.39	≥450.80.02	较旧的显卡（GTX 10系列、RTX 20/30系列）
CUDA 12.2	≥525.60.13	≥525.60.13	RTX 30/40系列，较新的驱动
CUDA 12.8	≥570.65	≥570.26	RTX 40/50系列，最新驱动

🎮 显卡型号推荐表

显卡系列	推荐 CUDA 版本	说明
GTX 10系列（1060/1070/1080等）	CUDA 11.8	兼容性最好
GTX 16系列（1650/1660等）	CUDA 11.8	兼容性最好
RTX 20系列（2060/2070/2080等）	CUDA 11.8 或 12.2	根据驱动版本选择
RTX 30系列（3060/3070/3080/3090等）	CUDA 12.2	推荐使用
RTX 40系列（4060/4070/4080/4090等）	CUDA 12.2 或 12.8	最新驱动用12.8
RTX 50系列（5090/5080/5070等）	🔴 必须使用 CUDA 12.8	⚠️ 注意：RTX 50系列必须使用CUDA 12.8版本

⚠️ 重要提示

RTX 50系列用户：由于新架构要求，必须使用 CUDA 12.8 版本，驱动版本必须 ≥570.00
驱动版本查询：在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
向下兼容：高版本驱动可以运行低版本CUDA程序（例如：570驱动可以运行CUDA 11.8程序）
性能考虑：使用与驱动匹配的CUDA版本可获得最佳性能

📥 模型下载说明

基础版用户（需自行下载模型）

基础版包含VAD模型，但不包含Whisper语音识别模型。您需要：

从 Hugging Face 下载模型
- 示例模型地址：https://huggingface.co/chickenrice0721/whisper-large-v2-translate-zh-v0.2-st
- 这是"海南鸡v2 5000小时"版本的日文转中文优化模型

放置模型文件

将下载的模型文件放入：
faster_whisper_transwithai_chickenrice/
└── models/
    └── [您下载的模型文件夹]/

其他可用模型
- OpenAI Whisper官方模型
- 其他社区优化模型

海南鸡版用户（开箱即用）

海南鸡版已包含：

✅ 音声优化 VAD 语音活动检测模型
✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
✅ 所有必要的配置文件

无需额外下载，解压后直接运行即可使用！

🚀 快速开始指南

1. 选择版本

根据上述表格，选择适合您显卡的CUDA版本

2. 下载对应版本

仅转录/翻译：下载基础版 + 自行下载模型
日文转中文优化：下载海南鸡版（推荐）

3. 解压并运行

# GPU模式（推荐）
将音视频文件拖放到 "运行(GPU).bat"

# CPU模式（无显卡用户）
将音视频文件拖放到 "运行(CPU).bat"

# 低显存模式（4GB显存）
将音视频文件拖放到 "运行(GPU,低显存模式).bat"

💡 常见问题

Q: 我应该选择哪个CUDA版本？
A: 运行 nvidia-smi 查看您的驱动版本，然后对照上表选择。

Q: 海南鸡版和基础版有什么区别？
A: 海南鸡版包含预训练的日文转中文优化模型（5000小时训练），基础版需要自行下载模型。

Q: RTX 4090 应该用哪个版本？
A: 推荐使用 CUDA 12.2 或 12.8 版本，取决于您的驱动版本。

Q: 显存不足怎么办？
A: 使用"低显存模式"批处理文件，或切换到CPU模式。

📝 更新日志

当前版本特性

🎯 支持多CUDA版本（11.8/12.2/12.8）
🚀 优化的日文转中文翻译效果（海南鸡v2版本）
🔊 音声优化的VAD语音活动检测
💾 改进的缓存机制，加快CI/CD构建速度
📦 分离的基础版和完整版，满足不同需求
🔧 自动VAD模型下载和管理

📞 技术支持

如遇到问题，请：

检查显卡驱动是否为最新版本
确认选择了正确的CUDA版本
查看控制台输出的错误信息
提交Issue到项目仓库: https://github.com/haaswiiliammowsigf/Faster-Whisper-TransWithAI-ChickenRice

🔗 官方链接

GitHub仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
音声优化 VAD 模型: https://huggingface.co/TransWithAI/Whisper-Vad-EncDec-ASMR-onnx
Telegram群组: https://t.me/transWithAI
开发团队: AI汉化组

🙏 致谢

🚀 基于 SYSTRAN/faster-whisper 开发
🐔 使用 chickenrice0721/whisper-large-v2-translate-zh-v0.2-st 日文转中文优化模型
🔊 使用 TransWithAI/Whisper-Vad-EncDec-ASMR-onnx 音声优化 VAD 模型
🎙️ OpenAI Whisper 原始项目
💪 感谢某匿名群友的算力和技术支持

本工具基于 Faster Whisper 开发，海南鸡模型经过5000小时音频数据优化训练，专门针对日文转中文翻译场景。
由AI汉化组开源维护，永久免费。

Release files generated with ading2210/gh-large-releases.

File Name	Size	SHA-256 Hash
faster_whisper_transwithai_windows_cu118-chickenrice.zip	4.50 GiB	_{^{38ddc143c8471655f607ecff3071f1bf81ee7edc0fb962ad5b29ebd6c27b495e}}
faster_whisper_transwithai_windows_cu118.zip	2.22 GiB	_{^{f8d1eff4367d05a123d93627a81b3f54a3ab905aa99dea8ad18449cf010352a5}}
faster_whisper_transwithai_windows_cu122-chickenrice.zip	4.70 GiB	_{^{55253da240480ca5ff0f6193fff4df8f05447326519bda37f4133d2ae1e16f7e}}
faster_whisper_transwithai_windows_cu122.zip	2.42 GiB	_{^{41891bdd70c1a9a7f81371fbd4b5c7885dcc1301bec846fad9e0e41795028607}}
faster_whisper_transwithai_windows_cu128-chickenrice.zip	5.32 GiB	_{^{f002c5252b33b582ecaa97b8e2d80d0e5d52526c49014db0c92ce71ff733f3e2}}
faster_whisper_transwithai_windows_cu128.zip	3.04 GiB	_{^{d4459bb699f0c0d2bb6530c69dee7b8712bcc997bcdd5a8c1c4d214880c42352}}
placeholder.txt	70.00 B	_{^{527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b}}

Important

Download files from the links in the table above, instead of the assets list.

Assets 25

15 Nov 06:24

github-actions

v1.0

809b96e

v1.0

🎙️ Faster Whisper 转录工具 - 发行说明

⚠️ 重要声明

📦 发行包说明

本发行版包含多个变体版本，请根据您的显卡型号选择合适的版本：

🎯 版本类型说明

基础版（Base Package）

下载大小：约 2.2GB
包含内容：
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD（语音活动检测）ONNX 模型
- ❌ 不含 Whisper 模型（需自行下载）
适用场景：需要使用自定义模型的用户

海南鸡版（Chickenrice Edition）

下载大小：约 4.4GB
包含内容：
- ✅ 所有 GPU 依赖项
- ✅ 音声优化 VAD（语音活动检测）ONNX 模型
- ✅ "海南鸡v2 5000小时" 日文转中文优化模型
适用场景：开箱即用的日文转中文翻译
模型说明：包含经过5000小时音频数据训练的海南鸡v2版本模型，专门优化日文转中文翻译

📌 文件命名规则

文件名后缀	CUDA版本	模型类型
`*_cu118.zip`	CUDA 11.8	基础版
`*_cu118-chickenrice.zip`	CUDA 11.8	海南鸡版
`*_cu122.zip`	CUDA 12.2	基础版
`*_cu122-chickenrice.zip`	CUDA 12.2	海南鸡版
`*_cu128.zip`	CUDA 12.8	基础版
`*_cu128-chickenrice.zip`	CUDA 12.8	海南鸡版

🔍 如何选择正确的 CUDA 版本

方法一：通过 nvidia-smi 查询

打开命令提示符或终端
输入命令：nvidia-smi
查看输出中的 Driver Version 和 CUDA Version

+-------------------------------------------------------------------------+
| NVIDIA-SMI 570.00       Driver Version: 570.00       CUDA Version: 12.8|
+-------------------------------------------------------------------------+

方法二：通过显卡型号和驱动版本对照表

📊 NVIDIA 驱动版本与 CUDA 版本兼容性表

CUDA 版本	最低驱动要求（Windows）	最低驱动要求（Linux）	推荐使用场景
CUDA 11.8	≥452.39	≥450.80.02	较旧的显卡（GTX 10系列、RTX 20/30系列）
CUDA 12.2	≥525.60.13	≥525.60.13	RTX 30/40系列，较新的驱动
CUDA 12.8	≥570.65	≥570.26	RTX 40/50系列，最新驱动

🎮 显卡型号推荐表

显卡系列	推荐 CUDA 版本	说明
GTX 10系列（1060/1070/1080等）	CUDA 11.8	兼容性最好
GTX 16系列（1650/1660等）	CUDA 11.8	兼容性最好
RTX 20系列（2060/2070/2080等）	CUDA 11.8 或 12.2	根据驱动版本选择
RTX 30系列（3060/3070/3080/3090等）	CUDA 12.2	推荐使用
RTX 40系列（4060/4070/4080/4090等）	CUDA 12.2 或 12.8	最新驱动用12.8
RTX 50系列（5090/5080/5070等）	🔴 必须使用 CUDA 12.8	⚠️ 注意：RTX 50系列必须使用CUDA 12.8版本

⚠️ 重要提示

RTX 50系列用户：由于新架构要求，必须使用 CUDA 12.8 版本，驱动版本必须 ≥570.00
驱动版本查询：在 nvidia-smi 中显示的 CUDA Version 是您的驱动支持的最高CUDA版本
向下兼容：高版本驱动可以运行低版本CUDA程序（例如：570驱动可以运行CUDA 11.8程序）
性能考虑：使用与驱动匹配的CUDA版本可获得最佳性能

📥 模型下载说明

基础版用户（需自行下载模型）

基础版包含VAD模型，但不包含Whisper语音识别模型。您需要：

从 Hugging Face 下载模型
- 示例模型地址：https://huggingface.co/chickenrice0721/whisper-large-v2-translate-zh-v0.2-st
- 这是"海南鸡v2 5000小时"版本的日文转中文优化模型

放置模型文件

将下载的模型文件放入：
faster_whisper_transwithai_chickenrice/
└── models/
    └── [您下载的模型文件夹]/

其他可用模型
- OpenAI Whisper官方模型
- 其他社区优化模型

海南鸡版用户（开箱即用）

海南鸡版已包含：

✅ 音声优化 VAD 语音活动检测模型
✅ "海南鸡v2 5000小时"日文转中文优化版Whisper模型
✅ 所有必要的配置文件

无需额外下载，解压后直接运行即可使用！

🚀 快速开始指南

1. 选择版本

根据上述表格，选择适合您显卡的CUDA版本

2. 下载对应版本

仅转录/翻译：下载基础版 + 自行下载模型
日文转中文优化：下载海南鸡版（推荐）

3. 解压并运行

# GPU模式（推荐）
将音视频文件拖放到 "运行(GPU).bat"

# CPU模式（无显卡用户）
将音视频文件拖放到 "运行(CPU).bat"

# 低显存模式（4GB显存）
将音视频文件拖放到 "运行(GPU,低显存模式).bat"

💡 常见问题

Q: 我应该选择哪个CUDA版本？
A: 运行 nvidia-smi 查看您的驱动版本，然后对照上表选择。

Q: 海南鸡版和基础版有什么区别？
A: 海南鸡版包含预训练的日文转中文优化模型（5000小时训练），基础版需要自行下载模型。

Q: RTX 4090 应该用哪个版本？
A: 推荐使用 CUDA 12.2 或 12.8 版本，取决于您的驱动版本。

Q: 显存不足怎么办？
A: 使用"低显存模式"批处理文件，或切换到CPU模式。

📝 更新日志

当前版本特性

🎯 支持多CUDA版本（11.8/12.2/12.8）
🚀 优化的日文转中文翻译效果（海南鸡v2版本）
🔊 音声优化的VAD语音活动检测
💾 改进的缓存机制，加快CI/CD构建速度
📦 分离的基础版和完整版，满足不同需求
🔧 自动VAD模型下载和管理

📞 技术支持

如遇到问题，请：

检查显卡驱动是否为最新版本
确认选择了正确的CUDA版本
查看控制台输出的错误信息
提交Issue到项目仓库: https://github.com/haaswiiliammowsigf/Faster-Whisper-TransWithAI-ChickenRice

🔗 官方链接

GitHub仓库: https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice
音声优化 VAD 模型: https://huggingface.co/TransWithAI/Whisper-Vad-EncDec-ASMR-onnx
Telegram群组: https://t.me/transWithAI
开发团队: AI汉化组

🙏 致谢

🚀 基于 SYSTRAN/faster-whisper 开发
🐔 使用 chickenrice0721/whisper-large-v2-translate-zh-v0.2-st 日文转中文优化模型
🔊 使用 TransWithAI/Whisper-Vad-EncDec-ASMR-onnx 音声优化 VAD 模型
🎙️ OpenAI Whisper 原始项目
💪 感谢某匿名群友的算力和技术支持

本工具基于 Faster Whisper 开发，海南鸡模型经过5000小时音频数据优化训练，专门针对日文转中文翻译场景。
由AI汉化组开源维护，永久免费。

Release files generated with ading2210/gh-large-releases.

File Name	Size	SHA-256 Hash
faster_whisper_transwithai_windows_cu118-chickenrice.zip	4.50 GiB	_{^{c14e6c4a2e6e42a14fbfb7def2d17013ddd1af51e53bad81b03cbcb76b464fd0}}
faster_whisper_transwithai_windows_cu118.zip	2.22 GiB	_{^{62c328b6d3cdc703b24127ef3557188bdd9f67453b4acce1429e57cf3d29c1cd}}
faster_whisper_transwithai_windows_cu122-chickenrice.zip	4.70 GiB	_{^{16044808c80cb5195faa7d56ef15018674504421eafaa9853500b19ef93a1a20}}
faster_whisper_transwithai_windows_cu122.zip	2.42 GiB	_{^{7a04b7bd6794d0d02c7d196aa60353e4680ce8cb12bae90070cee098699a5776}}
faster_whisper_transwithai_windows_cu128-chickenrice.zip	5.31 GiB	_{^{a3d5b297e5291937640116826c51f301d0d78a25e025dcbb03b71ac80d27698a}}
faster_whisper_transwithai_windows_cu128.zip	3.03 GiB	_{^{2b3af9655d1f1c7fbe31a7cc9c31395062f33461ae50c7a1c23207a75cbb6b87}}
placeholder.txt	70.00 B	_{^{527229ec1235d6d0ca065f12e6226d2fa8a137aff7478a7e5fc4a0d8af9a9b6b}}

Important

Download files from the links in the table above, instead of the assets list.

Assets 25

Releases: TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

v1.7

🎙️ Faster Whisper 转录工具 - 发行说明

⚠️ 重要声明

📦 发行包说明

🎯 版本类型说明

基础版（Base Package）

海南鸡版（Chickenrice Edition）

📌 文件命名规则

🔍 如何选择正确的版本

NVIDIA 显卡 —— 选择 CUDA 版本

方法一：通过 nvidia-smi 查询

方法二：通过显卡型号和驱动版本对照表

📊 NVIDIA 驱动版本与 CUDA 版本兼容性表

🎮 显卡型号推荐表

⚠️ 重要提示

AMD 显卡 —— 选择 ROCm/HIP 版本

📥 模型下载说明

基础版用户（需自行下载模型）

海南鸡版用户（开箱即用）

🚀 快速开始指南

1. 选择版本

2. 下载对应版本

3. 解压并运行

💡 常见问题

📝 更新日志

v1.7 (2026-02-24)

v1.6 (2026-01-12)

v1.5 (2025-12-26)

v1.4 (2025-11-25)

v1.3 (2025-11-17)

v1.2 (2025-11-15)

v1.1 (2025-11-14)

v1.0 (2025-11-13)

📞 技术支持

🔗 官方链接

🙏 致谢

Uh oh!

v1.6

🎙️ Faster Whisper 转录工具 - 发行说明

⚠️ 重要声明

📦 发行包说明

🎯 版本类型说明

基础版（Base Package）

海南鸡版（Chickenrice Edition）

📌 文件命名规则

🔍 如何选择正确的 CUDA 版本

方法一：通过 nvidia-smi 查询

方法二：通过显卡型号和驱动版本对照表

📊 NVIDIA 驱动版本与 CUDA 版本兼容性表

🎮 显卡型号推荐表

⚠️ 重要提示

📥 模型下载说明

基础版用户（需自行下载模型）

海南鸡版用户（开箱即用）

🚀 快速开始指南

1. 选择版本

2. 下载对应版本

3. 解压并运行

💡 常见问题

📝 更新日志

v1.6 (2026-01-12)

v1.5 (2025-12-26)

v1.4 (2025-11-25)

v1.3 (2025-11-17)

v1.2 (2025-11-15)

v1.1 (2025-11-14)

v1.0 (2025-11-13)

📞 技术支持

🔗 官方链接

🙏 致谢

Uh oh!

v1.5

🎙️ Faster Whisper 转录工具 - 发行说明

⚠️ 重要声明

📦 发行包说明

🎯 版本类型说明

基础版（Base Package）

海南鸡版（Chickenrice Edition）

📌 文件命名规则