Skip to content

Latest commit

 

History

History
15 lines (8 loc) · 554 Bytes

README.md

File metadata and controls

15 lines (8 loc) · 554 Bytes

视频转换

这个项目旨在实现视频自动转换语种,配音,同时更改嘴型

工作原理

我们首先通过Whisper模型生成标注有时间戳的字幕,用翻译工具把字幕翻译成对应的语言,通过VideoReTalking生成对应语种的嘴型再合成回原视频,通过tortoise-tts训练语音合成模型,生成对应语种的声音,最后将合成的声音和视频合并。

原始视频:

1709100975822

生成视频:

1709100991051