QuickTTS/utils.py at main · RafaelGodoyEbert/QuickTTS · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
# utils.py

import os
import subprocess
from pathlib import Path
from pydub import AudioSegment
from pydub.silence import split_on_silence
import pysrt
from tqdm import tqdm
import asyncio

def remove_silence(input_file, output_file):
    """Lê um arquivo MP3, remove o silêncio e salva como MP3 com alta qualidade, mantendo pequenas pausas."""
    audio = AudioSegment.from_mp3(input_file)
    segments = split_on_silence(
        audio,
        min_silence_len=500,
        silence_thresh=-40,
        keep_silence=250
    )
    non_silent_audio = AudioSegment.silent(duration=0)
    for segment in segments:
        non_silent_audio += segment
    non_silent_audio.export(output_file, format="mp3", bitrate="192k")

def timetoms(time_obj):
    """Converte um objeto de tempo do Pysrt para milissegundos."""
    return time_obj.hours * 3600000 + time_obj.minutes * 60000 + time_obj.seconds * 1000 + time_obj.milliseconds

# --- VERSÃO COMPLETAMENTE NOVA E ROBUSTA ---
async def adjust_audio_speed(input_file, output_file, target_duration_ms):
    """Ajusta a velocidade do áudio usando o filtro 'atempo' do FFmpeg para máxima qualidade."""

    # Usa ffprobe para obter a duração exata, é mais confiável que pydub
    try:
        probe_cmd = [
            "ffprobe", "-v", "error", "-show_entries", "format=duration",
            "-of", "default=noprint_wrappers=1:nokey=1", input_file
        ]
        result = subprocess.run(probe_cmd, capture_output=True, text=True, check=True)
        original_duration_ms = float(result.stdout.strip()) * 1000
    except (subprocess.CalledProcessError, FileNotFoundError):
        # Fallback para pydub se ffprobe não estiver disponível ou falhar
        original_duration_ms = len(AudioSegment.from_mp3(input_file))

    if original_duration_ms == 0 or target_duration_ms <= 0:
        silent_audio = AudioSegment.silent(duration=target_duration_ms)
        silent_audio.export(output_file, format="mp3", bitrate="192k")
        return silent_audio

    speed_factor = original_duration_ms / target_duration_ms

    # Se a velocidade já for quase perfeita, apenas renomeia para evitar re-compressão
    if 0.99 < speed_factor < 1.01:
        Path(input_file).rename(output_file)
        return AudioSegment.from_mp3(output_file)

    # Constrói a cadeia de filtros 'atempo'
    atempo_filters = []
    current_factor = speed_factor

    # Para aceleração > 2.0x
    while current_factor > 2.0:
        atempo_filters.append("atempo=2.0")
        current_factor /= 2.0

    # Para desaceleração < 0.5x
    while current_factor < 0.5:
        atempo_filters.append("atempo=0.5")
        current_factor /= 0.5

    # Adiciona o fator final (que agora está entre 0.5 e 2.0)
    if current_factor != 1.0:
        atempo_filters.append(f"atempo={current_factor:.5f}")

    filter_string = ",".join(atempo_filters)

    # Executa o comando FFmpeg
    ffmpeg_cmd = [
        "ffmpeg", "-y", "-i", input_file, "-filter:a", filter_string,
        "-b:a", "192k", "-ar", "44100", # Define bitrate e sample rate de alta qualidade
        "-hide_banner", "-loglevel", "error", output_file
    ]

    try:
        # Roda o subprocesso bloqueante em uma thread separada para não congelar a UI
        proc = await asyncio.create_subprocess_exec(
            *ffmpeg_cmd,
            stdout=asyncio.subprocess.PIPE,
            stderr=asyncio.subprocess.PIPE
        )
        stdout, stderr = await proc.communicate()
        if proc.returncode != 0:
            print(f"Erro no FFmpeg ao ajustar a velocidade: {stderr.decode()}")
            # Em caso de erro, cria silêncio para não quebrar o processo
            silent = AudioSegment.silent(duration=target_duration_ms)
            silent.export(output_file, format="mp3")
    except FileNotFoundError:
        print("ERRO: FFmpeg não encontrado. Verifique se ele está instalado e no PATH do sistema.")
        raise

    return AudioSegment.from_mp3(output_file)


async def merge_audio_files(output_folder, srt_file_path):
    """Mescla segmentos de áudio baseados nos tempos de um arquivo SRT com sincronização correta."""
    subs = pysrt.open(srt_file_path)
    final_audio = AudioSegment.silent(duration=0)
    base_name = Path(srt_file_path).stem

    with tqdm(total=len(subs), desc=f"Mesclando áudios para {base_name}", unit="segmento") as pbar:
        for sub in subs:
            start_time_ms = timetoms(sub.start)
            end_time_ms = timetoms(sub.end)

            audio_file = Path(output_folder) / f"{sub.index:02d}.mp3"

            silence_duration = start_time_ms - len(final_audio)
            if silence_duration > 5: # Adiciona uma pequena margem para evitar micro-silêncios
                final_audio += AudioSegment.silent(duration=silence_duration)

            if audio_file.exists() and audio_file.stat().st_size > 0:
                audio_segment = AudioSegment.from_mp3(str(audio_file))
                final_audio += audio_segment
            else:
                segment_duration = end_time_ms - start_time_ms
                final_audio += AudioSegment.silent(duration=max(0, segment_duration))

            pbar.update(1)

    srt_output_dir = Path("output/srt_output")
    srt_output_dir.mkdir(parents=True, exist_ok=True)
    output_file_path = srt_output_dir / f"{base_name}_final.mp3"
    final_audio.export(str(output_file_path), format="mp3", bitrate="192k")
    print(f"\nÁudio final salvo em: {output_file_path}\n")
    return str(output_file_path)

def listar_audios():
    """Lista os arquivos de áudio na pasta de saída do SRT."""
    try:
        srt_output_dir = "output/srt_output"
        if not os.path.exists(srt_output_dir):
            os.makedirs(srt_output_dir, exist_ok=True)
            return ["Nenhum áudio gerado ainda"]
        arquivos = [f for f in os.listdir(srt_output_dir) if f.endswith(('.mp3', '.wav'))]
        return arquivos if arquivos else ["Nenhum áudio gerado ainda"]
    except Exception as e:
        print(f"Erro ao listar áudios: {e}")
        return ["Erro ao listar arquivos"]

def tocar_audio(arquivo):
    """Retorna o caminho completo para um arquivo de áudio selecionado para tocar."""
    if arquivo and arquivo != "Nenhum áudio gerado ainda":
        return f"output/srt_output/{arquivo}"
    return None