-
Notifications
You must be signed in to change notification settings - Fork 1
Expand file tree
/
Copy pathutils.py
More file actions
155 lines (129 loc) · 6.39 KB
/
utils.py
File metadata and controls
155 lines (129 loc) · 6.39 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
# utils.py
import os
import subprocess
from pathlib import Path
from pydub import AudioSegment
from pydub.silence import split_on_silence
import pysrt
from tqdm import tqdm
import asyncio
def remove_silence(input_file, output_file):
"""Lê um arquivo MP3, remove o silêncio e salva como MP3 com alta qualidade, mantendo pequenas pausas."""
audio = AudioSegment.from_mp3(input_file)
segments = split_on_silence(
audio,
min_silence_len=500,
silence_thresh=-40,
keep_silence=250
)
non_silent_audio = AudioSegment.silent(duration=0)
for segment in segments:
non_silent_audio += segment
non_silent_audio.export(output_file, format="mp3", bitrate="192k")
def timetoms(time_obj):
"""Converte um objeto de tempo do Pysrt para milissegundos."""
return time_obj.hours * 3600000 + time_obj.minutes * 60000 + time_obj.seconds * 1000 + time_obj.milliseconds
# --- VERSÃO COMPLETAMENTE NOVA E ROBUSTA ---
async def adjust_audio_speed(input_file, output_file, target_duration_ms):
"""Ajusta a velocidade do áudio usando o filtro 'atempo' do FFmpeg para máxima qualidade."""
# Usa ffprobe para obter a duração exata, é mais confiável que pydub
try:
probe_cmd = [
"ffprobe", "-v", "error", "-show_entries", "format=duration",
"-of", "default=noprint_wrappers=1:nokey=1", input_file
]
result = subprocess.run(probe_cmd, capture_output=True, text=True, check=True)
original_duration_ms = float(result.stdout.strip()) * 1000
except (subprocess.CalledProcessError, FileNotFoundError):
# Fallback para pydub se ffprobe não estiver disponível ou falhar
original_duration_ms = len(AudioSegment.from_mp3(input_file))
if original_duration_ms == 0 or target_duration_ms <= 0:
silent_audio = AudioSegment.silent(duration=target_duration_ms)
silent_audio.export(output_file, format="mp3", bitrate="192k")
return silent_audio
speed_factor = original_duration_ms / target_duration_ms
# Se a velocidade já for quase perfeita, apenas renomeia para evitar re-compressão
if 0.99 < speed_factor < 1.01:
Path(input_file).rename(output_file)
return AudioSegment.from_mp3(output_file)
# Constrói a cadeia de filtros 'atempo'
atempo_filters = []
current_factor = speed_factor
# Para aceleração > 2.0x
while current_factor > 2.0:
atempo_filters.append("atempo=2.0")
current_factor /= 2.0
# Para desaceleração < 0.5x
while current_factor < 0.5:
atempo_filters.append("atempo=0.5")
current_factor /= 0.5
# Adiciona o fator final (que agora está entre 0.5 e 2.0)
if current_factor != 1.0:
atempo_filters.append(f"atempo={current_factor:.5f}")
filter_string = ",".join(atempo_filters)
# Executa o comando FFmpeg
ffmpeg_cmd = [
"ffmpeg", "-y", "-i", input_file, "-filter:a", filter_string,
"-b:a", "192k", "-ar", "44100", # Define bitrate e sample rate de alta qualidade
"-hide_banner", "-loglevel", "error", output_file
]
try:
# Roda o subprocesso bloqueante em uma thread separada para não congelar a UI
proc = await asyncio.create_subprocess_exec(
*ffmpeg_cmd,
stdout=asyncio.subprocess.PIPE,
stderr=asyncio.subprocess.PIPE
)
stdout, stderr = await proc.communicate()
if proc.returncode != 0:
print(f"Erro no FFmpeg ao ajustar a velocidade: {stderr.decode()}")
# Em caso de erro, cria silêncio para não quebrar o processo
silent = AudioSegment.silent(duration=target_duration_ms)
silent.export(output_file, format="mp3")
except FileNotFoundError:
print("ERRO: FFmpeg não encontrado. Verifique se ele está instalado e no PATH do sistema.")
raise
return AudioSegment.from_mp3(output_file)
async def merge_audio_files(output_folder, srt_file_path):
"""Mescla segmentos de áudio baseados nos tempos de um arquivo SRT com sincronização correta."""
subs = pysrt.open(srt_file_path)
final_audio = AudioSegment.silent(duration=0)
base_name = Path(srt_file_path).stem
with tqdm(total=len(subs), desc=f"Mesclando áudios para {base_name}", unit="segmento") as pbar:
for sub in subs:
start_time_ms = timetoms(sub.start)
end_time_ms = timetoms(sub.end)
audio_file = Path(output_folder) / f"{sub.index:02d}.mp3"
silence_duration = start_time_ms - len(final_audio)
if silence_duration > 5: # Adiciona uma pequena margem para evitar micro-silêncios
final_audio += AudioSegment.silent(duration=silence_duration)
if audio_file.exists() and audio_file.stat().st_size > 0:
audio_segment = AudioSegment.from_mp3(str(audio_file))
final_audio += audio_segment
else:
segment_duration = end_time_ms - start_time_ms
final_audio += AudioSegment.silent(duration=max(0, segment_duration))
pbar.update(1)
srt_output_dir = Path("output/srt_output")
srt_output_dir.mkdir(parents=True, exist_ok=True)
output_file_path = srt_output_dir / f"{base_name}_final.mp3"
final_audio.export(str(output_file_path), format="mp3", bitrate="192k")
print(f"\nÁudio final salvo em: {output_file_path}\n")
return str(output_file_path)
def listar_audios():
"""Lista os arquivos de áudio na pasta de saída do SRT."""
try:
srt_output_dir = "output/srt_output"
if not os.path.exists(srt_output_dir):
os.makedirs(srt_output_dir, exist_ok=True)
return ["Nenhum áudio gerado ainda"]
arquivos = [f for f in os.listdir(srt_output_dir) if f.endswith(('.mp3', '.wav'))]
return arquivos if arquivos else ["Nenhum áudio gerado ainda"]
except Exception as e:
print(f"Erro ao listar áudios: {e}")
return ["Erro ao listar arquivos"]
def tocar_audio(arquivo):
"""Retorna o caminho completo para um arquivo de áudio selecionado para tocar."""
if arquivo and arquivo != "Nenhum áudio gerado ainda":
return f"output/srt_output/{arquivo}"
return None