Checks
Environment Details
Win 11, python 3.12, torch==2.11.0+cu126 torchaudio==2.11.0+cu126
Steps to Reproduce
Это [Z AA1 M AO0 K], а это [Z AA0 M AO1 K], и это [Z AA M AO K].
In this text, word ZAMOK sounds same, but does not!
In first variant stress must be on A char, is second on Ochar.
code & data to reproduce:
cwd = Path.cwd()
ref_audio_path = cwd / 'SKLAVENWACHE.wav'
ref_text = 'Старые дома примкнут к тому, кто победит, как и всегда. Многие шепчутся, что он бастард, не имеющий на него прав. Ты был во многих борделях разных городов. Вестерос уязвим, как никогда.'
ttext = 'Это [Z AA1 M AO0 K], а это [Z AA0 M AO1 K], и это [Z AA M AO K].'
output_file_path = cwd / 'result.wav'
output_file_path.unlink(missing_ok=True)
gothic_voice_omni.zip
✔️ Expected Behavior
No response
❌ Actual Behavior
No response
Checks
Environment Details
Win 11, python 3.12, torch==2.11.0+cu126 torchaudio==2.11.0+cu126
Steps to Reproduce
Это [Z AA1 M AO0 K], а это [Z AA0 M AO1 K], и это [Z AA M AO K].In this text, word
ZAMOKsounds same, but does not!In first variant stress must be on
Achar, is second onOchar.code & data to reproduce:
gothic_voice_omni.zip
✔️ Expected Behavior
No response
❌ Actual Behavior
No response