Elder Scrolls 5: Skyrim Special Edition
The Elder Scrolls 5: Skyrim Special Edition is a re-release of the open-world fantasy role-playing game The Elder Scrolls 5: Skyrim Legendary Edition for... Read more
xVASynth 2 - SKVA Synth - voiceover tool
-
www.nexusmods.comDownloadArchive password: vgtimes
xVASynth 2 - SKVA Synth.
xVASynth is an artificial intelligence tool for creating high-quality voiceovers using voices from video games. The app supports hundreds of voices in dozens of games and provides control over pitch, duration and energy down to the letter.
Introduction
xVASynth (or [SK]VASynth, for Skyrim voices) is an artificial intelligence application that generates voiceover lines using specific voices from video games. It can convert text to speech (TTS) from text input or speech to speech (S2S) from audio input. The app uses FastPitch models [1,2], which give users artistic control over the pitch, duration, and energy values (v2+ models only) for each letter in the audio. They also allow you to generate audio with an explicit pronunciation via ARPAbet notation.
This also means that new vocabulary can be generated beyond what the voice actors have already read.
xVASynth 2 — SKVA Synth.
xVASynth — это инструмент искусственного интеллекта для создания высококачественных реплик озвучки с использованием голосов из видеоигр. Приложение поддерживает сотни голосов в десятках игр и обеспечивает управление высотой тона, продолжительностью и энергией с точностью до каждой буквы.
Вступление
xVASynth (или [SK]VASynth, для голосов Skyrim) — это приложение с искусственным интеллектом, которое генерирует реплики озвучки, используя определенные голоса из видеоигр. Он может преобразовывать текст в речь (TTS) из текстового ввода или речь в речь (S2S) из аудиовхода. Приложение использует модели FastPitch [1,2], которые дают пользователям художественный контроль над высотой тона, длительностью и значениями энергии (только модели v2+) для каждой буквы в аудио. Они также позволяют генерировать звук с явно заданным произношением через нотацию ARPAbet.
Использование нейронного синтеза речи приводит к естественному звучанию голоса, что очень сложно сделать с помощью более традиционных методов, включающих объединение существующих данных. Это также означает, что может быть сгенерирован новый словарный запас помимо того, что актеры озвучивания уже прочитали.
Useful links: