Games Elder Scrolls 5: Skyrim Special Edition Files Editors and programs xVASynth 2 - SKVA Synth - voiceover tool

xVASynth 2 - SKVA Synth - voiceover tool

  • Author: Dan Ruta
    Size: 723.20 MB
    Uploaded by: Flixx
    Date: April 26, 2022, 10:21 AM
    Downloads: 1020

    xVASynth 2 - SKVA Synth.

    xVASynth is an artificial intelligence tool for creating high-quality voiceovers using voices from video games. The app supports hundreds of voices in dozens of games and provides control over pitch, duration and energy down to the letter.

    Introduction

    xVASynth (or [SK]VASynth, for Skyrim voices) is an artificial intelligence application that generates voiceover lines using specific voices from video games. It can convert text to speech (TTS) from text input or speech to speech (S2S) from audio input. The app uses FastPitch models [1,2], which give users artistic control over the pitch, duration, and energy values ​​(v2+ models only) for each letter in the audio. They also allow you to generate audio with an explicit pronunciation via ARPAbet notation.

    This also means that new vocabulary can be generated beyond what the voice actors have already read.

    The file name and description have been translated Show original (RU)Show translation (EN)
    xVASynth 2 - SKVA Synth - инструмент для озвучки

    xVASynth 2 — SKVA Synth.

    xVASynth — это инструмент искусственного интеллекта для создания высококачественных реплик озвучки с использованием голосов из видеоигр. Приложение поддерживает сотни голосов в десятках игр и обеспечивает управление высотой тона, продолжительностью и энергией с точностью до каждой буквы.

    Вступление

    xVASynth (или [SK]VASynth, для голосов Skyrim) — это приложение с искусственным интеллектом, которое генерирует реплики озвучки, используя определенные голоса из видеоигр. Он может преобразовывать текст в речь (TTS) из текстового ввода или речь в речь (S2S) из аудиовхода. Приложение использует модели FastPitch [1,2], которые дают пользователям художественный контроль над высотой тона, длительностью и значениями энергии (только модели v2+) для каждой буквы в аудио. Они также позволяют генерировать звук с явно заданным произношением через нотацию ARPAbet.

    Использование нейронного синтеза речи приводит к естественному звучанию голоса, что очень сложно сделать с помощью более традиционных методов, включающих объединение существующих данных. Это также означает, что может быть сгенерирован новый словарный запас помимо того, что актеры озвучивания уже прочитали.

    Useful links:

    Comments 0
    Leave a comment