Озвучиваем текст любым голосом с помощью RVC-TTS

1 мин

|

Салют всем интернет бродягам! В данной статье мы дадим подробную инструкцию о том, как с помощью бесплатного скрипта RVC-TTS озвучить любой текст интересными голосами. Для этого вам потребуются небольшие технические знания, однако повторить манипуляции по установке под силу каждому. Поехали!

Изображение создана на платформе DALL·E 3

Как озвучить любой текст нейросетью

Начинаем процесс установки. Для запуска программы RVC-TTS следует принять во внимание несколько вещей:

  • Ваша операционная система — Windows;
  • У вас установлен Python версии 3.10;
  • Имеется установленный Git;
  • Наличие актуальной видео-карты у вашего ПК.

Подробно на этих пунктах мы не будем останавливаться, так как всю информацию можно свободно найти в Google. Далее переходим непосредственно к установке чудо машины для озвучки:

  • Открываем командную строку, открываем любую папку и начинаем выполнять по очереди следующие команды:
    • git clone https://github.com/litagin02/rvc-tts-webui.git
    • cd rvc-tts-webui
    • curl -L -O https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/hubert_base.pt
    • curl -L -O https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/rmvpe.pt
    • python -m venv venv
    • venv\Scripts\activate
    • pip install torch torchvision torchaudio –index-url https://download.pytorch.org/whl/cu118
    • pip install -r requirements.txt
  • Наш генератор озвучки установлен, однако запустить его не выйдет до тех пор пока мы не положим в него голосовую модель (RVC model), которая будет озвучивать весь текст. Найти такие рвс модели можно на просторах интернета. Это могут быть голоса каких либо персонажей, либо голоса реальных людей и даже звезд. После того как вы выберете подходящую модель поместите её в папку “weights”;
  • После производим запуск в командной строке следующими командами:
    • venv\Scripts\activate
    • python app.py
  • Готово! Откроется веб интерфейс, в котором вам необходимо выбрать язык и текст в соответствующих полях и далее нажать на кнопку “Convert”.
Интерфэйс программы

Итог

Озвучка текста нейросетями представляет собой инновационное и многообещающее направление в сфере синтеза речи. С развитием искусственного интеллекта и глубокого обучения, нейросети стали способными создавать высококачественные голосовые ассистенты и аудиоконтент, которые могут улучшить пользовательский опыт в различных областях.

Приведенная нами инструкция приоткроет двери в киберпанк и даст возможность бесплатно воплощать все ваши задумки и идеи. Будущее уже настало, всем ахой!


Подписаться
Уведомить о
guest
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии