Салют всем интернет бродягам! В данной статье мы дадим подробную инструкцию о том, как с помощью бесплатного скрипта RVC-TTS озвучить любой текст интересными голосами. Для этого вам потребуются небольшие технические знания, однако повторить манипуляции по установке под силу каждому. Поехали!
Как озвучить любой текст нейросетью
Начинаем процесс установки. Для запуска программы RVC-TTS следует принять во внимание несколько вещей:
- Ваша операционная система — Windows;
- У вас установлен Python версии 3.10;
- Имеется установленный Git;
- Наличие актуальной видео-карты у вашего ПК.
Подробно на этих пунктах мы не будем останавливаться, так как всю информацию можно свободно найти в Google. Далее переходим непосредственно к установке чудо машины для озвучки:
- Открываем командную строку, открываем любую папку и начинаем выполнять по очереди следующие команды:
- git clone https://github.com/litagin02/rvc-tts-webui.git
- cd rvc-tts-webui
- curl -L -O https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/hubert_base.pt
- curl -L -O https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/rmvpe.pt
- python -m venv venv
- venv\Scripts\activate
- pip install torch torchvision torchaudio –index-url https://download.pytorch.org/whl/cu118
- pip install -r requirements.txt
- Наш генератор озвучки установлен, однако запустить его не выйдет до тех пор пока мы не положим в него голосовую модель (RVC model), которая будет озвучивать весь текст. Найти такие рвс модели можно на просторах интернета. Это могут быть голоса каких либо персонажей, либо голоса реальных людей и даже звезд. После того как вы выберете подходящую модель поместите её в папку “weights”;
- После производим запуск в командной строке следующими командами:
- venv\Scripts\activate
- python app.py
- Готово! Откроется веб интерфейс, в котором вам необходимо выбрать язык и текст в соответствующих полях и далее нажать на кнопку “Convert”.
Итог
Озвучка текста нейросетями представляет собой инновационное и многообещающее направление в сфере синтеза речи. С развитием искусственного интеллекта и глубокого обучения, нейросети стали способными создавать высококачественные голосовые ассистенты и аудиоконтент, которые могут улучшить пользовательский опыт в различных областях.
Приведенная нами инструкция приоткроет двери в киберпанк и даст возможность бесплатно воплощать все ваши задумки и идеи. Будущее уже настало, всем ахой!