Салют всем интернет бродягам! В данной статье мы дадим подробную инструкцию о том, как с помощью бесплатного скрипта RVC-TTS озвучить любой текст интересными голосами. Для этого вам потребуются небольшие технические знания, однако повторить манипуляции по установке под силу каждому. Поехали!
![](https://piratecpa.net/wp-content/webpc-passthru.php?src=https://piratecpa.net/wp-content/uploads/2023/10/oig-3-1024x1024.jpeg&nocache=1)
Как озвучить любой текст нейросетью
Начинаем процесс установки. Для запуска программы RVC-TTS следует принять во внимание несколько вещей:
- Ваша операционная система — Windows;
- У вас установлен Python версии 3.10;
- Имеется установленный Git;
- Наличие актуальной видео-карты у вашего ПК.
Подробно на этих пунктах мы не будем останавливаться, так как всю информацию можно свободно найти в Google. Далее переходим непосредственно к установке чудо машины для озвучки:
- Открываем командную строку, открываем любую папку и начинаем выполнять по очереди следующие команды:
- git clone https://github.com/litagin02/rvc-tts-webui.git
- cd rvc-tts-webui
- curl -L -O https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/hubert_base.pt
- curl -L -O https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/rmvpe.pt
- python -m venv venv
- venv\Scripts\activate
- pip install torch torchvision torchaudio –index-url https://download.pytorch.org/whl/cu118
- pip install -r requirements.txt
- Наш генератор озвучки установлен, однако запустить его не выйдет до тех пор пока мы не положим в него голосовую модель (RVC model), которая будет озвучивать весь текст. Найти такие рвс модели можно на просторах интернета. Это могут быть голоса каких либо персонажей, либо голоса реальных людей и даже звезд. После того как вы выберете подходящую модель поместите её в папку “weights”;
- После производим запуск в командной строке следующими командами:
- venv\Scripts\activate
- python app.py
- Готово! Откроется веб интерфейс, в котором вам необходимо выбрать язык и текст в соответствующих полях и далее нажать на кнопку “Convert”.
![](https://piratecpa.net/wp-content/webpc-passthru.php?src=https://piratecpa.net/wp-content/uploads/2023/10/65-1024x583.jpeg&nocache=1)
Итог
Озвучка текста нейросетями представляет собой инновационное и многообещающее направление в сфере синтеза речи. С развитием искусственного интеллекта и глубокого обучения, нейросети стали способными создавать высококачественные голосовые ассистенты и аудиоконтент, которые могут улучшить пользовательский опыт в различных областях.
Приведенная нами инструкция приоткроет двери в киберпанк и даст возможность бесплатно воплощать все ваши задумки и идеи. Будущее уже настало, всем ахой!