Как создавать видео со своими цифровыми спикерами для креативов и заливов

Йо-хо-хо, пираты конверсий! Как старик Флинт завораживает команду одним своим словом, а как капитан Джек Воробей выкручивается из любой ситуации благодаря своей харизме, так и в рекламных связках авторитетное мнение — это ключ к сокровищнице профита. Кто-то доверяет белому халату, кто-то — голосу селебрити, а кто-то — убедительному тону политика. И именно поэтому опытные медиабайеры используют образы таких людей в своих кампаниях. При этом не все рекламодатели разрешают использовать в креативах реально существующих людей, опасаясь проблем с законом. А рекламные платформы также реджектят такие объявления. Решением этой проблемы может стать создание собственного, не существующего в реальности, спикера, который будет говорить именно то, что нужно. Сегодня мы поднимем паруса нейросетей и откроем для себя гавань создания видео с виртуальными спикерами для рекламных заливов.

Пошаговый гайд по созданию цифрового спикера для креативов

Тем, кто решил взять на вооружение виртуальных спикеров достаточно нескольких ИИ-инструментов и немного творчества. Ниже рассмотрим пошаговую инструкцию, которая поможет создать убедительного цифрового спикера для рекламных кампаний.

Генерация статичного изображения спикера

Первый шаг — создать портрет нашего будущего персонажа. Для этих целей отлично подходит нейронка FLUX. Она способна генерировать реалистичные лица с нуля, с учетом пожеланий относительно возраста, пола, этнической принадлежности, эмоций и т.д. Также можно контролировать мельчайшие детали, от цвета глаз до формы прически, чтобы создать идеального эксперта для любой вертикали — хоть врача для залива нутры, хоть успешного трейдера под крипто-оффер. Экспериментируя с разными параметрами можно создать тот образ, который будет максимально соответствовать вашей целевой аудитории.

Чтобы создать цифровую личность переходим на сайт fal.ai.

Регистрируемся путем подвязки профиля GitHub.

Во вкладке «Explore» переходим к шаблону «FLUX Realism LoRA».

Редактируем уже существующий шаблон текстового промта или прописываем с нуля собственное описание личности. В дополнительных настройках также указываем желаемые параметры (например, количество шагов вывода, которые необходимо выполнить ИИ, формат файла, количество вариантов изображений).

Затем жмем кнопку «Run» и получаем изображение, которое можно скачать в установленном ранее формате.

Под сгенерированным изображением сервис показывает стоимость каждого запроса. Бонусного $1 на балансе вполне хватит, чтобы ознакомиться с возможностями и функционалом платформы, сгенерировав несколько десятков уникальных изображений.

Для наглядности приведем еще несколько вариантов полученных изображений согласно заданному промту.

Оживляем картинку: от статики к динамике

Следующий этап — придать спикеру движение и жизнь. Сервис Runway Gen-3 Alpha — поможет сделать это быстро и довольно качественно. ИИ не просто анимирует изображение, а придает ему естественность и выразительность. Спикер может кивать головой, улыбаться, поднимать брови, жестикулировать — все, что нужно для убедительной презентации. Тщательно настраивайте анимацию, чтобы она выглядела максимально естественно и соответствовала контексту видео, оффера и всей связки в целом.

Чтобы оживить полученное фото цифровой личности переходим на официальный сайт Runway и регистрируемся на платформе.

Загружаем полученное ранее изображение, выбираем ориентацию изображения и обрезаем его (в бесплатной версии предлагаются вертикальная и горизонтальная ориентация с соотношением размеров 1280 на 768 пикселей), а также прописываем промт и устанавливаем длительность видеоролика и жмем кнопку «Generate».

Генерация короткого видео длительностью 10 секунд занимает не больше минуты и расходует 50 кредитов с баланса. В пробной версии предоставляется 125 бесплатных кредитов, что эквивалентно 4 видео.

Приведем пример одного из полученных видео на основании статичного изображения цифровой личности

Синхронизируем движения губ и добавляем голос

Завершающий и ключевой штрих — дать спикеру голос. Добавить голос и синхронизировать движения губ можно воспользовавшись функционалом все того же Runway, выбрав подходящий вариант шаблона голоса и манеры подачи информации, релевантные ЦА.

В Telegram-канале Pirate CPA мы рассказывали о еще одной платформе, для достижения идеальной синхронизации губ с аудио — Merlinclone. Вы можете использовать заранее записанный голос, текст, который сервис превратит в речь, или даже изменять язык уже существующего видео. Merlinclone предлагает широкий выбор голосов и языков, а также возможность тонкой настройки интонаций и акцентов. Платформа также предлагает тестовый период для ознакомления со всеми возможностями и создания убедительной озвучки.

Чтобы получить доступ к функционалу платформы необходимо зарегистрироваться.

Функционал платформы постоянно дополняется и модернизируется и на момент выхода статьи на сайте велись работы по улучшению качества и добавлению дополнительных опций.

Для озвучки текста также можно воспользоваться сервисом NaturalReader, где также можно выбрать диалект, голос, манеру речи спикера.

Оценить результат озвучки и синхронизации движения губ со звуковой дорожкой, созданной в триальной версии Runway можно ознакомиться по ссылке. Отметим, что пример примитивный и видео было создано в ознакомительных целях. Уделив больше времени кастомизации речи и самого спикера, можно получить очень достойный и реалистичный результат.

Как распознать цифровую личность

С развитием технологий создания цифрового контента, распознать сгенерированную личность становится все более сложной задачей. Виртуальные спикеры, созданные с помощью нейросетей, поражают своей реалистичностью, однако все же существуют нюансы, которые позволяют отличить их от реальных людей. Внимательное наблюдение и знание нескольких ключевых признаков помогут вам разоблачить цифрового двойника.

Чтобы обнаружить следы цифровой кисти, стоит обратить внимание на такие факторы:

Слишком идеальная кожа. Сгенерированные лица часто имеют идеально ровную и пастельную, без каких-либо недостатков кожу. Отсутствие пор, морщин, родинок и других естественных признаков может быть подозрительным сигналом;
Неестественный блеск в глазах. Глаза человека — зеркало души, и у виртуальных спикеров это зеркало может выдавать их искусственную природу. Обращайте внимание на неестественный блеск, отсутствие рефлексов и микродвижений глаз;

Мимика, которая «отстает». Синхронизация мимики и речи — сложная задача даже для самых продвинутых нейросетей. Если движения губ не совсем соответствуют звукам, а выражение лица меняется с задержкой, это может быть признаком цифрового фейка;
«Плавающие» элементы. Обращайте внимание на детали, такие как волосы, очки, украшения, пальцы рук. В сгенерированных видео эти элементы могут двигаться неестественно, «проваливаться» в кожу или сливаться с фоном. Например, на «оживленной» картинке из примера выше можно заменить, что в движении на левой руке то 4, то 5 пальцев;

Артефакты сжатия и рендеринга. Цифровые видео могут содержать небольшие артефакты, связанные со сжатием и рендерингом. Это могут быть пикселизация, размытие, странное мерцание или искажение цветов.

Узкопрофильные специалисты также используют специальный софт и онлайн-сервисы, помогающие анализировать видео и выявлять признаки цифровой обработки. Они постоянно развиваются и становятся все более эффективными в борьбе с фейками.

Будущее за виртуальными спикерами?

Что же ждет нас дальше? Виртуальные спикеры — это лишь начало новой эры в арбитраже трафика. Многие команды и соло-арбитражники уже активно используют возможности ИИ по генерации видео и изображений для креативов.

Учитывая тот факт, что ИИ все больше проникает во все сферы жизни человека, можно предположить, что совсем скоро арбитражники и медиабайеры получат еще больше возможностей. Например, это может быть создание персонализированных видео- и фото-креативов для каждого сегмента аудитории за считавнные минуты, тестирование различных сообщений и образов без привлечения реальных актеров, создание уникальных креативов, которые будут выделяться на фоне конкурентов. В 2024 году цифровые модели набирают миллионы подписчиков в течение нескольких месяцев, государственные органы и СМИ создают виртуальных спикеров, для подачи информации. И это только начало.

Конечно, есть и риски. Например, возможность злоупотреблений, негативная реакция аудитории на «искусственных» спикеров, этические вопросы. Но ясно одно: виртуальные спикеры — это мощный инструмент, и тот, кто научится им пользоваться, сможет поймать свой попутный ветер, дующий в направлении профита.

Вывод

Креативы с виртуальными спикерами — это не просто модная фишка, а реальная возможность повысить эффективность рекламных кампаний уже сейчас. В статье мы рассмотрели основные этапы создания таких видео, от генерации лица до синхронизации губ и озвучки. Помните: главное — экспериментировать, тестировать новые подходы и не бояться штормов. Ведь только смелые корсары находят самые большие сокровища. Так что поднимайте паруса, наполняйте трюмы конверсиями и пусть виртуальные спикеры приводят вам множество лидов!