технологии

Синтезированный голос против человеческого: кто останется у микрофона в новой реальности

Разбираемся, как ИИ влияет на сферу озвучивания и может ли он заменить дикторов и актеров дубляжа
Will Francis/Unsplash
Will Francis/Unsplash

В России синтезированные голоса все чаще используют для создания рекламы, образовательных роликов и прочего контента. Разбираемся вместе с актрисой дубляжа и диктором, какие возможности открывает искусственный интеллект в сфере озвучки, что ждет индустрию в ближайшем будущем и есть ли риск для ее коллег лишиться работы.

Как ИИ используется в озвучке

ИИ-озвучка — это синтезированная речь, созданная на основе нейросетей, которые обучаются на огромных массивах аудиоданных. Такие голоса звучат максимально реалистично: они передают интонации, тембр и даже эмоции. Главная цель технологии — сэкономить время и деньги заказчика, упростить производство контента и сделать его более доступным.

Компании все чаще используют ИИ в рекламных целях: в соцсетях публикуются короткие ролики, озвученные нейросетями. Синтетические голоса позволяют выпускать десятки вариантов видео за день, адаптируя их под разные аудитории и маскируя под контекстную рекламу.

ИИ также применяют для перевода и озвучки видеороликов с иностранных языков, при этом алгоритмы способны сохранять особенности оригинальных голосов. Теперь образовательный видеоролик или эпизод сериала можно адаптировать для русскоязычной аудитории, не прибегая к полноценному дубляжу — достаточно использовать подходящее разрешение.

Диктор и актриса дубляжа Зарина Полетаева отметила в разговоре с «Постньюс», что нейросети хорошо справляются именно с рутинными задачами. «Я думаю, что ИИ может быть помощником, если использовать его как инструмент, а не как полноценную замену человеку. Например, для коррекции текстов, предварительного написания рекламных черновиков, для наложения эффектов или, в конце концов, вдохновения», — сказала она. По мнению эксперта, такой подход позволяет специалистам сохранять контроль над качеством и оригинальностью финального продукта, одновременно экономя время и ресурсы.

Может ли ИИ заменить дикторов

Бурное развитие технологий заставляет опасаться, не вытеснит ли ИИ «живых» специалистов. Полетаева объяснила, что пока нейросети не составляют реальную конкуренцию, хотя ее коллеги иногда беспокоятся на этот счет — например, когда обновляются англоязычные модели, умеющие смеяться и вести более-менее осмысленные диалоги. Так, в сообществе дикторов даже появился хэштег #Заживыеголоса, под которым они призывают избегать синтезированных голосов.

«Роликов с “синтетическими” голосами становится все больше, однако конкуренцией это назвать сложно. Тексты для таких видео обычно пишут либо сами заказчики, либо тот же ИИ, в связи с чем результат получается бездушным, посредственным. — сказала спикер. — Люди, создающие такой некачественный продукт, не закладывают серьезный бюджет под свои задачи и намерены платить копейки, поэтому я бы вообще не стала с ними сотрудничать. У них нет стремления сделать хорошо».

Специалист подчеркнула, что синтезированным голосам пока далеко до полноценной работы актера озвучки. По мнению Полетаевой, основная проблема — неудобство взаимодействия с технологиями: заказчики не умеют точно формулировать запросы, режиссеры — писать промпты, а контроль за финальным результатом в таких условиях почти невозможен. Поэтому сейчас ИИ логичнее рассматривать как дополнительный инструмент, а не угрозу.

«Я не думаю, что у меня может украсть работу ИИ — просто в силу того, что с ним неудобно работать. По крайней мере пока», — отметила Полетаева.

Почему нужна маркировка контента, созданного ИИ

Дикторы считают, что подделка голоса несет риски не только для артистов, но и для обычных граждан. Уже есть случаи, когда мошенники применяли синтез речи для обмана людей. Поэтому эксперты настаивают на обязательной маркировке таких материалов.

«Технологии развиваются, становится достаточно сложно отличить подделку, особенно когда отрывок речи короткий. Все больше людей в это верят. По моему мнению, нужно честно сообщать, если голос сгенерирован. Нежелание маркировать подобный контент — это намеренное введение аудитории в заблуждение», — объяснила Полетаева.

Что ждет индустрию в будущем

Эксперт уверена, что через 5–10 лет профессия актера озвучки изменится, но не исчезнет.

«Я считаю, что останутся только лучшие. Посредственных актеров озвучки и плохих заменят нейронки. А, соответственно, те, кому необходимо выполнение сложных задач, будут нанимать профессионалов высокого качества за большие деньги. То есть их станет меньше, но они будут цениться больше: грубо говоря, как художники после появления фотографии. Изображение реальности стало делом фотографов, но от этого художники цениться меньше не стали. Просто стали нужны хорошие мастера. И актеры озвучки будут нужны хорошие», — убеждена Полетаева.

Мошенники массово воруют голоса россиян. Как не стать их жертвой?
Мошенники массово воруют голоса россиян. Как не стать их жертвой?
Елена Кудашова
Подписывайтесь на нас в Telegramперейти
ВК49865