технологии

В Китае ИИ-аватары заменяют стримеров. Неужели это выгодно и эффективно?

Компании поставили перед собой пугающую цель: к 2025 году они хотят создать как минимум 100 млн таких рабочих
Скриншот: technologyreview.com
Скриншот: technologyreview.com

Если прокрутить видеозаписи, транслируемые в четыре часа утра на Taobao, самой популярной китайской платформе электронной коммерции, можно обнаружить, что, невзирая на ранний час, стримеры оживленно демонстрируют товары перед камерами. Впрочем, делают они это круглосуточно. Дело в том, что почти все лица на экранах — ИИ-аватары. Разбираемся, как они работают и в чем их преимущество над людьми.

Разве делать ИИ-аватары не дорого?

Если вы не живете в Китае, вам будет трудно понять, насколько популярен формат прямых трансляций, во время которых блогеры обозревают какие-либо товары. Более 500 млн китайцев регулярно смотрят эти видео — в прошлом году они принесли продажи на сумму $4,6 трлн. То есть более четверти всех покупок, совершенных в Китае через Интернет, были оплачены с помощью трансляций.

Влиятельные люди на Taobao, Douyin (китайский TikTok) и других платформах всего за несколько часов заключают крупные сделки. Самые известные имена могут за одну ночь продать товаров более чем на 1 млрд долларов. Почему именно стриминг? Дело в том, что традиционные сайты для большинства покупателей кажутся просто полкой с товарами. В живых трансляциях между ведущим и зрителями закрепляется более эмоциональная связь. Но в то же время обучение ведущих этих трансляций, их удержание и изучение технических деталей вещания обходятся небольшим брендам очень дорого. Гораздо дешевле автоматизировать эту работу.

Многие стримеры на Taobao — ненастоящие. Это сгенерированные ИИ-клоны. По мере того, как технологии, позволяющие создавать реалистичные аватары, голоса и движения, становятся все более совершенными, популярность таких дипфейков резко возросла, особенно на китайских стриминговых платформах.

С 2022 года множество китайских стартапов и крупных технологических компаний предлагает услуги по созданию фейковых аватаров для стриминга. Затратив всего несколько минут видео и 1 тыс. долларов, бренды могут клонировать человека для круглосуточной работы.

Как создаются ИИ-аватары

Основанный в 2017 году в Нанкине стартап Silicon Intelligence специализируется на обработке естественного языка, в частности на технологиях преобразования текста в речь. Основатель и генеральный директор говорит, что компания впервые увидела потенциал ИИ в качестве инструмента для проведения прямых трансляций в 2020 году. Тогда Silicon Intelligence потребовалось 30 минут обучающего видео, чтобы создать цифрового клона, который мог бы говорить и вести себя как человек. В следующем году это заняло 10 минут, затем три, а сейчас требуется всего минута видео.

По мере совершенствования технологий услуги становятся все дешевле. Создание дипфейка обходится заказчику примерно в 8000 юаней ($1100). Если он хочет создать более сложного и способного стримера, цена возрастает до нескольких тыс. долларов. В стоимость входит годовое техническое обслуживание. После создания аватара его рот и тело двигаются в такт со звуком, записанным в сценарии. Но и здесь работа ИИ не заканчивается: если раньше сценарии писались людьми, то теперь компании используют для их генерации большие языковые модели. Более продвинутая версия технологии способна распознавать комментарии в прямом эфире и находить подходящие ответы в своей базе данных, чтобы отвечать на них в режиме реального времени. Таким образом, создается впечатление, что ИИ-стример активно общается с аудиторией.

ИИ-клоны обучаются распространенным сценариям и жестам, которые можно увидеть в видеороликах, посвященных электронной коммерции. Компания располагает базой данных, содержащей около сотни заранее разработанных движений. Например, когда человек говорит «Добро пожаловать на мой канал», он направляет палец вверх, поскольку именно там находится кнопка «Подписаться» на экране большинства мобильных приложений. Аналогичным образом, когда стримеры представляют новый продукт, они указывают вниз — на корзину, где зрители могут найти товары. ИИ-клоны воспроизводят все эти распространенные приемы. Компании не хотят, чтобы дипфейк призывал подписаться на канал и при этом хлопал в ладоши. Как минимум для китайцев это будет выглядеть странно.

В 2020 году появилась аналогичная компания — Xiaoice, — которая нацелилась на создание более человекоподобного ИИ, в частности, аватаров, способных проявлять эмоции. В прошлом году Xiaoice провела пилотное тестирование с несколькими клиентами, а в этом официально запустила услугу по созданию цифровых клонов стоимостью менее $1000. Как и Silicon Intelligence, Xiaoice требует от стримеров одноминутное видео о себе. Но их деятельность не ограничивается электронной коммерцией. Например, Лю Цзяньхун, китайский спортивный диктор, во время чемпионата мира по футболу 2022 года сделал клон самого себя, чтобы зачитывать результаты матчей и другие важные новости на Douyin.

Сгенерированные стримеры не смогут превзойти звезд электронной коммерции, но достаточно хороши, чтобы заменить стримеров среднего уровня. Создатели-люди, в том числе те, кто использовал свои видеоролики для обучения клонов ИИ, уже ощущают давление со стороны цифровых конкурентов. По данным аналитической компании iiMedia Research, в этом году стало сложнее устроиться на работу в качестве ведущего онлайн-трансляций в электронной коммерции, а средняя зарплата ведущих в Китае снизилась на 20% по сравнению с 2022 годом. И немудрено. Виртуальный стример может заменить шесть или семь человек, которые вносят меньший вклад и имеют более низкие показатели ROI (окупаемость инвестиций).

В чем ИИ-аватары уступают живым

На самом деле мало в чем. Например, многие из клиентов, — это мебельные бренды, и хотя ИИ достаточно умен, чтобы говорить и использовать жесты, он не может сесть на диван или лечь в кровать, поэтому стримы не имеют той привлекательности, которая присуща реальным пользователям, тестирующим продукцию. Но для некоторых это не препятствие.

ИИ не сможет делать все то, что умеет человек-стример, особенно тестировать продукты в реальном времени, отвечая на вопросы аудитории, но это подходит компаниям, которые просто хотят пробиться на новый рынок и потратить не слишком много денег. Все-таки ИИ обходится гораздо дешевле, чем содержание реального человека в штате.

Технологии продолжают развиваться. Следующим шагом Silicon Intelligence будет добавление эмоционального интеллекта к ИИ-стримерам. Например, в случае оскорбительных комментариев ведущий будет грустить, а если товары хорошо продаются, — радоваться. Компания также работает над тем, чтобы ИИ-стримеры взаимодействовали и учились друг у друга.

Анастасия Дегтярева