Голливуд в панике: что известно о ИИ-генераторе видео Veo 3 от Google
Не так давно Google представил новую версию своего ИИ-генератора видео Veo — Veo 3. По словам создателей, «безмолвная эра» генерации видео при помощи искусственного интеллекта подходит к концу. Разбираемся, что это за нейросеть и в чем ее особенности.
Что известно о Veo 3
Кажется, режиссерам и монтажерам придется подвинуться, потому что скоро мы будем смотреть фильмы, полностью сгенерированные искусственным интеллектом. Или нет.
Как работает Veo 3
Для Veo 3 можно написать инструкцию (детальный промт) с описанием персонажей и окружающей их обстановки, а также предложить для них диалог с описанием того, как он должен звучать. После этого ИИ сам вставит аудиодорожку в создаваемый ролик. До этой нейросети часто использовалась Sora от OpenAI. Она создавала короткие ролики из текста, изображений и даже других видео, но без озвучки.
Veo 3 от Google DeepMind не «ломает» законы физики. Например, ее предшественники заставляли воду течь наверх, люди двигались неестественно и пугающе, а еще было невозможно читать надписи на вывесках.
Что нового в сравнении с Veo 2
Третья версия оказалась мощнее Veo 2. Там появились:
- большее разрешение при выводе в 4K;
- улучшенное соблюдение промптов (это означает более точные ответы на заданные инструкции);
- автоматическое добавление речи (диалоги и закадровый голос);
- встроенная функция генерации любых звуков.
В Veo 3 есть интересные фичи и для режиссеров, они обеспечат эффект реальных съемок:
- использование персонажей, сцен и стилей, указанных режиссером;
- сохранение их согласованности на протяжении всего видео;
- возможность управлять Veo с помощью точных инструкций для камеры и вести съемку по определенной схеме.
Как пользоваться Veo 3
К сожалению, пока Veo 3 Google доступна только в США. Для пользователей доступен английский язык, русский язык не поддерживается. А еще все ролики будут помечаться водяными знаками SynthID. Это необходимо для борьбы с дипфейками.
Стоимость использования Veo 3
- 100 генераций в месяц — $20 (цена подписки Google AI Pro);
- сверх 100 генераций плюс дополнительные опции — $250 (стоимость подписки Google AI Ultra).
Что такое Flow
Наряду с Veo 3 Google также показала инструмент Flow, который помогает создавать кинематографические ролики. Этот механизм разработан для Veo и других самых продвинутых моделей Google DeepMind: Imagen и Gemini.
Реакция на Veo 3
Пользователи называют качество роликов, сгенерированных Veo 3 от Google DeepMind, голливудским. Однако сами режиссеры пока неохотно комментируют технологическую новинку, возможно, не воспринимая ее всерьез.
Однако Google при разработке Veo 3 объединил усилия с кинорежиссером и сценаристом Дарреном Аронофски и кинематографистом Элизой Макнитт. «Кинопроизводство всегда было связано с технологиями. После новаторского изобретения братьев Люмьер и Эдисона кинематографисты раскрыли силу повествования камер», — сказал Аронофски. «Более поздние технологические прорывы — звук, цвет, визуальные эффекты — позволили нам рассказывать истории способами, которые невозможно было использовать раньше. Сейчас самое время изучить эти новые инструменты для будущих работ», — считает известный режиссер.
А генеральный директор Brandtech Дэвид Джонс утверждает, что «благодаря такому изменению контроля и качества ранее невозможные идеи превращаются в реальный маркетинговый контент за считаные минуты» и видит в таких новинках путь к перестройке целой отрасли.