технологии

Голливуд в панике: что известно о ИИ-генераторе видео Veo 3 от Google

Алгоритм создает озвучку без дополнительных подсказок, понимая содержание ролика
Кадр из видео, сгенерированного Veo3 / https://deepmind.google/models/veo/
Кадр из видео, сгенерированного Veo3 / https://deepmind.google/models/veo/

Не так давно Google представил новую версию своего ИИ-генератора видео Veo — Veo 3. По словам создателей, «безмолвная эра» генерации видео при помощи искусственного интеллекта подходит к концу. Разбираемся, что это за нейросеть и в чем ее особенности.

Что известно о Veo 3

Кажется, режиссерам и монтажерам придется подвинуться, потому что скоро мы будем смотреть фильмы, полностью сгенерированные искусственным интеллектом. Или нет.

Как работает Veo 3

Для Veo 3 можно написать инструкцию (детальный промт) с описанием персонажей и окружающей их обстановки, а также предложить для них диалог с описанием того, как он должен звучать. После этого ИИ сам вставит аудиодорожку в создаваемый ролик. До этой нейросети часто использовалась Sora от OpenAI. Она создавала короткие ролики из текста, изображений и даже других видео, но без озвучки.

Veo 3 от Google DeepMind не «ломает» законы физики. Например, ее предшественники заставляли воду течь наверх, люди двигались неестественно и пугающе, а еще было невозможно читать надписи на вывесках.

Кадр из видео, сгенерированного Veo3 / https://deepmind.google/models/veo/
Кадр из видео, сгенерированного Veo3 / https://deepmind.google/models/veo/

Что нового в сравнении с Veo 2

Третья версия оказалась мощнее Veo 2. Там появились:

  • большее разрешение при выводе в 4K;
  • улучшенное соблюдение промптов (это означает более точные ответы на заданные инструкции);
  • автоматическое добавление речи (диалоги и закадровый голос);
  • встроенная функция генерации любых звуков.

В Veo 3 есть интересные фичи и для режиссеров, они обеспечат эффект реальных съемок:

  • использование персонажей, сцен и стилей, указанных режиссером;
  • сохранение их согласованности на протяжении всего видео;
  • возможность управлять Veo с помощью точных инструкций для камеры и вести съемку по определенной схеме.

Как пользоваться Veo 3

К сожалению, пока Veo 3 Google доступна только в США. Для пользователей доступен английский язык, русский язык не поддерживается. А еще все ролики будут помечаться водяными знаками SynthID. Это необходимо для борьбы с дипфейками.

Кадр из видео, сгенерированного Veo3 / https://deepmind.google/models/veo/
Кадр из видео, сгенерированного Veo3 / https://deepmind.google/models/veo/

Стоимость использования Veo 3

  • 100 генераций в месяц — $20 (цена подписки Google AI Pro);
  • сверх 100 генераций плюс дополнительные опции — $250 (стоимость подписки Google AI Ultra).

Что такое Flow

Наряду с Veo 3 Google также показала инструмент Flow, который помогает создавать кинематографические ролики. Этот механизм разработан для Veo и других самых продвинутых моделей Google DeepMind: Imagen и Gemini.

Кадр из видео, сгенерированного Veo3 / https://deepmind.google/models/veo/
Кадр из видео, сгенерированного Veo3 / https://deepmind.google/models/veo/

Реакция на Veo 3

Пользователи называют качество роликов, сгенерированных Veo 3 от Google DeepMind, голливудским. Однако сами режиссеры пока неохотно комментируют технологическую новинку, возможно, не воспринимая ее всерьез.

Однако Google при разработке Veo 3 объединил усилия с кинорежиссером и сценаристом Дарреном Аронофски и кинематографистом Элизой Макнитт. «Кинопроизводство всегда было связано с технологиями. После новаторского изобретения братьев Люмьер и Эдисона кинематографисты раскрыли силу повествования камер», — сказал Аронофски. «Более поздние технологические прорывы — звук, цвет, визуальные эффекты — позволили нам рассказывать истории способами, которые невозможно было использовать раньше. Сейчас самое время изучить эти новые инструменты для будущих работ», — считает известный режиссер.

А генеральный директор Brandtech Дэвид Джонс утверждает, что «благодаря такому изменению контроля и качества ранее невозможные идеи превращаются в реальный маркетинговый контент за считаные минуты» и видит в таких новинках путь к перестройке целой отрасли.

Анастасия Макарова
ВК49865