Опубликовано 20.05.2026 | Автор: kmveg

Google представила технологию создания цифровых двойников для нейросетевых видео

Google Labs значительно обновила сервис Flow, предназначенный для генерации и редактирования контента с помощью искусственного интеллекта. Ключевым нововведением стала функция «аватар», которая позволяет пользователям создавать свои детализированные цифровые копии и интегрировать их в любые видеоролики, сгенерированные нейросетью. По словам вице-президента по управлению продуктами Google Labs Элиаса Романа, инструмент ориентирован на авторов контента, которые хотят присутствовать в кадре, не прибегая к реальным съемкам.

Технологическая основа и возможности модели Omni Flash

В основе обновленного сервиса лежит новая модель Omni Flash, пришедшая на смену предыдущей разработке под названием Veo. Новинка существенно улучшила детализацию видео и решила проблему искажения персонажей при последовательной генерации кадров. В отличие от ранних версий Flow, Omni Flash позволяет сохранять внешность героя неизменной на протяжении всего ролика, даже при смене планов и ракурсов.

Разработка Flow является частью стратегии Google по внедрению «ИИ-агентов» — автоматизированного программного обеспечения для выполнения задач — и популяризации метода создания функций с помощью простых текстовых запросов на естественном языке. Теперь пользователи могут задавать единые инструкции для целой серии видео и автоматически сортировать похожие клипы по папкам.

Процесс создания цифрового клона

Процедура настройки аватара напоминает создание биометрического профиля. В обзоре технологии отмечается, что процесс состоит из нескольких этапов:

Пользователь сканирует QR-код в настройках своего аккаунта через смартфон.
Система просит записать видео, на котором необходимо произнести последовательность чисел.
Для захвата всех особенностей внешности требуется поворачивать голову под разными углами.

Данная технология обеспечивает высокую точность воспроизведения не только визуального образа, но и голоса. В ходе тестирования было продемонстрировано, как цифровая копия человека может произносить текст на фоне анимированного изображения, при этом пользователь может мгновенно менять детали окружения или одежду персонажа с помощью текстовых команд, не перезаписывая исходные данные.

Безопасность и конкуренция на рынке ИИ

В вопросах этики и безопасности Google придерживается строгих правил: на начальном этапе создавать ИИ-версии можно только для самих себя, а не для третьих лиц. Все видеоматериалы, созданные с помощью модели Omni Flash, помечаются специальными цифровыми водяными знаками SynthID, которые позволяют идентифицировать контент как созданный искусственным интеллектом.

Аналогичные решения развивают и другие крупные технологические компании. Например, корпорация Meta* ранее представила функции для Instagram*, позволяющие автоматически переводить видеоролики на другие языки с коррекцией движения губ под произносимые звуки. Подобные инструменты также внедряются в YouTube Shorts.

Несмотря на то что ИИ-инструменты упрощают производство контента, эксперты указывают на поляризацию мнений среди зрителей. Часть аудитории воспринимает такие ролики как недостаточно искренние, что заставляет платформы искать баланс между технологическим прогрессом и сохранением доверия пользователей.

* — деятельность компании запрещена на территории РФ

Comments are closed.