Google представила технологию создания цифровых двойников для нейросетевых видео


Опубликовано 20.05.2026 | Автор: kmveg

0

Google представила технологию создания цифровых двойников для нейросетевых видео

Google Labs значительно обновила сервис Flow, предназначенный для генерации и редактирования контента с помощью искусственного интеллекта. Ключевым нововведением стала функция «аватар», которая позволяет пользователям создавать свои детализированные цифровые копии и интегрировать их в любые видеоролики, сгенерированные нейросетью. По словам вице-президента по управлению продуктами Google Labs Элиаса Романа, инструмент ориентирован на авторов контента, которые хотят присутствовать в кадре, не прибегая к реальным съемкам.

Технологическая основа и возможности модели Omni Flash

В основе обновленного сервиса лежит новая модель Omni Flash, пришедшая на смену предыдущей разработке под названием Veo. Новинка существенно улучшила детализацию видео и решила проблему искажения персонажей при последовательной генерации кадров. В отличие от ранних версий Flow, Omni Flash позволяет сохранять внешность героя неизменной на протяжении всего ролика, даже при смене планов и ракурсов.

Разработка Flow является частью стратегии Google по внедрению «ИИ-агентов» — автоматизированного программного обеспечения для выполнения задач — и популяризации метода создания функций с помощью простых текстовых запросов на естественном языке. Теперь пользователи могут задавать единые инструкции для целой серии видео и автоматически сортировать похожие клипы по папкам.

Процесс создания цифрового клона

Процедура настройки аватара напоминает создание биометрического профиля. В обзоре технологии отмечается, что процесс состоит из нескольких этапов:

  • Пользователь сканирует QR-код в настройках своего аккаунта через смартфон.
  • Система просит записать видео, на котором необходимо произнести последовательность чисел.
  • Для захвата всех особенностей внешности требуется поворачивать голову под разными углами.

Данная технология обеспечивает высокую точность воспроизведения не только визуального образа, но и голоса. В ходе тестирования было продемонстрировано, как цифровая копия человека может произносить текст на фоне анимированного изображения, при этом пользователь может мгновенно менять детали окружения или одежду персонажа с помощью текстовых команд, не перезаписывая исходные данные.

Безопасность и конкуренция на рынке ИИ

В вопросах этики и безопасности Google придерживается строгих правил: на начальном этапе создавать ИИ-версии можно только для самих себя, а не для третьих лиц. Все видеоматериалы, созданные с помощью модели Omni Flash, помечаются специальными цифровыми водяными знаками SynthID, которые позволяют идентифицировать контент как созданный искусственным интеллектом.

Аналогичные решения развивают и другие крупные технологические компании. Например, корпорация Meta* ранее представила функции для Instagram*, позволяющие автоматически переводить видеоролики на другие языки с коррекцией движения губ под произносимые звуки. Подобные инструменты также внедряются в YouTube Shorts.

Несмотря на то что ИИ-инструменты упрощают производство контента, эксперты указывают на поляризацию мнений среди зрителей. Часть аудитории воспринимает такие ролики как недостаточно искренние, что заставляет платформы искать баланс между технологическим прогрессом и сохранением доверия пользователей.

* — деятельность компании запрещена на территории РФ




Comments are closed.

Наверх ↑
  • Категории
    • Болезни и вредители (36)
    • Новости (2685)
    • Полезные свойства и вред (33)
    • Садовый инвентарь (18)
    • Удобрения (33)
    • Цветы (36)
  • Свежие статьи
  • Свежие комментарии
  • Товары для дачи