Исследователи сделали прорыв на пути к созданию реалистичного синтезированного видео. Команда ученых из Германии, Франции, Великобритании и США использовала искусственный интеллект для переноса наклона головы, мимики, движений глаз человека из одного видео в другое.
Результат работы нейронной сети выглядит очень реалистично и убедительно. Суть проста: человек находится перед камерой и повторяет определенный набор мимических выражений и артикулирует фразы. Искусственный интеллект анализирует данные и переносит их в другое видео – заснятый на нем человек начинает в точности повторять те же самые движения, слова и наклон головы.
Нейронной сети, созданной исследователями, нужно всего лишь несколько минут для обработки полученного видео, затем она переносит и синхронизирует данные с целевым видеофайлом. Система может даже манипулировать некоторыми фоновыми тенями, когда это необходимо. Синтезированный результат почти неотличим от исходного файла.
Команда сравнивает свой метод с рядом подобных исследований, в том числе – с прошлогодним. Тогда разработчики использовали нейронную сеть для манипулирования существующим видео, синхронизируя его с различными аудиозаписями. Новый же метод делает артикуляцию и выражения лиц более реалистичными и точными.
Ученые, занимающиеся проектом, отмечают, что эта нейронная сеть будет полезна для VR, производства фильмов и постпродакшна в целом. Но совершенно очевидно, что использовать систему можно и с недобрыми намерениями: в информационных войнах, для морального насилия, при создании фейковых новостей и в других целях.
«Я знаю об этических последствиях подобных разработок, – отметил Юстус Тейс, один из исследователей проекта. – Это одна из причин, по которой мы опубликовали результаты. Я думаю, очень важно, чтобы люди узнавали о том, как их мнением могут манипулировать».
Работа будет представлена на ежегодной конференции SIGGRAPH, которая состоится в августе.