Российские разработчики представили алгоритм на основе сверточной нейросети, умеющий превращать статичные портреты в анимированное изображение. На Youtube-канале ученые выложили "ожившие" изображения русского классика Федора Достоевского, актрисы Мерлин Монро, физика Альберта Эйнштейна, Неизвестной с картины Ивана Крамского и Моны Лизы Леонардо да Винчи, передает Toppress.kz со ссылкой на "Новости литературы".
Созданная система, снимая маску с лица человека на отдельных кадрах из видео, переносит их на отдельные изображения лиц, причем алгоритм может работать даже с одиночным изображением, в том числе с портретами.
Задачу переноса информации с видео на статичное изображение упростили разработчики из "Samsung" и "Сколково" под руководством Егора Захарова. В основе их подхода — алгоритм, обученный на большом количестве кадров, которые содержат лица людей. На каждое лицо на таком кадре наложили специальную маску, обозначающую границы и базовую мимику. То, как такая маска соотносится с исходным кадром, хранится в виде вектора, данные из которого используют для того, чтобы наложить отдельную маску на изображение человека, после чего готовое изображение сравнивается с ground truth.
Эта модель позволила разработчикам перенести информацию между двумя объектами при помощи всего одного или нескольких кадров: для конечного продукта берут изображение-источник и изображение-цель, из которого формируют маску, которую потом накладывают на источник. При этом для этого нужно всего несколько кадров. Таким способом можно не только изменить мимику человека на портрете, но и превратить его в анимированное изображение.
В итоге у разработчиков получился алгоритм, достоверно переносящий информацию между изображениями. В результате можно создать из портрета "говорящую голову", причем для этого нет необходимости использовать большое количество примеров изображения-источника и изображения-цели.