Тема: Анимация лица по эталонному видеопотоку с применением генеративно-состязательной нейронной сети
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
ВВЕДЕНИЕ 7
1 СУЩЕСТВУЮЩИЕ ТЕХНОЛОГИИ ГЕНЕРИРОВАНИЯ
ВИДЕОПОТОКА ПО ШАБЛОНУ ИЗОБРАЖЕНИЯ 9
1.1 Технологии анимации движений человека 9
1.2 Нейронные сети, генерирующие анимацию лица человека 13
1.3 Сервисы для генерации анимации лица человека 15
1.4 Выводы по разделу 18
2 ЗАДАЧА АНИМАЦИИ ЛИЦА 20
2.1 Постановка задачи анимации лица и подготовка исходных данных
для проведения экспериментов 20
2.2 Архитектура нейронной сети 21
2.2.1 Классический вариант генеративно-состязательной сети 21
2.2.2 Многослойная сверточная нейронная сеть 23
2.2.3 Сверточная нейронная сеть U-Net 24
2.2.4 Архитектура нейронной сети SAFA 26
2.3 Обучение и оценка сети 29
2.4 Архитектура для повышения качества анимации 36
2.5 Выводы по разделу 38
3 МЕТОД ПОСТОБРАБОТКИ ДЛЯ УЛУЧШЕНИЯ КАЧЕСТВА
ВИДЕОПОТОКА 39
3.1 Разработка предложенного метода постобработки 39
3.1.1 Средства для разработки 39
3.1.2 Разработка алгоритма разделения видеопотока на кадры 40
3.1.3 Разработка алгоритма объединения кадров в видеопоток 42
3.2 Выводы по разделу 43
4 ЭКСПЕРЕМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ ПРЕДЛОЖЕННОГО
МЕТОДА 45
4.1 Методика эксперимента 45
4.2 Полученные результаты проведенных экспериментов 47
4.3 Выводы по разделу 49
ЗАКЛЮЧЕНИЕ 50
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 51
📖 Введение
Ручной анимацией в современном времени уже практически не пользуются, потому что, чтобы анимировать 1 секунду движения, нужно нарисовать около 24 кадров движения. При этом эти кадры должны быть логичны и последовательны, переходы между ними не должны вызывать чувства чужеродности, и движения в этих кадрах должны выглядеть натурально. Если говорить о часовой анимации, то такую работу уже практически невозможно выполнить [5]. Это слишком дорогостояще, поэтому в двадцатом веке начали развиваться технологии автоматической анимации. Хотя в последствии была разработана фотоперекладка, но это позволило только передать реалистичность движений, время на такую анимацию по-прежнему тратиться очень много [2].
Преимуществом маркерной системы является высокое качество итогового продукта. При этом стоимость таких систем может доходить до 250 000 долларов. Такие системы обычно арендуются, а не покупаются [4]. Они применяются в высокобюджетных проектах и совершенно не подходят для маленьких компаний.
По сравнению с маркерными системами, безмаркерные как правило основываются на системах компьютерного зрения, из-за чего могут страдать от низкого разрешения, низкой частоты кадров и тому подобное Большинство таких систем не подходят для производства медиа проектов, поэтому к ним частично добавляются компоненты маркерной системы [21]. Цена таких гибридных систем может доходить до 3000 евро. Такие расценки
уже подходят для маленьких компаний, но по-прежнему являются достаточно дорогостоящими для личного использования.
Для решения задачи безмаркерного захвата движения хорошо подходят технологии генеративно-состязательных нейронных сетей. В последние годы эта область достаточно сильно расширилась, потому стали возможны исследования в области полностью безмаркерного захвата движения. Уже существуют открытые технологии для генерации анимации лица и замены лица на фото и видео материалах. Однако данные технологии зачастую страдают от помех в кадре, низкого разрешения, низкой частоты кадров и тому подобное [14, 15, 19, 22].
Но даже с учетом всех улучшений в плане удобства использования захвата движения, эта технология по-прежнему сковывает движения актеров и заставляет по нескольку раз снимать одну и ту же сцену, чтобы захватить движения разных актеров [3]. Из-за всех недостатков современных полностью безмаркерных систем захвата движения исследования в этой области являются актуальными в современных реалиях.
Целью данной работы является улучшение качества генерирования анимации лица. Для достижения данной цели необходимо решить следующие задачи.
1. Исследование существующих подходов для решения задачи анимации лица.
2. Подборка набора данных для проведения исследований.
3. Разработка математической модели искусственной нейронной сети.
4. Оценка качества модели на экспериментальных данных.
✅ Заключение
– рассмотрение существующих подходов для анимации лица;
– подбор данных для проведения исследований;
– разработка математической модели искусственной нейронной сети;
– проведение экспериментальных исследований.
Рассмотрение существующих технологий для генерации анимации лица показало, что на данный момент существуют.
1. Технологии захвата движения – очень дорогие, но в то же время очень качественные.
2. Сугубо узконаправленные технологии – например, Microsoft Kinect, используемая как игровой контроллер.
3. Нейросетевые подходы – не очень качественные, но активно развивающиеся технологии.
Для достижения цели работы был выбран нейросетевой подход, а именно исследовалась архитектура генеративно-состязательной нейронной сети SAFA. Была имплементирована данная архитектура и был разработан модуль постобработки для этой архитектуры. Помимо этого были проведены исследования качества этого модуля, которые показали, что предложенный метод очень хорошо восстанавливает детали лица в анимации.
Также исследования показали, что когерентность и реалистичность кадров генерируемой анимации по-прежнему очень слабы. Данные недостатки можно исправить в дальнейших работах.





