📄Работа №215569

Тема: Анимация лица по эталонному видеопотоку с применением генеративно-состязательной нейронной сети

📝
Тип работы Дипломные работы, ВКР
📚
Предмет информатика
📄
Объем: 51 листов
📅
Год: 2022
👁️
Просмотров: 14
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание

АННОТАЦИЯ 2
ВВЕДЕНИЕ 7
1 СУЩЕСТВУЮЩИЕ ТЕХНОЛОГИИ ГЕНЕРИРОВАНИЯ
ВИДЕОПОТОКА ПО ШАБЛОНУ ИЗОБРАЖЕНИЯ 9
1.1 Технологии анимации движений человека 9
1.2 Нейронные сети, генерирующие анимацию лица человека 13
1.3 Сервисы для генерации анимации лица человека 15
1.4 Выводы по разделу 18
2 ЗАДАЧА АНИМАЦИИ ЛИЦА 20
2.1 Постановка задачи анимации лица и подготовка исходных данных
для проведения экспериментов 20
2.2 Архитектура нейронной сети 21
2.2.1 Классический вариант генеративно-состязательной сети 21
2.2.2 Многослойная сверточная нейронная сеть 23
2.2.3 Сверточная нейронная сеть U-Net 24
2.2.4 Архитектура нейронной сети SAFA 26
2.3 Обучение и оценка сети 29
2.4 Архитектура для повышения качества анимации 36
2.5 Выводы по разделу 38
3 МЕТОД ПОСТОБРАБОТКИ ДЛЯ УЛУЧШЕНИЯ КАЧЕСТВА
ВИДЕОПОТОКА 39
3.1 Разработка предложенного метода постобработки 39
3.1.1 Средства для разработки 39
3.1.2 Разработка алгоритма разделения видеопотока на кадры 40
3.1.3 Разработка алгоритма объединения кадров в видеопоток 42
3.2 Выводы по разделу 43
4 ЭКСПЕРЕМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ ПРЕДЛОЖЕННОГО
МЕТОДА 45
4.1 Методика эксперимента 45
4.2 Полученные результаты проведенных экспериментов 47
4.3 Выводы по разделу 49
ЗАКЛЮЧЕНИЕ 50
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 51

📖 Введение

Анимация лица применяется в таких проектах, как кино, видеоигры и других подобных медиа проектах. Существует несколько способов анимирования лица, к ним относятся ручная анимация, захват движения с помощью специальных датчиков, так называемые маркерные системы, и захват движения без использования этих датчиков, так называемые безмаркерные системы [9].
Ручной анимацией в современном времени уже практически не пользуются, потому что, чтобы анимировать 1 секунду движения, нужно нарисовать около 24 кадров движения. При этом эти кадры должны быть логичны и последовательны, переходы между ними не должны вызывать чувства чужеродности, и движения в этих кадрах должны выглядеть натурально. Если говорить о часовой анимации, то такую работу уже практически невозможно выполнить [5]. Это слишком дорогостояще, поэтому в двадцатом веке начали развиваться технологии автоматической анимации. Хотя в последствии была разработана фотоперекладка, но это позволило только передать реалистичность движений, время на такую анимацию по-прежнему тратиться очень много [2].
Преимуществом маркерной системы является высокое качество итогового продукта. При этом стоимость таких систем может доходить до 250 000 долларов. Такие системы обычно арендуются, а не покупаются [4]. Они применяются в высокобюджетных проектах и совершенно не подходят для маленьких компаний.
По сравнению с маркерными системами, безмаркерные как правило основываются на системах компьютерного зрения, из-за чего могут страдать от низкого разрешения, низкой частоты кадров и тому подобное Большинство таких систем не подходят для производства медиа проектов, поэтому к ним частично добавляются компоненты маркерной системы [21]. Цена таких гибридных систем может доходить до 3000 евро. Такие расценки
уже подходят для маленьких компаний, но по-прежнему являются достаточно дорогостоящими для личного использования.
Для решения задачи безмаркерного захвата движения хорошо подходят технологии генеративно-состязательных нейронных сетей. В последние годы эта область достаточно сильно расширилась, потому стали возможны исследования в области полностью безмаркерного захвата движения. Уже существуют открытые технологии для генерации анимации лица и замены лица на фото и видео материалах. Однако данные технологии зачастую страдают от помех в кадре, низкого разрешения, низкой частоты кадров и тому подобное [14, 15, 19, 22].
Но даже с учетом всех улучшений в плане удобства использования захвата движения, эта технология по-прежнему сковывает движения актеров и заставляет по нескольку раз снимать одну и ту же сцену, чтобы захватить движения разных актеров [3]. Из-за всех недостатков современных полностью безмаркерных систем захвата движения исследования в этой области являются актуальными в современных реалиях.
Целью данной работы является улучшение качества генерирования анимации лица. Для достижения данной цели необходимо решить следующие задачи.
1. Исследование существующих подходов для решения задачи анимации лица.
2. Подборка набора данных для проведения исследований.
3. Разработка математической модели искусственной нейронной сети.
4. Оценка качества модели на экспериментальных данных.

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

Цель данной работы заключалась в имплементации метода генерации анимации лица и разработке его последующего улучшения. Для достижения данной цели были поставлены следующие задачи:
– рассмотрение существующих подходов для анимации лица;
– подбор данных для проведения исследований;
– разработка математической модели искусственной нейронной сети;
– проведение экспериментальных исследований.
Рассмотрение существующих технологий для генерации анимации лица показало, что на данный момент существуют.
1. Технологии захвата движения – очень дорогие, но в то же время очень качественные.
2. Сугубо узконаправленные технологии – например, Microsoft Kinect, используемая как игровой контроллер.
3. Нейросетевые подходы – не очень качественные, но активно развивающиеся технологии.
Для достижения цели работы был выбран нейросетевой подход, а именно исследовалась архитектура генеративно-состязательной нейронной сети SAFA. Была имплементирована данная архитектура и был разработан модуль постобработки для этой архитектуры. Помимо этого были проведены исследования качества этого модуля, которые показали, что предложенный метод очень хорошо восстанавливает детали лица в анимации.
Также исследования показали, что когерентность и реалистичность кадров генерируемой анимации по-прежнему очень слабы. Данные недостатки можно исправить в дальнейших работах.

Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

1 Галушкин, А. И. Синтез многослойных систем распознавания образов / А. И. Галушкин. – Москва: Энергия, 1974. – 368 с.
2 Коноплев, Б. Н. Основы фильмопроизводства / Б. Н. Коноплев, В. С. Богатова. – Москва: «Искусство», 1975. – 448 с.
3 Кубрак, Н. Как работает Motion Capture: эволюция и закулисье / Н. Кубрак // DTF. – 2020. – URL: https://dtf.ru/cinema/109583-kak-rabotaet- motion-capture-evolyuciya-i-zakulise (дата обращения: 07.02.2022).
4 Олефиренко, Д. Motion Capture: про движение / Д. Олефиренко // Хабр. – 2015. – URL: https://habr.com/ru/company/plarium/blog/366803/ (дата обращения: 06.02.2022).
5 Солин, А. И. Задумать и нарисовать мультфильм / А. И. Солин, И. А. Пшеничная. – Москва: ВГИК, 2014. – 300 с.
6 Brunet, D. On the Mathematical Properties of the Structural Similarity Index / D. Brunet, J. Vass, E. R. Vrscay, Z. Wang // IEEE Transactions on Image Processing. – 2012. – V. 21, № 4. – P. 2324–2328. – URL:
https://ece.uwaterloo.ca/~z70wang/publications/TIP_SSIM_MathProperties.pdf (дата обращения: 11.02.2022).
7 Bulat, A. How far are we from solving the 2D & 3D Face Alignment problem? (and a dataset of 230,000 3D facial landmarks) / A. Bulat, G. Tzimiropoulos // arXiv. – 2017. – URL: https://arxiv.org/abs/1703.07332 (дата обращения: 11.02.2022).
8 Deng, J. ArcFace: Additive Angular Margin Loss for Deep Face Recognition / J. Deng, J. Guo, N. Xue, S. Zafeiriou // arXiv. – 2019. – URL: https://arxiv.org/abs/1801.07698 (дата обращения: 11.02.2022).
9 Katsu, Y. Simultaneous tracking and balancing of humanoid robots for imitating human motion capture data / Y. Katsu, J. K. Hodgins // 2009 IEEE/RSJ International Conference on Intelligent Robots and Systems. – 2009. –
P. 2510–2517. – URL: http://vigir.missouri.edu/~gdesouza/Research/
Conference_CDs/IEEE_IROS_2009/papers/0095.pdf (дата обращения: 06.02.2022).
10 Kingma, D. P. Adam: A Method for Stochastic Optimization / D. P. Kingma, J. Ba // arXiv. – 2014. – URL: https://arxiv.org/abs/1412.6980 (дата обращения: 11.02.2022).
11 Krause, E. F. Taxicab Geometry: An Adventure in Non-Euclidean Geometry / E. F. Krause. – Dover Publications, 1986. – 88 p.
12 Li, Tianye. Learning a model of facial shape and expression from {4D} scans / Tianye Li, T. Bolkart, M. J. Black, Hao Li, J. Romero // ACM Transactions on Graphics, (Proc. SIGGRAPH Asia). – 2017. – URL: https://doi.org/10.1145/ 3130800.3130813 (дата обращения: 11.04.2022).
13 Oriani, E. A quick PSNR/SSIM analyzer for Linux: [сайт]. – URL: http://qpsnr.youlink.org/ (дата обращения: 11.02.2022).
14 Pumarola, A. GANimation: Anatomically-aware Facial Animation from a Single Image / A. Pumarola, A. Agudo, A. M. Martinez, A. Sanfeliu, F. Moreno- Noguer // arXiv. – 2018. – URL: https://arxiv.org/abs/1807.09251 (дата обращения: 06.02.2022).
15 Wang, Qiulin. SAFA: Structure Aware Face Animation / Qiulin Wang, Lu Zhang, Bo Li // arXiv. – 2021. – URL: https://arxiv.org/abs/2111.04928 (дата обращения: 06.02.2022)..22

🖼 Скриншоты

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.

©2026 Cервис помощи студентам в выполнении работ