Тема: ТЕХНОЛОГИЯ ЗАХВАТА ДВИЖЕНИЙ И МИМИКИ ЛИЦА С ПОМОЩЬЮ НЕЙРОННОЙ СЕТИ
Характеристики работы
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
ВВЕДЕНИЕ 5
1. МЕТОДЫ ЗАХВАТА ДВИЖЕНИЙ И МИМИКИ ЛИЦА 7
1.1. Этапы захвата движений 7
1.2. Определение ключевых точек лица человека на изображении 8
1.2.1. Ранние алгоритмы обнаружения лицевых ориентиров 9
1.2.2. Поиск лицевых ориентиров с помощью ансамбля деревьев
решений 19
1.2.3. Многозадачные каскадные сверточные сети (Multi-task Cascaded
Convolutional Networks) 23
1.2.4. Практичный детектор лицевых ориентиров (Practical Facial
Landmark Detector) 26
1.2.5. Агрегированная по стилям сеть (Style Aggregated Network) .... 28
1.3. Способы переноса мимики в цифровую трехмерную модель 30
1.3.1. Морфируемая модель для синтеза трехмерных лиц (A Morphable
Model For The Synthesis Of 3D Faces) 30
1.3.2. Реконструкция персонализированных черт для лица из
монокулярного видео (Reconstruction of Personalized 3D Face Rigs from Monocular Video) 32
1.3.3. Комбинированная динамическая 3D модель выражений
(Combined dynamic 3D expression model) 34
1.3.4. Метод совмещения детектирования и реконструкции 36
1.4. Выводы по первой главе 39
2. ЗАХВАТ ДВИЖЕНИЙ И МИМИКИ ЛИЦА С ПОМОЩЬЮ НЕЙРОННОЙ
СЕТИ И ПОСЛЕДУЮЩАЯ ИХ РЕКОНСТРУКЦИЯ 41
2.1. Постановка задачи поиска ориентиров на лице человека 41
2.1.1. Архитектура нейронной сети 42
2.1.2. Подготовка данных 43
2.1.3. Метрики качества 45
2.1.4. Функции активации 47
2.1.5. Функция потерь 49
2.1.6. Операция свертки 51
2.1.7. Операция субдискретизации (пулинга) 53
2.1.8. Метод оптимизации функции потерь 54
2.1.9. Метод обратного распространения ошибки 56
2.2. Постановка задачи трехмерной реконструкции лица 59
2.2.1. Общее описание метода 60
2.2.2. Установление проективного соответствия, регистрация данных 60
2.2.3. Вычисление векторов смещений для ключевых вершин 62
2.2.4. Интерполирование векторов смещений для остальных вершин 63
2.3. Выводы по второй главе 65
3. РЕАЛИЗАЦИЯ МОДЕЛЕЙ И ПРОВЕРКА НА ТЕСТОВЫХ ДАННЫХ ... 66
3.1. Конфигурация нейронной сети 66
3.2. Алгоритмы обучения и тестирования нейронной сети 67
3.3. Результаты обучения, полученные метрики 71
3.4. Тестирование алгоритма реконструкции 74
3.5. Выводы по третьей главе 76
ЗАКЛЮЧЕНИЕ 78
ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ 80
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 81
📖 Аннотация
📖 Введение
Выделяют два основных вида mo-cap технологий: Body Motion Capture - применяется для захвата положения тела в пространстве, переноса физики движений актёра на трехмерную модель, и Facial Motion Capture (FMC) - используется для оценки эмоций, мимики лица человека и создания лицевой анимации. С помощью FMC были получены такие персонажи как Голлум из трилогии Властелин колец, герои блокбастера Аватар, Волан-де-Морт в серии Гарри Поттер, дракон Смауг в фильмах Хоббит и многие другие.
Также системы Motion Capture разделяют по подходу к фиксации движений: на маркерную и безмаркерную системы.
Для маркерной системы используется специальная аппаратура, костюм с датчиками, комплекс из камер, на лицо наносят маркеры, для захвата мимики. Данные полученные с оборудования сводятся в общую трехмерную модель, максимально точно воспроизводя движения актёра, на основе которой создаётся анимация персонажа.
Безмаркерная технология базируется на технологиях компьютерного зрения. Актёру не требуется носить специализированные костюмы, нет рисков повредить датчики и маркеры, для фиксации движений достаточно одной камеры. Благодаря росту производительности вычислительной техники, и научному прогрессу растёт качество технологий компьютерного зрения, а с ними развиваются и технологии захвата движений. Несмотря на то что технология исследуется достаточно длительное время, регулярно появляются новые разработки.
Исходя из высокой применимости и не совершенности текущих безмаркерных Motion Capture систем задача захвата и оцифровки движений является актуальной и современной.
Целью данной работы является разработка модуля безмаркерной Facial Motion Capture системы с применением искусственной нейронной сети и алгоритмов компьютерного зрения.
Для достижения данной цели необходимо решить следующие задачи:
1) проанализировать существующие подходы к решению задачи определения ключевых точек лица по фотографии;
2) разработать математическую модель нейронной сети;
3) проанализировать, собрать и подготовить данные для обучения и/или валидации выбранного подхода;
4) проанализировать существующие подходы к решению задачи трехмерной реконструкции мимики;
5) разработать математическую модель технологии генерации трехмерной копии лица и его мимических состояний;
6) проверить совместную работу алгоритма захвата и алгоритма синтеза анимации.
✅ Заключение
движения и мимики лица, использующего модель искусственной нейронной
сети для определения черт лица и авторскую методику реконструкции лиц.
В ходе работы задача определения черт лица была сформулирована, как
задача поиска лицевых ориентиров на изображении, рассмотрены различные
подходы к ее решению, которые подразделяются на две основные группы –
методы из области компьютерного зрения и глубокие нейронные сети. Для
решения поставленной задачи была выбрана архитектура нейронной сети
SBR-CPM.
Для выбранной архитектуры нейронной сети была составлена
математическая модель, приведены метрики качества и функции потерь,
позволяющие оценить точность работы SBR-CPM. В качестве алгоритма
обучения выбран метод обратного распространения ошибки с применением
оптимизации функции потерь методом ускоренного градиента Нестерова.
Для обучения и тестирования рассматриваемой нейронной сети
подготовлен набор данных, содержащий 99 029 изображений с аннотациями
лицевых ориентиров. После дальнейших преобразований путем аугментации,
число изображений выросло до 112 246. Среди них 19 727 изображений
представляют собой валидационную выборку, оставшиеся – тренировочную.
Аугментация данных осуществлялась с помощью библиотеки Imageaug.
В качестве фреймворка для обучения нейронной сети использовался
PyTorch. Это фреймворк машинного обучения для языка Python с открытым
исходным кодом, написанный на языке Си. В качестве среды разработки
использовался PyCharm с применением языка программирования Python 3.6.
Для проведения анализа точности работы нейронной сети были
использованы метрики качества, такие как – среднеквадратическая ошибка
(NRMSE), частота неудач (FR), кумулятивное распределение ошибок (CED),
также была вычислена количественная метрика – площадь под кривой CED.
79
В данной работе был подробно описан авторский метод реконструкции
лица, основанный на применении сплайнов к шаблонной трехмерной сетке.
Приведены демонстрации работы всех ключевых этапов алгоритма,
построены графики, отображающие корректность применяемых деформаций
к базовой форме.
Таким образом, цель достигнута, а поставленные задачи – полностью
решены. Разработанная система может с успехом применяться для записи
лицевой анимации и создания кат-сцен (видео сцены) в играх или
мультфильмах. Права на использование алгоритма реконструкции лиц
переданы компании «ООО ТРИДИВИ».
В связи со стремительным развитием области нейронных сетей и
появлением новых современных решений целью дальнейшей работы может
стать исследование новых архитектур и подходов к решению задачи захвата
движения и мимики лица.





