Тип работы:
Предмет:
Язык работы:


Разработка алгоритма распознавания эмоций на изображении

Работа №115185

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы51
Год сдачи2022
Стоимость4235 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
145
Не подходит работа?

Узнай цену на написание


Введение 5
Глава 1 Анализ технологий распознавания эмоций на изображении 7
1.1 Введение в задачу распознавания эмоций на изображении 7
1.2 Сравнение алгоритмов распознавания эмоций 13
Глава 2 Проектирование алгоритма для анализа эмоций на изображении 21
2.1 Алгоритм нейросетевого распознавания эмоций 21
2.2 Источник данных для обучения нейронной сети 28
2.3 Оптимизация структуры нейронной сети и данных для обучения . . 32
Глава 3 Программная реализация алгоритма для распознавания эмоций на изображении 36
3.1 Описание разработанного приложения 36
3.2 Особенности программной реализации и примеры работы приложения 37
Заключение 48
Список используемой литературы и используемых источников 50


Компьютерное зрение - это научное направление по созданию аппаратно-программных комплексов, способных производить обнаружение, локализацию и распознавание объектов. Технологии компьютерного зрения применяются при решении таких задач, как обеспечение безопасности на массовых мероприятия, автоматизация охранных функций на различных объектах, верификация клиентов банков по изображению, улучшение качества фотографий [1].
В настоящее время исследователи из области искусственного интеллекта изучают возможности применения технологий компьютерного зрения для распознавания эмоций человека на основе изображения его лица.
Ежегодно проводятся соревнования разработчиков алгоритмов распознавания эмоций, цель в которых - добиться максимальной точности распознавания на заданном наборе данных. Анализ результатов соревнований AFEW-VA, EmotioNet challenge, OMG-Emotion challenge, 6th Emotion Recognition in the Wild Challenge (EmotiW) и EmoReact, AffectNet позволил выявить следующие особенности реализации алгоритмов. При реализации алгоритмов используется связка двух методов:
- метод поиска ключевых точек лица на изображении,
- метод классификации, определяющий класс эмоции на основе взаимного расположения ключевых точек лица.
Конечная точность работы алгоритма распознавания эмоций зависит от подбора удачного сочетания этих двух методов [5].
В данной работе предлагается отказаться от использования связки «метод поиска ключевых точек лица + метод классификации» и вместо этого использовать сверточную нейронную сеть. Сверточные нейронные сети предназначены для работы с изображениями и умеют самостоятельно определять необходимые признаки изображений для их классификации. Предполагается, что сверточная нейронная сеть с малым количеством слоев сможет показать результаты по точности сопоставимые со связкой «метод поиска ключевых точек лица + метод классификации».
Таким образом, цель работы - подбор архитектуры и тестирование нейронной сети, обеспечивающей распознавание эмоций на изображении при наименьшем количестве слоев и без поиска ключевых точек лица.
Для достижения цели решаются следующие задачи:
- проанализировать предметную область и существующих подходов по распознаванию эмоций на изображениях;
- разработать нейросетевой алгоритм распознавания эмоций на изображении и выбрать структуру нейронной сети;
- разработать программное обеспечение и протестировать
эффективность алгоритма.
Практическая значимость бакалаврской работы заключается в разработке программного обеспечения для нейросетевого распознавания эмоций.
Данная работа состоит из введения, трех глав, заключения, списка используемой литературы и приложений.
В первой главе рассматривается сущность задачи распознавания эмоций, а также анализируются существующие подходы для решения данной задачи.
Во второй главе осуществляет разработка алгоритма для распознавания эмоций на изображении, описывается обучающая выборка и результаты тестирования алгоритма.
В третьем разделе рассматриваются особенности программной реализации предложенного алгоритма распознавания эмоций на изображении.
В заключении представляются выводы по проделанной работе.
Бакалаврская работа состоит из 51 страницы текста, 33 рисунков, 2 таблиц, 4 формул и 20 источников.


Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


В ходе выполнения бакалаврской работы были получены следующие результаты:
- на основе анализа литературных источников установлено, что большинство алгоритмов распознавания эмоций основано на совместной работе двух методов: метода поиска ключевых точек лица на изображении (Point Distribution Model, Facial Landmark Detection, Active Appearance Model и 2D-and-3D-face-alignment) и метода классификации данных (нейронные сети, деревья принятия решений, классификатор SVM);
- в работе предложено связку метода поиска ключевых точек лица и метода классификации можно заменить на сверточную нейронную сеть, что позволит облегчить настройку классификатора эмоций за счет использования стандартных алгоритмов обучения нейронных сетей;
- спроектирована максимально простая архитектура нейронной сети для решения задачи распознавания эмоций, которая включает в себя входной слой для получения изображения в виде числового массива 48*48*1; сверточный слой (convolution) c ядром 5*5, шагом свертки 2, количеством плоскостей (каналов) 32 и функцией активации ReLU; слой субдискретизации (max-pooling) с группой уплотнения 2*2; слой dropout, блокирующий сигналы 25% нейронов предыдущего слоя; сверточный слой (convolution) c ядром 3*3, количеством плоскостей (каналов) 64 и функцией активации ReLU; слой субдискретизации (max-pooling) с группой уплотнения 2*2; слой dropout, блокирующий сигналы 25% нейронов предыдущего слоя; слой снижения размерности (flatten) данных до одномерного вектора; слой (core layer ReLU) из 500 нейронов прямого распространения с функцией активацией ReLU и выходной (core layer SoftMax) слой с функцией активацией SoftMax.
- Увеличение точности работы нейронной сети с 66,4% до 78,1% удалось достигнуть за счет добавления слоев dropout, функционирующих только в процессе настройки сети и ослабляющих эффект переобучения сети за счет случайного блокирования некоторой части сигналов предыдущего слоя. Также точности сети была увеличена за счет синтезирования дополнительных изображений в самый малочисленный класс (класса эмоций «Disgust» / отвращение) изображений обучающей выборки. Синтез дополнительных изображений осуществлялся за счет применения со случайными параметрами операций масштабирования и вращения к исходным изображениям, содержащимся в классе.
- на языке программирования python разработано приложение, основанное на работе нейронной сети и позволяющего на основе анализа изображения лица определять один из 7 типов эмоция испытываемых человеком.



1. Визильтер Ю. В. Обработка и анализ изображений в задачах машинного зрения: Курс лекций и практических занятий. - М.: Физматкнига, 2010. - 672 с.
2. Галушкин, А.И. Нейронные сети: основы теории. / А.И. Галушкин. - М.: РиС, 2015. - 496 с.
3. Гелиг, А. Х. Введение в математическую теорию обучаемых распознающих систем и нейронных сетей. Учебное пособие / А.Х. Гелиг, А.С. Матвеев. - М.: Издательство СПбГУ, 2014. - 224 с.
4. Головко В.А. От многослойных персептронов к нейронным сетям глубокого доверия: парадигмы обучения и применение // XVII Всероссийская научно-техническая конференция с международным участием, 2015. - C. 47¬84.
5. Гонсалес Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс. - Москва: Техносфера, 2012. - 1104 с.
6. Каллан, Р. Нейронные сети: Краткий справочник / Р. Каллан. - М.: Вильямс И.Д., 2017. - 288 с.
7. Клейнберг Дж., Тардос Е. Алгоритмы: разработка и применение. Классика Computers Science / Пер. с англ. Е. Матвеева. - СПб.: Питер, 2016. - 800 с.
8. Красильников Н. Цифровая обработка 2D- и 3Э-изображений / Н. Красильников: Отдельное издание. - БХВ-Петербург, 2011. - 608 с.
9. Редько, В.Г. Эволюция, нейронные сети, интеллект: Модели и концепции эволюционной кибернетики / В.Г. Редько. - М.: Ленанд, 2019. - 224 с.
10. Beyerer J. Automated Visual Inspection: Theory, Practice and Applications / J. Beyerer, P. Fernando, F. Christian. - Springer Berlin Heidelberg, 2016. - 798 p.
11. Calender M. BRIEF: binary robust independent elementary features / M. Calender, V. Lepetit, C. Strecha, P. Fua // European Conference on Computer Vision, 2010. - P. 778-792.
12. Chollet F. Deep Learning with Python - Manning Publications, 2017. - 384 p.
13. Geron Au. Hands-On Machine Learning with Scikit-Learn, Keras and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems Second Edition (Third Release) - O'Reilly Media, 2019. - 856 p.
14. Lubanovic B. Introducing Python: Modern Computing in Simple Packages Second Edition - O'Reilly Media, 2019. - 605 p.
15. Lutz M. Python Pocket Reference, 5th Edition - O'Reilly Media, 2014. - 264 p.
16. McKinney W. Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, 2nd Edition - O'Reilly Media, 2017. - 544 p.
17. Muller A.C. Introduction to Machine Learning with Python: A Guide for Data Scientists / A.C. Muller, S. Guido - O'Reilly Media, 2016. - 392 p.
18. Singh P. Learn TensorFlow 2.0: Implement Machine Learning and Deep Learning Models with Python / P. Singh, A. Manure - Apress, 2019. - 177 p.
19. Sutskever I. On the importance of initialization and momentum in deep learning / I. Sutskever, J. Martens, G. Dahl, G. Hinton // Journal of Machine Learning Research. - 2013. - V. 28, No. 3. - P. 1139-1147.
20. VanderPlas J. Python Data Science Handbook: Essential Tools for Working with Data - O'Reilly Media, 2016. - 672 p.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ