Тип работы:	Предмет:	Язык работы:

Моделирование алгоритма для распознавания эмоций на изображении и видеопотоке

Работа №	107502
Тип работы	Магистерская диссертация
Предмет	математическое моделирования
Объем работы	70
Год сдачи	2022
Стоимость	5650 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено	103

Не подходит работа?

Узнай цену на написание

Содержание

Введение 3
1 Исследование области распознавания эмоций 7
1.1 Введение в задачу классификации эмоций 7
1.2 Обзор существующих программных решений 11
1.3 Выбор алгоритма распознавания эмоций 17
1.4 Описание используемых моделей алгоритмов классификации 33
2 Проектирование моделей алгоритма для распознавания эмоций 51
2.1 Проектирование модели алгоритма распознавания лиц 51
2.2 Проектирование модели алгоритма классификации эмоций 58
3 Программные решения для реализации и сравнительный анализ представленных моделей 60
3.1 Программные решения, используемые для реализации спроектированных моделей 60
3.2 Сравнительный анализ реализованных моделей алгоритмов классификации эмоций 63
Заключение 67
Список используемой литературы 68

Введение

В настоящее время, когда человечество переступило порог двадцатого века и вступило в третье тысячелетие нашей эры, информационные технологии стали неотъемлемой частью человеческой жизни. Их грамотное применение на производственном поприще является целью любого профессионала. ЮНЕСКО определяет информационные технологии как комплекс взаимосвязанных технологических, научных, инженерных дисциплин, которые направлены на хранение, обработку и использование информации. ИТ включают в себя множество разнообразных областей развития. Например, интеллектуальные системы, когнитивные ИТ, технологии баз данных, компьютерная графика, управленческие информационные системы, а также многие другие. Одной из таких областей является компьютерное зрение.
Актуальность настоящего исследования определена потребностью в алгоритмах распознавания объектов, которые сохраняют высокую точность работы независимо от того, как изменяется положение объекта в пространстве относительно объектива камеры. В области распознавания эмоций ощущается недостаток подобных алгоритмов, поэтому на данный момент невозможно с высокой точностью классифицировать эмоции на лицах отличных от фронтального положения более чем на 45 градусов. Наличие подобных алгоритмов распознавания позволило бы значительно автоматизировать социальные исследования, а также исследования в области психологии.
Объектом исследования является алгоритм распознавания эмоций.
Предметом исследования является повышение точности алгоритма распознавания эмоций для лиц отличных от фронтального положения более чем на 45 градусов.
Цель исследования: моделирование алгоритма распознавания эмоций на лицах отличных от фронтального положения более чем на 45 градусов и проведение сравнительного анализа точности полученного алгоритма относительно аналогичных.
Гипотеза исследования состоит в том, что точность работы алгоритма распознавания эмоций на лицах отличных от фронтального положения более чем на 45 градусов можно повысить, если:
• увеличить область для классификации передаваемую из алгоритма распознавания лиц в алгоритм классификации эмоций, для увеличения полезной информации для классификации;
• добавить в свёрточные слои алгоритма классификации эмоций пакетную нормализацию.
Для достижения поставленной цели необходимо решить следующие задачи:
• проанализировать предметную область;
• выбрать модель алгоритма для распознавания эмоций точность которой является наиболее высокой из уже существующих;
• спроектировать модернизированную модель алгоритма распознавания лиц для увеличения захватываемой им области лица;
• спроектировать модернизированную модель алгоритма классификации эмоций с применением пакетной нормализации;
• реализовать полученные модели;
• провести сравнительный анализ между реализованными моделями, стандартной моделью алгоритма распознавания эмоций и другими аналогами.
Методы исследования: в ходе выполнения работы применялись такие методы теоретического исследования, как изучение и анализ научной литературы по задачам распознавания объектов в машинном обучении, также в ходе выполнения работы применялись практические методы исследования, такие как компьютерное моделирование алгоритмов машинного обучения, а также их сравнительный анализ.
Научная новизна исследования заключается в:
• применении технологии DNN для алгоритма распознавания лиц, данная технология была применена не к последнему слою CNN, а к её предпоследнему слою, за счёт проведения операции обратного пулинга, что позволило увеличить размерность карт признаков, которые применялись для выделения границ обнаруженного лица, соответственно это позволило увеличить область в которой содержится лицо для алгоритма классификации эмоций;
• применении подхода пакетной нормализации в модели алгоритма классификации эмоций, что позволило не только ускорить процесс обучения, а также повысить точность её работы на 5,93%.
Теоретическая значимость исследования заключается в:
• предложен подход, для более глубокого применения технологии DNN, что позволяет расширить область изображения, в которой содержится искомый объект;
• доказано, что добавление слоёв пакетной нормализации может повысить точность работы CNN.
Практическая значимость исследования заключается в разработке модели алгоритма для классификации, которая со средней точностью в 74% способна распознавать эмоций на лицах отличных от фронтального положения более чем на 45 градусов.
На защиту выносятся:
• модель алгоритма распознавания эмоций на лицах отличных от фронтального положения более чем на 45 градусов;
• результаты сравнительного анализа алгоритмов распознавания эмоций.
В первом разделе производится исследование предметной области, даётся экскурс в задачу распознавания эмоций, рассматриваются уже существующие программные решения, описываются используемые в работе базовые модели алгоритмов, а также производится выбор наиболее точной базовой модели, которая в дальнейшем будет использоваться для улучшения.
Во втором разделе проводится исследование с целью увеличения области выделяемой распознавателем лиц с помощью технологии DNN, также рассматривается возможность применения к свёрточным слоям классификатора эмоций пакетной нормализации для повышения точности работы.
В третьем разделе приводятся программные решения, используемые для реализации моделей полученных во втором разделе, а также производится сравнительный анализ реализованных моделей.
Работа состоит из введения, трёх разделов, заключения, содержит 23 рисунка, 34 формулы, список использованной литературы (30 источников). Основной текст работы изложен на 70 страницах.

Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!

ДИПЛОМНЫЕ МАГИСТЕРСКИЕ ДИССЕРТАЦИИ

Курсовые Статьи Диплом Рязань

Заключение

В результате выполнения данной работы была спроектирована и реализована модель алгоритма для распознавания эмоций, данная модель эффективно решает поставленную задачу, не смотря на значительное отклонение лица от фронтального положения (свыше 45 градусов). Для получения данного результата в каждом разделе работы решались свои задачи.
По итогам данной работы можно сделать следующие выводы:
• увеличение области выделяемой распознавателем лиц при помощи технологии DNN позволило увеличить точность работы алгоритма распознавания эмоций на 13,78% и составила 66% с учётом того, что на изображениях отсутствует окклюзия, в случае её присутствие данный показатель уменьшается до 58%, потому как значимость величины области при появлении окклюзии снижается;
• применение пакетной нормализации для свёрточных слоёв классификатора эмоций также позволило увеличить точность базовой модели на 5,93% и составила 58% для изображений на которых окклюзия отсутствует, с появлением окклюзии точность опустилась всего на 4% и составила 54% в среднем, что позволяет говорить о том, что данный алгоритм более устойчив к окклюзии чем базовая модель;
• объединение обеих описанных выше моделей в один алгоритм позволило повысить среднюю точность распознавания эмоций на 22%, и она равняется 74% для изображений без окклюзии, а для изображений с окклюзией средняя точность работы данного алгоритма равняется 68%;
• можно сделать вывод, что разработанный алгоритм распознавания эмоций позволяет качественно распознавать эмоций на лицах отличных от фронтального положения более чем на 45 градусов при том что на них будет отсутствовать окклюзия.

Литература

1. Визильтер Ю. В. Обработка и анализ изображений в задачах машинного зрения: Курс лекций и практических занятий. - М.: Физматкнига, 2010. - 672 с.
2. Галушкин, А.И. Нейронные сети: основы теории. / А.И. Галушкин. - М.: РиС, 2015. - 496 с.
3. Гарсия Г. Б., Исмаэль С.Г., Ноэлия В. Э. Обработка изображений с помощью OpenCV. М.: ДМК Пресс, 2016. 210 с.
4. Гелиг, А. Х. Введение в математическую теорию обучаемых распознающих систем и нейронных сетей. Учебное пособие / А.Х. Гелиг, А.С. Матвеев. - М.: Издательство СПбГУ, 2014. - 224 с.
5. Головко В.А. От многослойных персептронов к нейронным сетям глубокого доверия: парадигмы обучения и применение // XVII Всероссийская научно-техническая конференция с международным участием, 2015. - C. 47-84.
6. Гонсалес Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс. - Москва: Техносфера, 2012. - 1104 с.
7. Каллан, Р. Нейронные сети: Краткий справочник / Р. Каллан. - М.: Вильямс И.Д., 2017. - 288 с.
8. Клейнберг Дж., Тардос Е. Алгоритмы: разработка и применение. Классика Computers Science / Пер. с англ. Е. Матвеева. - СПб.: Питер, 2016. - 800 с.
9. Клетте Р. Компьютерное зрение. Теория и алгоритмы. М.: ДМК Пресс, 2019. 508 с.
10. Красильников Н. Цифровая обработка 2D- и SD-изображений / Н. Красильников: Отдельное издание. - БХВ-Петербург, 2011. - 608 с.
11. Редько, В.Г. Эволюция, нейронные сети, интеллект: Модели и концепции эволюционной кибернетики / В.Г. Редько. - М.: Ленанд, 2019. - 224 c.
12. Шумский С.А. Машинный интеллект. Очерки по теории машинного обучения и искусственного интеллекта / С.А. Шумский. — М.: РИОР, 2019. - 340 с
13. Bagnall A, Lines J, Hills J, Bostrom A. Time-series classification with COTE: the collective of transformation-based ensembles. IEEE Trans Knowl Data Eng. 2015; 27:2522 - 2535. doi: 10.1109/TKDE.2015.2416723. - DOI.
14. Batista G, Keogh E, Tataw O, deSouza V. CID: an efficient complexity-invariant distance measure for time series. Data Min Knowl Discov. 2014;28(3):634-669. doi: 10.1007/s10618-013-0312-3. - DOI.
15. Baydogan M, Runger G. Time series representation and similarity based on local autopatterns. Data Min Knowl Discov. 2016;30(2):476-509. doi: 10.1007/s10618-015-0425-y. - DOI.
...