Тип работы:
Предмет:
Язык работы:


Распознавание лицевой экспрессии с помощью нейронных сетей

Работа №125840

Тип работы

Бакалаврская работа

Предмет

нейронные сети

Объем работы36
Год сдачи2017
Стоимость4800 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
92
Не подходит работа?

Узнай цену на написание


Введение 3
Приоритетные задачи 6
1. Формализация задачи 7
1.1 Постановка задачи 7
1.2 Обзор существующих алгоритмов 8
2. Теоретические обоснования 17
2.1 OpenCV 17
2.2 Сверточные нейронные сети 21
3. Реализация алгоритма 25
3.1 База изображений 25
3.2 Сверточная нейронная сеть 26
3.3 Реализация 27
3.4 Использование алгоритма 29
4. Заключение 31
4.1 Перспективах 32
Список литературы 34

Что такое эмоции? Сможем ли мы верно ответить на этот вопрос? А какова вероятность, что мы точно сможем распознать лицевую экспрессию у своего собеседника?
Данный вопрос давно интересует не только психологов современно­го мира, так же этой проблемой давно занимаются и исследуют ученые всего мира. Проведенные исследования на эту тему были затронуты еще в книге «Выражение эмоций у человека и животного» Чарльза Дарвина [1], где он утверждает, что эмоции скорее варьируются от вида к виду, то есть это видовой признак, чем культурный. В начале 20 века существовала до­статочно фундаментальная теория о том, что не существует «универсаль­ных» эмоций. Данная теория опиралась на зависимость представителя от типа культуры. На эту же тему в 1969 году была издана одна из самых важных литературных работ, проделанная психологами и учеными. Это исследование Пола Экмана и Уоллеса Фризена [2] [3], которые были явны­ми оппонентами существующих канонов эмоционального происхождения. Они доказали, что существует 6 универсальных эмоций, которые не зависят от культурной и национальной принадлежности: удовольствие, страдание, страх, гнев, удивление и отвращение. Конечно же, к данным эмоциям все­гда относят нейтральное состояние лица человека.
В последние годы распознавание эмоций стало принимать популяр­ный характер не только в методах и специфике психологии и социологии. С учетом всемирной и всепоглощающей идеи об искусственном интеллек­те ученые и программисты всего мира пришли к консенсусу необходимости достаточно точного определения эмоций с помощью программных средств. Распознавание любого вида проявления человеческого отклика и реакции -это одно из самых важных препятствий для создания искусственного ин­теллекта. На данный момент такой вектор исследования очень важен и имеет огромное значение для всего человечества, особенно в отраслях биз­неса и военных структурах.
Принимая во внимание нынешнее пристрастие к автоматизации про­цессов, ученые, и не только, стали заниматься проблемами распознавания и детектирования большого количества объектов, окружающих нас. И, в какой-то мере, это приносит хорошие результаты. Распознавание номеров у машин уже вошло в обиход и активно используется правоохранительными органами, детектирование лиц с помощью программ и компьютера — уже давно не новинка, так как во многих крупных компаниях стоит система безопасного входа по определению сотрудника посредством фотографий. Но один из самых важных прорывов во взаимодействии безопасности и де­тектирования был совершен при введении на особо важные объекты камер с распознаванием отрицательных, враждебно настроенных эмоций, кото­рые помогут вычислить преступника, грабителя или террориста. Нельзя не упомянуть про прорывы в распознавании голоса, тональности текста, речи и так далее. Исходя из этого, видно, что данное направление не сто­ит на месте и успешно развивается. На данный момент значительную ни­шу в этом научном направлении занимает машинное обучение. Уже давно признали, что машинное обучение одно из самых успешных, конструктив­ных, универсальных и оптимальных методов для распознавания объектов на фотографии, видео фрагментах, фильмах и электронных записях. Ма­шинное обучение показало и продолжает показывать огромное увеличение точности алгоритмов по детектированию. Но главенствующее положение на данный момент в области машинного обучения занимают нейронные сети, которые безупречно доказали свою эффективность, и не перестают улучшать результат, поэтому мы будем использовать именно этот метод. Данный метод в основном требует либо огромного количества данных, ко­торые послужат тренировочными и тестовыми образцами, либо идеально выстроенной нейронной сети, которая учитывает все нюансы и специфи­ческие моменты требуемой задачи. Важной проблемой в области распо­знавания лицевых экспрессий—это отсутствие согласованной и полностью учитывающей всех особенностей эталонной базы данных, на которой бы строились все алгоритмы. Данный эталон служил бы некоторым главен­ствующим инструментом, который обеспечивал бы возможности сравни­тельной характеристики ныне существующих методов и подходов. Было сделано множество попыток создать данную базу фотографий, но ученые и программисты так и не пришли к общему паттерну. Возможно, проблема кроется в глобализации маркетинга и поискам выгоды в каждой научной отрасли.
Идея нейронных сетей была взята из физиологии, ведь, как всем из­вестно, прототип этой архитектуры был получен из примера функциони­рования человеческого мозга. Человеческая биологическая нейронная сеть была взята за основу. Ученые пытались смоделировать работу нашего моз­га и протекающих в нем реакций, поэтому данный метод и нашел приме­нение в основном в распознавании объектов, образов и в задачах прогнози­рования. Существует несколько методов, взятых из научной литературы, для распознавания эмоций на лице человека:
1. Статичный метод В данном методе классификатор, который использу­ют авторы [4], распознает каждый кадр и сравнивает его с заявленными вначале эмоциями, и на основе каждого кадра делает вывод. Обычно в таких подходах используется Наивный Байесовский классификатор [4]. В то же время, он использует строгое и нереалистичное предположение о том, что все признаки не взаимосвязаны друг с другом и являются новым классом.
2. Динамический метод В этом методе, классификаторы принимают во внимание временный шаблон, полученный до этого, для отображения выражения лица. Скрытая Марковская модель [5] наилучше подходит для такой реализации. СММ отслеживает сгенерированные до этого состояния, и на основе этого достаточно оптимально выводит полу­ченный результат. На основе данного алгоритма в работе получилось даже отследить долгий фрагмент и получить необходимый прогноз по отслеживанию эмоции.
Работы по теме распознавания можно обычно разделить на два типа:
• Сравнение методов по обработке и определение эмоции
• Введение нового метода, полученного на основе предыдущих работ, ко­торый усовершенствует предыдущие результаты.
Иногда в последнее десятилетие можно выделить еще один тип, кото­рый описывает разницу в осуществлении разных подходах на разном типе машин и разном типе аппаратурной части (обучение на CPU и GPU [6]).
Приоритетные задачи
Задача идентификации эмоций обычно решается в два этапа, каждый из которых бесспорно важен и определяет успешность результата, первый — распознавание лица на изображении, второй — распознавание лицевой экспрессии на основе полученного лица. В своей работе я рассмотрю метод, который будет распознавать эмоцию человека из полученного лица при помощью построенной и обученной на выборке нейронной сети.
Мой приоритет — улучшить значение точности алгоритмов по срав­нению с человеческой точностью на выборке, то есть достигнуть того, что компьютер решает проблему распознавания не хуже человеческого глаза. Самая основополагающая задача — сгенерировать подход, который одинако­во будет распознавать эмоции, вне зависимости от национальности и воз­раста. Дополнительные задачи, которые необходимо выполнить:
• Необходимо изучить и исследовать нейронные сети в области детекти­рования экспрессий, и вообще в области распознавания
• Провести качественный обзор и сравнение уже существующих методов, с помощью которых уже была решена поставленная мною задача
• Выделить проблемы данной научной области и обозначить перспекти­вы развития
Для дальнейшего прорыва в получении и создании искусственного интеллекта необходимо понимание особенностей работы мозга, в том числе распознавания объектов. Поэтому вектор данной работы очень востребован и популярен.

Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


В проделанной работе была реализована программа для распозна­вания эмоций на человеческом лице по изображению. Был придуман ал­горитм обработки входных данных, а также была построена архитектура нейронной сеть, которая успешно была протестирована на тестовых дан­ных. Более того, полученная нейронная сети идеально удовлетворяла соот­ношению время обучения/точность алгоритма. Так как обучение нейрон­ной сети — очень долгий и сложный процесс, поэтому данный фактор играл ключевую роль при выполнении работы. Самым трудным этапом в данной работе являлся эмпирический подбор параметров сети, который определял финальную точность. Получение весов при обучении сверточной нейронной сети — процесс на подобии «черного ящика», этим обуславливалась критиче­ская проблема при построении такой архитектуры.
При выполнении практической и теоретической части работы были выполнены данные поставленные задачи:
1. Изучение такого инструмента машинного обучения как нейронные се­ти, которые в настоящее время превалируют в анализе данных и пока­зывают наилучшие результаты со сложными задачами. На этом этапе так же были выделены и рассмотрены разные существующие методы, с помощью которых решалась задача детектирования лицевых экспрес­сий, был проведён сравнительный анализ и выявлены достоинства и недостатки каждого из методов.
2. Смоделировал архитектуру сверточной нейронной сети, которая пока­зывает один из наилучших результатов точности детектирования эмо­ций. В дополнении к этому, обучение на такой сети оказалось опти­мальным для доступных машинных ресурсов, и при этом обучалась в более 2000 раз быстрее, чем на процессоре.
3. Был успешно создан алгоритм по распознаванию эмоций на человече­ском лице, а также программа была проверена в условиях реальной жизни. При несложных манипуляциях алгоритм такого типа можно встраивать в системы видеонаблюдения и лайв-детектирования.
4. В работе, в первую очередь, была поставлена задача показать высо­кую точность при детектировании. Достигнутая точность оказалось на одном уровне с точностью определения эмоция человеком на данной выборке. Такие цифры были получены с помощью проведения экспе­римента учеными, создавшими эмоциональную базу данных.
4.1 Перспективы
Завершая данную работу, было намечено огромное количество пер­спектив развития данной области и усовершенствования алгоритмов по распознаванию эмоциональных окрасок на человеческом лице при помо­щи средств машинного обучения. Прежде всего, нельзя забывать, что эмо­ции — очень субъективная окраска человеческого лица, очень часто даже человек не может определить лицевую экспрессию без комплекса других деталей, которые мы можем отмечать во время диалога с собеседником. Ча­сто появляется необходимость в детектировании таких деталей, как тембр голоса, телодвижения и ситуационная составляющая. Ситуация бесспорно влияет на наше восприятие ситуации, являясь зачастую источником этих самых изменений в эмоциональной окраске. Поэтому в перспективе распо­знавания эмоциональной составляющей человеческого лица—создание ком­плекса алгоритмов, которые бы учитывали все тонкости. Голосовое детек­тирование вместе с трекингом изменений окружающей среды, распозна­вание основных психологических телодвижений индивидуума и все это в совокупности с обычным эмоциональным детектором порядком увеличи­ли бы точность любых программных средств в этой проблеме машинного обучения. Более того, уже сейчас начинают появляться комплексные алго­ритмы, которые используют параллельные нейронные сети, для вычисле­ния ключевых точек и обычную сверхточную нейтронную сеть на основе ResNet уже обученной на ImageNet. Данные матрицы весов, полученные с помощью этих сетей, являются ещё одной тренировочный выборкой для объединяющей их обычный нейронной сети. Такие сложные и громоздкие вычисления производятся в огромных дата центрах, при использовании со­временник вычислительных машин с параллельными графическими про­цессорами нового поколения.
Необходимость создания тенденции на интегрирование систем рас­познавания и систем видеонаблюдения уже становится понятной многим крупных компаниям, так как это влечёт за собой интерес государства и огромный финансовый успех на рынке систем безопасности. В дополнение ко всем, нельзя не упомянуть, что развитие таких систем неуклонно вле­чёт технологии и науку, в целом, к созданию искусственного интеллекта и любых его форм. Ведь умение понять, что чувствует собеседник или сто­порный человек—одна из уникальных человеческих способностей, которая пока в полной мере недоступна компьютеру.


[1] Darwin С., The Expression of the Emotions in Man and Animals, Oxford University Press, 1998. 472p
[2] Ekman P., Darwin and Facial expressions, Academic Press, 1973. 273p
[3] Ekman P., Facial expression and emotion, American Psychologist, 48:384­392, 1993
[4] Sebe N., Emotion recognition using a Cauchy Naive Bayes classifier // Pattern Recognition, 2002. Proceedings. 16th International Conference on, 10 December 2002. P. 34-46
[5] Nefian A., Hayes M., Hidden Markov model for face recognition // Image Processing, 1998. ICIP 98. Proceedings. 1998 International Conference on, 06 August 2002. P. 48-56
[6] Li E., Wang B., GPU and CPU Cooperative Accelaration for Face Detection on Modern Processors // Multimedia and Expo (ICME), 2012 IEEE International Conference on, 13 September 2012. P. 67-89
[7] Esau N., Wetzel E., Real-Time Facial Expression Recognition Using a Fuzzy Emotion Model // Fuzzy Systems Conference, 2007. FUZZ-IEEE 2007. IEEE International, 27 August 2007
[8] Kita S., Mita A., Emotion Identification method using RGB information of human face // Sensors and Smart Structures Technologies for Civil, Mechanical, and Aerospace Systems, 2015
[9] Agarwal M.. Jain N.. Face Recognition Using Principle Component Analysis, Eigenface and Neural Network // Signal Acquisition and Processing, 2010. ICSAP TO. International Conference on, 18 March 2010. P. 34-45
[10] Kar A., High Performance Human Face Recognition using Gabor Based Pseudo Hidden Markov Model // International Journal of Applied Evolutionary Computation (I J AEG), 2013. P. 11-22
[11] Srinivasan M., Vijayakumar S.,Pseudo 2D Hidden Markov Model Based Face Recognition System Using Singular Values Decomposition Coefficients //In The 2013 International Conference on Image Processing, Computer Vision,& Pattern Recognition(IPCV 2013), 2013. P. 252-258.
[12] Documentation of OpenCV. http://docs.opencv.org
[13] Gregori E. Introduction To Computer Vision Using OpenCV // Embedded Systems Conference in San Jose, 2012.
[14] Borylo P., Face Occurrence Verification Using Haar Cascades - Comparison of Two Approaches // Communications in Computer and Information Science, 2011. 149p
[15] Haar-like features. https://en.wikipedia.org/wiki/Haar-like_features
...


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ