Введение 3
Постановка задачи 4
Обзор литературы 5
Глава 1. Обзор готовых решений и методов 6
1.1 Обзор существующих реализаций 6
1.1.1. FaceReader 6
1.1.2. EmoDetect 7
1.1.3. FaceSecurity 9
1.1.4. MS Oxford Project Emotion Recognition 11
1.2 Методы обнаружения лиц 12
1.3 Методы распознавания эмоций 15
1.3.1 Метод опорных точек 15
1.3.2 Метод Виолы-Джонса 17
Глава 2. Реализация 19
2.1 Основная концепция реализуемого проекта 19
2.2 Выбор облачной технологии 21
2.3 Выбор технологии создания 22
2.4 Результаты 26
Выводы 28
Заключение 30
Список литературы
В современном мире, в век развития информационных технологий, где искусственный интеллект уже не кажется научной фантастикой, а является предметом работы многих учёных, появилось понятие компьютерного зрения. Если кратко, то компьютерное зрение — это теория и технология создания машин, которые могут производить обнаружение, отслеживание и классификацию объектов. Для того, чтобы взаимодействие машины и человека проходило наиболее комфортно и удобно для последнего, необходимо создать технологию, способную воспринимать сигналы, посылаемые ей человеком, будь то голосовые команды (как это продемонстрировали исследователи из университета Тафтса на конференции AI-HRI в ноябре 2015 года[1]), определённые невербальные жесты (технология Kinect) или сигналы мимики лица (проявление эмоций и чувств). Считывание человеческих эмоций может быть как единственным способом взаимодействия так и вспомогательным, например, для того чтобы следить за состоянием человека во время выполнения основной работы. Такой подход сделает анализ команд более точным, а взаимодействие будет проще.
Само распознавание человеческих эмоций может стать основной частью проекта по определению лжи, где в дополнение в биометрическим параметрам тела добавится информация о мимике, играющей важную роль при решении такой задачи. И даже если отойти от науки, можно найти применение этой задачи в развлекательных ресурсах, так система может запоминать моменты из фильмов, которые, судя по эмоциям, понравились зрителю больше всего, и подбирать подобный материал с учётом сформированных интересов.
Постановка задачи
Целью данной работы является разработка приложения, определяющего эмоциональное состояние человека на основе его мимики, представленной во входном видеопотоке. Главной задачей приложения является распознавание черт лица, свойственных определённым человеческим эмоциям и вычисление конечного, понятного пользователю, результата.
Для достижения этой цели поставлены следующие шаги:
1) Рассмотреть существующие решения поставленной задачи и сравнить их достоинства и недостатки.
2) Провести сравнение алгоритмов решающих поставленную задачу и проанализировать их достоинства и недостатки. Выбрать наиболее подходящий, то есть тот, при котором будут минимизированы затраты ресурсов машины, на которой будет выполняться приложение, времени выполнения, финансовые затраты при разработке, и максимизирована скорость выполнения.
3) Рассмотреть существующие языки программирования, выбрать тот, который наиболее подходит для реализации приложения, то есть тот, при выборе которого достигаются оптимальные значения из пункта 2.
4) Выбор платформы и технологии создания, на основе анализа существующих инструментов и средств разработки.
5) Реализовать алгоритм и тестирование приложения. Нахождение и исправление ошибок.
В данной работе была поставлена задача распознавания эмоций в видеопотоке и изучена её актуальность, рассмотрены существующие реализации и сравнение их преимуществ и недостатков. Проведён обзор алгоритмов поиска объектов, в частности лиц, на изображении. На основании этого обзора выбран методы Виолы-Джонса для обнаружения лиц в кадре и метод на основе ключевых точек для распознавания эмоций как приоритетные в реализации приложения решающего поставленную задачу. Во время работы с данным методом были обучены каскады, предназначенные для нахождения конкретных частей лица на изображении, а также успешно реализовано нахождение координат опорных точек, на основе которых строится конечный результат. Выявлены проблемы работы с данным алгоритмом и представлены их возможные решения