Введение
1 Обзор предметной области 5
1.1 Анализ существующих решений 5
1.1.1 Методы на основе деформируемых моделей 6
1.1.2 Методы основанные на явной регрессии формы 7
1.2 Выравнивание формы методом ансамбля деревьев регрессии . .
1.2.1 Основная идея 8
1.2.2 Каскад регрессоров 9
1.2.3 Обучение каждого регрессора в каскаде 9
2 Реализация метода расставления характерных точек 11
2.1 Базы цифровых изображений 11
2.1.1 Helen 11
2.1.2 LFPW 11
2.2 Обнаружение лица 12
2.3 Схема обучения модели 13
2.4 Процесс обучения каскада регрессоров 14
2.4.1 Слабые регрессоры 15
2.4.2 Выбор узлов разделения 16
2.5 Отслеживание характерных точек лица на видео 17
2.5.1 Обнаружение лиц 17
2.5.2 Слежение 17
3 Экспериментальное исследование метода 18
3.1 Язык программирования и использованные библиотеки 18
3.2 Характеристики оборудования 18
3.3 Влияния параметров метода на его точность 18
3.4 Вычислительная сложность 24
3.5 Предложения по улучшению точности и скорости метода .... 24
4 Вывод
5 Приложение 27
5.1 Листинг исходного кода
В связи с развитием компьютерной техники, увеличением объемов передачи видео и фотографий в сети интернет, появлением большого количества прикладных задач - большое внимание уделяется вопросам компьютерного зрения и обработки изображений. Компьютерное зрение - это дисциплина изучающая проблемы понимания и анализа реальных сцен, полученных из изображения или видео [1].
Одним из перспективных и быстроразвивающихся направлений компьютерного зрения является распознавание лиц, в частности оценка положения лица относительно камере на изображении или видео. Цифровые портреты часто используются при обеспечении информационной безопасности для идентификации личности. Также автоматическое, высокоэффективное и точное нахождение характерных точек лица, которые несут в себе наибольшее количество сематентической информации, таких как: уголки глаз, края губ и бровей, нос, овал лица, имеет важное значение для решения ряда прикладных задач: идентификации лиц, отслеживания эмоций, ЗВ-моделирования, замены лиц, морфинга. В то время как методы за последнее время улучшились мы остаемся далеки от надежной и точной локализации характерных точек лица. Лица имеют неодинаковые антропологические особенности, могут быть повернуты или наклонены относительно камеры, частично перекрыты. Изображения могут быть сильно зашумлены. Освещение может быть непостоянным и неоднородным [2].
Разработка и реализация алгоритма нахождения характерных точек с высокой точностью и скоростью в естественной среде является актуальной задачей.
Цели и задачи
Целью дипломной работы является реализация метода нахождения и отслеживания характерных точек лица человека на видео. Исследование результатов работы алгоритма, поиск способов повышения точности и скорости работы выбранного метода.
Для достижения данной цели были решены следующие задачи:
1. изучение литературы по компьютерному зрению, машинному обучению, обработке изображений;
2. программная реализация метода нахождения характерных точек лица на цифровом изображении, основывающегося на ансамбле деревьев регрессии;
3. обучение алгоритма на основе базы цифровых изображений Helen и LFPW;
4. проведение экспериментального исследования влияния параметров метода на его точность и вычислительную сложность;
5. реализация отслеживания характерных точек лица на видео;
6. анализ полученных результатов.
Практическая значимость
Реализованный метод позволяет в режиме реального времени находить характерные точки лица и отслеживать их на видео. Найденные характерные точки можно использовать в алгоритмах идентификации и верификации лиц, распознавания возраста, эмоций, установления положения лица относительно камеры.
При выполнении дипломной работы был реализован алгоритм обнаружения характерных точек лица на изображении основанный на ансамбле деревьев регрессии. Цели и задачи, поставленные в данной работе были выполнены. Был проведен анализ влияния различных параметров на точность выравнивания формы. При обучении модели было предложено использовать более точный метод обнаружения лиц, а при слежении за характерными точками лица на видео использовать более быстрый. Результатом реализованного метода является модель, которая может найти характерные точки лица человека при первоначальной инициализации со средней формой за 0,099 секунд. При этом возможно нахождение характерных точек для большого количества лиц на одном изображении. Также было реализовано слеживание за характерными точками лица на видео.