Тип работы:
Предмет:
Язык работы:


Исследование и разработка методов компьютерного зрения для задач определения атрибутов личности по изображению лица

Работа №120440

Тип работы

Магистерская диссертация

Предмет

информационные системы

Объем работы82
Год сдачи2022
Стоимость5500 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
132
Не подходит работа?

Узнай цену на написание


Глава 1 Анализ современного состояния исследований в области компьютерного зрения 9
1.1 Понятие и проблемы компьютерного зрения 9
1.2 Задачи компьютерного зрения 14
1.3 Актуальность задачи определения атрибутов личности
по изображению лица 16
Глава 2 Анализ методов компьютерного зрения для решения задач определения атрибутов личности по изображению лица 22
2.1 Основные этапы определения атрибутов личности по изображению
лица 22
2.2 Роль машинного обучения в определении атрибутов личности по
изображению лица 26
2.3 Метод опорных векторов 29
2.4 Кластеризация изображения 31
2.5 Метод главных компонент (PCA) 34
2.6 Метод Виолы-Джонса 37
2.7 Нейросетевые методы 41
Глава 3 Разработка алгоритма определения атрибутов личности с помощью сверточных нейронных сетей 48
Глава 4 Экспериментальное исследование и апробация метода распознавания
личности на основе нейросетевых алгоритмов 56
4.1 Описание программного комплекса и оборудования 56
4.2 Общая характеристика языка программирования Python 56
4.3 Формирование набора данных изображений лиц 59
4.4 Модели глубокого обучения 60
4.5 Методы оценки качества работы алгоритмов 61
4.6 Сравнительное исследование моделей Keras 63
4.7 Тестирование метода определения возраста и пола человека
по изображению лица 66
Заключение 71
Список используемой литературы и используемых источников 73
Приложение А Фрагмент программного кода на языке программирования Python глубокого обучения модели определения атрибутов личности по изображению лица 77


Человечество с древних времен в процессе развитии использует иллюстрации. Изображения возникли раньше письменности и несли в себе функцию сохранения информации. До нас дошли древние пещерные изображения, которые иллюстрируют события, происходящие в жизни обычного человека того времени (охота, стая животных, корабли). Кроме рисунков для фиксирования объектов на историческом пути становления компьютерного зрения применялись различные приборы и устройства.
Еще в 1970-е годы ХХ века ученые предлагали применять к изображению математические операции. Так, А. Розенфельд доказал, что любой матрице можно сопоставить дискретное изображение [18]. Вместе с тем изображение интересно не своими функциями и матрицами, а той конкретной информацией, которая в нем изначально заложена.
Прошло 50 лет, но несмотря на значительные успехи, достигнутые в области изучения искусственного интеллекта (ИИ) и машинного зрения, его роль в автоматизации является главной только на развитом производстве с высоким технологическим уровнем. В остальных случаях компьютерное зрение выступает как дополнительная вспомогательная опция к человеческому анализу.
Аналитики ведущего поставщика информации и консультационных услуг IDC в своем докладе «Эра данных 2025» (Data Age 2025) указывают, что уже к 2025 году объем всей имеющейся информации в мире составит 163 зеттабайт. Если сравнить с 10-летним предшествующим периодом, показатель превысит данные 2016 года в 10 раз. Другими словами, каждый год человечество создает почти столько же информации, сколько уже имеет.
Для эпохи продолжительного информационного взрыва характерна неразбериха и обесценивание информации. Из информационного водопада все сложнее выудить полезную релевантную часть. Человеку справиться с этой задачей не под силу.
Вследствие этого возникают сложности при решении таких задач, как выбор эффективных методов и средств сбора, обработки и анализа Big Data (большие объемы, высокоскоростные и/или вариативные информационные активы), а также препятствия для своевременного и обоснованного принятия управленческих решений [12].
Человек - самый распространенный объект на фотографиях, поэтому анализ изображений с людьми является первостепенной задачей компьютерного зрения. Лицо человека несет достаточно информации, которую можно обозначить как атрибуты. К ним относятся пол, возраст, эмоции, раса и другое, которые необходимо выделить для получения информации.
Чтобы решить эту задачу автоматически, следует привлечь к определению атрибутов личности по изображению лица интеллектуальные компьютерные системы. Информационный хаос смогут победить только самые инновационные разработки в такой области ИИ, как компьютерное зрение.
Об актуальности темы свидетельствует не только практическое внедрение системы технического зрения (СТЗ) в нетрадиционные для автоматизации сферы человеческой жизнедеятельности (мультимедиа, искусство и дизайн, геоинформационные системы и базы данных изображений) [24], но и проявление все большего интереса к ней со стороны научного сообщества.
Компьютерное зрение является довольно молодой наукой [16]. Примечательно, что свое основное развитие она получает в основном в последние годы в сторону практического использования. Например, изучение задач определения атрибутов личности по изображению лица с помощью компьютерного зрения связано с коммерческими интересами в большей степени, чем с научными. В связи с этим данная область прикладной информатики не может похвастаться большим количеством изданных научных произведений.
В ходе написания диссертации исследованы зарубежные и отечественные научные труды в области компьютерного зрения. По вышеуказанным причинам упор сделан на современные издания, однако рассмотрены также и классические монографии.
Объектом настоящего исследования является информационный процесс обработки графических изображений.
Предметом исследования являются методы компьютерного зрения для задач определения атрибутов личности по изображению лица .
Цель исследования: исследовать и разработать точные автоматические методы и алгоритмы распознавания таких атрибутов человека как пол и возраст, а также провести анализ их эффективности.
Гипотеза диссертации: следует ожидать, что разработанный в рамках диссертационного исследования алгоритм достаточно точно определит атрибуты личности по изображению лица.
В соответствии с поставленной целью выделены основные задачи диссертации:
- провести обзор современного состояния исследований в области методов компьютерного зрения;
- провести анализ наиболее эффективных методов определения атрибутов личности по изображению лица;
- выбрать методы, на основании которых разработать алгоритм определения возраста и пола лица по изображению;
- провести апробацию моделей, полученных в ходе обучения нейросетей с различными характеристиками, с целью определения более эффективных;
- провести практические эксперименты и оценить качество работы разработанного алгоритма.
В ходе работы применялись следующие методы научного исследования: визуализация данных, математическая статистика, ранжирование, шкалирование и нахождение математических величин.
При выполнении диссертации последовательно пройдены следующие этапы:
- постановочный (постановка проблемы, определение предмета и объекта исследования, изучение литературы в предметной области, формулировка цели, гипотезы и задач исследования);
- исследовательский (выбор методологии исследования,
непосредственный процесс исследования, формулирование предварительных выводов и их уточнение, обоснование заключительных выводов);
- заключительный (практическое обоснование полученных результатов и их апробация, подтверждение или опровержение гипотезы).
Научная новизна диссертационной работы. В процессе исследования на основании метода машинного обучения был предложен алгоритм решения задачи автоматического определения по изображению таких атрибутов человека, как возраст и пол.
Теоретическая значимость. Теоретические положения и выводы, полученные в ходе диссертации, приведут к приращению научных знаний в области исследования компьютерного зрения, а также могут способствовать развитию научного интереса в изучении данного направления.
Практическая значимость диссертационной работы состоит в реализации теоретических аспектов в ходе практических экспериментов и в возможности применять получившиеся результаты в будущих достижениях области компьютерного зрения.
При проведении научного исследования принято участие в VII Международной научно-практической конференции (школы-семинара) молодых ученых «Прикладная математика и информатика: современные исследования в области естественных и технических наук» и Всероссийской студенческой научно-практической междисциплинарной конференции «Молодежь. Наука. Общество» с докладами, затрагивающими тему диссертации: «Формирование изображений в системе технического зрения с помощью датчиков», «Цветовая фильтрация OpenCV для решения задач компьютерного зрения».
На защиту выносится:
- алгоритм автоматического определения атрибутов личности (пол и возраст) по изображению лица на основе методов компьютерного зрения;
- результаты апробации и оценки эффективности разработанных
методов определения атрибутов личности (пол и возраст)
по изображению лица.
Диссертация состоит из введения, 4 глав, заключения, списка
используемой литературы и используемых источников и приложения.
Работа изложена на 82 страницах, содержит 26 рисунков, 3 таблицы и 41 источник.
Использованные в диссертации изображения находятся в свободном доступе, являются общественным достоянием или собственными изображениями.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Компьютерное зрение - перспективное научное направление в области ИИ, имеющее прямое прикладное применение. Правильное построение программного кода зависит от полноты понимания теоретических основ и элементарных принципов действия СТЗ.
Магистерская диссертация посвящена актуальной проблеме автоматического определения атрибутов личности по изображению лица, решаемой при помощи методов компьютерного зрения.
Выполненные в работе научные исследования представлены следующими основными результатами.
В процессе проведенного исследования в главе 1 диссертации исследована широкая теоретическая база в области понимания задач компьютерного зрения и их решения, рассмотрены проблемы, возникающие при решении задач компьютерного зрения, доказана актуальность решения такой задачи, как определение атрибутов личности по изображению лица.
В главе 2 диссертации теоретически определены общие положения функционирования СТЗ по формированию, представлению, обработке и анализу изображений, а также рассмотрены связанные с данными операциями методы машинного обучения в контексте решения задач определения атрибутов личности по изображению лица. По итогам исследования определены достоинства и недостатки каждого метода, а для решения поставленной задачи предложено использовать нейросетевые алгоритмы.
В главе 3 разработан алгоритм автоматического определения возраста и пола лица на основе метода глубокого ожидания (DEX), определены способы предобработки изображений и метод обнаружения лица на изображении.
В главе 4 определен программный комплекс для решения задачи определения атрибутов личности по изображению лица, найдена подходящая база фотографий лиц людей с метками для пола и возраста, подобраны архитектуры нейронных сетей для глубокого обучения и проведено их теоретическое и практическое сравнение. В ходе исследования обучены модели по заданным параметрам, проверена их работоспособность на тестовом множестве. Из полученных весов выбрана модель с наименьшими ошибками определения возраста, которая успешно применена в реальной ситуации. Так, был правильно определен пол и возраст личности по изображению лица на видеопоследовательности.
Тем самым, проведенным исследованием получены полезные теоретические и практические методики решения такой задачи компьютерного зрения, как определение атрибутов личности по изображению лица.
Для доказывания главной гипотезы работы исходные данные исследования получены на основании системного подхода к изучению научной отечественной и зарубежной литературы в области компьютерного зрения, а также моделирования работы СТЗ для решения конкретных задач.
Таким образом, в ходе работы решена актуальная научно-практическая проблема исследования и разработан алгоритм, который достаточно точно определил атрибуты личности по изображению лица.


1. Блум Ф., Лейзерсон А., Хофстедтер Л. Мозг, разум и поведение. М. : Мир, 1988. 246 с.
2. Визильтер Ю.В. [и др.]. Обработка и анализ изображений в задачах машинного зрения: Курс лекций и практических занятий. М.: Физматкнига, 2010. 672 с.
3. Глебов Н.И., Кочетов Ю.А., Плясунов А.В. Методы оптимизации. Учеб. пособие. Новосибирск : Новосиб. ун-т, 2000. 105 с.
4. Горячкин Б.С., Китов М.А. Компьютерное зрение // E-Scio 2020. № 9. С. 317-345.
5. Динамика интернет-торговли, прогноз. Data Insight
[Электронный ресурс]. URL:
https://datainsight.ru/sites/default/files/DI_eCommerce2020_2024.pdf. Л. 3 (дата обращения: 28.10.2020).
6. Журавлев Ю.И., Гуревич И.В. Распознавание образов и анализ изображений / Искуственный интеллект. - В 3-х кн. - М. : Радио и связь, Кн. 2. Модели и методы: Справочник, 1990. 304 с.
7. Захаренко Г.И. Формирование изображений в системе технического зрения с помощью датчиков // VII Международная научно-практическая конференция (школа-семинар) молодых ученых: сборник материалов. 2021. С. 256-261.
8. Клетте Рейнхард. Компьютерное зрение. Теория и алгоритмы. М. : ДМК Пресс, 2019. 506 с.
9. Комарцова Л.Г., Максимов А.В. Нейрокомпьютеры: учеб. пособие для студентов вузов, обучающихся по специальности «Вычисл. машины, комплексы, системы и сети» направления подгот. дипломир. специалистов «Информатика и вычисл. техника». М. : Изд-во МГТУ им. Н.Э. Баумана, 2004. 399 с.
10. Коршунов А. [и др.]. Определение демографических атрибутов пользователей микроблогов. Труды Института системного программирования РАН, 2013, том 25. С. 180.
11. Кузнецов Д.А. [и др.]. Сравнительный анализ популярных методов распознавания лиц на изображениях // Научный результат. Информационные технологии. Т. 4. № 4. 2019.
12. Мкртычев С.В. Большие данные: подходы к определению и классификации // Сборник докладов III Всероссийской научной конференции с международным участием (ТГУ). 2021. С. 253-258.
13. Мокеев А.В. О точности и быстродействии метода синтеза главных компонент. Бизнес-информатика № 3 (13). 2010.
14. Новаковский С.В. Цвет в цветном телевидении. М. : Радио и связь, 1988. 288 с.
15. Поляков Г.И. О принципах нейронной организации мозга. М. : Изд- во Моск. ун-та, 1965. 166 с.
16. Потапов А.С. Системы компьютерного зрения. Учебное пособие. СПб : Университет ИТМО, 2016. 161 с.
17. Розенблатт Ф. Принципы нейродинамики : Перцептроны и теория механизмов мозга. М. : Мир, 1965. 480 с.
18. Розенфельд А. Распознавание и обработка изображений с помощью вычислительных машин. М. : Мир, 1972. 230 с.
...
Всего источников – 41.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ