Применение нейронных сетей для распознавания пола и возраста человека на основе фотографий
|
Введение 4
Обзор литературы 7
Постановка задачи 9
Глава 1. Нейронные сети 10
1.1. Некоторые теоретические выкладки о нейронных сетях 10
1.2. Обучение нейронных сетей 12
1.3. VGG-Face 15
Глава 2. Построение и обучение нейронных сетей 16
2.1. Математическая постановка задачи 16
2.2. Выбор базы фотографий 17
2.3. Предобработка данных 18
2.4. Подготовка рабочей среды 19
2.5. Определение пола 19
2.6. Предсказание пола и возраста одним классификатором 20
2.7. Определение возраста регрессией без разделения по гендерному признаку 22
2.8. Определение возраста классификацией без разделения по гендерному признаку 23
2.9. Определение возраста классификацией с разделением по гендерному признаку 24
2.10. Определение возраста регрессией с разделением по гендерному признаку 27
Глава 3. Анализ полученных результатов 28
3.1. Результаты вычислительных экспериментов 28
3.2. Сравнение моделей 29
Выводы 30
Заключение 31
Список использованных источников 32
Приложение А. Существующие решения задачи 35
Приложение Б. Архитектура сети VGG-Face 38
Приложение С. Базы фотографий лиц людей 40
Обзор литературы 7
Постановка задачи 9
Глава 1. Нейронные сети 10
1.1. Некоторые теоретические выкладки о нейронных сетях 10
1.2. Обучение нейронных сетей 12
1.3. VGG-Face 15
Глава 2. Построение и обучение нейронных сетей 16
2.1. Математическая постановка задачи 16
2.2. Выбор базы фотографий 17
2.3. Предобработка данных 18
2.4. Подготовка рабочей среды 19
2.5. Определение пола 19
2.6. Предсказание пола и возраста одним классификатором 20
2.7. Определение возраста регрессией без разделения по гендерному признаку 22
2.8. Определение возраста классификацией без разделения по гендерному признаку 23
2.9. Определение возраста классификацией с разделением по гендерному признаку 24
2.10. Определение возраста регрессией с разделением по гендерному признаку 27
Глава 3. Анализ полученных результатов 28
3.1. Результаты вычислительных экспериментов 28
3.2. Сравнение моделей 29
Выводы 30
Заключение 31
Список использованных источников 32
Приложение А. Существующие решения задачи 35
Приложение Б. Архитектура сети VGG-Face 38
Приложение С. Базы фотографий лиц людей 40
Возраст и пол человека играют важнейшую роль в социальной жизни индивида и в его взаимодействии с другими людьми. Например, в зависимости от возрастной группы человека во многих языках меняется форма обращения к нему.
Определение пола и возраста является популярной задачей машинного обучения, и в настоящий момент существуют различные подходы к ее решению [7, 12]. Решение данной задачи имеет множество практических приложений. К примеру, появляется возможность быстрого принятия решения о допуске лиц на мероприятие, имеющее возрастной ценз, или на продажу им некоторых товаров. В области маркетинга и анализа статистики сегментирование посещений по социально-демографическому признаку позволяет лучше понять состояние рынка и предпочтения пользователей.
Рассмотрим подробнее некоторые возможные методы решения данной задачи:
1. Методы, основанные на активной модели внешнего вида (AAA) - группа статистических методов, оценивающая визуальные возрастные особенности. Учитываются как главные особенности, такие как глаза, рот, нос и подбородок, так и вторичные, например, морщины. На основе различий этих особенностей у лиц разных возрастных групп строится модель внешнего вида.
2. Mean-Variance Loss [17] - метод, который рассматривает целевую переменную как распределение вероятностей по возрастным и гендерным классам. Функция потерь состоит из комбинации перекрестной энтропии, квадрата отклонения среднего значения распределения от целевой переменной и стандартного отклонения полученного распределения вероятности. В результате подход позволяет уменьшить разброс предсказания и повысить среднюю точность.
3. SSR-Net [21] - компактная сеть с мягкой поэтапной регрессией для оценки возраста. Иерархическая структура позволяет использовать простые и быстрые нейронные сети.
4. Кроме нейронных сетей, для определения пола и возраста применяются и другие методы машинного обучения, например Random Forest [19]. В задаче классификации метод определяет целевой класс как наиболее распространенный предсказанный класс среди всех деревьев. Что касается регрессии, то целевая переменная определятся как среднее значение среди всех деревьев.
5. Модель типа CaffeModel - данное решение представлено в статье «Понимание и сравнение глубоких нейронных сетей для классификации по возрасту и полу». Модель решает задачу классификации. Возрастной диапазон поделен на определенные промежутки, каждый из которых является отдельным классом.
Перечисление работ, содержащих описание решения данной задачи приведено в Приложении А. На данный момент нет ответа на вопрос, какая методология прогнозирования пола и возраста является лучшей. В этом исследовании мы будем работать именно с нейросетевыми моделями.
Распознавание пола человека по фотографии относится к задаче бинарной классификации. Предсказание возраста - это регрессионная задача, но мы решим ее и как задачу классификации, путем группировки по различным возрастным диапазонам. В качестве основы для решения поставленных задач используем предобученную сверточную нейронную сеть.
Областью исследования являются нейронные сети. Предмет исследования - изображения лиц людей.
В данной работе предстоит решить такие проблемы как: выбор наилучшей предобученной сети, подходящей для распознавания пола и возраста; поиск базы фотографий; разработка и обучение нейронных сетей; тестирование и сравнение полученных моделей; анализ результатов.
В работе приведен обзор литературы по изучаемой теме и сформулированы цель и задачи исследования. В первой главе представлены некоторые теоретические сведения по сверточным нейронным сетям, сделан выбор архитектуры сети, которая станет основой последующих моделей. Вторая глава посвящена подготовке данных и обучению нейронных сетей. В третьей главе представлены полученные результаты проведенных вычислительных экспериментов, выполнено сравнение моделей. В разделе «Выводы» проводится анализ полученных результатов. В заключении подведены итоги проведенной работы.
Определение пола и возраста является популярной задачей машинного обучения, и в настоящий момент существуют различные подходы к ее решению [7, 12]. Решение данной задачи имеет множество практических приложений. К примеру, появляется возможность быстрого принятия решения о допуске лиц на мероприятие, имеющее возрастной ценз, или на продажу им некоторых товаров. В области маркетинга и анализа статистики сегментирование посещений по социально-демографическому признаку позволяет лучше понять состояние рынка и предпочтения пользователей.
Рассмотрим подробнее некоторые возможные методы решения данной задачи:
1. Методы, основанные на активной модели внешнего вида (AAA) - группа статистических методов, оценивающая визуальные возрастные особенности. Учитываются как главные особенности, такие как глаза, рот, нос и подбородок, так и вторичные, например, морщины. На основе различий этих особенностей у лиц разных возрастных групп строится модель внешнего вида.
2. Mean-Variance Loss [17] - метод, который рассматривает целевую переменную как распределение вероятностей по возрастным и гендерным классам. Функция потерь состоит из комбинации перекрестной энтропии, квадрата отклонения среднего значения распределения от целевой переменной и стандартного отклонения полученного распределения вероятности. В результате подход позволяет уменьшить разброс предсказания и повысить среднюю точность.
3. SSR-Net [21] - компактная сеть с мягкой поэтапной регрессией для оценки возраста. Иерархическая структура позволяет использовать простые и быстрые нейронные сети.
4. Кроме нейронных сетей, для определения пола и возраста применяются и другие методы машинного обучения, например Random Forest [19]. В задаче классификации метод определяет целевой класс как наиболее распространенный предсказанный класс среди всех деревьев. Что касается регрессии, то целевая переменная определятся как среднее значение среди всех деревьев.
5. Модель типа CaffeModel - данное решение представлено в статье «Понимание и сравнение глубоких нейронных сетей для классификации по возрасту и полу». Модель решает задачу классификации. Возрастной диапазон поделен на определенные промежутки, каждый из которых является отдельным классом.
Перечисление работ, содержащих описание решения данной задачи приведено в Приложении А. На данный момент нет ответа на вопрос, какая методология прогнозирования пола и возраста является лучшей. В этом исследовании мы будем работать именно с нейросетевыми моделями.
Распознавание пола человека по фотографии относится к задаче бинарной классификации. Предсказание возраста - это регрессионная задача, но мы решим ее и как задачу классификации, путем группировки по различным возрастным диапазонам. В качестве основы для решения поставленных задач используем предобученную сверточную нейронную сеть.
Областью исследования являются нейронные сети. Предмет исследования - изображения лиц людей.
В данной работе предстоит решить такие проблемы как: выбор наилучшей предобученной сети, подходящей для распознавания пола и возраста; поиск базы фотографий; разработка и обучение нейронных сетей; тестирование и сравнение полученных моделей; анализ результатов.
В работе приведен обзор литературы по изучаемой теме и сформулированы цель и задачи исследования. В первой главе представлены некоторые теоретические сведения по сверточным нейронным сетям, сделан выбор архитектуры сети, которая станет основой последующих моделей. Вторая глава посвящена подготовке данных и обучению нейронных сетей. В третьей главе представлены полученные результаты проведенных вычислительных экспериментов, выполнено сравнение моделей. В разделе «Выводы» проводится анализ полученных результатов. В заключении подведены итоги проведенной работы.
В выпускной квалификационной работе бакалавра были решены следующие задачи:
1. изучены возможные решения данной проблемы;
2. найдены необходимые для обучения и тестирования сети компоненты, а именно - набор фотографий Wikipedia и предобученная сеть VGG- Face;
3. выполнена предобработка собранных данных, также выборка поделена на 3 части - обучающую, тестовую и валидационную;
4. разработаны и обучены нейронные сети;
5. проанализированы полученные результаты, выполнено сравнение реализованных моделей и сделаны соответствующие выводы.
1. изучены возможные решения данной проблемы;
2. найдены необходимые для обучения и тестирования сети компоненты, а именно - набор фотографий Wikipedia и предобученная сеть VGG- Face;
3. выполнена предобработка собранных данных, также выборка поделена на 3 части - обучающую, тестовую и валидационную;
4. разработаны и обучены нейронные сети;
5. проанализированы полученные результаты, выполнено сравнение реализованных моделей и сделаны соответствующие выводы.
Подобные работы
- Применение нейросетевых технологий для определения пола и возраста человека на основе фотографии лица
Бакалаврская работа, нейронные сети . Язык работы: Русский. Цена: 4600 р. Год сдачи: 2017 - Автоматическое обнаружение и трекинг объектов на основе алгоритмов компьютерного зрения
Дипломные работы, ВКР, информатика. Язык работы: Русский. Цена: 6500 р. Год сдачи: 2019 - Исследование и разработка методов компьютерного зрения для задач определения
атрибутов личности по изображению лица
Магистерская диссертация, информационные системы. Язык работы: Русский. Цена: 5500 р. Год сдачи: 2022 - Разработка приложения для биометрической оценки фото и видео
изображений
Дипломные работы, ВКР, информационные системы. Язык работы: Русский. Цена: 4500 р. Год сдачи: 2023





