Тема: Автоматическое обнаружение и трекинг объектов на основе алгоритмов компьютерного зрения
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Глава 1. Обзор существующих методов 6
1.1 Основные методы реализации компьютерного зрения 6
1.2 Методы идентификации личности 9
1.2.1 Метод EigenFaces 9
1.2.2 Метод FiserFaces 10
1.2.3 Метод LBPH 12
1.3 Автоматическая система слежения за объектом 14
1.3.1 Алгоритм MeanShift 14
1.3.2 Алгоритм KLT 15
1.4 Нейронные сети 16
1.4.1 Свёрточные нейронные сети 18
Глава 2. Постановка и решение задачи 21
2.1 Цели и задачи 21
2.2 Алгоритм реализации идентификации лиц 23
2.3 Алгоритм реализации нейронных сетей 23
2.4 Используемые средства для выполнения работы 25
2.4.1 Язык программирования 25
2.4.2 Библиотеки алгоритмов компьютерного зрения 25
2.4.3 Нейросетевые библиотеки 26
2.5 Разработка базы данных 27
2.6 Разработка приложения 28
Глава 3. Результаты и оценка эффективности алгоритма 34
3.1 Предел применимости 34
3.2 Эффективность идентификации личности 35
3.2.1 Тестирование на базе «faces94» 35
3.2.2 Тестирование на базе «Celebrities» 36
3.3 Эффективность определения пола и возраста 39
3.3.1 Тестирование на базе «IMDB-WIKI» 38
3.4 Анализ результатов и выбор алгоритма 39
3.5 Пример работы алгоритма в режиме реального времени 40
Заключение 44
Список литературы 45
Приложение 1 47
Приложение 2 63
Приложение 3 66
📖 Введение
Использование программного обеспечения для анализа визуального контента является такой же большой революцией в вычислительной технике, как и мобильная связь 20 лет назад, и предоставит разработчикам и предприятиям преимущество в создании удивительных продуктов.
Computer Vision - это процесс использования машин для понимания и анализа изображений (как фотографий, так и видео). Хотя эти типы алгоритмов были в различных формах с 1960-х годов, последние достижения в области машинного обучения, а также скачки в области хранения данных, вычислительных возможностей и дешевых высококачественных устройств ввода привели к значительным улучшениям в том, насколько хорошо программное обеспечение может исследовать этот вид контента.
Значительной проблемой, стоящей перед концепциями компьютерного зрения, считается неустойчивость визуальных образов, сопряженная с переменами освещённости, окраски, масштабов и ракурсов наблюдения. Также необходимо устранение неоднозначности, возникающей при проектировании трехмерных объектов реального мира на плоские изображения.
Можно распределить решение задачи идентификации личности на два этапа. Первый - определение положения лица на изображении. Подход, который применяется для ее решения может быть различен и зависит от условий его применения. Формально, как правило, используются характерные признаки для определения, что на фотографии присутствует человек, и бустинг для выявление наиболее подходящих признаков. Второй этап - идентификация. На сегодняшний день существует множество алгоритмов, для её реализации. Также наиболее развивающимся направлением в решении как этой проблемы, так и других проблем компьютерного зрения, являются нейронные сети.
✅ Заключение
Был разработан программный комплекс автоматического учета посещаемости студентов на занятиях, в который также входят модуль для работы с реляционной базой данных и нейросетевой модуль. В разработанном программном обеспечении реализованы следующие функции: формирование базы данных вручную или через загрузку списка студентов из файла, автоматическая видеосъемка, определение присутствующих и отсутствующих на занятии и занесение информации об этом в базу данных, анализ посещаемости за весь семестр, определение пола и возраста лиц, оставшихся нераспознанными. Идентификация личности осуществляется в режиме реального времени, а также есть возможность работы с видеофайлами. Система была протестирована на занятиях студентов института ВМиИТ-ВМК. Для тестирования программы была создана реляционная база данных и разработаны две нейронные сети.
В дальнейшем планируется улучшить работу системы распознавания лиц с помощью комбинации нескольких методов и точность нейронных сетей, увеличив обучающую выборку (количество изображений).



