Аннотация 2
Введение 5
Глава 1 АНАЛИЗ МЕТОДОВ И ПОДХОДОВ РАСПОЗНАВАНИЯ ОБЪЕКТОВ 7
1.1 Анализ задачи распознавания объектов на изображении 7
1.2 Метод гибкого сравнения на графах 8
1.3 Свёрточные нейронные сети 10
1.3.1 Общая информация об нейронных сетях 10
1.3.2 Архитектура сверточной нейронной сети 15
1.4 Гистограмма направленных градиентов и метод опорных векторов 17
1.5 Обоснование выбранного метода 19
Глава 2 РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ 21
2.1 Выбор используемого программного обеспечения 21
2.2 Принцип работы метода HOG 21
2.3 Подготовка обучающей выборки 26
Глава 3 ТЕСТИРОВАНИЕ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ 29
3.1 Обучение детекторов 29
3.2 Распознание горящей фары 36
3.3 Оценка разрешения камеры и времени затрачиваемое на решение задачи 42
Заключение 43
Список используемой литературы 45
Приложения 48
В современных реалиях идет активное развитие технологий, и автоматизация приходит в любой процесс жизни человека. Это уже не является чем-либо удивительным то, что описывалось фантастами в далеком прошлом уже является реальным. Сегодня системы использующие машинное зрение и искусственный интеллект на базе нейронных сетей, это современный тренд.
В данном проекте ставиться задача применения «Гистограммы направленных градиентов» для распознания и определения исправности светотехники, а именно блока-фары автомобиля. Блок-фара представляет конструктив, в который интегрировано несколько источников света.
По сигналу от оператора происходит активация системы, в систему приходит сигнал начала теста, по этому сигналу требуется определить наличие блока-фары. И по дополнительным сигналам различить состояние блока-фары. Предполагается что система изначально определит наличие объекта и после определит дальнейший ход действий.
Принцип действий при обнаружении объекта должен быть примерно следующим. По сигналу система запускается и определяет наличие объекта после чего просит оператора включить ближний свет. Оператор в свою очередь выполняет действие и нажимает на своём пульту кнопку - горит. А система в свою очередь подтверждает или не подтверждает состояние блока фары. Таким образом происходит поочередно проверка всех ламп. На вход поступает сигнал о начале проверки, а на выход поступает сигнал верно или не верно и с какой точностью система это определила.
В таком порядке должна работать конечное программное обеспечение. Чтобы реализовать данный модуль необходимо понять, как устроены методы по обнаружению объектов. Рассмотреть основные принципы реализации нейронных сетей и определить наиболее подходящий метод для решения данной задачи.
Не менее важным фактором будет выбор оборудования, с помощью которого будет происходить получение информации об объекте. Сюда входит камера и способ её взаимодействия с модулем, то есть получение данных об объекте.
Цель выпускной квалификационной работы (ВКР) - исследование методов локализации и классификации объектов на изображении и разработка универсального алгоритма для решения практико-ориентированных задач.
Объект ВКР - распознавание блока фары и соответствующих её состояний.
Предмет ВКР: Способы выделения информации в видеопотоке с применением технологии ИИ.
Основные задачи ВКР:
1. Исследовать методы локализации и классификации объектов на изображении.
2. Разработать алгоритм, решающий практико-ориентированную задачу распознавания объекта и его состояний на изображении;
3. Протестировать разработанное решение и провести анализ полученных результатов.
В рамках выпускной квалификационной работы были рассмотрены способы локализации и классификации, были выполнены все задачи и поставленные цели. Разработано ПО для тестирования блока фары требуемое для решения задачи.
В ходе выполнения бакалаврской работы были решены следующие задачи:
1. Изучены некоторые способы локализации и классификации объектов на изображениях и произведен выбор наиболее подходящего способа.
2. Исходя из сделанного выбора был рассмотрен математический аппарат алгоритма применяемого метода, который может в последствии применятся и в других областях при решение практико-ориентированных задач.
3. Произведено тестирование разработанного программного продукта на реальных данных. В ходе тестирования установлено, что обученные детекторы хорошо справляются с поставленной задачей и определяют к какому состоянию, относится текущее состояние блока фары.
Для обучения и тестирования использовался отснятый видеоматериал на камеру и нарезанный на кадры. Полученные таким образом изображения отбирались для обучения более четкие, для тестов использовались также и смазанные изображения чтобы проверить устойчивость детекторов.
Полученные результаты по применению алгоритма можно считать успешными, во время тестирования не было выявлено никаких ошибок, которые могли бы помешать получению верных результатов.
Разработанное программное решение может использоваться для помощи человеку, проводящему тестирование автомобиля или в будущем может полностью заменить человека на этом этапе тестирования. Так же возможно переобучение алгоритма для решения других практико-ориентированных задач.