Аннотация
Введение 5
Глава 1 Изучение подходов и методов идентификации объектов 7
1.1 Изучение проблемы распознавания объектов на изображении 7
1.2 Метод гибкого сравнения на графах 9
1.3 Свёрточные нейронные сети 13
1.4 Гистограмма направленных градиентов и метод опорных
векторов 18
1.5 Обоснование выбранного метода 23
Глава 2 Разработка программного обеспечения 25
2.1 Выбор определенного программного обеспечения для решения
конкретной задачи 25
2.2 Принцип работы метода HOG 25
2.3 Подготовка обучающей выборки 31
Глава 3 Тестирование программного обеспечения 33
3.1 Обучение детекторов 33
3.2 Распознание горящей фары 39
3.3 Оценка разрешения камеры и времени затрачиваемое на решение
задачи 44
Заключение 45
Список используемой литературы 46
Сегментация изображения — это процесс разделения изображения на несколько сегментов или областей на основе определенных характеристик, таких как цвет, текстура или форма. Основная цель сегментации изображения — упростить изображение или сделать его более осмысленным и легким для анализа.
После завершения сегментации изображения следующим шагом является классификация состояния каждого сегмента на основе определенных критериев. Это может включать в себя определение типа объекта или материала, присутствующего в сегменте, идентификацию любых дефектов или аномалий, или даже обнаружение специфических особенностей, таких как края или углы.
Одно из основных применений сегментации изображений и последующей классификации находится в области компьютерного зрения, где она используется в различных задачах, таких как обнаружение, распознавание и отслеживание объектов. Например, при автономном вождении сегментация изображения может использоваться для идентификации различных объектов, таких как пешеходы, транспортные средства и дорожные знаки, а последующая классификация может помочь определить состояние каждого объекта (например, переходит ли пешеход улицу или нет).
Еще одним применением сегментации и классификации изображений является медицинская визуализация, где их можно использовать для идентификации и анализа различных структур и тканей в организме. Например, при МРТ сегментация изображения может использоваться для отделения мозга от окружающих тканей, а последующая классификация может помочь определить состояние каждого сегмента (например, есть ли опухоль или нет).
Таким образом, сегментация изображений и последующая классификация являются важными методами компьютерного зрения и медицинской визуализации, которые могут помочь упростить и проанализировать сложные изображения. Эти методы имеют множество применений и постоянно совершенствуются для достижения большей точности и эффективности.
Цель выпускной квалификационной работы (ВКР) - исследование методов локализации и классификации объектов на изображении и разработка универсального алгоритма для решения практико-ориентированных задач.
Объект ВКР - распознавание блока фары и соответствующих её состояний.
Предмет ВКР: Способы выделения информации в видеопотоке с применением технологии ИИ.
Основная цель выпускной квалификационной работы заключается в выполнении следующих задач:
• Изучение методов локализации и классификации объектов на изображении.
• Разработка алгоритма, который будет решать конкретную задачу распознавания объекта и его состояний на изображении, ориентированную на практику.
• Тестирование разработанного решения и проведение анализа полученных результатов.
Итоговый проект успешно выполнил все задачи и цели, связанные с локализацией и классификацией объектов. Разработанное программное обеспечение предназначалось для тестирования блока фар и удовлетворяло всем требованиям задачи. В ходе проекта были выполнены следующие задачи:
• Были изучены различные способы локализации и классификации объектов на изображениях и выбран наиболее подходящий.
• Рассмотрен математический алгоритм выбранного метода, который может быть применен для решения практических задач в других областях.
• Разработанный программный продукт был протестирован на реальных данных, и было установлено, что обученные детекторы эффективны в определении текущего состояния блока фар.
Запись с камеры была нарезана на кадры и использовалась для обучения и тестирования. Для обучения были выбраны четкие изображения, а для проверки стабильности детекторов использовались размытые изображения. Алгоритм дал успешные результаты, и при тестировании не было обнаружено ошибок, которые могли бы помешать получению правильных результатов.
Разработанное программное решение может быть использовано для оказания помощи человеку при тестировании автомобиля или замены человека на данном этапе тестирования в дальнейшем. Кроме того, алгоритм можно переобучить для решения других практических задач.