Аннотация
Введение 5
Глава 1 Изучение подходов и методов идентификации объектов 7
1.1 Изучение проблемы распознавания объектов на изображении 7
1.2 Метод гибкого сравнения на графах 9
1.3 Свёрточные нейронные сети 13
1.4 Гистограмма направленных градиентов и метод опорных
векторов 18
1.5 Обоснование выбранного метода 23
Глава 2 Разработка программного обеспечения 25
2.1 Выбор определенного программного обеспечения для решения
конкретной задачи 25
2.2 Принцип работы метода HOG 25
2.3 Подготовка обучающей выборки 31
Глава 3 Тестирование программного обеспечения 33
3.1 Обучение детекторов 33
3.2 Распознание горящей фары 39
3.3 Оценка разрешения камеры и времени затрачиваемое на решение
задачи 44
Заключение 45
Список используемой литературы 46
Сегментация изображения — это процесс разделения изображения на несколько сегментов или областей на основе определенных характеристик, таких как цвет, текстура или форма. Основная цель сегментации изображения — упростить изображение или сделать его более осмысленным и легким для анализа.
После завершения сегментации изображения следующим шагом является классификация состояния каждого сегмента на основе определенных критериев. Это может включать в себя определение типа объекта или материала, присутствующего в сегменте, идентификацию любых дефектов или аномалий, или даже обнаружение специфических особенностей, таких как края или углы.
Одно из основных применений сегментации изображений и последующей классификации находится в области компьютерного зрения, где она используется в различных задачах, таких как обнаружение, распознавание и отслеживание объектов. Например, при автономном вождении сегментация изображения может использоваться для идентификации различных объектов, таких как пешеходы, транспортные средства и дорожные знаки, а последующая классификация может помочь определить состояние каждого объекта (например, переходит ли пешеход улицу или нет).
Еще одним применением сегментации и классификации изображений является медицинская визуализация, где их можно использовать для идентификации и анализа различных структур и тканей в организме. Например, при МРТ сегментация изображения может использоваться для отделения мозга от окружающих тканей, а последующая классификация может помочь определить состояние каждого сегмента (например, есть ли опухоль или нет).
Таким образом, сегментация изображений и последующая классификация являются важными методами компьютерного зрения и медицинской визуализации, которые могут помочь упростить и проанализировать сложные изображения. Эти методы имеют множество применений и постоянно совершенствуются для достижения большей точности и эффективности.
Цель выпускной квалификационной работы (ВКР) - исследование методов локализации и классификации объектов на изображении и разработка универсального алгоритма для решения практико-ориентированных задач.
Объект ВКР - распознавание блока фары и соответствующих её состояний.
Предмет ВКР: Способы выделения информации в видеопотоке с применением технологии ИИ.
Основная цель выпускной квалификационной работы заключается в выполнении следующих задач:
• Изучение методов локализации и классификации объектов на изображении.
• Разработка алгоритма, который будет решать конкретную задачу распознавания объекта и его состояний на изображении, ориентированную на практику.
• Тестирование разработанного решения и проведение анализа полученных результатов.
Итоговый проект успешно выполнил все задачи и цели, связанные с локализацией и классификацией объектов. Разработанное программное обеспечение предназначалось для тестирования блока фар и удовлетворяло всем требованиям задачи. В ходе проекта были выполнены следующие задачи:
• Были изучены различные способы локализации и классификации объектов на изображениях и выбран наиболее подходящий.
• Рассмотрен математический алгоритм выбранного метода, который может быть применен для решения практических задач в других областях.
• Разработанный программный продукт был протестирован на реальных данных, и было установлено, что обученные детекторы эффективны в определении текущего состояния блока фар.
Запись с камеры была нарезана на кадры и использовалась для обучения и тестирования. Для обучения были выбраны четкие изображения, а для проверки стабильности детекторов использовались размытые изображения. Алгоритм дал успешные результаты, и при тестировании не было обнаружено ошибок, которые могли бы помешать получению правильных результатов.
Разработанное программное решение может быть использовано для оказания помощи человеку при тестировании автомобиля или замены человека на данном этапе тестирования в дальнейшем. Кроме того, алгоритм можно переобучить для решения других практических задач.
1. Зайцев, А. Тенденции в области искусственного интеллекта. Современные методы машинного обучения / А. Зайцев // Видеонаука: сетевой журн. - 2018. - №1(9). - URL: https://videonauka.ru/stati/32-vystavkikonferentsii- seminary/182-tendentsii-v-oblastiiskusstvennogo-intellekta-sovremennye- metodymashinnogo-obucheniya
2. Столяров, А. Пища роботов: как хранилища данных повлияют на будущее ИИ / А. Столяров // CNews : интернет-портал. - http://storage.cnews.ru/articles/2018-11- 29_pishcha_robotov_kak_hranilishcha_dannyh_po vliyayut_na_budushchee_ii
3. Федосеев А. А. Распознавание образов / А.А Федосеев Е.А., Фрышкина // Ученые заметки ТОГУ. - 2018. - Т. 9, № 2. - С. 475-479. - https://elibrary.ru/item.asp?id=35358856
4. Isakov, Yu.A.Artificial intelligence / Yu.A. Isakov //
ModernScience. - 2018. - № 6-1. - С. 25-27. -
https://elibrary.ru/item.asp?id=35277490
5. Vadinsky, O An overview of approaches evaluating intelligence of artificial systems / O. Vadinsky // Acta informatica pragensia. - 2018. - № 7-1. - С. 74-103 https://elibrary.ru/item.asp?id=35423152
6. Liu, W., Anguelov, D., Erhan, D., Szegedy, C., Reed, S., Fu, C. Y.,
& Berg, A. C. (2018). SSD: Single shot multibox detector. In European conference on computer vision (pp. 21-37). Springer, Cham.
https://link.springer.com/chapter/10.1007/978-3-030-01234-2_2
7. Redmon, J., & Farhadi, A. (2018). YOLOv3: An incremental improvement. arXiv preprint arXiv:1804.02767. https://arxiv.org/abs/1804.02767
8. Ren, S., He, K., Girshick, R., & Sun, J. (2018). Faster R-CNN:
Towards real-time object detection with region proposal networks. IEEE transactions on pattern analysis and machine intelligence, 39(6), 1137-1149.
https://ieeexplore.ieee.org/document/7801919
9. Hu, J., Shen, L., & Sun, G. (2018). Squeeze-and-excitation
networks. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 7132-7141).
https://openaccess.thecvf.com/content_cvpr_2018/html/Hu_Squeeze-and- Excitation_Networks_CVPR_2018_paper.html
10. Li, H., Qi, X., Dai, J., Ji, X., & Wei, Y. (2018). Fully convolutional instance-aware semantic segmentation. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 2359-2367). https: //openaccess.thecvf.com/content_cvpr_2018/html/Li_Fully_Convolutional_I nstance-Aware_CVPR_2018_paper.html
11. Zhou, Y., Zhu, Y., Ye, Q., Qiu, Q., & Jiao, J. (2018). Densely connected pyramid dehazing network. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 3194-3203). https: //openaccess.thecvf.com/content_cvpr_2018/html/Zhou_Densely_Connected _Pyramid_CVPR_2018_paper.html
12. Zhang, H., Dana, K., Shi, J., Zhang, Z., Wang, X., Tyagi, A., & Agrawal, A. (2018). Context encoding for semantic segmentation. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 7151-7160). https: //openaccess.thecvf.com/content_cvpr_2018/html/Zhang_Context_Encoding _for_CVPR_2018_paper.html
13. Wang, X., Girshick, R., Gupta, A., & He, K. (2018). Non-local
neural networks. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 7794-7803).
https://openaccess.thecvf.com/content_cvpr_2018/html/Wang_Non- Local_Neural_Networks_CVPR_2018_paper.html
14. Li, Y., Huang, C., & Nevatia, R. (2018). Learning to associate
objects for pedestrian tracking. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 4203-4212).
https://openaccess.thecvf.com/content_cvpr_2018/html/Li_Learning_to_Associate _CVPR_2018_paper.html
15. Li, H., Pang, J., Shi, J., & Xu, X. (2018). Detection distillation: Transferring knowledge from object detection to semantic segmentation. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 3154-3163)....30