🔍 Поиск готовых работ

🔍 Поиск работ

Программная реализация и анализ эффективности моделей сверточных нейронных сетей YOLO для решения задач классификации объектов на изображениях

Работа №201809

Тип работы

Бакалаврская работа

Предмет

информационные системы

Объем работы99
Год сдачи2023
Стоимость4385 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
18
Не подходит работа?

Узнай цену на написание


Введение 11
1 Задачи детектирования объектов на изображениях с помощью моделей
СНС 13
1.1 Детектирование летающих объектов на изображениях 13
1.2 Однофазные и двухфазные детекторы объектов на изображениях 14
2 Постановка задачи исследований 19
2.1 Требования к моделям СНС для детектирования летающих объектов 19
2.2 Цель работы и решаемые задачи 20
3 Выбор компактных моделей семейства YOLO 22
3.1 Сравнительный анализ моделей семейства YOLO 22
3.2 Подходы к обнаружению мелких объектов на изображениях 26
3.3 Анализ компактных моделей СНС 28
3.3.1 Модель СНС YOLO Nano 29
3.3.2 Архитектура модели СНС YOLOv4-Tiny 32
3.3.3 Архитектура модели СНС YOLOv5 33
3.3.4 Архитектура модели СНС YOLOv7 36
4 Подготовка датасета 41
5 Программная реализация компактных моделей СНС и особенности их
обучения 45
5.1 Общие положения 45
5.2 Особенности разработки и обучения моделей СНС семейства YOLO 46
6 Результаты обучения и исследования компактных моделей СНС семейства
YOLO 48
6.1 Результаты обучения компактных моделей СНС 48
6.2 Результаты исследования компактных моделей СНС 52
7 Оценка коммерческого потенциала и перспективности проведения научных
исследований с позиции ресурсоэффективности и ресурсосбережения 57
7.1 Потенциальные потребители результатов исследования 57
7.2 Анализ конкурентных технических решений 57
7.3 Технология QuaD 59
7.4 SWOT-анализ .60
7.5 Структура работ в рамках научного исследования 61
7.6 Определение трудоемкости выполнения работ 62
7.7 Разработка графика проведения научного исследования 63
7.8 Бюджет научно-технического исследования 65
7.8.1 Расчет затрат на специальное оборудование для научных
(экспериментальных) целей 65
7.8.2 Основная заработная плата исполнителей темы .66
7.8.3 Дополнительная заработная плата исполнителей темы 68
7.8.4 Отчисления во внебюджетные фонды (страховые отчисления) 69
7.8.5 Накладные расходы .70
7.8.6 Формирование бюджета затрат научно-исследовательского проекта 71
7.8.7 Определение ресурсной (ресурсосберегающей), финансовой,
бюджетной, социальной и экономической эффективности исследования .71
7.9 Определение потенциального эффекта исследования .74
8 Социальная ответственность .77
8.1 Правовые и организационные вопросы обеспечения безопасности 78
8.1.1 Правовые нормы трудового законодательства .78
8.1.2 Организационные мероприятия при компоновке рабочей зоны 78
8.2 Производственная безопасность .79
8.2.1 Вредные производственные факторы 80
8.2.1.1 Нагрузка на зрительный аппарат 80
8.2.1.2 Отсутствие или недостаток необходимого искусственного освещения
и пониженная световая и цветовая контрастность 81
8.2.1.3 Умственное перенапряжение, в том числе вызванное информационной
нагрузкой .82
8.2.2 Опасные производственные факторы 83
8.3 Экологическая безопасность 84
8.4 Безопасность в чрезвычайных ситуациях 84
8.5 Вывод по разделу 86
Заключение 88
Список публикаций .90
Список источников 91
Приложение А 96

Обнаружение (детектирование) объектов на изображении представляет собой ключевую задачу в области компьютерного зрения и включает одновременное определение местоположения и классификацию объектов на изображении. Положение объекта определяется с помощью ограничивающего прямоугольника (англ.bounding box). Современные достижения в области глубокого обучения позволили сделать значительные успехи в решении многих задач компьютерного зрения, включая обнаружение объектов, благодаря применению глубоких сверточных нейронных сетей (СНС) [1,2].
Большая часть современных моделей СНС для решения задач мультиклассификации объектов на изображениях сосредоточена на повышении точности детектирования объектов, не уделяя должного внимания вычислительной эффективности алгоритмов детектирования объектов. Такой подход приводит к моделям СНС с высокой вычислительной сложностью и низкой ресурсоэффективностью, которые поэтому сложно применять в случае развертывания таких моделей СНС на мобильных устройствах, например, на беспилотных летательных аппаратах (БПЛА) [3]. Таким образом, к моделям СНС, предназначенным для развертывания на мобильных устройствах предъявляются требования [4]:
1. Проведение мультиклассификации объектов на изображениях в режиме реального времени;
2. Высокая вычислительная эффективность СНС и эффективность по занимаемой памяти (малый объем весовых коэффициентов модели СНС);
3. Конкурентноспособность по сравнению с другими моделями СНС в части точности мультиклассификации объектов на изображениях.
В наибольшей степени предъявляемым требованиям соответствуют модели семейства (класса) YOLO [5]. В моделях этого класса мультиклассификация объектов рассматривается как задача регрессии прямоугольных рамок и классов объектов. Модели СНС класса YOLO обрабатывают изображение за один проход. На сегодняшний день существует большое разнообразие моделей YOLO с разным количеством параметров, отличающихся друг от друга по точности и скорости обнаружения объектов [6]. Исследование соответствующих моделей СНС из этого класса, отвечающих вышеуказанным требованиям, с целью использования их в тех или иных мобильных системах компьютерного зрения (СКЗ) является актуальной и весьма сложной задачей.
Данная работа посвящена программной реализации и исследованию четырех компактных моделей СНС класса (семейства) YOLO для применения наиболее эффективных из них в мобильных СКЗ, детектирующих летающие объекты на изображениях в реальном времени.
В разделе 1 рассмотрены современные классы моделей СНС для детектирования летающих объектов на изображениях с целью использования их в мобильных СКЗ. В разделе 2 показаны требования к моделям СНС для детектирования летающих объектов и сформулированы цель и задачи исследования. Раздел 3 посвящен выбору компактных моделей СНС семейства YOLO для дальнейших исследований. В разделе 4 описаны особенности созданного датасета. В разделе 5 освещена программная реализация компактных моделей СНС и особенности их обучения. В разделе 6 приведены результаты обучения и исследования компактных моделей СНС. В разделе 7 изложены вопросы, связанные с финансовым менеджментом, ресурсоэффективностью и ресурсосбережением разработки. Раздел 8 содержит вопросы социальной ответственности: правовые и организационные вопросы, техники безопасности работников и экологической безопасности.
Результаты работы докладывались на трех международных научно-практических конференциях студентов, аспирантов и молодых учёных, получен диплом за лучший доклад. Основные результаты работы опубликованы в виде трех статей в сборниках этих конференций.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


При выполнении ВКР получены следующие наиболее важные результаты и сделаны выводы.
1. Проанализированы модели СНС для детектирования летающих объектов на изображениях с целью создания мобильных СКЗ. Выявлено, что наиболее перспективными для реализации этой цели являются модели СНС класса YOLO. Для последующего исследования выбраны четыре компактные модели из этого класса СНС как наиболее отвечающие сформированным требованиям.
2. Разработаны программы для подготовки датасета. Программно реализована модель СНС YOLO Nano.
3. Сформирован набор оптических изображений с летающими объектами трех классов: «Птица», «БПЛА вертолетного типа» и «БПЛА самолетного типа». На изображениях находятся один или более объектов разных размеров и разных классов . На основе этого набора создан датасет в виде размеченных изображений . В него включено 3400 изображений и файлов аннотаций.
4. Проведен детальный анализ архитектуры компактных СНС YOLOv4 - Tiny, YOLOv5n, YOLOv7-Tiny и YOLO Nano, позволивший задать оптимальные значения параметров этих моделей при обучении.
5. Каждая из четырех компактных моделей СНС настроена, обучена и валидирована с использованием обучающей и валидационной выборок датасета.
6. Проведены исследования эффективности каждой из четырех моделей СНС с использованием тестовой выборки датасета. Показано, что точность детектирования летающих объектов на изображениях по метрикам AP0,5 и mAPo,5 наибольшая при использовании модели СНС YOLOv7-tiny. При этом требование по точности детектирования объектов на изображениях удовлетворяется только для этой модели. Выявлено, что для всех моделей СНС скорость детектирования объектов значительно превышает пороговое значение FPS, равное 25, а алгоритмическая эффективность этих моделей позволяет им выполняться на вычислительных устройствах мобильных СКЗ даже с весьма скромными ресурсами.
7. По результатам всех исследований модель СНС YOLOv7-tiny рекомендована к использованию в мобильных СКЗ реального времени.
8. Результаты работы докладывались на трех международных научно-практических конференциях студентов, аспирантов и молодых учёных, получен диплом за лучший доклад. Основные результаты работы опубликованы в виде трех статей в сборниках этих конференций.



1. Voulodimos A. et al. Deep learning for computer vision: A brief review //Computational intelligence and neuroscience. -2018. - Т. 2018.
2. Alzubaidi L. et al. Review of deep learning: Concepts, CNN architectures, challenges, applications, future directions //Journal of big Data. - 2021.-Т. 8.-С. 1-74.
3. Hassan S. A., Rahim T., Shin S. Y. Real-time uav detection based on deep learning network //2019 International Conference on Information and Communication Technology Convergence (ICTC). - IEEE, 2019. - С. 630-632.
4. Tang W., Hua G., Wang L. How to train a compact binary neural network with high accuracy? //Proceedings of the AAAI conference on artificial intelligence. - 2017. - Т. 31. - №. 1.
5. Redmon J. et al. You only look once: Unified, real-time object detection //Proceedings of the IEEE conference on computer vision and pattern recognition. - 2016. - С. 779-788.
6. Wang S. Research towards Yolo-series algorithms: comparison and analysis of object detection models for real-time UAV applications //Journal of Physics: Conference Series. - IOP Publishing, 2021. - Т. 1948. - №. 1. - С. 012021.
7. Lu X. et al. MimicDet: bridging the gap between one-stage and two- stage object detection //Computer Vision-ECCV 2020: 16th European Conference, Glasgow, UK, August 23-28, 2020, Proceedings, Part XIV 16. - Springer International Publishing, 2020. -С. 541-557.
8. Girshick R. et al. Rich feature hierarchies for accurate object detection and semantic segmentation //Proceedings of the IEEE conference on computer vision and pattern recognition. - 2014. - С. 580-587.
9. Purkait P., Zhao C., Zach C. SPP-Net: Deep absolute pose regression with synthetic views //arXiv preprint arXiv:1712.03452. - 2017.
10. Girshick R. Fast r-cnn //Proceedings of the IEEE international conference on computer vision. - 2015. - С. 1440-1448.
11. Redmon J., Farhadi A. Yolov3: An incremental improvement //arXiv preprint arXiv:1804.02767. - 2018.
12. Lin T. Y. et al. Feature pyramid networks for object detection //Proceedings of the IEEE conference on computer vision and pattern recognition. - 2017.-С. 2117-2125.
13. Girshick R. Fast r-cnn //Proceedings of the IEEE international conference on computer vision. - 2015. - рр. 1440-1448.
14. Ma J., Chen L., Gao Z. Hardware implementation and optimization of tiny-YOLO network //Digital TV and Wireless Multimedia Communication: 14th International Forum, IFTC 2017, Shanghai, China, November 8-9, 2017, Revised Selected Papers 14. - Springer Singapore, 2018. - рр. 224-234.
15. Wong A. et al. YOLO nano: A highly compact you only look once convolutional neural network for object detection //2019 Fifth Workshop on Energy Efficient Machine Learning and Cognitive Computing-NeurIPS Edition (EMC2-NIPS). - IEEE, 2019. - рр. 22-25.
16. T.-Y. Lin, P. Dollar, R. Girshick, K. He, B. Hariharan, and S. Belongie. Feature pyramid networks for object detection. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pages 2117-2125,2017.
17. Shu Liu, Lu Qi, Haifang Qin, Jianping Shi, and Jiaya Jia. Path aggregation network for instance segmentation. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pages 8759-8768, 2018.
18. M. Tan, R. Pang, Q. V. Le. EfficientDet: Scalable and efficient object detection. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2020.
19. Liang-Chieh Chen, George Papandreou, Iasonas Kokkinos, Kevin Murphy, and Alan L Yuille. DeepLab: Semantic image segmentation with deep convolutional nets, atrous convolution, and fully connected CRFs. IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 40(4):834-848, 2017.
20. Ali J. B. et al. Linear feature selection and classification using PNN and SFAM neural networks for a nearly online diagnosis of bearing naturally progressing degradations //Engineering Applications of Artificial Intelligence. - 2015.-Т. 42.-С. 67-81.
21. Qiu M., Huang L., Tang B. H. ASFF-YOLOv5: multielement detection method for road traffic in UAV images based on multiscale feature fusion //Remote Sensing. - 2022. - Т. 14. - №. 14. - С. 3498.
22. Ghiasi G., Lin T. Y., Le Q. V. Nas-fpn: Learning scalable feature pyramid architecture for object detection //Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. - 2019. - С. 7036-7045.
23. Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. Spatial pyramid pooling in deep convolutional networks for visual recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 37(9):1904-1916, 2015.
24. Songtao Liu, Di Huang, et al. Receptive Field Block Net for Accurate and Fast Object Detection. In Proceedings of the European Conference on Computer Vision (ECCV), pages 385-400, 2018.
25. Sanghyun Woo, Jongchan Park, Joon-Young Lee, and In So Kweon. CBAM: Convolutional Block Attention Module. In Proceedings of the European Conference on Computer Vision (ECCV), pages 3-19, 2018.
26. T.-Y. Lin, M. Maire, S. Belongie, L. Bourdev, R. Girshick, J. Hays, P. Perona, D. Ramanan, C. L. Zitnick, P. Dollar. Microsoft COCO: Common Objects in Context. arXiv preprint arXiv:1405.0312, 2014.
27. Wang C. Y., Bochkovskiy A., Liao H. Y. M. YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors //Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. - 2023. - С. 7464-7475.
28. A. Bochkovskiy, C.-Y. Wang, H.-Y. M. Liao. YOLOv4: Optimal Speed and Accuracy of Object Detection. arXiv preprint arXiv:2004.10934, 2020.
29. Liu Y. et al. A survey and performance evaluation of deep learning methods for small object detection //Expert Systems with Applications. - 2021. - Т. 172.-С. 114602.
30. Shorten C., Khoshgoftaar T. M. A survey on image data augmentation for deep learning //Journal of big data. - 2019. - Т. 6. - №. 1. - С. 1-48.
31. Weiss K., Khoshgoftaar T. M., Wang D. D. A survey of transfer learning //Journal of Big data. - 2016. -Т. 3. -№. 1. - С. 1-40.
32. Duan S. et al. An anchor box setting technique based on differences between categories for object detection //International Journal of Intelligent Robotics and Applications. - 2022. - Т. 6. - №. 1. - С. 38-51.
33. Подготовка данных для расширенного машинного обучения [Электронный ресурс] // Microsoft: [сайт] - Режим доступа: https://docs.microsoft.com/ru-ru/azure/architecture/data-science-process/prepare- dataсвободный. - Загл. с экрана (дата обращения 15.02.2023)
34. Bochkovskiy A., Wang C. Y., Liao H. Y. M. Yolov4: Optimal speed and accuracy of object detection //arXiv preprint arXiv:2004.10934. - 2020.
35. Jocher G. et al. ultralytics/yolov5: v5. 0-YOLOv5-P6 1280 models, AWS, Supervise. ly and YouTube integrations //Zenodo. - 2021.
36. PyTorch [Электронный ресурс] - Режим доступа:
https://pytorch.orgсвободный. - Загл. с экрана (дата об Режим доступа:
https://roboflow.comсвободный. - Загл. с экрана (дата обращения 15.05.2023)
38. Кузьмина Е.А, Кузьмин А.М. Методы поиска новых идей и решений «Методы менеджмента качества» №1 2003 г.
39. Кузьмина Е.А, Кузьмин А.М. Функционально-стоимостный анализ. Экскурс в историю. «Методы менеджмента качества» №7 2002 г.
40. Основы функционально-стоимостного анализа: Учебное пособие / Под ред. М.Г. Карпунина и Б.И. Майданчика. - М.: Энергия, 1980. - 175 с.
41. Скворцов Ю.В. Организационно-экономические вопросы в дипломном проектировании: Учебное пособие. - М.: Высшая школа, 2006. - 399 с.
42. СП 52.13330.2016 (ред. от 28.12.2021) [Электронный ресурс]. - URL: https://ac-mos.ru/about/price-expert/chatbot/market-price/download/rent/44- O3/acts/12. (дата обращения: 07.04.2023)
43. Трудовой кодекс Российской Федерации от 30.12.2001 N 197-ФЗ (ред. От 19.12.2022, с изм. от 11.04.2023) [Электронный ресурс]. - URL: https://www.consultant.ru/document/cons doc LAW 34683/(дата обращения: 23.04.2023)
44. ГОСТ 12.1.019-2017 [Электронный ресурс]. - URL:
https://docs.cntd.ru/document/1200161238(дата обращения: 15.05.2023)
45. СП 52.13330.2016 [Электронный ресурс]. - URL:
https://energv.midural.ru/images/Upload/2017/101/SPEIO 07.11.2016 777.pdf(дата обращения: 12.04.2023)
46. СНиП 23-05-95 [Электронный ресурс]. - URL: https://kola.rosavtodor.gov.ru/storage/app/media/kola/uploaded-files/08-16-sp- 52133302016-estestvennoe-i-iskusstvennoe-osveshchenie-aktualizirovannava- redaktsiva-snip-23-05-95-1.pdf(дата обращения: 11.04.2023)


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ