Тип работы:	Предмет:	Язык работы:

ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ В ЗАДАЧАХ КЛАССИФИКАЦИИ ВИЗУАЛЬНЫХ ДАННЫХ

Работа №	74499
Тип работы	Дипломные работы, ВКР
Предмет	информатика
Объем работы	40
Год сдачи	2020
Стоимость	4750 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено	164

Не подходит работа?

Узнай цену на написание

Содержание

ВВЕДЕНИЕ 5
1 АНАЛИЗ СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ РЕШЕНИЯ ЗАДАЧ
КЛАССИФИКАЦИИ И ЛОКАЛИЗАЦИИ 7
1.1 Метрики оценки качества сверточных нейронных сетей 7
1.1.1 Т очность и полнота 7
1.1.2 График Точности и Полноты 8
1.1.3 Метрика степени пересечения областей на изображении «IoU» 9
1.1.4 Метрика оценки качества ранжирования «mAP» 10
1.2 Детектирование объектов на основе сверточных нейронных сетей YOLO 11
1.2.1 Архитектура сети YOLO 11
1.2.2 Архитектура сети YOLOv2 14
1.2.3 Архитектура сети YOLOv3 16
1.3 Детектирование объектов на основе сверточной нейронной сети
RetinaNet 18
1.3.1 Функция потерь Focal loss 18
1.3.2 Функциональная пирамидальная сеть 19
1.3.3 Архитектура сети RetinaNet 20
1.5 Выводы по главе 27
2 ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ СВЕРТОЧНЫХ НЕЙРОННЫХ
СЕТЕЙ ПРИ РЕШЕНИИ ЗАДАЧИ ДЕТЕКТИРОВАНИЯ ОБЪЕКТОВ 28
2.1 Метод обучения нейронных сетей на основе подхода «Transfer learning» 28
2.2 Постановка задачи 29
2.3 Сравнительный анализ эффективности сверточных нейронных сетей .. 31
2.4 Определение расстояния до детектируемых объектов при помощи
контроллера Kinect v2 33
2.4.1 Построение карты глубин 33
2.4.2 Совмещение детектора для задачи классификации и локализации c
игровым контроллером Kinect v2 34
2.5 Вывод по главе 37
ЗАКЛЮЧЕНИЕ 38
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

Введение

Актуальность. Компьютерное зрение - область научных и прикладных исследований, направленных на извлечение и последующее использование информации об объектах внешнего мира, полученной из изображений. Первоначальной задачей компьютерного зрения было восстановление пространственной структуры объекта (3D) по плоским изображениям (2D). Затем, данная задача была расширена в сторону анализа состояния объекта по изображениям
Задачи компьютерной обработки и анализа изображений открывают широкие перспективы автоматизации многих сфер человеческой деятельности. Новые подходы в области задачах классификации, локализации, сегментации объектов берут в курс в сторону быстродействия и точности, что позволяет создавать системы распознавания в режиме реального времени. Усовершенствование быстродействия таких подходов позволяет создать различные системы распознавания, что делает возможным их применение в таких сферах жизни, как маркетинг, где, например, такие подходы используются для поиска определенного бренда одежды, идентификации правонарушителей системой городского видеонаблюдения, диагностики раковых заболеваний на снимках КТ и МРТ в медицине. Также подходы в решении задач классификации и локализации активно используются в робототехнике, например, для использование летательных и сухопутных дронов для анализа энергосетей в труднодоступных для человека местах.
Целью магистерской диссертации является оценка эффективности сверточных нейронных сетей, а также разработка интеллектуальной системы для определения расстояния до детектированных при помощи сверточных нейронных сетей объектов.
Для достижения поставленной цели необходимо решить следующие задачи:
Обзор современных источников литературы по основной теме исследования.
Подготовка данных для обучения сверточных нейронных сетей посредством аннотирования изображений.
Обучение разных архитектур сверточных нейронных сетей и определение их эффективности.
Разработка интеллектуальной системы определения расстояния до локализированных объектов на основе стереокамеры.
Научная новизна заключается в разработке интеллектуальной системы определения расстояния до локализированных объектов на основе методов глубокого обучения, а также использования стереокамеры.
Апробация и публикации. В процессе работы над магистерской диссертацией была опубликована статья:
- в сборнике VI Международной научной конференции «Актуальные проблемы авиации и космонавтики» (г. Красноярск, 2020).

Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!

ДИПЛОМНЫЕ МАГИСТЕРСКИЕ ДИССЕРТАЦИИ

Курсовые Статьи Диплом Рязань

Заключение

Первым этапом выполнения работы было исследование предметной области. Были рассмотрены архитектуры сверточных нейронных сетей для задачи классификации и локализации YOLO и RetinaNet, а также способы оценки их эффективности.
Вторым этапом выполнения работы был поиск соответствующих фреймворков для обучения на данных о цветах, находящихся в открытом доступе, обучение архитектур сверточных нейронных сетей, а также оценка эффективности распознавания и быстродействия. До начала обучения данные были предварительно обработаны путем аннотирования каждого из изображений. Более точным подходом оказалась архитектура RetinaNet, в то время как обе модели YOLO превосходили по скорости быстродействия.
Последним этапом выполнения работы была разработка интеллектуальной системы определения расстояния по визуальным данным, путем совмещения работы совмещения разных архитектур детекторов, а также бесконтактного игрового контролера Kinect v2. В работе продемонстрирована работа системы и показаны выявленные минусы данного подходы, избавиться от которых можно перейдя от задачи локализации к задаче сегментации изображения.

Литература

1. Pascal VOC database. - URL: https://host.robots.ox.ac.uk/pascal/VOC (дата обращения 14.05.2020). - Текст: электронный.
2. The pascal visual object classes challenge: A retrospective. International Journal of Computer Vision / Everingham, S. M. A. Eslami, L. Van Gool, C. K. I. Williams, J. Winn, and A. Zisserman // - Jan. 2015. - P. 17. - direct text.
3. COCO dataset. - URL: http://cocodataset.org/#detection-eval (дата
обращения 12.05.2020). - Текст: электронный.
4. Going Deeper with Convolutions. - URL: https://arxiv.org/abs/1409.4842 (дата обращения 14.05.2020). - Текст: электронный
5. Deep Residual Learning for Image Recognition - URL: https://arxiv.org/abs/1512.03385 (дата обращения 12.05.2020). - Текст: электронный.
6. J. Redmon, S. Divvala, R. Girshick, and A. Farhadi / You only look once: Unified, real-time object detection// - 2015. - P. 1-10. - direct text.
7. J. Redmon. Darknet: Open source neural networks in С - URL: http://pjreddie.com/darknet/, 2013-2016. (дата обращения 12.05.2020). - Текст: электронный.
8. S. Ren, K. He, R. Girshick, and J. Sun. / Faster r-cnn: Towards real-time object detection with region proposal networks // - Jan. 2016. - P. 1-14. - direct text.
9. R. B. Girshick/ Fast R-CNN // ICCV. - Sep. 2015. - P. 1-9. - direct text.
10. P. F. Felzenszwalb, R. B. Girshick, and D. McAllester / Cascade object detection with deformable part models// In CVPR. - 2010. - P. 1-10. - direct text.
11. Воронов С. В., Мухометзянов Р. Н., Воронов И. В. Обнаружение и распознавание дорожных знаков в реальном времени на мобильных устройствах [Текст] // Автоматизация процессов управления. - Ульяновск: ФНПЦ АО «НПО «Марс», 2018, №2. - С. 105-111.
12. J. Redmon and A. Farhadi/ Yolo9000: Better, faster, stronger. In Computer Vision and Pattern Recognition // (CVPR) 2017 IEEE Conference, - 2017. - P. 1-9. - direct text.
13. Redmon and A. Farhadi / Yolov3: An incremental improvement // - 2018. - P. 1-9. - direct text.
14. Liu W., Anguelov D., Szegedy C. SSD: Single Shot MultiBox Detector [Text] // ECCV 2016. - 2016, Vol.1. - Pp. 21-37. Liu, Wei et al / SSD: Single Shot MultiBox Detector // Lecture Notes in Computer Science (2016) // - 2016. - P. 1-37.
15. T.Y. Lin, P. Dollar, R. Girshick, K. He, B. Hariharan, and S. Belongie / Feature pyramid networks for object detection // In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition pages - 2017. - P. 1-9. - direct text.
16. T.Y. Lin, P. Goyal, R. Girshick, K. He, and P. Dollar / Focal loss for dense object detection // - Feb. 2018. - P. 1-10. - direct text.
17. K. He, X. Zhang, S. Ren, J. Sun / Deep Residual Learning for Image Recognition // - Dec. 2015. - P. 1-10. - direct text.
18. A.Krizhevsky I.Sutskever G.E. Hinton / ImageNet Classification with Deep Convolutional Neural Networks // - P. 1-9. - direct text.
19. Deng, J., Dong, W., Socher, R., Li, L., Li, K., & Fei-fei, L. / ImageNet: A Large-Scale Hierarchical Image Database. In IEEE Conference on Computer Vision and Pattern Recognition // - P. 1-10. - direct text.
20. K. Simonyan, A.Zisserman / Very Deep Convolutional Networks for Large-Scale Image Recognition// - Apr. 2015. - P. 1-10. - direct text.
21. Pan, S. J., & Yang, Q / Automated Classification of Lung Diseases in Computed Tomography Images Using a Wavelet Based Convolutional Neural Network // IEEE Transactions on Knowledge and Data Engineering, - 2010. - P. 1-11. - direct text.
22. Flower recognition database - URL:
https://www.kaggle.com/alxmamaev/flowers- recognition#102841525_bd6628ae3c.jpg (дата обращения 13.05.2020). - Текст: электронный.
23. labelImg - URL: https://github.com/tzutalin/labelImg дата обращения 14.05.2020). - Текст: электронный.
24. Imageai - URL: https://imageai.readthedocs.io/en/latest/ (дата обращения 14.05.2020 дата обращения 13.05.2020). - Текст: электронный.
25. Keras-retinanet - URL: https://github.com/fizyr/keras-retinanet (дата
обращения 14.05.2020 дата обращения 14.05.2020). - Текст: электронный.
26. PyKinectv2 - URL: https://github.com/Kinect/PyKinect2 (дата обращения 14.05.2020 дата обращения 14.05.2020). - Текст: электронный.
27. K. He, G. Gkioxari, P. Dollar, and R. Girshick / Mask r-cnn // - ICCV- Apr. 2017. - P. 1-5. - direct text.