Тема: Модификация архитектуры модели обнаружения объектов в режиме реального времени
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1 Анализ классов методов распознавания объектов на изображении 7
1.1 Обзор подходов к распознаванию объектов на изображении 7
1.2 Анализ методов распознавания объектов на основе машинного
обучения 8
1.3 Анализ методов распознавания объектов на основе глубокого
обучения 11
2 Сравнительный анализ детекторов объектов на основе сверточных
нейронных сетей и их компонентов 22
2.1 Анализ основных принципов функционирования детекторов
объектов на основе сверточных нейронных сетей 22
2.2 Сравнительный анализ сверточных архитектур, входящих в состав
детекторов объектов 25
2.3 Обзор современных детекторов объектов на изображении на основе
сверточных нейронных сетей 31
2.3.1 Обзор детектора Faster R-CNN 31
2.3.2 Обзор детектора R-FCN 34
2.3.3 Обзор детектора YOLOv4 36
2.3.4 Обзор детектора SSD 39
2.3.5 Обзор детектора Retina-Net 41
2.3.6 Обзор детектора RefineDet 43
2.3.7 Обзор детектора YOLOR 45
2.4 Сравнительный анализ современных детекторов объектов на
изображении на основе сверточных нейронных сетей 48
3 Модификация архитектуры детектора объектов YOLOR 51
3.1 Выявление сильных сторон детектора YOLOR 51
3.2 Предлагаемые улучшения 54
3.2.1 Улучшение экстрактора признаков 54
3.2.2 Улучшение сети уточнения карт признаков 60
3.3 Описание математической модели модифицированного детектора YOLOR 64
3.4 Оценка производительности модифицированной архитектуры
детектора объектов YOLOR 75
Заключение 84
Список используемой литературы 86
📖 Введение
Актуальность данной работы обуславливается ростом потребности в более точных детекторах объектов для приложений реального времени, поскольку большая часть исследований, нацеленных на создание быстрых детекторов приводит к значительному снижению точности обнаружения объектов.
Целью данной выпускной квалификационной работы является модификация одного из современных детекторов объектов на изображении для улучшения показателей точности и скорости обнаружения.
Объектом исследования в данной работе являются детекторы объектов, пригодные для работы в приложениях реального времени. Предметом исследования является влияние структурных особенностей различных детекторов объектов на показатели точности и скорости обнаружения.
Гипотеза исследования заключается в предположении, что производительность детекторов объектов на изображении во многом зависит от сверточной архитектуры, входящей в его состав, поэтому правильный выбор и конструирование различных частей детектора, состоящих из сверточных нейронных сетей, позволят значительно повысить точность и скорость обнаружения.
Для достижения поставленной цели необходимо выполнить следующие задачи:
- провести обзор и оценку существующих подходов к обнаружению объектов на изображении;
- провести структурный и сравнительный анализы современных детекторов объектов на изображении, пригодных для работы в режиме реального времени, с целью определения наилучшего из них;
- выявить сильные и слабые стороны наилучшего по результатам сравнения детектора, предложить способы его улучшения и оценить производительность модифицированного детектора.
Научная новизна данного исследования состоит в использовании подхода оптимизации сверточных архитектур, входящих в состав детектора, для повышения его производительности. Кроме того, в данном исследовании предлагается новая сверточная нейронная сеть для извлечения признаков из изображения.
Практическая значимость исследования состоит в разработке сверточной архитектуры, которую можно применять для улучшения производительности большинства существующих детекторов объектов на изображении.
Положения, выносимые на защиту:
- в ходе исследования была разработана новая сверточная нейронная
сеть для выделения признаков на изображении, используемая для улучшения работы детектора YOLOR;
- модифицированные детекторы объектов, полученные в результате
перестроения экстрактора признаков и сети уточнения признаков YOLOR, демонстрируют лучшие результаты как в точности, так и в скорости обнаружения.
Магистерская диссертация состоит из введения, анализа классов методов распознавания объектов на изображении, сравнительного анализа детекторов объектов на основе сверточных нейронных сетей и их компонентов, модификации архитектуры детектора объектов YOLOR, оценки производительности модифицированного детектора и заключения.
В первом разделе проводится обзор подходов к распознаванию объектов на изображении и анализ методов, реализующие данные подходы.
Во втором разделе проводится анализ основных принципов функционирования детекторов на основе сверточных нейронных сетей, сравнительный анализ сверточных архитектур, входящих в состав детекторов, обзор основных детекторов объектов на изображении и их сравнительный анализ.
В третьем разделе производится выявление сильных сторон детектора YOLOR, предлагаются способы улучшения и описывается математическая модель детектора. Также производится оценка точности и скорости модифицированного детектора.
Полученные в ходе выполнения данной работы модификации детектора объектов на изображении демонстрируют наилучшие показатели точности обнаружения по сравнению с оригинальным детектором, а также обладают достаточной скоростью для работы в приложениях реального времени.
✅ Заключение
Для оценки влияния отдельных компонентов детектора на точность и скорость обнаружения был проведен анализ основных принципы работы детекторов объектов на изображении на основе СНС и выполнен сравнительный анализ основных сверточных архитектур, выступающих в качестве структурных частей множества детекторов. Также, были рассмотрены особенности реализации некоторых современных детекторов объектов на изображении, таких как: R-CNN, R-FCN, YOLO, SSD, RetinaNet, RefineDet и YOLOR. В рамках сравнительного анализа данных детекторов были описаны их преимущества и недостатки, а также произведена оценка их показателей точности и скорости обнаружения объектов на изображении. На основании результатов сравнительного был сделан вывод, что одноступенчатые детекторы являются более подходящими для обнаружения объектов в режиме реального времени, за счет лучшего быстродействия. Кроме того, среди рассмотренных детекторов объектов, наилучшим оказался YOLOR, обладающий самыми высокими показателями точности и скорости обнаружения.
Для улучшения детектора YOLOR был проведен анализ его сильных и слабых частей. Главной особенностью детектора YOLOR является применение неявных знаний в процессе обнаружения объектов, которая была сохранена в модифицированном детекторе объектов, поскольку способствуют повышению точности и скорости обнаружения.
В процессе модификации детектора YOLOR было сделано несколько улучшений: в качестве экстрактора признаков была выбрана сконструированная в ходе текущего исследования сверточная архитектура Res3Net, объединяющая преимущества CSPResNeXt и Res2Net, которые обладают лучшей производительностью по сравнению с экстрактором признаков CSPDarknet, также шея детектора YOLOR, состоящая из сети уточнения признаков PAN и блока пространственного объединения пирамид SPP, была заменена на блочную сеть уточнения признаков BiFPN, которая позволяет гибко масштабировать размер рецептивного поля, повышая точность обнаружения и сохраняет пространственную информацию об объектах, которая могла бы быть утеряна при использовании SPP.
Для оценки были обучены две модификации детектора: YOLOR-LM и YOLOR-DM, отличающиеся глубиной сетевой архитектуры. В качестве оцениваемых параметров выступали точность обнаружения, рассчитываемая по метрике AP, и скорость обнаружения (FPS). В результате сравнительного анализа было выявлено, что модификация YOLOR-LM на 4% точнее и на 30% быстрее по сравнению с оригинальным детектором YOLOR. Другая модификация YOLOR-DM, обладающая самой глубокой сетевой архитектурой, повышает точность на 5% по сравнению с детектором YOLOR, однако медленнее него на 25%.
Из полученных результатов исследования следует, что для детектора YOLOR, найдется такой детектор YOLOR-LM, превосходящий его в точности и скорости обнаружения и такой детектор YOLOR-DM, превосходящий оба этих детектора в точности обнаружения, но обладающий меньшим быстродействием.
Таким образом, была подтверждена гипотеза о том, что производительность детектора во многом зависит от правильного конструирования сверточных архитектур, входящих в его состав.



