Тип работы:
Предмет:
Язык работы:


РАЗРАБОТКА АЛГОРИТМА ПОЗДНЕГО ОБЪЕДИНЕНИЯ МЕТОДОВ ОБНАРУЖЕНИЯ ОБЪЕКТОВ НА ЦИФРОВОМ ИЗОБРАЖЕНИИ

Работа №30419

Тип работы

Магистерская диссертация

Предмет

информатика

Объем работы71
Год сдачи2018
Стоимость5700 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
255
Не подходит работа?

Узнай цену на написание


Введение 2
1. Вычисление точности детектора 6
2. Описание базовых детекторов 9
2.1. Faster Regions with CNN 9
2.2. Single Shot MultiBox Detector 11
2.3. Deconvolution Network 16
3. Метод Dynamic Belief Fusion 19
4. Новый алгоритм позднего объединения 25
4.1. Кластеризация ответов детекторов 25
4.2. Определение значения уверенности в кластере 27
4.3. Локализация объекта в кластере 28
5. Результаты экспериментов 30
Заключение 39
Список литературы 40
Приложение 42


Задача поиска объектов на изображении является одной из важных задач компьютерного зрения, большое количество статей о новых подходах к построению методов обнаружения объектов - также называемых детекторами - говорит об актуальности данной проблемы.
Первый метод обнаружения объектов, работающий в режиме реального времени - метод Виолы-Джонса [1] - был предложен в 2001 году. Алгоритм был разработан для обнаружения лиц людей на фотографиях. Данный метод представляет собой каскад сильных классификаторов AdaBoost, которые в свою очередь построены на слабых классификаторах - неглубоких деревьях решений. Для того, чтобы обнаружить лицо на фотографии, необходимо пройти по изображению скользящим окном различных размеров, в каждом выделенном окном фрагменте изображения вычислить характеристики Хаара, показанные на рисунке 1, затем полученные характеристики подать на вход классификатору и получить ответ, который говорит о наличии или отсутствии лица в данном окне. В 2005 году был предложен метод Histogram of Oriented Gradients [2], который, как и характеристики Хаара, был направлен на формирование вектора характеристик на основе изображения, но уже для задачи обнаружения пешеходов, а в 2008 году - метод SURF [3] для вычисления характеристик, инвариантных к повороту и размеру объекта. Эти методы построены на основе визуального представления человека об исследуемом объекте. Однако необходимость в таких методах пропадает в связи с появлением глубоких сверточных нейронных сетей.
Считается, что активное применение глубоких нейронных сетей для задачи распознавания объектов началось в 2012 году после выхода статьи Алекса Крижевского ”ImageNet Classification with Deep Convolutional Neural Networks” [4]. Предложенная в статье глубокая нейронная сеть AlexNet, архитектура которой представлена на рисунке 2, стала победителем ’ImageNet Large Scale Visual Recognition Challenge (ILSVRC) of 2012”.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Данная работа была посвящена разработке и реализации позднего агломеративного алгоритма объединения детекторов. Для проведения экспериментов были настроены реализации современных методов обнаружения объектов, таких как Faster R-CNN, DeNet и SSD. Для оценки точности нового алгоритма позднего объединения был реализован лучший до этого момента метод позднего объединения детекторов Dynamic Belief Fusion (DBF). Были поставлены эксперименты с несколькими возможными реализациями метода DBF и выбрана реализация, показывающая лучший результат на наборе данных PASCAL VOC 2007. Результаты этой реализации сравнивались с новым алгоритмом позднего объединения детекторов. Предложенный алгоритм достигает лучшей точности как в сравнении с работой индивидуальных детекторов, так и в сравнении с методом DBF. По сравнению с работой индивидуальных детекторов ошибка (1-mAP) уменьшилась на 32%, а по сравнению с работой метода DBF - на 6 %. Также новый алгоритм показывает лучшее время работы, чем метод DBF и NMS, на 10.7 мс и 0.7 мс соответственно.


[1] Viola Р., Jones М. Rapid object detection using a boosted cascade of simple features //Computer Vision and Pattern Recognition, 2001. CVPR 2001. Proceedings of the 2001 IEEE Computer Society Conference on. - IEEE, 2001. - T. 1. - C. I-I.
[2] Dalal N., Triggs B. Histograms of oriented gradients for human detection //Computer Vision and Pattern Recognition, 2005. CVPR 2005. IEEE Computer Society Conference on. - IEEE, 2005. - T. 1. - C. 886-893.
[3] Bay H., Tuytelaars T., Van Gool L. Surf: Speeded up robust features //European conference on computer vision. - Springer, Berlin, Heidelberg, 2006. - C. 404-417.
[4] Krizhevsky A., Sutskever I., Hinton G. E. Imagenet classification with deep convolutional neural networks //Advances in neural information processing systems. - 2012. - C. 1097-1105.
[5] Liu W. et al. Ssd: Single shot multibox detector. 2016 //To appear. -
2016. - T. 2.
[6] Tychsen-Smith L., Petersson L. DeNet: Scalable Real-time Object Detection with Directed Sparse Sampling //arXiv preprint arXiv:1703.10295. - 2017.
[7] Ren S. et al. Faster r-cnn: Towards real-time object detection with region proposal networks //Advances in neural information processing systems. - 2015. - C. 91-99.
[8] Girshick R. et al. Rich feature hierarchies for accurate object detection and semantic segmentation //Proceedings of the IEEE conference on computer vision and pattern recognition. - 2014. - C. 580-587.
[10] Knauer U., Seiffert U. Cascaded reduction and growing of result sets for combining object detectors //International Workshop on Multiple Classifier Systems. - Springer, Berlin, Heidelberg, 2013. - C. 121-133.
[11] Karaoglu S., Liu Y., Gevers T. Detect2rank: Combining object detectors using learning to rank //IEEE Transactions on Image Processing. - 2016. - T. 25. - №. 1. - C. 233-248.
[12] Lee H. et al. Dynamic belief fusion for object detection //Applications of Computer Vision (WACV), 2016 IEEE Winter Conference on. - IEEE, 2016. - C. 1-9.
[13] Simonyan K., Zisserman A. Very deep convolutional networks for large- scale image recognition //arXiv preprint arXiv:1409.1556. - 2014.
[14] Everingham M. et al. The PASCAL visual object classes (voc) challenge //International journal of computer vision. - 2010. - T. 88. - №. 2. -
C. 303-338.
[15] Everingham M. et al. The PASCAL visual object classes challenge: A retrospective //International journal of computer vision. - 2015. - T.
111. - №. 1. - C. 98-136.
[16] He K. et al. Deep residual learning for image recognition //Proceedings of the IEEE conference on computer vision and pattern recognition. -
2016. - C. 770-778.
[17] Yang Y., Lichtenwalter R. N., Chawla N. V. Evaluating link prediction methods //Knowledge and Information Systems. - 2015. - T. 45. - №.
3. - C. 751-782.

Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ