Тип работы:
Предмет:
Язык работы:


Разработка и реализация алгоритма поиска наиболее интересных объектов на изображении

Работа №84548

Тип работы

Дипломные работы, ВКР

Предмет

информатика

Объем работы28
Год сдачи2016
Стоимость4200 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
40
Не подходит работа?

Узнай цену на написание


Список иллюстраций 3
Список таблиц 4
Введение 5
1. Поиск потенциальных объектов 7
1.1. Выделение границ 7
1.2. Анализ границ 8
1.3. Cхожесть ребер, содержание контура в окне 9
1.4. Генерация окон 11
1.5. Оценочная функция 12
1.6. Подавление немаксимумов 12
2. Сбор и получение данных 13
2.1. Сбор признаков 13
2.2. Формат входных данных 13
2.3. Формат выходных данных 14
3. Обучение 15
3.1. Классификация 15
3.2. Ошибки классификации 15
3.3. Adaboost 16
4. Реализация 19
4.1. Язык программирования 19
4.2. Обучение 19
4.3. Сбор признаков 19
5. Эксперименты 22
Заключение 26
Список литературы

Компьютерное зрение — область, содержащая в себе методы анализа, об-работки и понимания изображений. Одной из типовых задач компьютерного зрения является обнаружение объектов на изображении. Многие алгоритмы обнаружения используют смежные алгоритмы, как компоненты для составления своего алгоритма [1][2][3], что предположительно дает преимущество в решении этой задачи. Так, например, в задаче обнаружения при обучении детектора используется трекер, который подтверждает, что детектор прав [3]. В основе многих алгоритмов обнаружения лежит так называемый подход скользящего окна (англ. sliding window). Количество окон определяется многими параметрами, от их количества зависит точность алгоритмов обнаружения, для обеспечения высокой точности обнаружения количество окон должно быть больше чем 105. Подход заключается в том, что необходимо пробегаться окошком определенного размера с определенным шагом несколько раз по всему изображению с разными размерами шага и окна. Задача обнаружения объекта на изображении может быть довольно эффективно решена при помощи сверточных нейронных сетей (англ. Convolutional Neural Network) [4]. CNN — архитектура искусственных нейронных сетей, в котором могут содержаться сверточные слои. Например, алгоритм обнаружения Rich Feature Hierarchies [5] использует CNN для анализа изображений и работает с высокой точностью, но у него нет возможности работать в режиме реального времени, что сужает область его применения. Как было сказано ранее, алгоритмы основанные на подходе скользящего окна используют большое количество окон для анализа. Для обеспечения работы CNN в режиме реального времени необходимо каким-либо образом сократить количество анализируемых окон. Основной задачей предлагаемого решения является значительное сокращение количества окон (англ. bounding box), которые в дальнейшем будут проанализированы CNN, для достижения высокой точности обнаружения. Заведомо такой алгоритм должен быть очень быстрым и должен точно определять окна, которые точно не содержат объектов. В таком случае в таких алгоритмах важна ошибка второго рода, но не ошибка первого рода. В основе реализуемого алгоритма лежит анализ ребер, образующих цельный контур, содержащийся в рассматриваемом окне [6]. Некоторые идеи по обучению и выявлению признаков были навеяны работами основанными на анализе границ, которые описывали каждый блок таких ребер некоторым дескриптором (англ. descriptor), и в дальнейшем осуществлялась функция оценки окна при помощи методов машинного обучения [7]. Данная работа посвящена разработке и реализации алгоритма, который позволит очень эффективно и точно определять предположительные расположения произвольных объектов на изображении. Целью работы является разработка функции оценки основанной на алгоритме машинного обучения, а не использование функции описанной человеком.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В рамках работы был разработан новый алгоритм поиска наиболее интересных объектов на изображении. Была поставлена задача построения новой функции оценки, предсказывающей содержание потенциального объекта интереса в предлагаемом окне и основанной на методах машинного обучения. Поставленная задача была реализована в виде программы, были проведены эксперименты, показывающие, что по строенная функция оценки повышает точность обнаружения на открытой базе изображений Pascal VOC [14]. Было показано, что разработанный алгоритм вычислительно сложнее, чем предложенный в статье [6], что ограничивает область его применения.


[1] Paul Viola and Michael Jones. «Robust real-time object detection». In: International Journal of Computer Vision 4 (2001).
[2] Pedro F Felzenszwalb et al. «Object detection with discriminatively trained part-based models». In: Pattern Analysis and Machine Intelligence, IEEE Transactions on 32.9 (2010), pp. 1627-1645.
[3] Zdenek Kalal, Krystian Mikolajczyk, and Jiri Matas. «Tracking-learning- detection». In: Pattern Analysis and Machine Intelligence, IEEE Transactions on 34.7 (2012), pp. 1409-1422.
[4] Yann LeCun and Yoshua Bengio. «Convolutional networks for images, speech, and time series». In: The handbook of brain theory and neural networks 3361.10 (1995), p. 1995.
[5] Ross Girshick et al. «Rich feature hierarchies for accurate object detection and semantic segmentation». In: Proceedings of the IEEE conference on computer vision and pattern recognition. 2014, pp. 580-587.
[6] C Lawrence Zitnick and Piotr Dollar. «Edge boxes: Locating object proposals from edges». In: Computer Vision-ECCV2014. Springer, 2014, pp. 391-405.
[7] Ming-Ming Cheng et al. «BING: Binarized normed gradients for objectness estimation at 300fps». In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2014, pp. 3286-3293.
[8] Jan Hosang, Rodrigo Benenson, and Bernt Schiele. «How good are detection proposals, really?» In: arXivpreprint arXiv:1406.6962 (2014).
[9] Richard Szeliski. Computer Vision: Algorithms and Applications. 1st. New York, NY, USA: Springer-Verlag New York, Inc., 2010. ISBN: 1848829345, 9781848829343.
[10] Piotr Dollar and C Zitnick. «Structured forests for fast edge detection». In: Proceedings of the IEEE International Conference on Computer Vision. 2013, pp. 1841-1848.
[11] David Jacobs. «Image gradients». In: Class Notes for CMSC 426 (2005).
[12] Thomas H Cormen et al. «Greedy algorithms». In: Introduction to algorithms 1 (2001), pp. 329-355.
[13] Bogdan Alexe, Thomas Deselaers, and Vittorio Ferrari. «Measuring the objectness of image windows». In: Pattern Analysis and Machine Intelligence, IEEE Transactions on 34.11 (2012), pp. 2189-2202.
[14] M Everingham et al. The pascal visual object classes challenge 2007 (voc 2007) results (2007). 2008.
[15] Е.В. Разинков. «Машинное обучение». Конспект лекций, прочитанных в Казанском Федеральном Университете. 2015.
[16] Learning OpenCV «Computer vision with the OpenCV library». In: GaryBradski & Adrian Kaebler-OReilly (2008).
[17] Stefan Van Der Walt, S Chris Colbert, and Gael Varoquaux. «The NumPy array: a structure for efficient numerical computation». In: Computing in Science & Engineering 13.2 (2011), pp. 22-30.
[18] Wes McKinney et al. «Data structures for statistical computing in Python». In: Proceedings of the 9th Python in Science Conference. Vol. 445. 2010, pp. 51-56.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ