Тип работы:
Предмет:
Язык работы:


Методы создания гибридных классификаторов на основе каскадов и глубоких нейронных сетей

Работа №75143

Тип работы

Магистерская диссертация

Предмет

математика

Объем работы30
Год сдачи2016
Стоимость5550 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
46
Не подходит работа?

Узнай цену на написание


Введение 4
1. Постановка задачи 7
2. Обзор 8
2.1. Существующие методы 8
2.1.1. Каскадный классификатор 8
2.1.2. Нейронные сети 9
2.2. Используемые технологии 11
2.2.1. Метод VeryFast 11
2.2.2. Библиотека cuda-convnet 14
3. Гибридный классификатор DeepCascade 16
3.1. Архитектура 16
3.1.1. Алгоритм 16
3.1.2. Топология глубокой нейронной сети 17
3.2. Обучение 19
3.2.1. Предварительное обучение 19
3.2.2. Создание данных 19
4. Программная реализация 20
4.1. Детектор 20
4.2. Классификатор 21
5. Эксперименты 23
5.1. Набор данных 23
5.2. Критерии оценивания 23
5.3. Сравнительное тестирование 25
Заключение 27
Список литературы


Задача детекции объектов по изображениям – это важная задача
современности. Её применение можно найти в разных областях: робототехнике, системах автовождения, приложениях по отслеживанию и
встроенных устройствах [19]. Актуальной на сегодняшний день стоит
задача детекции пешеходов [15]. Эта задача заключается в определении положения пешехода и его масштабов на изображении. Также такая задача может формулироваться в терминах класса, когда необходимо определить принадлежность пешехода заранее выбранному классу. В этом случае говорят о задаче классификации, простейшим видом
которой является бинарная классификация [1]. В решении задачи детекции пешеходов первостепенными критериями являются качество и
скорость. Детектор, удовлетворяющий этим характеристикам, с малой
долей риска можно использовать в системах с ограниченной вычислительной мощностью [17].
На сегодняшний день существует множество методов решения задачи детекции. Среди них особо выделяются каскадные алгоритмы и
нейронные сети. Каскадные методы получили широкое распространение благодаря высокой скорости обнаружения, позволяющей их применять в приложениях реального времени. Но вместе с тем, сравнивая
их с современными решениями, каскадные процедуры проводят обнаружения с большим процентом ложных детекций, тем самым уступая
многим другим методам в плане качества [20]. Нейронные сети, в свою
очередь, демонстрируют высокую точность обнаружений, значительно
сокращая уровень ложно позитивных детекций. Это их основное преимущество. Из недостатков нейронных сетей стоит отметить низкую
скорость обнаружения, по которой они проигрывают многим другим
подходам, несмотря на размер сети и связность слоёв. Как показано в
статье [1] на задаче детекции пешеходов малая скорость работы не позволяет использовать нейросети в реальных приложениях даже с учётом
ускорения на GPU-устройствах.
Это хорошо зарекомендовавшие себя подходы, реализацию кото-
4рых можно найти во многих программных библиотеках. Среди них
можно выделить OpenCV1, дополнительные инструменты MATLAB2 и
т.д. При этом существует довольно много библиотек, предназначенных
для работы исключительно с нейросетями: Caffe3, Theano4, Deepnet5
и Pylearn26 и т.п. Сильной стороной перечисленных библиотек можно считать наличие открытого исходного кода, а также быструю C++
реализацию ядра библиотеки, ускоренную на GPU. Следует отметить,
что библиотеки Caffe и Theano используют библиотеку cudaDNN7, а
Deepnet и Pylearn2 – библиотеку cuda-convnet [10]. Данные инструментальные средства предоставляют мощные функциональные возможности, удовлетворяющие многим потребностям исследователей в области
компьютерного зрения. Но в этом преимуществе кроятся и свои недостатки. Среди них следует отметить отсутствие высокоточных и быстрых методов, отражающих актуальное состояние предлагаемых решений. К этим методам относятся такие, которые фокусируются либо на
повышении качества [12], либо на ускорении обнаружений [16]. Кроме
того, в случае с MATLAB нельзя говорить о открытом исходном коде,
что также можно считать за недостаток.
Вместе с тем в реальных приложениях актульными остаются подходы, которые сочетают как скорость, так и точность. К таким методам
можно отнести получившие сегодня распространение гибридные подходы, сочетающие каскадные методы с глубокими нейросетями. Это интуитивное решение брать лучшее из каждого метода демонстрирует хорошие результаты [17]. Такой подход раскрывает широкие возможности
по созданию новых детекторов. Одним из гибридных алгоритмов был
разработан в составе исследователькой группы Alex Krizhevsky. Предложенный им подход показывает на сегодняшний день самые высокие
1http://docs.opencv.org/2.4/modules/objdetect/doc/objdetect.html
2http://www.mathworks.com/products/computer-vision/, http://www.mathworks.com/products/neuralnetwork/
3https://github.com/BVLC/caffe
4https://github.com/Theano/Theano
5https://github.com/nitishsrivastava/deepnet
6https://github.com/lisa-lab/pylearn2
7https://developer.nvidia.com/cudnn
5результаты как в качестве, так и скорости. Данный метод получил название DeepCascade [17]. Сильным преимуществом этого решения по
сравнению с другими является то, что оно основано на двух свободнораспространяемых библиотеках Doppia [2] и cuda-convnet2 [11]. Данные
библиотеки представляют собой GPU-реализацию быстрого каскадного
алгоритма VeryFast и глубокой нейронной сети.
Несмотря на то, что отдельные алгоритмы имеются в составе библиотек с открытым кодом, их интеграция в единую систему не является решенной задачей. Разработка такой библиотеки с открытым кодом
позволит использовать ее для прототипирования алгоритмов детекции
других видов объектов, например, автомобильных номеров или лиц.
Предлагаемая магистерская работа и посвящена разработке библиотеки для детекции объектов на основе интеграции каскадного и нейросетевого подходов.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе выполнения исследовательской работы были выполнены следующие задачи:
• Исследованы существующие актуальные гибридные решения по
обнаружению объектов.
• Реализован гибридный классификатор DeepCascade.
• Произведено обучение детектора пешеходов на изображениях средствами библиотек.
• Проведено сравнительное тестирование разработанного гибридного классификатора.


[1] Angelova A., Krizhevsky A., Vanhoucke V. Pedestrian detection with a Large-Field-Of-View deep network // IEEE International Conference on Robotics and Automation. — 2015.
[2] Benenson R. Doppia library // bitbucket.org, веб-сервис для хостинга IT-проектов.— 2015.— URL: https://bitbucket.org/rodrigob/ doppia/ (online; accessed: 1.05.2016).
[3] Dalal N, Triggs B. Histograms of Oriented Gradients for Human Detection // IEEE Conference on Computer Vision and Pattern Recognition. — 2005.
[4] Dollar P., Belongie S., Perona P. The Fastest Pedestrian Detector in the West // British Machine Vision Conference. — 2010.
[5] Freund Y., Schapire R. A decision-theoretic generalization of on-line learning and an application to boosting // Journal of Computer and System Science. — no. 55.
[6] Goodfellow I., Bengio Y., Courville A. Deep learning. — 2016. — Book in preparation for MIT Press. URL: http://www.deeplearningbook. org.
[7] Handwritten Digit Recognition with a Back-Propagation Network / Y. LeCun, B. Boser, J. Denker et al. // Neural Information Processing Systems Conference. — 1990. — No. 2. — P. 396-404.
[8] Improving neural networks by preventing co-adaptation of feature detectors / G. Hinton, N. Srivastava, A. Krizhevsky et al. // Journal of Computing Research Repository. — 2012.
[9] Integral Channel Features / P. Dollar, Z. Tu, P. Perona, S. Belongie // British Machine Vision Conference. — 2009.
[10] Krizhevsky A. cuda-convnet library // code.google.com, веб-сервис для хостинга IT-проектов.— 2014.— URL: https://code.google. com/p/cuda-convnet/ (online; accessed: 1.05.2016).
[11] Krizhevsky A. cuda-convnet2 library // github.com, веб-сервис для хостинга IT-проектов.— 2014.— URL: https://github.com/ akrizhevsky/cuda-convnet2 (online; accessed: 1.05.2016).
[12] Krizhevsky A., Sutskever I., Hinton G. ImageNet Classification with Deep Convolutional Neural Networks // Neural Information Processing Systems Conference. — 2012. — No. 25. — P. 1097-1105.
[13] LeCun Y., Kavukcuoglu K., Farabet C. Convolutional Networks and Applications in Vision // International Symposium on Circuits and Systems. - No. 253-256. - 2010.
[14] Papageorgiou C., Oren M., Poggio T. A general framework for object detection // International Conference on Computer Vision.— 1998.— P. 555-562.
[15] Pedestrian Detection: A Benchmark / P. Dolla, C. Wojek, B. Schiele, P. Perona // IEEE Conference on Computer Vision and Pattern Recognition. -- 2009.
[16] Pedestrian detection at 100 frames per second / R. Benenson, M. Mathias, R. Timofte, L. Van Gool // IEEE Conference on Computer Vision and Pattern Recognition. — 2012. — P. 2903-2910.
[17] Real-Time Pedestrian Detection With Deep Network Cascades /
A. Angelova, A. Krizhevsky, V. Vanhoucke et al. // British Machine Vision Conference. -- 2015.
[18] Rumelhart D., Hinton G., Williams R. Learning Internal Representations by Error Propagation // Parallel Distributed Processing: Explorations in the Microstructure of Cognition, Vol. 1.— 1986. — P. 318-362.
[19] Ten Years of Pedestrian Detection, What Have We Learned? / R. Benenson, M. Omran, J. Hosang, B. Schiele // Conference on Computer Vision for Road Scene Understanding and Autonomous Driving. — 2014. — P. 613-627.
[20] Viola P., Jones M. Rapid object detection using a boosted cascade of simple features // IEEE Conference on Computer Vision and Pattern Recognition. — 2001.
[21] Viola P., Jones M. Robust Real-time Object Detection // International Journal of Computer Vision. — 2001.
[22] Viola P., Jones M., Snow D. Detecting Pedestrians Using Patterns of Motion and Appearance // International Journal of Computer Vision. — 2005. — no. 2. — P. 153-161.


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ