Тип работы:
Предмет:
Язык работы:


Нейросетевое детектирование объектов в условиях ограниченного времени

Работа №131624

Тип работы

Бакалаврская работа

Предмет

нейронные сети

Объем работы44
Год сдачи2016
Стоимость4850 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
41
Не подходит работа?

Узнай цену на написание


Введение 3
Постановка задачи 7
Глава 1. Обзор литературы 8
1.1. Поиск объектов на изображении 8
1.2. Предложение окон-кандидатов 9
1.3. Взаимодействие с мобильными устройствами и web API 10
Глава 2. План реализации системы 12
2.1. Система детектирования предметов одежды 13
2.1.1. Поиск объектов 14
2.1.2. Классификация окон-кандидатов 16
2.1.3. Пост-обработка результатов 17
2.2. Программное обеспечение детектора 18
2.2.1. Ядро (KIRA) 19
2.2.2. Балансировщик 25
2.2.3. Конфигурация nginx 27
2.2.4. Доработка фреймворка Caffe 28
Глава 3. Обучение сетей и тестирование системы 29
3.1. Обучение MultiBox и Fast R-CNN 29
3.2. Тестирование детектора 29
3.3. Тестирование быстродействия и устойчивости системы 30
Выводы 33
Заключение 35
Список литературы 36
Приложение 1 40
Приложение 2 42
Приложение 3 43
Приложение 4 44

Теория обработки цифровых изображений — один из основных раз­делов в информатике. В рамках него разработаны алгоритмы сжатия графических данных, их анализа, машинного зрения. Человек давно пытается научить компьютер понимать, что находится на изображении. То что для нас кажется задачей вполне тривиальной, разработанным алгоритмам все еще не под силу. Хотя уже имеются примеры созда­ния методов, составляющих вербальное описания сцен [1]. Однако для начала нужно решить более простые проблемы, а именно, необходимо научиться находить ключевые объекты реального мира на изображе­нии и понимать, что это за объекты. Первая задача также называется задачей детектирования. Определение конкретного класса предмета на изображении называется задачей классификации.
К решению задач детектирования и классификации применяются различные подходы: статистические, специально разработанные теории ключевых точек, генетические алгоритмы. Другим методом является машинное обучение, зачастую использующее в работе дополнительно один из предыдущих. Тем не менее есть примечательный независимый инструмент — нейронные сети.
В контексте машинного обучения нейронные сети являются наибо­лее перспективным методом для детектирования и классификации объ­ектов на изображении. Нейронные сети построены по принципу моде­лирования взаимодействия биологических нейронов в коре головного мозга живых организмов. Некоторые модели кроме общих представле­ний о работе мозга используют и более специфические знания о, на­пример, устройстве зрительной коры, и реализуются они в свёрточных нейронных сетях [2].
Для оценки качества алгоритмов детектирования и классификации собраны базы данных, содержащие изображения и вспомогательную информацию об объектах на них. Самая большая — ImageNet включа­ет в себя более 14 миллионов изображений и 20 тысяч классов объек­тов [3]. Каждый год на ней проводится соревнование ImageNet Large Scale Visual Recognition Challenge (ILSVRC), в котором выявляются лучшие алгоритмы в решении задачи детектирования и классифика­ции. И если еще 6 лет назад большая часть алгоритмов была построена на идее ключевых точек и их дескрипторов [4], то сейчас участники соревнования активно развивают нейросетевые модели, показывающие существенный прирост по всем метрикам качества [5].
Однако несмотря на возросшую за последние несколько лет попу­лярность нейронных сетей и значительный прогресс в оптимизации их быстродействия и качества работы, их применение в реальных задачах все еще ограничено. Это связано как с тем, что работа алгоритмов тре­бует существенных вычислительных ресурсов, так и с тем, что обучение сети — их главное отличие от классических алгоритмов, не програм­мируется и не задается фиксированным образом, это вносит элемент случайности в решение поставленных задач. Обучаясь на тренировоч­ных данных, сеть, исключительно за счет своего внутреннего устрой­ства, выделяет общие и частные признаки объектов, которые на стадии тестирования используются для поиска и классификации объектов на тестовом изображении. Сложность заключается именно в поиске оп­тимального внутреннего устройства, процесс этот не алгоритмизируем и требует существенного опыта и, возможно, даже удачи. Часть пред­ставленной работы будет посвящена поиску архитектурных изменений для двух сетей и описанию достигнутых результатов.
Другой модной тенденцией последнего времени стали онлайн- магазины. Конкуренция заставляет их предлагать новый функционал, повышающий удобство выбора и покупки товаров. Так, один магазин одежды и аксессуаров обратился в компанию, где проводилось пред­ставленное исследование, с просьбой разработать систему, позволяю­щую пользователю искать похожие предметы по фотографиям, сде­ланным камерой смартфона или загруженным из интернета. Руковод­ство магазина справедливо полагало, что подобная возможность смо­жет привлечь больше покупателей. Описывали же будущую систему следующим образом: это должно быть мобильное приложение, в ко­торое пользователь может загружать фотографии (или делать прямо в нем) интересующих его предметов одежды, получая в ответ список наиболее похожих товаров из ассортимента магазина с ценами и прочей вспомогательной информацией.
При детальном рассмотрении задачу можно разделить на подзада­чи:
• разработка мобильного приложения;
• разработка системы поиска и классификации объектов на фото­графии;
• разработка поиска похожих объектов;
• создание сервиса для взаимодействия с мобильным приложением.
Настоящая работа будет посвящена второму и четвертому пунктам, поэтому подробнее опишем связанные с ними требования, поступившие от заказчика. Были выставлены ограничения не только на качество системы, но и на время работы. Основной целевой аудиторией станут пользователи мобильных устройств, которых легко потерять большим временем ожидания результатов. На качество детектирования и клас­сификации объектов условия даны в двух метриках: полноты (recall) и точности (precision). Первая характеризует количество правильно най­денных объектов относительно общего количества интересующих нас объектов на изображении. Точность же показывает, сколько объектов правильно детектировалось среди всего множества найденных предме­тов.
Эталонными стали следующие значениями:
• Recall > 80%;
• Precision > 80%;
• Время работы < 1 cек.
Другое требование, выдвинутое заказчиком и не относящееся напря­мую к взаимодействию с пользователем, — расширяемость построенной системы. Под расширяемостью подразумевается возможность быстрой адаптации к изменяющемуся ассортименту магазину. Дополнительно решено реализовать возможность простой смены алгоритмов на слу­чай, если появится необходимость задействовать в приложении более современные и оптимизированные их версии.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В рамках проведенной работы были выполнены все поставленные цели:
• удалось достигнуть требуемого качества детектирования предме­тов одежды;
• система справляется с нагрузкой и остается стабильной в пиковые часы;
• реализованная гибкость позволяет добавлять новые методы об­работки изображений и новые классы в систему распознавания с минимальными затратами времени;
• скорость обработки запросов находится на уровне в три раза мень­шем верхней границы.
Разработано уникальное программное обеспечение, успешно приме­няемое в коммерческих приложениях уже на протяжении года. За это время получена награда в конкурсе стартапов Burda International Start­up Competition [39], где система оценивалась международным жюри.
Успех разработки еще раз показывает перспективность исследова­ний в сфере нейронных сетей и оправданность их применения в реаль­ных задачах компьютерного зрения.


[1] O Vinyals., A Toshev, Bengio.S, D. Erhan. Show and Tell: A Neural Image Caption Generator.— 2015.— URL: http://arxiv.org/pdf/ 1411.4555v2.pdf (online; accessed: 11.05.2016).
[2] LeCun Y., Bottou L., Bengio Y., Haffner P. Gradient-Based Learning Applied to Document Recognition // Proceedings of the IEEE. — 1998. —November. — Vol. 86, no. 11. — P. 2278-2324.
[3] ImageNet Stats.— 2016.— URL: http://image-net.org/about-stats (online; accessed: 11.05.2016).
[4] ImageNet 2010 results. — 2010. — URL: http://www.image-net.org/ challenges/LSVRC/2010/results (online; accessed: 11.05.2016).
[5] ImageNet 2015 results.— 2015.— URL: http://image-net.org/ challenges/LSVRC/2015/results (online; accessed: 11.05.2016).
[6] S. Ludger. Shape Matching.-- 2011.-- URL: http://ganymed. imib.rwth-aachen.de/deserno/seminare/SMBV12_02.pdf (online; accessed: 11.05.2016).
[7] J. Canny. A Computational Approach to Edge Detection.-- 1986.— URL: https://perso.limsi.fr/vezien/PAPIERS_ACS/canny1986. pdf (online; accessed: 11.05.2016).
[8] D. Scharstein. Matching Images by Comparing their Gradient Fields.— URL: http://www.cs.middlebury.edu/~schar/papers/ gradient.pdf (online; accessed: 11.05.2016).
[9] S. Ekvall, S. Kragic'. Receptive Field Cooccurrence Histograms for Object Detection.— 2005.— URL: http://www.nada.kth.se/ ~ekvall/ekvall_iros2005.pdf (online; accessed: 11.05.2016).
[10] SIFT // Lowe D. -- 2003. -- URL: http://www.cs.ubc.ca/~lowe/ keypoints/ (online; accessed: 11.05.2016).
[11] H. Bay, A. Ess, T. Tuytelaars, L. Van Gool. SURF.— 2006.— URL: http://www.vision.ee.ethz.ch/en/publications/papers/ articles/eth_biwi_00517.pdf (online; accessed: 11.05.2016).
[12] Locality-sensetive hashing.— 2015.— URL: https://en.wikipedia. org/wiki/Locality-sensitive_hashing (online; accessed: 11.05.2016).
[13] R. Girshick, J Donahue, T. Darrell, J. Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. — 2014. — URL: http://arxiv.org/pdf/1311.2524v5.pdf (online; accessed: 11.05.2016).
[14] B. Lao, K. Jagadeesh. Convolutional Neural Networks for Fashion Classification and Object Detection. — 2015. — URL: http://cs231n.stanford.edu/reports/BLAO_KJAG_CS231N_ FinalPaperFashionClassification.pdf (online; accessed: 11.05.2016).
[15] K. Hara, V. Jagadeesh, R. Piramuthu. Fashion Apparel Detection: The Role of Deep Convolutional Neural Network and Pose-dependent Priors.— 2016.— URL: http://arxiv.org/pdf/1411.5319v2.pdf (online; accessed: 11.05.2016).
...


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ