ВВЕДЕНИЕ 5
1 КРАТКИЕ ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ 7
1.1 ОБЗОР СУЩЕСТВУЮЩИХ МЕТОДОВ ОБНАРУЖЕНИЯ ОБЪЕКТОВ 7
1.2 HOG-ДЕСКРИПТОР 9
1.3 ВЛИЯНИЕ ФОКУСНОГО РАССТОЯНИЯ НА РАЗМЕР ОБЪЕКТА НА ИЗОБРАЖЕНИИ 26
2 РАЗРАБОТКА ПРОГРАММНОГО МОДУЛЯ 29
2.1 МОДЕРНИЗАЦИЯ АЛГОРИТМА МАСШТАБИРОВАНИЯ ИЗОБРАЖЕНИЯ ДЛЯ ПОИСКОВОГО ОКНА 29
2.2 СОЗДАНИЕ ПРОГРАММНОГО МОДУЛЯ 30
3 АНАЛИЗ И ТЕСТИРОВАНИЕ ПРОГРАММНОГО МОДУЛЯ 37
ЗАКЛЮЧЕНИЕ 40
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 41
ПРИЛОЖЕНИЕ
Задача распознавания пешеходов становится всё более актуальной. Это обусловлено тем, что доступность вычислительных мощностей и камер постоянно увеличивается. Системы, распознающие пешеходов, могут быть встроены в транспорт,
повышая безопасность на дорогах. Такие системы являются важными для беспилотных транспортных средств. Визуальное распознавание пешеходов также может быть
востребовано, когда необходимо учитывать численность проходящих мимо камеры
людей, например, для сбора информации о загруженности городских улиц.
В области распознавания пешеходов ведутся активные исследования. Стандартный подход к проблеме — выбор способа формирования векторов признаков и
выбор классификатора. Учёные предлагают способы получить из изображений новые признаки и варьируют классификаторы, чтобы изучить полученный метод распознавания по таким критериям, как точность (вероятность правильно определить,
есть ли в данном поисковом окне пешеход или нет) и скорость работы (некоторые
подходы работают в реальном времени, а некоторые могут работать минуты). Некоторые учёные подходят к проблеме более широко и изучают не только метод распознавания, но и статистическую информацию о самой задаче, например, распределение пешеходов по разным областям изображения. Статья [1] представляет собой исследование, в котором приводится и обширная статистическая информация о проблеме, и сравнение множества перспективных современных детекторов пешеходов.
В данной работе в качестве метода распознавания пешеходов был выбран метод гистограмм направленных градиентов. Навнит Далал и Билл Триггс, исследователи INRIA, впервые описали гистограмму направленных градиентов в своей работе
[2]. В этой работе они использовали алгоритм для нахождения пешеходов на статичных изображениях, хотя впоследствии расширили область применения до нахождения людей на видео, а также различных животных и машин на статичных изображениях.
Целью исследования является разработка программного модуля для обнаружения пешеходов на дороге по видеоизображению.
Для достижения поставленной цели необходимо решить следующие задачи:6
модернизировать алгоритм для ускорения обнаружения объекта;
реализовать программный модуль поиска пешеходов с использованием
дескриптора гистограмм направленных градиентов;
провести тестирование созданной программы.
В ходе выполнения данной работы цель была достигнута, были решены все
поставленные задачи, а именно:
модернизирован механизм работы поискового окна, использованы параллельные вычисления на ядрах процессора графической видеокарты для увеличения
скорости обнаружения;
реализована программа с использованием дескриптора гистограмм направленных градиентов;
проведены анализ и тестирование созданной программы;
Результаты, полученные при работе программы удовлетворяют требованиям
скорости вычисления. Время реакции программы превосходит время реакции среднестатистического человека.
Программный модуль может быть использован как элемент более сложных
автоматизированных систем. Например, в случае использования в автоматизированной системе ассистента водителя, данные, полученные от программного модуля, могут быть использованы для оповещения водителя или корректировки движения
транспортного средства.
Дальнейшие исследования в этой области могут быть направлены на совершенствование алгоритма дескриптора, переобучение классификатора, или же создание нового классификатора.
1 Dollar P. et al. Pedestrian detection: An evaluation of the state of the art //Pattern Analysis and Machine Intelligence, IEEE Transactions on. - 2012. - Т. 34. - №. 4. - С. 743-761.
2 N. Dalal, B. Triggs, и D. Europe, «Histograms of Oriented Gradients for Human Detection», Comput. Vis. Pattern Recognition, 2005. CVPR 2005. IEEE Comput. Soc. Conf., т. 1, сс. 886 - 893, 2005.
3 Viola P., Jones M.J. Rapid object detection using a boosted cascade of simple features // Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR’01). 2001, V. 1, pp. I-511-I-518.
4 Viola P., Jones M.J. Robust Real-Time Face Detection // International Journal of Computer Vision. № 57 (2). 2004. P. 137-154.
5 P. Felzenszwalb, D. McAllester, D. Ramaman. A Discriminatively Trained, Multiscale, Deformable Part Model. Proceedings of the IEEE CVPR 2008; P. Felzenszwalb, R. Girshick, D. McAllester, D. Ramanan.Object Detection with Discriminatively Trained Part Based Models. IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 32, No. 9, September 2010.
6 Caltech [P. Dollar, C. Wojek, B. Schiele and P. Perona. Pedestrian Detection: A Benchmark. CVPR 2009, Miami, Florida.
7 P. Dollar, C. Wojek, B. Schiele and P. Perona Pedestrian Detection: An Evaluation of the State of the Art PAMI, 2012.
8 Визильтер Ю.В., Желтов С.Ю., Бондаренко А.В. и др. Обработка и анализ изображений в задачах машинного зрения//Физматкнига.-2010. - 672 с.
9 Shi J. and Tomasi C. Good Features to Track. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pages 593-600, June 1994, C. Harris, M Stephens. A combined corner and edge detection. Plessley research Roke Manor, UK, 1988.
10 Трапезников И.Н. Разработка и анализ системы распознавания
автомобильных регистрационных знаков: дис. ... канд. техн. наук : 05.12.04;
Ярославль, 2014. 130 с. 10
11 Р. Гонсалес и Р. Вудс, Цифровая обработка изображений. Техносфера, 2006.
12 М. Гашников, Н. Глумов, Н. Ильясова, и И. Др., Методы компьютерной обработки изображений Под редакцией В.А. Сойфера. Москва: Издательская фирма «Физико-математическая литература», 2003.
13 Д. Сандерс и Э. Кэндрот, «Технология CUDA в примерах. Введение в программирование графических процессоров.» Издательство «ДМК», Москва, 2013.
14 Л. Шапиро и Д. Стокман, Компьютерное зрение. Москва: БИНОМ. Лаборатория знаний, 2006