ВВЕДЕНИЕ 5
1 КРАТКИЕ ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ 7
1.1 ОБЗОР СУЩЕСТВУЮЩИХ МЕТОДОВ ОБНАРУЖЕНИЯ ОБЪЕКТОВ 7
1.2 HOG-ДЕСКРИПТОР 9
1.3 ВЛИЯНИЕ ФОКУСНОГО РАССТОЯНИЯ НА РАЗМЕР ОБЪЕКТА НА ИЗОБРАЖЕНИИ 26
2 РАЗРАБОТКА ПРОГРАММНОГО МОДУЛЯ 29
2.1 МОДЕРНИЗАЦИЯ АЛГОРИТМА МАСШТАБИРОВАНИЯ ИЗОБРАЖЕНИЯ ДЛЯ ПОИСКОВОГО ОКНА 29
2.2 СОЗДАНИЕ ПРОГРАММНОГО МОДУЛЯ 30
3 АНАЛИЗ И ТЕСТИРОВАНИЕ ПРОГРАММНОГО МОДУЛЯ 37
ЗАКЛЮЧЕНИЕ 40
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 41
ПРИЛОЖЕНИЕ
Задача распознавания пешеходов становится всё более актуальной. Это обусловлено тем, что доступность вычислительных мощностей и камер постоянно увеличивается. Системы, распознающие пешеходов, могут быть встроены в транспорт,
повышая безопасность на дорогах. Такие системы являются важными для беспилотных транспортных средств. Визуальное распознавание пешеходов также может быть
востребовано, когда необходимо учитывать численность проходящих мимо камеры
людей, например, для сбора информации о загруженности городских улиц.
В области распознавания пешеходов ведутся активные исследования. Стандартный подход к проблеме — выбор способа формирования векторов признаков и
выбор классификатора. Учёные предлагают способы получить из изображений новые признаки и варьируют классификаторы, чтобы изучить полученный метод распознавания по таким критериям, как точность (вероятность правильно определить,
есть ли в данном поисковом окне пешеход или нет) и скорость работы (некоторые
подходы работают в реальном времени, а некоторые могут работать минуты). Некоторые учёные подходят к проблеме более широко и изучают не только метод распознавания, но и статистическую информацию о самой задаче, например, распределение пешеходов по разным областям изображения. Статья [1] представляет собой исследование, в котором приводится и обширная статистическая информация о проблеме, и сравнение множества перспективных современных детекторов пешеходов.
В данной работе в качестве метода распознавания пешеходов был выбран метод гистограмм направленных градиентов. Навнит Далал и Билл Триггс, исследователи INRIA, впервые описали гистограмму направленных градиентов в своей работе
[2]. В этой работе они использовали алгоритм для нахождения пешеходов на статичных изображениях, хотя впоследствии расширили область применения до нахождения людей на видео, а также различных животных и машин на статичных изображениях.
Целью исследования является разработка программного модуля для обнаружения пешеходов на дороге по видеоизображению.
Для достижения поставленной цели необходимо решить следующие задачи:6
модернизировать алгоритм для ускорения обнаружения объекта;
реализовать программный модуль поиска пешеходов с использованием
дескриптора гистограмм направленных градиентов;
провести тестирование созданной программы.
В ходе выполнения данной работы цель была достигнута, были решены все
поставленные задачи, а именно:
модернизирован механизм работы поискового окна, использованы параллельные вычисления на ядрах процессора графической видеокарты для увеличения
скорости обнаружения;
реализована программа с использованием дескриптора гистограмм направленных градиентов;
проведены анализ и тестирование созданной программы;
Результаты, полученные при работе программы удовлетворяют требованиям
скорости вычисления. Время реакции программы превосходит время реакции среднестатистического человека.
Программный модуль может быть использован как элемент более сложных
автоматизированных систем. Например, в случае использования в автоматизированной системе ассистента водителя, данные, полученные от программного модуля, могут быть использованы для оповещения водителя или корректировки движения
транспортного средства.
Дальнейшие исследования в этой области могут быть направлены на совершенствование алгоритма дескриптора, переобучение классификатора, или же создание нового классификатора.