Тема: Модификация метода Виолы-Джонса путём фильтрации входного потока с помощью оператора Лапласа
Характеристики работы
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1 Степень разработанности темы исследования 7
1.1 Существующие исследования по теме 8
1.2 Выводы: по существующим исследованиям 10
2 Современные подходы к решению задачи 11
2.1 Deformable Part Models 13
2.2 Scale-Invariant Feature Transform (SIFT) 16
2.3 Speeded Up Robust Features 19
2.4 Gradient Location Orientation Histogram (GLOH) 21
2.5 Histogram of Oriented Gradients (HOG) 22
2.6 Метод Виолы-Джонса 29
2.7 Выбор подхода 35
3 Варианты улучшения алгоритма. 37
3.1 Сглаживающий фильтр Гаусса 37
3.2 Выделение границ 42
3.3 Оператор Превитта. 47
3.4 Оператор Собеля 51
3.5 Оператор Лапласа 54
3.6 Детектор границ Канни 57
3.7 RASW - Runtime Adapting Sliding Window 60
3.8 Выбор способа улучшения метода Виолы-Джонса. 62
Глава 4 Описание выбранного решения 64
4.1 Реализация 65
4.2 Результаты работы реализации 70
Заключение 82
Список используемой литературы 83
📖 Введение
Актуальность темы исследования:
Исследования, посвященные улучшению работы методов компьютерного зрения, являются крайне актуальными по многим причинам. Существует множество задач, решение которых не представляется возможным без использования методов компьютерного зрения, или же существенно упрощается с их помощью. Область применения машинного зрения весьма широка: от считывателей штрих-кодов и QR-кодов в супермаркетах до приложений дополненной реальности (Augmented Reality).
В данной работе речь пойдёт об улучшении методов компьютерного зрения для решения одной из таких задач, выполняемых методами компьютерного зрения, а именно - о задаче поиска пешеходов на изображении . При реализации интеллектуальных систем от разработчика часто требуется анализировать изображения с целью поиска на них определённых объектов, например автомобилей, людей, знаков дорожного движения и т.п. Существует множество стандартных алгоритмов для решения задач локализации объектов, например HOG-SVM, метод Виолы-Джонса, Deformable Part Models и т.д., однако, проблемой некоторых существующих алгоритмов в определённых задачах, например, метода Виолы-Джонса является их относительно-низкая точность работы, поэтому исследования, направленные на повышение точности работы алгоритма являются актуальными.
Научная проблема исследования:
При решении вышеописанных задач возникает множество проблем, связанных с действиями в экстренных ситуациях, таких как пешеход на проезжей части. Для решения подобных проблем используются методы компьютерного зрения, а именно - обнаружения объектов, в данном случае пешеходов, на изображении.
Абсолютное большинство методов компьютерного зрения разрабатываются и настраиваются на конкретную задачу с помощью методов машинного обучения, которые позволяют определить значимые признаки и их значения, соответствующие искомым объектам.
Следует отметить, что не существует идеальных методов компьютерного зрения, и даже если сконцентрироваться на какой-либо конкретной задаче, как, например, задача поиска пешеходов на изображении, не существует метода, который не имел бы каких-либо недостатков. Например, одним из распространённых недостатков большинства методов компьютерного зрения является то, что они имеют трудоёмкость, которая зависит квадратично или даже кубично от объёма входных данных, вследствие чего их работа при решении различных серьёзных задач может быть слишком медлительной. Методы, которые не создают большую вычислительную нагрузку в свою очередь имеют сравнительно низкую эффективность обнаружения, что создаёт проблему недостатка пригодных альтернатив методам с высокой вычислительной нагрузкой.
Таким образом, научная проблема и актуальность исследования обусловлены несовершенством современных методов поиска пешеходов на изображении и нехваткой пригодных для подобной задачи альтернативных методов.
Объект исследования - компьютерное зрение в задаче поиска пешеходов на изображении.
Предмет исследования - использование метода Виолы-Джонса в задаче поиска пешеходов на изображении и модификации, способствующие улучшению его работы.
Цель исследования - модификация метода Виолы-Джонса с целью улучшения результатов его работы при приложении к задаче локализации людей на изображении.
Задачами работы являются:
1) Изучить особенности работы алгоритма Виолы-Джонса;
2) Разработка математической алгоритмической модели улучшения метода Виолы-Джонса за счёт предобработки входного изображения;
3) Разработать программное обеспечение, демонстрирующее работу данного подхода;
4) Протестировать модифицированный метод на основе тестовой выборки;
Гипотеза - результаты эксперимента по модификации метода Виолы - Джонса покажут уменьшение количества ошибок первого и второго рода при его работе в задаче поиска пешеходов на изображении.
Методологическая основа данной работы - сравнение, измерение и эксперимент.
В данной работе используется подход к решению описанной проблемы, опирающийся на проведение абстрактного (оторванного от реальной ситуации на дороге) испытания метода Виолы-Джонса с использованием предложенных модификаций и без них на наборе тестовых изображений. Полученные результаты работы, дающие представление о эффективности методов, позволят определить насколько предложенная модификация окажется полезной на практике, чем определяется практическая значимость исследования. Результаты испытания представлены с помощью графика кривых ROC, который позволяет наглядно представить и оценить количество объектов, верно - классифицированных в процессе работы методов.
Новизна исследования: установлено, что использование оператора Лапласа вместе со сглаживающим фильтром Гаусса для предобработки изображения позволяет повысить точность работы метода Виолы-Джонса в задачах локализации человека на 15-20%.
В ходе исследования установлено, что применение оператора Лапласа в сочетании с размытием по Гауссу ко входному потоку метода Виолы-Джонса приводит к уменьшению количества ошибок второго рода на 15-20%. При этом использование данной модификации приводит к увеличению количества ошибок первого рода, которое, впрочем, может быть нивелировано путём увеличения обучающей выборки.
Объем и структура диссертации: диссертационное исследование состоит из введения, 4 глав, заключения, библиографии (64 наименования). Работа изложена на 92 страницах, содержит 54 рисунка.
✅ Заключение
Однако, проблема высокого FPR, при использовании методов машинного обучения решаема с помощью увеличения обучающей выборки. Подобные результаты эксперимента позволяют сделать вывод о том, что выбранная модификация метода Виолы-Джонса требует большой обучающей выборки, чтобы избежать проблемы высокого FPR, однако даже в таком виде, она показывает результаты работы, превосходящие результаты работы классического метода, что позволяет говорить о возможности применения данного метода в различных прикладных задачах.



