Аннотация 2
ВВЕДЕНИЕ 6
Глава 1 АНАЛИЗ МЕТОДОВ ЛОКАЛИЗАЦИИ ОБЪЕКТОВ НА ИЗОБРАЖЕНИИ 8
1.1 Выбор актуальной практико-ориентированной задачи локализации объектов на изображении 8
1.2 Анализ задачи локализации объектов на изображении и определение ключевых этапов 8
1.3 Метод Виолы-Джонса 9
1.4 Метод опорных векторов с использованием гистограмм направленных градиентов 11
1.4.1 Определение понятия гистограммы направленных компонентов 11
1.4.2 Теоретическое описание метода опорных векторов 14
1.5. Свёрточные нейронные сети 17
1.5.1 Общие понятия нейронных сетей 17
1.5.3 Функция активации и основы обучения нейронной сети 18
1.5.4 Архитектура свёрточной нейронной сети 20
1.6 Обоснование выбора методов 23
Глава 2 АЛГОРИТМ ЛОКАЛИЗАЦИИ ОБЪЕКТОВ НА ИЗОБРАЖЕНИИ 27
2.1 Локализация дорожных знаков 27
2.1.1 Формирование и подготовка базы дорожных знаков 28
2.1.2 Обучение HOG&SVM дескрипторов 30
2.2 Классификация дорожных знаков 32
2.2.1 Подготовка обучающей базы данных 32
2.2.2 Проектирование и обучение нейронной сети 33
2.3 Разработка и проектирование алгоритма комплексного распознавания дорожных знаков 37
2.4 Тестирование разработанного программного решения 41
2.4.1 Тестирование и оценка точности модуля локализации 41
2.4.2 Тестирование классифицирующей свёрточной нейронной сети 44
ЗАКЛЮЧЕНИЕ 46
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 47
ПРИЛОЖЕНИЕ А. Листинг кода программной реализации 49
Задачи локализации и классификации образов часто встречаются и решаются в повседневной жизни людей. Проблема распознавания образов очень важна в наше время, так как существенное количество сигналов, поступающих единовременно, значительно осложняют жизнь современного человека. Данную проблему обычно называют «информационной перегрузкой».
Во многих междисциплинарных исследованиях также встречается проблема распознавание объектов. В частности, распознавание образов лежит в основе комплексных реализаций систем искусственного интеллекта, а реализация методов и систем распознавания изображений привлекает сегодня большое внимание.
Локализация объектов на изображении и их классификация является огромной проблемой в современной науке, так как нет какого-то универсального решения для всех задач. Однако, существует большое количество реализаций, которые решают данную проблему в конкретном случае.
Автоматизация локализации объектов особенно актуальна в областях жизни человека, где имеется большой поток поступающих сигналов, и не своевременная их обработка может нанести вред здоровью человека.
Одной из актуальных проблем сегодня, является автоматизация управления движением автомобиля и разработка систем помощи водителю, реагирующих на различные сигналы.
Дорожные знаки являются неотъемлемой частью современной дорожной инфраструктуры.
Они предоставляют критически важную информацию и убедительные рекомендации для участников дорожного движения, что, в свою очередь, требует от последних корректировки своего поведения при вождении, с тем чтобы они соблюдали все действующие в настоящее время правила дорожного движения. Без таких полезных рекомендаций мы, скорее всего, столкнемся с большим количеством ДТП, поскольку водители не получат критических уведомлений о том, насколько быстро они могут безопасно ехать, или не будут проинформированы о дорожных работах, крутых поворотах или школьных переходах. В наше время около 1,3 млн. человек умирают на дорогах каждый год.
Это число было бы намного выше без дорожных знаков, поэтому разработка алгоритмов и систем их обнаружения их обнаружения сегодня особенно актуальна.
Цель выпускной квалификационной работы (ВКР) - исследование методов локализации и классификации объектов на изображении и разработка универсального алгоритма для решения практико-ориентированных задач.
Объект ВКР - распознавание дорожных знаков.
Предмет ВКР: система распознавания дорожных знаков на изображении с использованием методов машинного обучения.
Основные задачи ВКР:
1. Исследовать методы локализации и классификации объектов на изображении.
2. Разработать алгоритм, решающий практико-ориентированную задачу распознавания объекта или объектов на изображении;
3. Протестировать разработанное решение и провести анализ полученных результатов.
В рамках данной выпускной квалификационной работы были выполнены все цели и задачи. Была рассмотрена задача локализации и классификации объектов на изображении на примере актуальной проблемы современного общества и компьютерного зрения - распознавание дорожных знаков.
В процессе выполнения бакалаврской работы решены следующие задачи:
1. Исследованы наиболее успешно зарекомендовавшие себя методы локализации и классификации изображений и сделан обоснованный выбор наиболее удачных решений.
2. На основании сделанного выбора разработан универсальный подход и алгоритм для решения задачи локализации и классификации объектов на изображении, который в последствии может быть применен для других практико-ориентированных задач локализации и распознавания образов.
3. Представлена программная реализация разработанного алгоритма и проведено численное тестирование её эффективности. В ходе тестирования были получены хорошие результаты на каждом модуле разработанного решения. На этапе локализации программа локализует дорожный знак с вероятностью 77,65%, а на этапе классификации удалось достичь точность в 97%, что очень близко к точности человека.
Разработанное решение может быть расширено и использоваться как система помощи водителю (автопилот), или же предложенный алгоритм может применяться для совершенно иной задачи с схожей проблематикой.
Нормативно-правовые акты
1. ГОСТ 19.701-90. Единая система программной документации. Схемы алгоритмов, программ, данных и систем.
Научная и методическая литература
2. Вьюгин В. Математические основы теории машинного обучения и прогнозирования. — МЦМНО, 2013 г. — 390 с.
3. Изучаем Python, 4-е издание. - Пер. с англ. - СПб.: Символ-Плюс, 2011 - 1280 с.
4. Назаренко А.В. Компьютерное зрение. Современный подход. Издательство: Вильямс, 2004 г. - 928 с.
Электронные ресурсы
5. CBCL PEDESTRIAN DATABASE [Электронный ресурс]. - Режим доступа: http://cbcl.mit.edu/software-datasets/PedestrianData.html - Pedestrian Dataset Massachusetts Institute of Technology - (дата обращения 14.02.2019).
6. German traffic sign recognition benchmark [Электронный ресурс]. - Режим доступа: http://benchmark.ini.rub.de/?section=gtsrb&subsection=dataset - (GTSRB) dataset - (дата обращения 26.02.2019).
7. THOTH [Электронный ресурс]. - Режим доступа: http://lear.inrialpes.fr/data - INRIA Person Data Set - (дата обращения 15.02.2019).
8. Википедия [Электронный ресурс]. - Режим доступа: Нйрз://гн.’МЬреШа.огд/’МЬ/Метод_Виолы_— Джонса - Метод Виолы- Джонса - (дата обращения 25.12.2018).
9. Википедия [Электронный ресурс]. - Режим доступа: lmps:/mi.vikipedia.c)rg/wiki/l 1ризнаки Хаара - Признаки Хаара - (дата обращения 26.12.2018).
10. Википедия [Электронный ресурс]. - Режим доступа: https://ru.wikipedia.org/wiki/r истограмма_направленных_градиентов - Гистограмма направленных градиентов - (дата обращения 13.01.2019).
Литература на иностранном языке
11. J. Stallkampa, M. Schlipsinga, J. Salmena C. Igelb Man vs. Computer: Benchmarking Machine Learning Algorithms for Traffic Sign Recognition, 2012. - 11 p.
12. Melin, P. Design of Intelligent Systems Based on Fuzzy Logic, Neural Networks and Nature-Inspired Optimization / Patricia Melin, Oscar Castillo, Janusz Kacprzyk. - Springer International Publishing, 2015. - 637 p.
13. C. Ronan, W. Jason. A Unified Architecture for Natural Language Processing: Deep Neural Networks with Multitask Learning. Proceedings of the 25th International Conference on Machine Learning. ICML '08. New York, NY, USA: ACM. 2008. 160-167 p.
14. Ciresan, D. C., Meier, U., Masci, J., & Schmidhuber, J. A committee of neural networks for traffic sign classification. In International Joint Conference on Neural Networks, 2011. - 4 p.
15. Habibi Aghdam. H, Jehani Heravi. E, Guide to Convolutional Neural Networks A Practical Application to Traffic-Sign Detection and Classification, 2017. - 282 p.
...