ВВЕДЕНИЕ 4
1 Анализ предметной области 6
1.1 Актуальность задачи распознавания изображений 6
1.2 ADAS - системы 8
1.3 Теория распознавания образов 9
1.4 Алгоритмы искусственного интеллекта и машинного обучения в задаче
распознавания изображений 13
1.5 Цели и задачи магистерской диссертации 15
2 Сравнительный анализ алгоритмов машинного обучения 16
2.1 Сравнение алгоритмов классификации 16
2. Е1 Разработка моделей классификаторов 16
2.1.2 Сравнение разработанных моделей классификаторов при распознавании
изображений рукописных цифр 19
2.1.3 Сравнение разработанных моделей классификаторов при распознавании
изображений дорожных знаков 22
2.2 Сравнение нейронных сетей 27
2.2.1 Разработка моделей нейронной сети 27
2.2.2 Сравнение разработанных моделей многослойного персептрона с
различной архитектурой при распознавании рукописных цифр 31
2.2.3 Сравнение разработанных моделей многослойного персептрона с
различной архитектурой при распознавании дорожных знаков 33
2.3 Сравнение сверточной нейронной сети 34
2.3.1 Разработка модели сверточной нейронной сети 34
2.3,2 Особенности организации вычислений с использованием технологии
CUDA и cuDNN 40
2.3.3 Сравнение разработанной модели сверточной нейронной сети при
распознавании рукописных цифр 41
2.3.4 Сравнение разработанной модели сверточной нейронной сети при
распознавании дорожных знаков 46
2.4 Итоги сравнительного анализа алгоритмов машинного обучения 51
3 Разработка системы распознавания пешеходов с видеопотока 53
3.1 Сравнение баз изображений пешеходов 53
3.2 Реализация системы распознавания пешеходов с видеоизображения с
использованием классификатора SVM 60
3.3 Реализация системы распознавания пешеходов с видеоизображения с
использованием сверточной нейронной сети 67
3.4 Сравнение реализаций систем распознавания пешеходов 74
4 Интеграция с ADAS - системой 77
4.1 Сравнение современных ADAS - систем 77
4.2 Интеграция системы распознавания в архитектуру ADAS - систем 82
ЗАКЛЮЧЕНИЕ 85
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 86
ПРИЛОЖЕНИЕ
По неутешительной статистике количество дорожно - транспортных происшествий с участием пешеходов растет, это связано как с ростом населения, так и количеством транспортных средств на дорогах. Исследования, проведенные в области транспортной безопасности, показывают, что основной причиной большинства дорожно - транспортных происшествий является человеческий фактор, а именно ошибки водителей.
Развитие науки и техники при управлении транспортными средствами за счет применения современных технологий в виде беспилотных систем управления и систем поддержки помощи водителю (ADAS) позволяют полностью или частично исключить данный фактор в процессе управления транспортным средством, тем самым повышая качество и безопасность процесса движения автомобиля.
Однако, если о полностью беспилотных автомобилях в гражданском автомобилестроении говорить еще рано, то применение систем помощи водителю (ADAS) получает в настоящее время распространение в транспортных средствах почти всех ведущих брендов. Данные системы, призванные предупреждать действия водителя, нацелены на всестороннюю поддержку в виде подсистем адаптивного управления и контроля: круиз контроль, безопасное торможение, удержание полосы, распознавание различных препятствий и т. д.
Реализация данных подсистем является актуальной задачей и требует всесторонней оценки окружающей обстановки, информация о которой поступает с различных датчиков, камер, лидаров, радаров и тесно связана с распознаванием образов, которая является сложной и нетривиальной проблемой, где применение обычных алгоритмов не решает ее достаточно точно и в свою очередь требует применения более эффективных методов искусственного интеллекта и машинного обучения.
Учитывая всю важность и высокую незащищенность пешеходов, как участников дорожного движения, и необходимости предупреждения водителей современной системой поддержки, в данной работе проведена разработка интеллектуальной системы распознавания пешеходов с видеоизображения для современных ADAS - систем.
В данной работе были разработаны системы распознавания пешеходов с видеоизображения с применением алгоритма сверточной нейронной сети и классификации SVM с последующей интеграцией в ADAS - систему, работающего с высокой точностью и временем близком к реальному для повышения качества и безопасности процесса управления автомобилем.
В ходе реализации были определены наиболее перспективные алгоритмы, с точки зрения точности, искусственного интеллекта и машинного обучения, посредством проведения сравнительного анализа в задаче классификации дорожных знаков с использованием базы GTSRB и рукописных цифр с использованием базы MNIST.
Алгоритмы, показавшие высокую точность в данном сравнении легли в основу системы распознавания пешеходов. Для них были разработаны и обучены, с использованием базы изображений пешеходов, соответствующие модели и разработана соответствующие программная часть и структурная схема системы.
Далее для разработанных моделей было проведено сравнение с уже существующими и обученными моделями сверточных нейронных сетей на скорость работы, которые подтвердили способность разработанных систем работать в режиме близком к реальному.
В заключении были рассмотрены современные ADAS - системы и представлена их обобщенная архитектура, выбрана открытая платформа в качестве основы для интеграции системы распознавания и разработана архитектура ADAS - системы с соответствующей интеграцией разработанных систем распознавания пешеходов.
1. Жданова К. Д., Буняков В. А. Анализ методов распознавания образов
для применения в системе ориентации для слепых и слабовидящих людей с использованием библиотеки OpenCV (c. 63). XL Неделя науки СПбГПУ:
материалы международной научно-практической конференции. Ч. XV. -СПб.: Изд-во Политехн. ун-та, 2011. - 68с.
2. MachineLearning. Задача классификации. [Электронный ресурс]. -
Режим доступа:https://basegroup.ru/community/glossary/nearest-neighbor/(дата
обращения 15.04.2017)
3. Википедия. Дерево принятия решений. [Электронный ресурс]. - Режим доступа: ййр://’№№№.шасйше1еагпшд.ги/’№1к1/шбех.рйр?1й1е=Байесовский_ классификатор/(дата обращения 19.04.2017).
4. Сташевский П. С. Поддержка принятия решений в здравоохранении с
использованием показателя популяционного риска заболеваемости (с. 87):
диссертация на соискание ученой степени кандидата технических наук: 05.13.10 / Сташевский Павел Сергеевич; [Место защиты: Сибирский
государственный университет телекоммуникаций и информатики].- Новосибирск, 2014.- 147 с.
5. База изображений рукописных цифр MNIST [Электронный ресурс]. - Режим доступа: http://yann.lecun.com/exdb/mnist/ (дата обращения 28.04.2017).
6. Википедия. База данных рукописных цифр MNIST. [Электронный ресурс]. - Режим доступа: https://m.vikipedia.orgAviki/MNIST (база данных) /(дата обращения 25.04.2017).
7. Шахуро В. И., Конушин А. С. Российская база изображений автодорожных знаков // Компьютерная оптика. — 2016. — Т. 40, № 2. — С. 294-300.
8. Larsson, F. Using Fourier descriptors and spatial models fortraffic sign recognition / F. Larsson, M. Felsberg // ImageAnalysis. - Berlin, Heidelberg: Springer, 2011. - P. 238-249.
9. Mogelmose, A. Vision-based traffic sign detection andanalysis for intelligent driver assistance systems: Perspectivesand survey / A. Mogelmose, M.M. Trivedi,T.B. Moeslund // IEEE Transactions on Intelligent TransportationSystems. -
2012. - Vol. 13(4). - P. 1484-1497.
10. ShigabievR.R., ZiyatdinovR.R., TalinovD.N. Automated System of Identification of Road Marking// The Materials of International Scientific and Technical Conference “Innovation Engineering Technologies, Equipment and Materials - 2016” (ISTC“IETEM-2016”). P. 2. - Kazan, 2016. - p.176-180.
11. Radford M. Neal, Geoffrey E. Hinton. A view of the EM algorithm that justifies incremental, sparse, and other variants». Learning in Graphical Models (MIT Press): 355-368.
12. Adaptive Threshholding OpenCV [Электронный ресурс]. - Режим доступа: https://docs.opencv. org/3.4/d7/d4d/tutorial_py_thresholding.html (дата обращения 1.05.2017).
13. Википедия. Нейронная сеть. [Электронный ресурс]. - Режим доступа: https://ru.wikipedia.org/wiki/Искусственная_нейронная_сеть (дата обращения 5.05.2017).
14. Sakai T., Nagao M., Fujibayashi S. Line extraction and pattern detection in a photograph // Pattern recognition. - 1969. - V. 1. -№ 5. - P. 233-248.
15. Yu N., Notkin B.S., Sedov V.A. Neuroiterative algorithm of tomographic reconstruction of the distributed physical fields in the fibreoptic measuring systems // Computer optics. - 2009. - V. 33. -№ 4. - P. 446-455.
16. Википедия. Сверточная нейронная сеть. [Электронный ресурс] - Режим доступа: https://ru.wikipedia.org/wiki/Свёрточная_нейронная_сеть (дата обращения 10.05.2017).
17. Wilson D.R., Martinez T.R. The general inefficiency of batch training for gradient descent learning // Neural Networks. - 2004. -V. 16. - № 4. - P. 1429-1451.
18. Fatica, M. CUDA for High Performance Computing -Materials of HPC- NA Workshop 3, January 2009.
19. Belgian researchers develop desktop supercomputer [Электронный ресурс] - Режим доступа: http://fastra.ua.ac.be/en/index.html (дата обращения: 15.05.2018).
20. YOLO: Real-Time Object Detection [Электронный ресурс] - Режим доступа: https://pjreddie.com/darknet/yolo/ (дата обращения: 10.04.2018).
21. Yet Another Computer Vision Index To Datasets (YACVID)
[Электронный ресурс] - Режим доступа:
http://riemenschneider.hayko.at/vision/dataset/index.php?filter=+pedestrian (дата
обращения: 17.05.2018).
22. Википедия. Гистограмма направленных градиентов. [Электронный ресурс] - Режим доступа: https://ru.wikipedia.org/wiki/ Свёрточная_нейронная _сеть (дата обращения 18.05.2017).
23. Википедия. ADAS - системы. [Электронный ресурс] - Режим доступа: https://en.wikipedia.org/wiki/Advanced_driver-assistance_systems (дата обращения 21.05.2017).
24. NVIDIA DRIVE. [Электронный ресурс] - Режим доступа:
https://developer.nvidia.com/drive (дата обращения 23.05.2017).
25. Microsoft Visual Studio [Электронный ресурс] - Режим доступа: https://visualstudio.microsoft.com/ru/ (дата обращения 05.01.2017).
26. OpenCV [Электронный ресурс] - Режим доступа: https://opencv.org/ (дата обращения 07.02.2017).