Тип работы:
Предмет:
Язык работы:


Модификация метода Виолы-Джонса путём фильтрации входного потока с помощью оператора Лапласа

Работа №103858

Тип работы

Магистерская диссертация

Предмет

математическое моделирование

Объем работы90
Год сдачи2018
Стоимость4935 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
72
Не подходит работа?

Узнай цену на написание


Введение 3
1 Степень разработанности темы исследования 7
1.1 Существующие исследования по теме 8
1.2 Выводы: по существующим исследованиям 10
2 Современные подходы к решению задачи 11
2.1 Deformable Part Models 13
2.2 Scale-Invariant Feature Transform (SIFT) 16
2.3 Speeded Up Robust Features 19
2.4 Gradient Location Orientation Histogram (GLOH) 21
2.5 Histogram of Oriented Gradients (HOG) 22
2.6 Метод Виолы-Джонса 29
2.7 Выбор подхода 35
3 Варианты улучшения алгоритма. 37
3.1 Сглаживающий фильтр Гаусса 37
3.2 Выделение границ 42
3.3 Оператор Превитта. 47
3.4 Оператор Собеля 51
3.5 Оператор Лапласа 54
3.6 Детектор границ Канни 57
3.7 RASW - Runtime Adapting Sliding Window 60
3.8 Выбор способа улучшения метода Виолы-Джонса. 62
Глава 4 Описание выбранного решения 64
4.1 Реализация 65
4.2 Результаты работы реализации 70
Заключение 82
Список используемой литературы 83


Способность видеть и различать объекты - нечто естественное и привычное для большинства людей. Однако, даже для сложных компьютерных систем на данный момент - это является чрезвычайно сложной задачей. Сейчас весьма большое количество исследовательских команд и даже целые корпорации предпринимают попытки обучить компьютер по крайней мере отчасти тому, что человек делает ежедневно, даже того не замечая.
Актуальность темы исследования:
Исследования, посвященные улучшению работы методов компьютерного зрения, являются крайне актуальными по многим причинам. Существует множество задач, решение которых не представляется возможным без использования методов компьютерного зрения, или же существенно упрощается с их помощью. Область применения машинного зрения весьма широка: от считывателей штрих-кодов и QR-кодов в супермаркетах до приложений дополненной реальности (Augmented Reality).
В данной работе речь пойдёт об улучшении методов компьютерного зрения для решения одной из таких задач, выполняемых методами компьютерного зрения, а именно - о задаче поиска пешеходов на изображении . При реализации интеллектуальных систем от разработчика часто требуется анализировать изображения с целью поиска на них определённых объектов, например автомобилей, людей, знаков дорожного движения и т.п. Существует множество стандартных алгоритмов для решения задач локализации объектов, например HOG-SVM, метод Виолы-Джонса, Deformable Part Models и т.д., однако, проблемой некоторых существующих алгоритмов в определённых задачах, например, метода Виолы-Джонса является их относительно-низкая точность работы, поэтому исследования, направленные на повышение точности работы алгоритма являются актуальными.
Научная проблема исследования:
При решении вышеописанных задач возникает множество проблем, связанных с действиями в экстренных ситуациях, таких как пешеход на проезжей части. Для решения подобных проблем используются методы компьютерного зрения, а именно - обнаружения объектов, в данном случае пешеходов, на изображении.
Абсолютное большинство методов компьютерного зрения разрабатываются и настраиваются на конкретную задачу с помощью методов машинного обучения, которые позволяют определить значимые признаки и их значения, соответствующие искомым объектам.
Следует отметить, что не существует идеальных методов компьютерного зрения, и даже если сконцентрироваться на какой-либо конкретной задаче, как, например, задача поиска пешеходов на изображении, не существует метода, который не имел бы каких-либо недостатков. Например, одним из распространённых недостатков большинства методов компьютерного зрения является то, что они имеют трудоёмкость, которая зависит квадратично или даже кубично от объёма входных данных, вследствие чего их работа при решении различных серьёзных задач может быть слишком медлительной. Методы, которые не создают большую вычислительную нагрузку в свою очередь имеют сравнительно низкую эффективность обнаружения, что создаёт проблему недостатка пригодных альтернатив методам с высокой вычислительной нагрузкой.
Таким образом, научная проблема и актуальность исследования обусловлены несовершенством современных методов поиска пешеходов на изображении и нехваткой пригодных для подобной задачи альтернативных методов.
Объект исследования - компьютерное зрение в задаче поиска пешеходов на изображении.
Предмет исследования - использование метода Виолы-Джонса в задаче поиска пешеходов на изображении и модификации, способствующие улучшению его работы.
Цель исследования - модификация метода Виолы-Джонса с целью улучшения результатов его работы при приложении к задаче локализации людей на изображении.
Задачами работы являются:
1) Изучить особенности работы алгоритма Виолы-Джонса;
2) Разработка математической алгоритмической модели улучшения метода Виолы-Джонса за счёт предобработки входного изображения;
3) Разработать программное обеспечение, демонстрирующее работу данного подхода;
4) Протестировать модифицированный метод на основе тестовой выборки;
Гипотеза - результаты эксперимента по модификации метода Виолы - Джонса покажут уменьшение количества ошибок первого и второго рода при его работе в задаче поиска пешеходов на изображении.
Методологическая основа данной работы - сравнение, измерение и эксперимент.
В данной работе используется подход к решению описанной проблемы, опирающийся на проведение абстрактного (оторванного от реальной ситуации на дороге) испытания метода Виолы-Джонса с использованием предложенных модификаций и без них на наборе тестовых изображений. Полученные результаты работы, дающие представление о эффективности методов, позволят определить насколько предложенная модификация окажется полезной на практике, чем определяется практическая значимость исследования. Результаты испытания представлены с помощью графика кривых ROC, который позволяет наглядно представить и оценить количество объектов, верно - классифицированных в процессе работы методов.
Новизна исследования: установлено, что использование оператора Лапласа вместе со сглаживающим фильтром Гаусса для предобработки изображения позволяет повысить точность работы метода Виолы-Джонса в задачах локализации человека на 15-20%.
В ходе исследования установлено, что применение оператора Лапласа в сочетании с размытием по Гауссу ко входному потоку метода Виолы-Джонса приводит к уменьшению количества ошибок второго рода на 15-20%. При этом использование данной модификации приводит к увеличению количества ошибок первого рода, которое, впрочем, может быть нивелировано путём увеличения обучающей выборки.
Объем и структура диссертации: диссертационное исследование состоит из введения, 4 глав, заключения, библиографии (64 наименования). Работа изложена на 92 страницах, содержит 54 рисунка.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


На основании приведённых примеров установлено, что применение предложенного автором метода приведёт к увеличению TPR (True Positive Response, или верный позитивный ответ) выводов о наличии человека на изображении, однако при этом увеличивается FPR (False Positive Response, или ложный положительный ответ), что недопустимо в задаче поиска человека на изображении.
Однако, проблема высокого FPR, при использовании методов машинного обучения решаема с помощью увеличения обучающей выборки. Подобные результаты эксперимента позволяют сделать вывод о том, что выбранная модификация метода Виолы-Джонса требует большой обучающей выборки, чтобы избежать проблемы высокого FPR, однако даже в таком виде, она показывает результаты работы, превосходящие результаты работы классического метода, что позволяет говорить о возможности применения данного метода в различных прикладных задачах.



1. Bradsky, G. Learning OpenCV: Computer Vision with OpenCV Library / G. Bradsky, A. Kaehler. - O'Reilly Media, 2008. - 555 p.
2. Ponce, J. Computer Vision: A Modern Approach / J. Ponce, D.A. Forsyth. - Prentice Hall Professional Technical Reference, 2002. - 720 p.
3. Szeliski, R. Coputer Vision: Algorithms and Applications / R. Szeliski. - Springer, 2011. - 812 p.
4. Форсайт Д.А. Компьютерное зрение. Современный подход / Д.А. Форсайт. -М.: Вильямс, 2004. - 928 с.
5. Гонсалес Р. Цифровая обработка изображений в среде MATLAB / Р. Гонсалес, Р. Вудс, С. Эддинс. -М.: Техносфера, 2006. - 616 с.
6. Дьяконов В.П. Matlab 6.5 SP1/7 + Simulink 5/6. Работа с изображениями и видеопотоками / В.П. Дьяконов. -М.: СОЛОН-Пресс, 2005. - 400с.
7. Яншин В.В. Анализ и обработка изображений, принципы и алгоритмы / В.В. Яншин. -М.: Машиностроение, 1995. - 111с.
8. Визильтер Ю.В. Обработка и анализ изображений в задачах машинного зрения / Ю.В. Визильтер. -М.: Физматкнига, - 2010. - 689с.
9. Фисенко В. Т. Компьютерная обработка и распознавание изображений: учебное пособие / В.Т. Фисенко. -СПб: СПбГУ ИТМО, 2008. -195 с.
10. Papageorgiou C., Poggio T. A trainable pedestrian detection system^re^^ / C. Papageougiou, T. Poggio // Intelligent Vehicles. - October 1998, pages 241-246.
11. Viola P., Jones M. Rapid Object Detection using a Boosted Cascade of Simple Features[текст] / P. Viola, M. Jones // Accepted Conference on Computer Vision and Pattern Recognition. - 2001. - 9 p.
12. Lee A. Comparing Deep Neural Networks and Traditional Vision
Algorithms in Mobile Robotics[текст] / A. Lee // Swarthmore College. - 2015. - 9 p.
13. Yi-Qing W. An Analysis of the Viola-Jones Face Detection
Algorithm[текст] / W. Yi-Quing // Image Processing On Line. - 2014. - 148 p.
14. Pedro F. Visual Object Detection with Deformable Part Models[TeKCT] / F. F. Pedro // Communications of the ACM. 2013. - 97-105 p.
15. David G. L. Distinctive Image Features from Scale-Invariant Keypoints[TeKCT] / G. L. David // Computer Science Department University of British Columbia. 2004. - 28 p.
16. Herbert B., Andreas S. Speeded-Up Robust Features (SURF)[TeKCT] / B. Herbert, S. Andreas // Katholieke Universiteit Leuven. 2008. - 14 p.
17. Pablo N. Benchmarking Haar and Histograms of Oriented Gradients Features Applied to Vehicle Detection[TeKCT] / N. Pablo // Universite Pierre et Marie Curie-Paris. 2007. - 6 p.
18. Navneet D., Bill T. Histograms of Oriented Gradients for Human Detectionx[TeKCT] / D. Navneet, T. Bill // IEEE Computer Society Washington, DC, USA. 2005. - 8 p.
19. Alberto D. C., Roberto A. V. Intelligent Computing Systems[TeKCT] / D. C. Alberto, A. V. Roberto // Springer International Publishing. 2016. - 153 p.
20. Abdul-Lateef Y. Advances in Computer Science and its Applications[TeKCT] / Y. Abdul-Lateef // Springer Berlin Heidelberg. 2014. - 1415 p.
21. Simone F. VOCUS: A Visual Attention System for Object Detection and Goal-Directed Search[TeKCT] / F. Simone // Springer Berlin Heidelberg. 2006. - 218 p.
22. Modesto C., Oscar D., Daniel H., Javier L. A comparison of face and facial feature detectors based on the Viola-Jones general object detection framework[TeKCT] / C. Modesto, D. Oscar, H. Daniel, L. Javier // Springer-Verlag. 2011. - 14 p.
23. Alexandre P. M. Bioinspired Computation in Artificial Systems[TeKCT] / P. M. Alexandre // Springer International Publishing. 2015. - 485 p.
24. Ryoji K., Hiroki S., Masayuki H. Hardware Architecture for HOG Feature Extraction[TeKCT] / K. Ryoji, S. Hiroki, H. Masayuki // IEEE Computer Society. 2009. - 34 p.
25. Forrest N. I., Matthew W. M., Kurt K. Energy-Efficient Histogram of Oriented Gradient Computation[TeKCT] / N. I. Forrest, W. M. Matthew, K. Kurt // University of California, Berkeley. 2015. - 7 p.
26. Li-Chuan G., Ze-xun G., Guo-xi W. Compressed Binary Discriminative Feature for Fast UAV Image Registration[TeKCT] / G. Li-Chuan, G. Ze-xun, W. Guo- xi // Springer International Publishing. 2015. - 16 p.
27. Kyung-mo K., Eui-young C. A Multiple Object Tracking Method using SURF and Color Histogram[TeKCT] / K. Kyung-mo, C. Eui-young // Computer Engineering, Pusan National University. 2014. - 4 p.
28. Paul V., Michael J. J. Robust Real-Time Face Detection[TeKCT] / V. Paul, J. J. Michael // Kluwer Academic Publishers. 2004. - 18 p.
29. Francesco C., Sander S., Twan B., Henk C. RASW: a Run-time Adaptive Sliding Window to Improve Viola-Jones Object Detection[TeKCT] / C. Francesco, S. Sander, B. Twan, C. Henk // Electronic Systems Group, Eindhoven University of Technology. 2014. - 6 p.
30. Moghimi M.M., Nayeri M., Pourahmadi M., Moghimi M.K. Moving Vehicle Detection Using AdaBoost and Haar-Like Feature in Surveillance Videos[TeKCT] / M.M. Moghimi, M. Nayeri, M. Pourahmadi, M.K. Moghimi // Department of Electrical Engineering, Shahed University, Tehran, Iran. 2018. - 13 p.
31. Lee D.C. Boosted Classifier for Car Detection[TeKCT] / D.C. Lee // ECE Department, Carnegie Mellon University, U.S.A. 2007. - 4 p.
32. Yongzheng X., Guizhen Y., Yunpeng W., Xinkai W., Yalong M. A Hybrid Vehicle Detection Method Based on Viola-Jones and HOG + SVM from UAV Images[TeKCT] / X. Yongzheng, Y. Guizhen, W. Yunpeng, W. Xinkai, M. Yalong // Beijing Key Laboratory for Cooperative Vehicle Infrastructure Systems and Safety Control, School of Transportation Science and Engineering, Beihang University, Beijing 100191, China; Jiangsu Province Collaborative Innovation Center of Modern Urban Traffic Technologies, SiPaiLou #2, Nanjing 210096, China. 2016. - 23 p.
33. Choudhury S., Chattopadhyay S.P., Hazra T.K. Vehicle detection and counting using haar feature-based classifier[TeKCT] / S. Choudhury, S.P. Chattopadhyay, T.K. Hazra // Industrial Automation and Electromechanical Engineering Conference (IEMECON), Bangkok, Thailand. 2017. - 4 p.
34. Almehmadi T., Htike Z.Z. Vehicle Classification System Using Viola Jones and Multi-Layer Perception[TeKCT] / T. Almehmadi, Z.Z. Htike // Department of Electrical Engineering, University of Malaya, Malaysia; Department of Mechatronics, International Islamic University, Malaysia. 2015. - 7 p.
35. Choi J. Realtime On-Road Vehicle Detection with Optical Flows and Haar- Like Feature Detectors[TeKCT] / J. Choi // Department of Computer Science, University of Illinois at Urbana-Champaign, Urbana. 2006. - 7 p.
36. Moutarde F., Stanciulescu B., Breheret A. Real-time visual detection of vehicles and pedestrians with new efficient adaBoost features [TeKCT] / F. Moutarde,
B. Stanciulescu, A. Breheret // 2nd Workshop on Planning, Perception and Navigation for Intelligent Vehicles (PPNIV), at IEEE International Conference on Intelligent Robots Systems (IROS), Nice, France. 2008. - 7 p.
37. Caraffi C., Vojir T., Trefny J., Sochman J., Matas J. A System for Real¬time Detection and Tracking of Vehicles from a Single Car-mounted Camera[TeKCT] /
C. Caraffi, T. Vojir, J. Trefny, J. Sochman, J. Matas // The Center for Machine Perception, Department of Cybernetics, Faculty of Electrical Engineering, Czech Technical University in Prague, Czech Re public. 2012. - 8 p.
38. Hermawati F.A., Budianto H. A Video Based License Plate Detection System Using Viola-Jones Method[TeKCT] / F.A. Hermawati, H. Budianto // Department of Informatics, Faculty of Engineering, University of 17 Agustus 1945 of Surabaya Jl. Semolowaru 45, Surabaya 60119, Indonesia. 2013. - 10 p.
39. Neumann D., Langner T., Ulbrich F., Spitta D., Goehring D. Online Vehicle Detection using Haar-like, LBP and HOG Feature based Image Classifiers with Stereo Vision Preselection[TeKCT] / D. Neumann, T. Langner, F. Ulbrich, D. Spitta, D. Goehring // Department of Computer Science, Freie University, Berlin, Germany. 2017. - 6 p.
40. Han S., Han Y., Hahn H. Vehicle Detection Method using Haar-like Feature on Real Time System[TeKCT] / S. Han, Y. Han, H. Hahn // Electronic Engineering Department, Soongsil University, Seoul, Korea. 2009. - 5 p.
41. Elkerdawi S.M., Sayed R., Elhelw M. Real-Time Vehicle Detection and Tracking Using Haar-Like Features and Compressive Tracking[TeKCT] / S.M. Elkerdawi, R. Sayed, M. Elhelw // Nile University, Ubiquitous Computing Group, Cairo, Egypt. 2014. - 9 p.
42. Liu K., Mattyus G. Fast multiclass vehicle detection on aerial
images[TeKCT] / K. Liu, G. Mattyus // Remote Sensing Technology Institute of the
German Aerospace Center. 2015. - 5 p.
43. Hao P., Bailing Z. An Integrative Approach to Accurate Vehicle Logo
Detection[TeKCT] / P. Hao, Z. Bailing // Journal of Electrical and Computer
Engineering. 2013. - 12 p.
44. Keller C.G., Sprunk C., Bahlmann C., Giebel J., Baratoff G. Real-time Recognition of U.S. Speed Signs[TeKCT] / C.G. Keller, C. Sprunk, C. Bahlmann, J. Giebel, G. Baratoff // Intelligent Vehicles Symposium. 2008. - 6 p.
45. Sebastian H., Johannes S., Jan S., Marc S., Christian I. Detection of Traffic Signs in Real-World Images: The German Traffic Sign Detection Benchmark[TeKCT] / H. Sebastian, S. Johannes, S. Jan, S. Marc, I. Christian // The 2013 International Joint Conference on Neural Networks (IJCNN). 2013. - 8 p.
46. Marcus M., Radu T., Rodrigo B., Luc V.G. Traffic sign recognition — How far are we from the solution?[TeKCT] / M. Marcus, T. Radu, B. Rodrigo, V.G.
Luc // The 2013 International Joint Conference on Neural Networks (IJCNN). 2013. - 4 p.
47. Zhang Y., Wang G., Gu X., Zhang S., Hu J. Real-time pedestrian detection with the videos of car camera [текст] / Y. Zhang, G. Wang, X. Gu, S. Zhang, J. Hu // Advances in Mechanical Engineering. 2015. - 9 p.
48. Adrian W.Y.W., Shahirina M.T., Yoong C.C. GPU Acceleration of Real Time Viola-Jones Face Detection[meKCT] / W.Y.W. Adrian, M.T. Shahirina, C.C. Yoong // IEEE International Conference on Control System, Computing and Engineering, Penang, Malaysia. 2015. - 6 p.
49. Paul A.V., Michael J.J., Daniel S. Detecting Pedestrians Using Patterns of Motion and Appearance[ текст] / A.V. Paul, J.J. Michael, S. Daniel // International Journal of Computer Vision. 2005. - 9 p.
50. Chen Y., Chen N., Zhou Y., Zhang W. Pedestrian Detection and Tracking for Counting Applications in Metro Station^e^^ / Y. Chen, N. Chen, Y. Zhou, W. Zhang // Discrete Dynamics in Nature and Society. 2014. - 12 p.
51. Kashif Q. Video tracking and person categorisation system^e^^ / Q. Kashif // Jazan University. 2013. - 5 p.
52. Goncalo M., Paulo P., Urbano N. Vision-based pedestrian detection using Haar-like features[тeкст] / M. Goncalo, P. Paulo, N. Urbano // Institute of Systems and Robotic, University of Coimbra, Coimbra, Portugal. 2018. - 6 p.
53. Javier H.A., Leopoldo A., Jose D.P. Pedestrian Detection in Crowded Environments through Bayesian Prediction of Sequential Probability Matrices[тeкст] / H.A. Javier, A. Leopoldo, D.P. Jose // Hindawi Publishing Corporation, Journal of Sensors. 2016. - 9 p.
54. Rodrigo B., Mohamed O., Jan H., Bernt S. Ten Years of Pedestrian Detection, What Have We Learned?^^^ / B. Rodrigo, O. Mohamed, H. Jan, S. Bernt // Max Planck Institute for Informatics, Saarbrucken, Germany. 2014. - 17 p.
55. Vijay G., Shashikant L. Vision Based Pedestrian Detection for Advanced Driver assistance[meKCT] / G. Vijay, L. Shashikant // Singhad College of Engineering Research center, Savitribai Phule Pune University, Pune 411 041, Maharashtra, India. 2015. - 8 p.
56. Xiaofei L., Lingxi L., Fabian F., Jianqiang W., Hui X., Morys B., Shuyue P., Dariu M.G., Keqiang L. A Unified Framework for Concurrent Pedestrian and Cyclist Detection[TeKCT] / L. Xiaofei, L. Lingxi, F. Fabian, W. Jianqiang, X. Hui, B. Morys, P. Shuyue, M.G. Dariu, L. Keqiang // IEEE Transactions on Intelligent Transportations Systems. 2016. - 13 p.
57. Bin Y., Junjie Y., Zhen L., Stan Z.L. Aggregate Channel Features for Multi-view Face Detection[TeKCT] / Y. Bin, Y. Junjie, L. Zhen, Z.L. Stan // Center for Biometrics and Security Research & National Laboratory of Pattern Recognition, Institute of Automation, Chinese Academy of Sciences, China. 2014. - 8 p.
58. Yonglong T., Ping L., Xiogang W., Xiaoou T. Deep Learning Strong Parts for Pedestrian Detection[TeKCT] / T. Yonglong, L. Ping, W. Xiogang, T. Xiaoou // 2015 IEEE International Conference on Computer Vision (ICCV). 2015. - 9 p.
59. Htike K.K. Hidden-Layer Ensemble Fusion of MLP Neural Networks for Pedestrian Detection[TeKCT] / K.K. Htike // School of Information Technology, UCSI University, Kuala Lumpur, Malaysia. 2017. - 12 p.
60. Antonio B., Domenico B., Gianpaolo F.T., Vitoantonio B. Computer vision and deep learning techniques for pedestrian detection and tracking: A survey[ текст] / B. Antonio, B. Domenico, F.T. Gianpaolo, B. Vitoantonio // Department of Electrical and Information Engineering (DEI), Polytechnic University of Bari, Italy. 2018. - 16 p.
61. Vincent F., Manh T.B., Djamal B., Pierrick L. Vision-Based People Detection System for Heavy Machine Applications[TeKCT] / F. Vincent, T.B. Manh, B. Djamal, L. Pierrick // Sorbonne Universites, Universite de Technologie de Compiegne, CNRS, UMR 7253, Heudiasyc-CS 60 319, 60 203 Compiegne Cedex, France. 2016. - 30 p.
62. Yu J., Miyamoto R., Onoye T. A speed-up scheme based on multiple-instance pruning for pedestrian detection using a support vector machine[текст] / J. Yu, R. Miyamoto, T. Onoye // IEEE Transactions on Image Processing. 2013. - 9 p.
63. Chao Z., Yuxin P. Group Cost-Sensitive Boosting for Multi-Resolution Pedestrian Detection[TeKCT] / Z. Chao, P. Yuxin // Proceedings of the Thirtieth AAAI Conference on Artifitial Intelligence (AAAI-16). 2016. - 7 p.
64. Girish N.C., Daruwata R.D., Manoj S.G. Comparisions of Robert, Prewitt, Sobel operator based edge detection methods for real time uses on FPGA[ текст] / N.C. Girish, R.D. Daruwata, S.G. Manoj // 2015 International Conference on Technologies for Sustainable Development (ICTSD), Mumbai, India. 2015. - 4 p.


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ