Тип работы:
Предмет:
Язык работы:


РАЗРАБОТКА СИСТЕМЫ РАСПОЗНАВАНИЯ ДЕМОГРАФИЧЕСКИХ ХАРАКТЕРИСТИК ЧЕЛОВЕКА В ВИДЕОПОТОКЕ С РЕАЛИЗАЦИЕЙ ВЫЧИСЛЕНИЙ НА CPU

Работа №73640

Тип работы

Бакалаврская работа

Предмет

информационные системы

Объем работы71
Год сдачи2019
Стоимость4340 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
101
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 4
ГЛАВА 1. КОМПОНЕНТ ДЕТЕКТИРОВАНИЯ ЛИЦА НА ИЗОБРАЖЕНИИ 6
1.1. Обзор современных подходов к решению задачи детектирования лица
на изображении 7
1.2. Проведение сравнительного анализа 9
1.2.1. Метрики тестирования 10
1.2.2. Данные для тестирования 11
1.2.3. Реализация методов детектирования 12
1.2.4. Проведение эксперимента 16
ГЛАВА 2. КОМПОНЕНТ РАСПОЗНАВАНИЯ ДЕМОГРАФИЧЕСКИХ
ХАРАКТЕРИСТИК ПО ИЗОБРАЖЕНИЮ ЛИЦА 21
2.1. Выбор подхода к решению задачи распознавания 22
2.1.1. Распознавание возраста 22
2.1.2. Распознавание пола 24
2.2. Данные для обучения 25
2.2.1. Обзор используемых данных 25
2.2.2. Алгоритм выравнивания лиц 29
2.3. Проведение сравнительного анализа 30
2.3.1. Обучение моделей 30
2.3.2. Проведение эксперимента 30
ГЛАВА 3. РЕАЛИЗАЦИЯ СИСТЕМЫ РАСПОЗНАВАНИЯ
ДЕМОГРАФИЧЕСКИХ ХАРАКТЕРИСТИК ЧЕЛОВЕК В ВИДЕОПОТОКЕ 35
3.1. Проектирование архитектуры системы 35
3.2. Техническая архитектура системы 39
3.3. Разработка системы 40
ГЛАВА 4. ТЕСТИРОВАНИЕ РАЗРАБОТАННОЙ СИСТЕМЫ 51
4.1. Работа системы 51
4.2. Параметры системы 55
4.3. Проведение тестирования 57
ЗАКЛЮЧЕНИЕ 61
СПИСОК ЛИТЕРАТУРЫ 62
ПРИЛОЖЕНИЕ 1 67
ПРИЛОЖЕНИЕ 2 68
ПРИЛОЖЕНИЕ 3 69
ПРИЛОЖЕНИЕ 4

Демографические характеристики человека играют важную роль во многих сфера жизни общества: сфере рекламы, охраны права, развлечения, обслуживания и др.
Автоматизированное распознавание таких характеристик человека по изображению лица может быть использовано, например:
• В таргетированном маркетинге, где релевантная для аудитории реклама или информация может транслироваться с цифровых рекламных щитов;
• При сборе данных для дальнейшего анализа: например, при разработке маркетингового плана или проведении таргетированных мероприятий;
• Для контентного поиска, где наличие таких характеристик
существенно упрощает пространство поиска;
• Для контроля безопасности: автоматическая система распознавания может помочь предотвратить продажу запрещенной продукции несовершеннолетним;
• При взаимодействии компьютер - человек: для подстройки контекста общения в соответствии с полом и возрастом.
Реализация многих из описанных практических возможностей применения автоматического распознавания требует непрерывной обработки видеопотока, при этом вычисления должны занимать минимально возможное количество времени, чтобы предоставить запас для дальнейших этапов обработки.
Широкому применению систем автоматизированного распознавания должна способствовать низкая вычислительная сложность наряду с обеспечением высокой точности работы и возможностью корректной работы на встроенных платформах без использования графических ускорителей.
Цель выпускной квалификационной работы: разработать систему распознавания демографических характеристик человека в видеопотоке с реализацией вычислений на CPU.
Задачи, решение которых необходимо для достижения цели:
1. Изучение подходов к детектированию лица человека и распознаванию демографических характеристик по изображению лица;
2. Проведение сравнительного анализа изученных подходов;
3. Проектирование и разработка системы распознавания демографических характеристик человека в видеопотоке;
4. Проведение тестирования разработанной системы.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе выполнения выпускной квалификационной работы была разработана система распознавания демографических характеристик человека в видеопотоке с реализацией вычислений на CPU, для этого были решены следующие задачи:
• Сформулированы требования к разрабатываемой системе;
• Изучены подходы к детектированию лиц на изображении и распознаванию характеристик человека по изображению его лица;
• Проведен сравнительный анализ подходов по показателям точности и скорости работы, выбраны модели, наиболее точно отвечающие поставленным требованиям;
• Спроектирована и разработана на языке Pythonсистема распознавания;
• Проведено тестирование точности работы системы в реальных условиях;
• Намечены планы дальнейшей работы в рамках разработанной системы и направления в целом.
По результатам тестирования в реальных условиях система показала точность распознавания пола — 100% и среднюю абсолютную ошибку в распознавании возраста — 4.07.
Дальнейшими этапами является работа над увеличением точности работы системы и её устойчивости к различным условиям среды, а также разработка системы учета посетителей торговых помещений с использованием разработанной в рамках данной работы системы как полноценного модуля.



1. Verschae, Rodrigo &Ruiz-del-Solar, Javier. Object Detection: Current and Future Directions. (2015). [Электронный ресурс]. - Режим доступа: https://www.researchgate.net/publication/284167004_Object_Detection_Curren t_and_Future_Directions (дата обращения 16.02.2019).
2. Mackin, Alex &Zhang, Fan & Bull, David. A Study of High Frame Rate Video
Formats. (2018). [Электронный ресурс]. - Режим доступа:
https://www.researchgate.net/publication/328896584_A_Study_of_High_Fram e_Rate_Video_Formats (дата обращения 24.02.2019).
3. Viola, Paul &Jones, Michael. Rapid Object Detection using a Boosted Cascade of Simple Features. (2001). [Электронный ресурс]. - Режим доступа: https://www.researchgate.net/publication/3940582_Rapid_Object_Detection_us ing_a_Boosted_Cascade_of_Simple_Features (дата обращения 14.02.2019).
4. Neubeck, Alexander &Van Gool, Luc. Efficient Non-Maximum Suppression.
(2006). [Электронный ресурс]. - Режим доступа:
https://www.researchgate.net/publication/220929789_Efficient_Non- Maximum_Suppression(дата обращения 16.02.2019).
5. N. Dalal and B. Triggs, Histograms of oriented gradients for human detection.
(2005). [Электронный ресурс]. - Режим доступа:
https://www.researchgate.net/publication/220929789_Efficient_Non- Maximum_Suppression(дата обращения 19.03.2019).
6. K. Zhang, Z. Zhang, Z. Li, and Y. Qiao. Joint face detection and alignment using multitask cascaded convolutional networks. (2016). [Электронный ресурс]. - Режим доступа: https://arxiv.org/abs/1604.02878(дата обращения 27.02.2019).
7. Liu, Wei &Anguelov, Dragomir & Erhan, Dumitru & Szegedy, Christian &
Reed, Scott & Fu, Cheng-Yang & C. Berg, Alexander. SSD: Single Shot MultiBox Detector. (2016). [Электронный ресурс]. - Режим доступа:
https://arxiv.org/abs/1512.02325(дата обращения 07.03.2019).
8. Zhang, Shifeng & Zhu, Xiangyu & Lei, Zhen & Shi, Hailin & Wang, Xiaobo &
Li, Stan. FaceBoxes: A CPU Real-time Face Detector with High Accuracy. (2017). [Электронный ресурс]. - Режим доступа:
https://arxiv.org/abs/1708.05234(дата обращения 06.04.2019).
9. Detection evaluation [Электронный ресурс]. - Режим доступа: http://cocodataset.org/#detection-eval(дата обращения 20.03.2019).
10.Shuo Yang, Ping Luo, Chen Change Loy, and Xiaoou Tang. WIDER FACE: A face detection benchmark. (2016). [Электронный ресурс]. - Режим доступа: https://arxiv.org/abs/1511.06523(дата обращения 16.04.2019).
11. Кеннет Рейтц, Таня Шлюссер. Автостопом по Python. - СПб.: Питер, 2017. - 336 с.
12. Tensorflow detection model zoo [Электронный ресурс]. - Режим доступа: https://github.com/tensorflow/models/blob/master/research/object_detection/g3 doc/detection_model_zoo.md (дата обращения 12.04.2019).
13. Andrew G. Howard, Menglong Zhu, Bo Chen, Dmitry Kalenichenko, Weijun
Wang, Tobias Weyand, Marco Andreetto, Hartwig Adam. MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications. (2017). [Электронный ресурс]. - Режим доступа:
https://arxiv.org/abs/1704.04861(дата обращения 14.05.2019).
14. Mark Sandler Andrew Howard Menglong Zhu Andrey Zhmoginov Liang-Chieh Chen. MobileNetV2: Inverted Residuals and Linear Bottlenecks. (2019). [Электронный ресурс]. - Режим доступа: https://arxiv.org/abs/1801.04381(дата обращения 26.05.2019).
15. Aspect ratios in digital photography [Электронный ресурс]. - Режим
доступа: https://expertphotography.com/aspect-ratio-photography(дата
обращения 18.04.2019).
16. Joint Face Detection and Alignment using Multi-task Cascaded Convolutional
Neural Networks [Электронный ресурс]. - Режим доступа: https:// github. com/kpzhang93/MTCNN_face_detection_alignment (дата
обращения 15.05.2019).
17.OpenCV. Haar cascades [Электронный ресурс]. - Режим доступа: https:// github. com/opencv/opencv/tree/master/data/haarcascades (дата
обращения 11.05.2019).
18. Dlib face detector. [Электронный ресурс]. - Режим доступа:
http://dlib.net/face_detector.py.html(дата обращения 14.05.2019).
19. N. Gourier, D. Hall, J. L. Crowley. Estimating Face Orientation from Robust Detection of Salient Facial Features. (2004). [Электронный ресурс]. - Режим доступа:
https ://www.researchgate.net/publication/240617517_Estimating_F ace_orientat ion_from_Robust_Detection_of_Salient_Facial_Structures (дата обращения 21.05.2019).
20.Shichuan Du, Yong Tao, and Aleix M. Martinez. Compound facial expressions of emotion. (2014). [Электронный ресурс]. - Режим доступа:
https://www.pnas.org/content/111/15/E1454(дата обращения 13.05.2019).
21. Саймон Хайкин. Нейронные сети. Полный курс. - Москва: Вильямс, 2018. - 1104 с.
22. How to Reduce Overfitting With Dropout Regularization in Keras.
[Электронный ресурс]. - Режим доступа:
https://machinelearningmastery.com/how-to-reduce-overfitting-with-dropout- regularization-in-keras/(дата обращения 26.04.2019).
23. Yang, Tsun-Yi &Huang, Yi-Hsuan & Lin, Yen-Yu & Hsiu, Pi-Cheng & Chuang, Yung-Yu. SSR-Net: A Compact Soft Stagewise Regression Network for Age Estimation. (2018). [Электронный ресурс]. - Режим доступа: https://www.researchgate.net/publication/326208517_SSR- Net_A_Compact_Soft_Stagewise_Regression_Network_for_Age_Estimation(дата обращения 20.05.2019).
24. Rasmus Rothe and Radu Timofte and Luc Van Gool. DEX: Deep EXpectation of apparent age from a single image. (2015). [Электронный ресурс]. - Режим доступа: https://www.researchgate.net/publication/306023833_Deep_Expectation_of_Real_and_Apparent_Age_from_a_Single_Image_Without_Facial_Landmarks (дата обращения 05.05.2019).
25. Karl Ricanek Jr and Tamirat Tesafaye. MORPH: A Longitudinal Image
Database of Normal Adult Age-Progression. (2006). [Электронный ресурс]. - Режим доступа: https://ieeexplore.ieee.org/document/1613043(дата
обращения 03.05.2019).
26. Naimish Agarwal, Artus Krohn-Grimberghe, Ranjana Vyas. Facial Key Points
Detection. (2017). [Электронный ресурс]. - Режим доступа: https://www.sparrho.com/item/facial-key-points-detection-using-deep- convolutional-neural-network-naimishnet/19950e4/ (дата обращения 14.05.2019).
27. Vahid Kazemi and Josephine Sullivan. One Millisecond Face Alignment with an Ensemble of Regression Trees (2014). [Электронный ресурс]. - Режим доступа: https://www.academia.edu/22496549/One_Millisecond_Face_Alignment_with_ an_Ensemble_of_Regression_Trees (дата обращения 08.05.2019).
28. Dlib face landmark detector. [Электронный ресурс]. - Режим доступа: http://dlib.net/face_landmark_detection.py.html(дата обращения 19.05.2019).
29. Usage of metrics. [Электронный ресурс]. - Режим доступа:
https://keras.io/metrics(дата обращения 21.05.2019).
30. Yunxuan Zhang, Li Liu, Cheng Li, and Chen Change Loy. Quantifying facial age by posterior of age comparisons. (2017). [Электронный ресурс]. - Режим доступа: https://arxiv.org/abs/1708.09687(дата обращения 21.05.2019).
31. Eirikur Agustsson, Radu Timofte, and Luc Van Gool. Anchored regression networks applied to age estimation and super resolution. (2017). [Электронный ресурс]. - Режим доступа: http://openaccess.thecvf.com/content_ICCV_2017/papers/Agustsson_Anchored _Regression_Networks_ICCV_2017_paper.pdf (дата обращения 17.05.2019).
32. Rasmus Rothe, Radu Timofte, and Luc Van Gool. Some like it hot-visual guidance for preference prediction. (2016). [Электронный ресурс]. - Режим доступа: https://arxiv.org/abs/1510.07867(дата обращения 16.05.2019).
33.Shixing Chen, Caojin Zhang, Ming Dong, Jialiang Le, and Mike Rao. Using ranking-CNN for age estimation. (2017). [Электронный ресурс]. - Режим доступа: https://www.researchgate.net/publication/316493165_Using_Ranking _CNN_for_Age_Estimation (дата обращения 20.05.2019).
34. Грегори Эндрюс. Основы многопоточного, параллельного и
распределенного программирования. - Москва: Вильямс, 2003. - 512 с.
35. CS231n: Convolutional Neural Networks for Visual Recognition.
[Электронный ресурс]. - Режим доступа: http://cs231n.stanford.edu(дата обращения 28.05.2019).
36. Библиотека Threading. [Электронный ресурс]. - Режим доступа:
https://docs.python.org/3/library/threading.html(дата обращения 11.05.2019).
37. Configuration file parser. [Электронный ресурс]. - Режим доступа:
https://docs.python.org/3/library/configparser.html (дата обращения
18.05.2019).
38. ChaLearn Looking at People and Faces of the World: Face AnalysisWorkshop
and Challenge 2016. [Электронный ресурс]. - Режим доступа:
https://ieeexplore.ieee.org/document/7789583(дата обращения 04.06.2019).


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ