Введение 3
Постановка задачи 5
Обзор литературы 6
Глава 1. Обзор датасета и предобработка изображений 7
1.1 Описание датасета 7
1.2 Предобработка изображений 10
Глава 2. Обзор предлагаемых решений 13
2.1 Нейросетевые технологии 13
2.2 Модели детекции 16
2.3 Модели классификации 20
Глава 3. Сравнение предлагаемых решений. 22
3.1 Обучение моделей 22
3.2 Сравнение решений по точности 24
3.3 Сравнение решений по скорости вычисления 29
Выводы 30
Заключение 32
Список использованной литературы 33
Вопрос безопасности почти постоянно стоит перед всеми людьми, а в современном мире он почти всегда затрагивает компании. Решение этого вопроса предоставляется и совершенствуется с ростом свободы доступа к информации и технологиям, а также уровня вовлеченности людей в эти технологии. Сегодня одним из наиболее востребованных подходов к осуществлению безопасности является использование камер.
Преимущества использования камер очевидны, но для более эффективного использования совмещаются возможности камер записывать видео с возможностями интеллекта человека - распознать, что или кто на этом видео.
Введение в исследование распознавания наличия медицинской маски на лице человека с использованием методов компьютерного зрения обладает особой актуальностью в свете недавних глобальных событий, связанных с пандемией COVID-19. Ношение масок стало не только мерой индивидуальной защиты, но и предметом общественного здравоохранения, что требует контроля и поддержки на многих уровнях.
Компьютерное зрение, как одна из передовых технологий в области искусственного интеллекта, представляет собой мощный инструмент для автоматизации и улучшения точности и скорости множества процессов, включая мониторинг соблюдения правил ношения масок в общественных местах. Эта технология использует алгоритмы машинного обучения и глубокого обучения для анализа изображений или видеоданных с целью определения, надета ли маска на лице человека, и если да, то корректно ли она надета.
Задача распознавания медицинских масок включает в себя несколько этапов: обнаружение и локализация лиц в кадре, определение наличия маски на лице и оценку корректности её расположения. Это вызовы, которые требуют разработки 3
специализированных моделей компьютерного зрения, способных эффективно функционировать в разнообразных и изменчивых условиях освещения, с различными углами обзора и при разном качестве изображений.
В рамках данной работы будут рассмотрены существующие подходы и алгоритмы, которые применяются для решения этой задачи, а также их преимущества и недостатки. Особое внимание будет уделено анализу того, какие технологии обеспечивают наибольшую точность и скорость в распознавании масок, что крайне важно для реализации эффективных систем мониторинга на практике. Эта работа стремится внести вклад в развитие методов компьютерного зрения, способствуя повышению уровня общественного здоровья и безопасности.
В рамках данной работы были обучены на предоставленном датасете, сравнены между собой по точности и времени вычисления модели детекции SSD+Mobilenetv3, SSD+VGG16, Faster R-CNN.
В ходе работы были получены следующие результаты:
1. Сравнение по точности было представлено с помощью подсчета метрики F1-score.
2. Сравнение по времени вычисления было представлено с помощью подсчета количества кадров в секунду, которое может обработать модель.
3. Таким образом были проанализированы результаты и даны рекомендации по применению той или иной рассмотренной модели для разных систем.
Полученные результаты имеют возможность применения моделей для тех или иных целей в зависимости от имеющихся вычислительных возможностей, описанных в предыдущей главе, в области здравоохранения.
1. Dataset // Kaggle URL:
https://www.kaggle.com/datasets/andrewmvd/face-mask-detection.
2. Mohammed Ali F. A., Al-Tamimi M. S. H. Face mask detection methods and techniques: A review //International Journal of Nonlinear Analysis and Applications. - 2022.-Т. 13.-№. 1.-С. 3811-3823.
3. Rahman M. H. et al. Real-time face mask position recognition system based on MobileNet model //Smart health. - 2023. - Т. 28. - С. 100382.
4. Said Y. Pynq-YOLO-Net: An embedded quantized convolutional neural network for face mask detection in COVID-19 pandemic era //International Journal of Advanced Computer Science and Applications. - 2020. - Т. 11. - №. 9.
5. Cheng L. et al. Improved SSD network for fast concealed object detection and recognition in passive terahertz security images //Scientific Reports. - 2022. - Т. 12. - №. 1. -С. 12082.
6. Su X. et al. Face mask detection and classification via deep transfer learning //Multimedia Tools and Applications. - 2022. - С. 1-20.
7. Shukla R. K., Tiwari A. K. Masked face recognition using mobilenet v2 with transfer learning //Computer Systems Science & Engineering. - 2023. - Т. 45. - №. 1.
8. Rahman M. H. et al. Real-time face mask position recognition system based on MobileNet model //Smart health. - 2023. - Т. 28. - С. 100382.
9. Zhao L., Wang L. A new lightweight network based on MobileNetV3 //KSII Transactions on Internet and Information Systems (TIIS). - 2022. - Т. 16. - №. 1. - С. 1-15.
10. Джулли А, Пал С. Библиотека Keras - инструмент глубокого обучения. Реализация нейронных сетей с помощью библиотек Theano и TensorFlow/ пер. с англ. М.: ДМК Пресс, 2018. - 294 с.
11. Рашка С. Python и машинное обучение / пер. с англ. М.: ДМК Пресс, 2017.-418 с.
12. Жерон О. Прикладное машинное обучение с помощью Scikit-Learn и TensorFlow / пер. с англ. СПб.: ООО Альфа-книга, 2018. - 688 с.
13. Python // Python official page. — Access mode: https://www.python.org/
14. OpenCV // OpenCV official page - Accessed mode: https://opencv.org/
15. PyTorch // PyTorch official page - Access mode: https://pytorch.org/
16. Reza A. M. Realization of the contrast limited adaptive histogram equalization (CLAHE) for real-time image enhancement //Journal of VLSI signal processing systems for signal, image and video technology. - 2004. - Т. 38. - С. 35-44.
17. Karen S. Very deep convolutional networks for large-scale image recognition //arXiv preprint arXiv: 1409.1556. - 2014.
18. Liu W. et al. Ssd: Single shot multibox detector //Computer Vision-ECCV 2016: 14th European Conference, Amsterdam, The Netherlands, October 11-14, 2016, Proceedings, Part I 14. - Springer International Publishing, 2016. - С. 21-37.
19. Ren S. et al. Faster r-cnn: Towards real-time object detection with region proposal networks //Advances in neural information processing systems. - 2015. - Т. 28.
20. Chiu Y. C. et al. Mobilenet-SSDv2: An improved object detection model for embedded systems //2020 International conference on system science and engineering (ICSSE). - IEEE, 2020. - С. 1-5.