Актуальность задачи распознавания человека не вызывает сомнений. Системы распознавания используют для контроля доступа на территорию, различного контроля перемещений и посещений. Также распознавание может использоваться для обеспечения безопасности и предотвращения совершения противоправных действий.
Распознавание лиц является одним из способов идентификации человека, наравне с распознаванием отпечатков пальцев, глаз и вен. Но в отличие от этих способов распознавание лица является наиболее не навязчивым способом идентификации. Также распознавание при помощи лица можно делать на расстоянии, что позволяет распознать человека без его непосредственного участия в процессе распознавания.
Как задача, распознавание лиц развивается уже несколько десятилетий, на ранних этапах распознавание строилось на простых изображениях, где была одинаковая освещенность, четкое изображение и было полностью видно лицо человека. В реальных условиях такие системы, часто показывали результаты намного хуже, чем при тестировании их на подготовленных наборах данных. Благодаря этому появились новые наборы задач, которые бы решали часть возникающих проблем при распознавании в реальных условиях. Такими задачами являются: распознавание лица в различных позах, при различном освещении, при низком качестве изображения, при различных эмоциях и окклюзии.
Распознавание лиц с окклюзией является одной из самых сложных задач, так как на изображении отсутствует информация о скрытых частях лица. Также на практике очень сложно собрать базу данных лиц, которая бы покрывала все возможные окклюзии, что делает данную задачу еще более не тривиальной.
На сегодняшний день нейронные сети чаще всего используют для распознавания лиц, так как при помощи них был достигнут наибольший прогресс в распознавании.
В ходе данной работы были выбраны и подготовлены наборы изображений лиц с окклюзией и без. Также были рассмотрены современные подходы к распознаванию изображений и была выбрана модель для улучшения. На основе архитектуры ResNet152 была построена модификация с добавлением новых слоев. В итоге построенная модель позволила улучшить точность распознавания лиц с окклюзией и без относительно сети ResNet.
1. D. Zeng, R. Veldhuis, and L. Spreeuwers. A survey of face recognition techniques under occlusion. IET Biometrics, pages 1-23, 2020, doi: arXiv:2006.11366
2. B. Jozer, F. Matej, O. Lubos, O. Milos and P. Jarmila, "Face recognition under partial occlusion and noise," Eurocon 2013, 2013, pp. 2072-2079, doi: 10.1109/EUROCON.2013.6625266.
3. W. Wan and J. Chen, "Occlusion robust face recognition based on mask learning," 2017 IEEE International Conference on Image Processing (ICIP), 2017, pp. 3795-3799, doi: 10.1109/ICIP.2017.8296992.
4. Gary B. Huang, Manu Ramesh, T amara Berg, and Erik Learned-Miller, “Labeled Faces in the Wild: A Datebase for Studying Face Recognition in Unconstrained Environments”
5. Chengrui Wang, Han Fang, Yaoyao Zhong, Weihong Deng, “MLFW: A Database for Face Recognition on Masked Faces”, doi: arXiv:2109.05804
6. Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun, “Deep Residual Learning for Image Recognition”, doi: arXiv:1512.03385
7. Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, Andrew Rabinovich, “Going Deeper with Convolutions”, doi: arXiv: 1409.4842
8. Francois Chollet, “Xception: Deep Learning with Depthwise Separable Convolutions”, doi: arXiv:1610.02357
9. Alex Krizhevsky, “One weird trick for parallelizing convolutional neural networks”, doi: arXiv:1404.5997
10. Karen Simonyan, Andrew Zisserman, “Very Deep Convolutional Networks for Large-Scale Image Recognition”, doi: arXiv: 1409.1556
11. Документация библиотеки PyTorch [Электронный ресурс], // URL: https://pytorch.org (дата обращения 28.05.2022).
12. Y. Li, J. Zeng, S. Shan and X. Chen, "Occlusion Aware Facial Expression Recognition Using CNN With Attention Mechanism," in IEEE Transactions on Image Processing, vol. 28, no. 5, pp. 2439-2450, May 2019, doi: 10.1109/TIP.2018.2886767.
13. K. V. Arya and Anukriti, "Face recognition under partial occlusion using HMM and Face Edge Length Model," 2014 9th International Conference on Industrial and Information Systems (ICIIS), 2014, pp. 1-6, doi: 10.1109/ICIINFS.2014.7036574.
14. L. Mao, F. Sheng and T. Zhang, "Face Occlusion Recognition With Deep Learning in Security Framework for the IoT," in IEEE Access, vol. 7, pp. 174531-174540, 2019, doi: 10.1109/ACCESS.2019.2956980.