🔍 Поиск готовых работ

🔍 Поиск работ

Разработка алгоритма детектирования и распознавания надписей на изображениях реальных сцен

Работа №202586

Тип работы

Магистерская диссертация

Предмет

информатика

Объем работы96
Год сдачи2022
Стоимость4965 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
10
Не подходит работа?

Узнай цену на написание


ВЕДЕНИЕ 13
1 МЕТОДЫ ДЕТЕКТИРОВАНИЯ И РАСПОЗНАВАНИЯ ТЕКСТА 14
1.1 Методы детектирования текста 14
1.1.1 Традиционные методы детектирования текста 14
1.1.2 Методы глубокого обучения для детектирования текста 16
1.2 Метод распознавания текста 24
1.3 Сравнение методов детектирования текста 25
2 ВЫБОР МЕТОДА И РЕАЛИЗАЦИЯ АЛГОРИТМА 27
2.1 Используемые инструменты разработки 27
2.2 Реализация модели FCN 28
2.3 Реализация модели U-net 31
2.4 Реализация модели EAST 32
2.5 Сравнение результатов детектирования текста 35
2.6 Реализация финального метода 38
2.6.1 Ветка распознавания 39
3 РЕЗУЛЬТАТЫ МОДЕЛИ 43
3.1 Результаты детектирования текста для метода 43
3.2 Результат вырезания области текста 43
3.3 Результаты распознавания корейского и английского текста 44
3.4 Результаты распознавания текста для модели EAST 46
3.5 Результат точности метода распознавания текста 47
4 ФИНАНСОВЫЙ МЕНЕДЖМЕНТ, РЕСУРСОЭФФЕКТИВНОСТЬ И
РЕСУРСОСБЕРЕЖЕНИЕ 49
4.1 Предпроектный анализ 49
4.2 Планирование управления научно-техническим проектом 53
4.3 Выводы по разделу 59
5 СОЦИАЛЬНАЯ ОТВЕТСВЕННОСТЬ 60
5.1 Правовые и организационные вопросы обеспечения безопасности 60
5.1.1 Специальные правовые нормы трудового законодательства 60
5.2 Организационные мероприятия при компоновке рабочей зоны 62
5.3 Производственная безопасность 63
5.3.1 Вредные производственные факторы 65
5.4 Экологическая безопасность 73
5.4.1 Анализ влияния объекта исследования на окружающую среду 73
5.4.2 Обоснование мероприятий по защите окружающей среды 74
5.5 Безопасность в чрезвычайных ситуациях 75
5.5.1 Анализ вероятных ЧС, которые может инициировать объект
разработки 75
5.5.2 Обоснование мероприятий по предотвращению ЧС и разработка
порядка действия в случае возникновения ЧС 75
5.6 Выводы по разделу 77
ЗАКЛЮЧЕНИЕ 78
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 79
ПРИЛОЖЕНИЕ А

Тексты — это образы или символы, несущие язык, фиксирующие идеи и передающие знания. В современном обществе наши жизненные сцены полны различной текстовой информации. Текст с конкретной и четкой семантикой является чрезвычайно важным обобщением, описанием и выражением для реальных сцен. Детектирование текста реальной сцены является ключевой технологией для реализации интеллектуального восприятия сцены, имеет важные исследовательское значение. Однако из-за сложного и разнообразного фона, неоднородных текстовых шрифтов, несовместимых размеров и неопределенных направлений текста в реальных сценах текущая обработка этой задачи не достигла идеальных результатов.
Обработка текста обычно делится на два этапа: детектирование текста и распознавание текста. Традиционные методы детектирования текста обычно используют ручное извлечение признаков для детектирования текста, а затем эти тексты распознаются путем сопоставления с шаблоном или обучения модели машинного обучения. Текущие методы глубокого обучения используют сверточные нейронные сети вместо методов ручного извлечения признаков для детектирования текста, а затем для распознавания текста применяются нейронные сети.
Целью данной работы является разработка алгоритма детектирования и распознавания надписей на изображениях реальных сцен. Для достижения поставленной цели необходимо решить следующие задачи:
- анализ существующих моделей и алгоритмов детектирования и распознавания надписей на изображениях реальных сцен;
- поиск и анализ наборов данных;
- выбор моделей и алгоритмов для реализации;
- разработка алгоритма детектирования и распознавания надписей на изображениях реальных сцен;
- реализация алгоритма и проведение численных экспериментов.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В этой работе анализируются и изучаются различные отличные статьи в смежных областях, а также рассматриваются и сравниваются существующие методы детектирования объектов и детектирования текста. EAST+CRNN был выбран в качестве сети для детектирования и распознавания текста.
Набор данных текстовых изображений реальных сцен ICDAR 2015 был выбран в качестве базы данных изображений для обучения и тестирования сети EAST. Искусственно синтезированный набор текстовых данных MJSynth был выбран в качестве базы данных изображений для обучения и проверки сети CRNN. И используйте набор данных ICDAR 2015 для тестирования общей архитектуры.
Разработан метод детектирования и распознавания надписей на изображениях реальных сцен, для чего выбираются параметры обучения нейронной сети, такие как размер входного изображения, замена базовой сети, выбор функции потерь.
Ветка детектирования текста метода достигла точности 79,8% в наборе данных ICDAR 2015, ветка распознавания достигла точности обучения 93,3% и точности проверки 91,8% в наборе данных MJSynth, в то время как в ICDAR 2015 г. Точность теста в наборе данных составляет 72,9%.
Этот метод в основном удовлетворяет требованиям идентификации и детектирования надписей на изображениях реальных сцен. А если добавить набор данных, похожий на обрезанные текстовые изображения, считается, что точность распознавания текста еще больше повысится.



1. Liu, W., Anguelov, D., Erhan, D., Szegedy, C., Reed, S., Fu, C. Y., & Berg, A. C. Ssd: Single shot multibox detector //European conference on computer vision. - Springer, Cham, 2016. - С. 21-37.
2. Ren, S., He, K., Girshick, R., & Sun, J. Faster r-cnn: Towards real-time object detection with region proposal networks //Advances in neural information processing systems. - 2015. - Т. 28.
3. Matas, J., Chum, O., Urban, M., & Pajdla, T. Robust wide-baseline stereo from maximally stable extremal regions //Image and vision computing. - 2004. - Т. 22. - №. 10. - С. 761-767.
4. Dalal N., Triggs B. Histograms of oriented gradients for human detection //2005 IEEE computer society conference on computer vision and pattern recognition (CVPR'05). - Ieee, 2005. - Т. 1. - С. 886-893.
5. Papageorgiou C. P., Oren M., Poggio T. A general framework for object detection //Sixth International Conference on Computer Vision (IEEE Cat. No. 98CH36271). - IEEE, 1998. - С. 555-562.
6. Neumann L., Matas J. Real-time scene text localization and recognition //2012 IEEE Conference on Computer Vision and Pattern Recognition. - IEEE, 2012. - С. 3538-3545.
7. He, K., Gkioxari, G., Dollar, P., & Girshick, R. Mask r-cnn //Proceedings of the IEEE international conference on computer vision. - 2017. - С. 2961-2969.
8. Long J., Shelhamer E., Darrell T. Fully convolutional networks for semantic segmentation //Proceedings of the IEEE conference on computer vision and pattern recognition. - 2015. - С. 3431-3440.
9. Deng, D., Liu, H., Li, X., & Cai, D. Pixellink: Detecting scene text via instance segmentation //Proceedings of the AAAI Conference on Artificial Intelligence. - 2018.
- Т. 32. - №. 1.
10. Lyu, P., Liao, M., Yao, C., Wu, W., & Bai, X. Mask textspotter: An end-to-end trainable neural network for spotting text with arbitrary shapes //Proceedings of the European Conference on Computer Vision (ECCV). - 2018. - С. 67-83.
11. Zhang, Z., Zhang, C., Shen, W., Yao, C., Liu, W., & Bai, X. Multi-oriented text detection with fully convolutional networks //Proceedings of the IEEE conference on computer vision and pattern recognition. - 2016. - С. 4159-4167.
12. Shi B., Bai X., Belongie S. Detecting oriented text in natural images by linking segments //Proceedings of the IEEE conference on computer vision and pattern recognition. - 2017. - С. 2550-2558.
13. Dai, J., Li, Y., He, K., & Sun, J. R-fcn: Object detection via region-based fully convolutional networks //Advances in neural information processing systems. - 2016. - Т. 29.
14. Jiang, Y., Zhu, X., Wang, X., Yang, S., Li, W., Wang, H. R2CNN: Rotational region CNN for orientation robust scene text detection //arXiv preprint arXiv:1706.09579. - 2017.
15. Simonyan K., Zisserman A. Very deep convolutional networks for large-scale image recognition //arXiv preprint arXiv: 1409.1556. - 2014.
16. Neubeck A., Van Gool L. Efficient non-maximum suppression //18th International Conference on Pattern Recognition (ICPR'06). - IEEE, 2006. - Т. 3. - С. 850-855.
17. Zhou, X., Yao, C., Wen, H., Wang, Y., Zhou, S., He, W., & Liang, J. East: an efficient and accurate scene text detector //Proceedings of the IEEE conference on Computer Vision and Pattern Recognition. - 2017. - С. 5551-5560.
18. Ronneberger O., Fischer P., Brox T. U-net: Convolutional networks for biomedical image segmentation //International Conference on Medical image computing and computer-assisted intervention. - Springer, Cham, 2015. - С. 234-241.
19. Shi B., Bai X., Yao C. An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition //IEEE transactions on pattern analysis and machine intelligence. - 2016. - Т. 39. - №. 11. - С. 2298-2304.
20. Graves, A., Fernandez, S., Gomez, F., & Schmidhuber, J. Connectionist temporal classification: labelling unsegmented sequence data with recurrent neural networks //Proceedings of the 23rd international conference on Machine learning. - 2006. - С. 369-376.
21. Hochreiter S., Schmidhuber J. Long short-term memory //Neural computation.
- 1997. - Т. 9. - №. 8. - С. 1735-1780.
22. Kim K. H. et al. Pvanet: Deep but lightweight neural networks for real-time object detection //arXiv preprint arXiv: 1608.08021. - 2016.
23. He, K., Zhang, X., Ren, S., & Sun, J. Deep residual learning for image recognition //Proceedings of the IEEE conference on computer vision and pattern recognition. - 2016. - С. 770-778.
24. KAIST Scene Text Database. [Электронный ресурс]. - URL: http://www.iapr- tc11.org/mediawiki/index.php/KAIST_Scene_Text_Database(дата обращения 01.02.2022).
25. Karatzas, D., Gomez-Bigorda, L., Nicolaou, A., Ghosh, S., Bagdanov, A., Iwamura, M., ... & Valveny, E. ICDAR 2015 competition on robust reading //2015 13th international conference on document analysis and recognition (ICDAR). - IEEE, 2015. - С. 1156-1160.
26. Jaderberg, M., Simonyan, K., Vedaldi, A., & Zisserman, A. Synthetic data and artificial neural networks for natural scene text recognition //arXiv preprint arXiv:1406.2227. - 2014.
27. Yu J., Jiang Y., Wang Z., Cao Z., & Huang T. Unitbox: An advanced object detection network //Proceedings of the 24th ACM international conference on Multimedia. - 2016. - С. 516-520.
28. Sherstinsky A. Fundamentals of recurrent neural network (RNN) and long short¬term memory (LSTM) network //Physica D: Nonlinear Phenomena. - 2020. - Т. 404.
- С. 132306.
29. TextRecognitionDataGenerator’s documentation [Электронный источник]. URL:https://textrecognitiondatagenerator.readthedocs.io/en/latest/index.html.Дата обращения: 05.05.2022.
30. Liao M., Shi B., Bai X. Textboxes++: A single-shot oriented scene text detector //IEEE transactions on image processing. - 2018. - Т. 27. - №. 8. - С. 3676-3690.
31. Liu, X., Liang, D., Yan, S., Chen, D., Qiao, Y., & Yan, J. Fots: Fast oriented text spotting with a unified network //Proceedings of the IEEE conference on computer vision and pattern recognition. - 2018. - С. 5676-5685.
32. Tian, Z., Huang, W., He, T., He, P., & Qiao, Y. Detecting text in natural image with connectionist text proposal network //European conference on computer vision. - Springer, Cham, 2016. - С. 56-72.
33. Трудовой кодекс: Федеральный закон от 30 декабря 2001г. N 197-ФЗ.
34. ГОСТ 12.0.003-2015 Опасные и вредные производственные факторы. Классификация. Перечень опасных и вредных факторов.
35. ГОСТ 22269-76 «Рабочее место оператора. Взаимное расположение элементов рабочего места».
36. ГОСТ 12.2.032-78 ССБТ. Рабочее место при выполнении работ сидя. Общие эргономические требования.
37. ГОСТ Р 50923-96. Дисплеи. Рабочее место оператора. Общие эргономические требования и требования к производственной среде. Методы измерения.
38. ГОСТ 21889-76 «Система "Человек-машина". Кресло человека-оператора. Общие эргономические требования».
39. СП 52.13330.2016 Естественное и искусственное освещение. Актуализированная редакция СНиП 23-05-95.
40. СанПиН 1.2.3685-21 Гигиенические нормативы и требования к обеспечению безопасности и (или) безвредности для человека факторов среды обитания.
41. ГОСТ 12.1.005-88 Система стандартов безопасности труда (ССБТ). Общие санитарно-гигиенические требования к воздуху рабочей зоны.
42. ГОСТ 12.1.003-83 Система стандартов безопасности труда (ССБТ). Шум. Общие требования безопасности.
43. ГОСТ 12.1.030-8 Система стандартов безопасности труда (ССБТ).
Электробезопасность. Защитное заземление. Зануление.
44. ГОСТ 12.1.038-82 Система стандартов безопасности труда (ССБТ).
Электробезопасность. Предельно допустимые значения напряжений прикосновения и токов.
45. МР 2.2.9.2311 - 07 «Профилактика стрессового состояния работников при различных видах профессиональной деятельности».
46. ГОСТ 12.1.004-91 Система стандартов безопасности труда (ССБТ). Пожарная безопасность. Общие требования.
47. ГОСТ 17.4.3.04-85 Охрана природы (ССОП). Почвы. Общие требования к контролю и охране от загрязнения.


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ