Тема: ИСПОЛЬЗОВАНИЕ НЕЙРОННЫХ СЕТЕЙ ДЛЯ РАСПОЗНАВАНИЯ ОБЪЕКТОВ НА ИЗОБРАЖЕНИЯХ
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Введение 5
1 Актуальность и цели исследования 6
1.1 Актуальность 6
1.2 Постановка задачи 7
2 Используемые методы распознавания цифр на изображении 9
2.1 Сверточные нейронные сети 9
2.1.1 Архитектура сверточных нейронных сетей 11
2.1.2 Обучение сверточных нейронных сетей 13
2.1.3 Преимущества в распознавании рукописных цифр: 16
2.1.4 Ограничения сверточных нейронных сетей в распознавании рукописных цифр: 17
2.2 Vision Transformer (ViT) 18
2.2.1 Архитектура ViT 19
2.2.2 Преимущества ViT 20
2.2.3 Обучение ViT 20
3 Разработка программного обеспечения 21
3.1 Выбор языка программирования 21
3.2 Используемые библиотеки 22
3.3 Описание работы итоговой нейронной сети и замеры точности 24
3.4 Описание кода 42
4 Результаты тестирования 48
4.1 Успешные распознования 48
4.2 Ошибочные распознования 59
Заключение 62
Список использованных источников 63
📖 Введение
Одной из таких задач является оптическое распознавание символов (OCR), в том числе распознавание рукописного текста. Одной из важных проблем в рукописном тексте, это отсутствие стандарта написания, в отличии от печатного, каждый человек имеет свой подчерк. Цифры имеют наклон, лишние завитки или черточнки, что цифру не меняет, но делает ее уникальной в написании.
В данной работе разрабатывается программное обеспечение (ПО) которое позволит пользователю рисовать цифры в графическом интерфейсе и изучается распознование математических цифр с помощью искусственного интеллекта.
Существует два типа распознавания рукописных символов: online и offline распознавание. Online распознавание например используется в сенсорных экранах. ПО отслеживает движения пальца пользователя, когда он рисует символы, далее эта информация участвует в алгоритме определения символа написанного пользователем.
В oflline распозновании доступна только конечная информация, к примеру различные сканы рукописных документов. Этот тип сложнее за счет того, что неизвестно как автор писал символы, подчерк, стилевые особенности, низкое качество рассматриваемого изображения,
Решение задачи offline распознавания математических цифр и будет рассмотрено в этой работе.
✅ Заключение
Одной из ключевых особенностей разработанного приложения является использование библиотек PyQt5 для создания графического интерфейса и Keras для работы с нейронными сетями. Это обеспечивает высокую производительность и эффективность в распознавании цифр.
Программа применяет алгоритм выполнения скриншота для захвата изображения цифры, после чего преобразует его в формат, подходящий для обработки нейронной сетью. Нейронная сеть, обученная на размеченных данных, проводит классификацию цифры и выводит результат на экран.
Таким образом, разработанное приложение представляет собой эффективный инструмент для распознавания рукописных цифр с помощью технологии искусственного интеллекта. Его простота использования и точность делают его полезным инструментом в различных сферах, включая образование, банковское дело, медицину и другие. В будущем возможно расширение функциональности программы и ее применение в новых областях, что сделает ее еще более полезной и востребованной.





