📄Работа №197312

Тема: РАЗРАБОТКА СИСТЕМЫ ОБРАБОТКИ МАТЕМАТИЧЕСКИХ РУКОПИСНЫХ ФОРМУЛ С ПРИМЕНЕНИЕМ НЕЙРОСЕТЕВЫХ ТЕХНОЛОГИЙ

Характеристики работы

Тип работы Дипломные работы, ВКР
Информатика и вычислительная техника
Предмет Информатика и вычислительная техника
📄
Объем: 42 листов
📅
Год: 2018
👁️
Просмотров: 53
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание

АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 7
1.1. Распознавание рукописных математических формул 7
1.2. Обзор аналогичных проектов и существующих решений 8
1.3. Обзор готовых решений для создания нейронных сетей 12
1.4. Соревнование по распознаванию математических формул 13
Выводы по первому разделу 14
2. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ 16
2.1. Сверточные нейронные сети 16
2.2. Алгоритм BFS (breadth-first search) 17
Выводы по второму разделу 18
3. ПРОЕКТИРОВАНИЕ 19
3.1. Варианты использования системы распознавания формул 19
3.2. Проектирование графического интерфейса пользователя 21
Выводы по третьему разделу 22
4. РЕАЛИЗАЦИЯ 23
4.1. Формирование обучающей выборки 23
4.2. Топология нейронной сети 27
4.3. Распознавание формулы 28
4.4. Разработка веб-сервиса 30
Выводы по четвертому разделу 32
5. ТЕСТИРОВАНИЕ 33
Вывод по пятому разделу 34
ЗАКЛЮЧЕНИЕ 35
ЛИТЕРАТУРА 36
ПРИЛОЖЕНИЯ 39
Приложение 1. Скриншоты веб-сервиса 39
Приложение 2. Примеры распознавания 41
Приложение 3. Награды 43

📖 Аннотация

В данной работе представлена разработка и реализация системы для распознавания и обработки рукописных математических формул с применением технологий глубокого обучения. Актуальность исследования обусловлена растущей потребностью в автоматизации обработки научных рукописей и учебных материалов, что позволяет существенно ускорить процесс цифровизации математических текстов и интеграции их в электронные документы, например, с использованием языка разметки LaTeX. Основным результатом работы является созданный веб-сервис, ядро которого составляет сверточная нейронная сеть, обученная на специально подготовленной выборке рукописных символов; система успешно решает задачи классификации символов и структурной сегментации формул. Научная значимость заключается в адаптации архитектуры CNN, подобной LeNet-5, для специфической задачи распознавания математической нотации, а практическая — в предоставлении удобного инструмента для исследователей и студентов, что подтверждено дипломом первой степени на научно-технической выставке. В контексте существующих решений, таких как InftyReader и Detexify, анализ которых проведен в работе, предложенная система предлагает специализированный подход к обработке именно рукописного ввода. Дальнейшее развитие проекта связано с увеличением объема и разнообразия обучающей выборки для повышения точности и скорости распознавания.

📖 Введение

ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ
Искусственные нейронные сети (ИНС) (Artificial neural networks, ANN) — упрощенные модели биологических нейронных сетей [26].
Сверточные нейронные сети (СНС, CNN) очень похожи на обычные нейронные сети: они также построены на основе нейронов, которые обладают изменяющимся весом и смещениями. Каждый нейрон получает некоторые входные данные, выполняет скалярное произведение информации и в отдельных ситуациях сопровождает это нелинейностью. Как и в случае с обычными нейронными сетями, вся CNN выражает одну дифференцируемую функцию взноса (эффективный взнос): с одной стороны, это необработанные пиксели изображения, с другой — вывод класса или группы вероятных классов, характеризующих картинку [29].
Классификация — один из разделов машинного обучения, посвященный решению следующей задачи. Имеется множество объектов (ситуаций), разделенных некоторым образом на классы. Задано конечное множество объектов, для которых известно, к каким классам они относятся. Это множество называется обучающей выборкой. Классовая принадлежность остальных объектов не известна. Требуется построить алгоритм, способный классифицировать произвольный объект из исходного множества [25].
Задача сегментации может быть сформулирована как разбиение исходного изображения на множество непересекающихся связных областей, ассоциируемых с объектами наблюдаемой сцены или их частями в соответствии с некоторыми выбранными критериями [30].
LaTeX — наиболее популярный набор макрорасширений системы компьютерного набора TeX [24].
АКТУАЛЬНОСТЬ ТЕМЫ ИССЛЕДОВАНИЯ
Задача распознавания печатного и рукописного текста приобрела актуальность в связи с широким распространением компьютерной техники. Существует множество решений задачи распознавания текста, вплоть до онлайн-сервисов [22]. Уровень распознавания существующих инструментов позволяет автоматизировать обработку машинописного текста и свести к минимуму необходимость постобработки человеком. Например, такими возможностями обладает программа ABBYY FineReader [27] и программа InftyReader [4]. Обе эти программы практически точно распознают печатные математические формулы. Однако в распознавании рукописных математических формул этот уровень еще достигнут.
C 2011 по 2016 год проводилось ежегодное соревнование по распознаванию математических формул — CROHME (Competition on Recognition of Online Handwritten Mathematical Expressions). Последнее подобное соревнование было проведено в 2016 году. Победу одержала команда «WIRIS» [11]. Для классификации отдельных символов ими были использованы технологии нейронных сетей.
Идея распознавания символов с помощью искусственных нейронных сетей рассматривалась Яном Лекуном и другими исследователями в работе «Handwritten character recognition using neural networks architecture» [8]. Задача распознавания символов является задачей классификации. Для решения этой задачи в основном используются сверточные нейронные сети.
Задача распознавания машинописного текста/формул и рукописного текста практически решена, однако распознавание рукописных математических выражений, по-прежнему, является актуальной задачей на сегодняшний день. Наиболее перспективным подходом к решению данной задачи является применение нейросетевых технологий.
ЦЕЛЬ И ЗАДАЧИ ИССЛЕДОВАНИЯ
Целью данной работы является разработка системы обработки математических рукописных формул, перевода рукописных формул в цифровые форматы LaTeX, MathML. Система должна быть реализована в виде веб-сервиса.
Для осуществления поставленной цели необходимо решить следующие задачи.
1. Провести обзор существующих аналогов и научной литературы по распознаванию рукописного текста и математических формул.
2. Подготовить обучающую и тестовую выборку рукописных символов.
3. Разработать нейронную сеть для распознавания рукописных математических символов.
4. Провести тестирование нейронной сети.
5. Реализовать систему обработки рукописных математических формул в виде веб-сервиса и провести ее тестирование.
СТРУКТУРА И ОБЪЕМ РАБОТЫ
Работа состоит из введения, 5 разделов, заключения, библиографии и трех приложений. Объем работы составляет 43 страницы, объем библиографии — 30 источников, объем приложений — 5 страниц.
В первой главе производится анализ предметной области и обзор существующих аналогов в данной области. Также здесь приведены существующие решения для создания нейронных сетей.
Во второй главе приведены описания алгоритмов, используемых в программной системе.
В третьей главе содержатся требования к классам нейронной сети, функциональные требования к программной системе, а также варианты использования этой системы.
Четвертая глава содержит детали реализации системы распознавания рукописных математических формул.
В пятой главе приведены результаты тестирования нейронной сети и системы распознавания рукописных математических формул.
В заключении приводятся основные результаты работы и рассматриваются направления дальнейших исследований.

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

В рамках дипломного проекта был разработан веб-сервис для распознавания рукописных математических формул.
В ходе разработки были решены следующие задачи.
1. Был проведен обзор существующих аналогов и научной литературы по распознаванию рукописного текста и математических формул.
2. Была подготовлена обучающая и тестовая выборка рукописных символов.
3. Разработана нейронная сеть для распознавания рукописных математических символов.
4. Проведено тестирование нейронной сети.
5. Реализована система обработки рукописных математических формул в виде веб-сервиса и проведено ее тестирование.
Работа апробирована на XIII Уральской выставке научно-технического творчества молодежи «Евразийские ворота России». Получила высокую оценку и диплом первой степени за лучшую творческую работу по информационным технологиям с вручением памятной медали выставки. Диплом представлен в приложении 3.
Дальнейшее направление работы
Планируется продолжать разработку и улучшение веб-сервиса, в частности.
1. Улучшить процент распознавания символов нейронной сетью путем увеличения обучающей выборки.
2. Увеличить количество классов в обучающей выборке.
3. Увеличить скорость распознавания.
4. Повысить удобство использования веб-сервиса.

Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

1. Deepin. Официальный сайт. [Электронный ресурс] URL: https://www.deepin.org/ru/ (дата обращения: 12.01.2018).
2. Detexify LaTeX handwritten symbol recognition. [Электронный ресурс] URL: http://detexify.kirelabs.org/ (дата обращения: 15.02.2018).
3. Google Документы. [Электронный ресурс] URL: http://docs.google.com/ (дата обращения: 15.02.2018).
4. InftyReader. Официальный сайт. [Электронный ресурс] URL: http://www.inftyreader.org/ (дата обращения: 22.02.2018).
5. Keras. Официальная документация. [Электронный ресурс] URL: https://keras.io/ (дата обращения: 13.01.2018).
6. kirel/detexify: Latex Symbol Classifier Web Frontend. [Электронный ресурс] URL: https://github.com/kirel/detexify (дата обращения: 18.02.2018).
7. LeCun Y. LeNet-5, convolutional neural networks. [Электронный ресурс] URL: http://yann.lecun.com/exdb/lenet/ (дата обращения: 19.02.2018).
8. Matan O. Handwritten Character Recognition Using Neural Network Architectures. / O. Matan, R. Kiang, C. Stenard, et al. // Proceedings of the 4th US Postal Service Advanced Technology Conference. - 1990. - Vol. 9. -
P. 1003-1011.
9. Mathematical Expression Recognition. [Электронный ресурс] URL: http://cat.prhlt.upv.es/mer/ (дата обращения: 20.02.2018).
10. Mouchere H. CROHME2011 : Competition on Recognition of Online Handwritten Mathematical Expressions. / H. Mouchere, C. Viard-Gaudin, D. H. Kim, et al. // 2011 International Conference on Document Analysis and Recognition. - 2011. - Vol. 4. - No. 1. - P. 1497-1500.
11. Mouchere H. ICFHR 2016 CROHME : Competition on Recognition of Online Handwritten Mathematical Expressions. / H. Mouchere, C. Viard- Gaudin, R. Zanibbi, et al. // 2016 15th International Conference on Frontiers in Handwriting Recognition (ICFHR). - 2016. - Vol. 5. - No. 1. - P. 607-612.
12. NumPy. Официальный сайт. [Электронный ресурс] URL: http://www.numpy.org/ (дата обращения: 18.01.2018).
13. Offline Mathematical Expression Recognition. [Электронный ресурс] URL: http://vision.soic.indiana.edu/b657/sp2016/ (дата обращения: 18.02.2018).
14. Photomath. Приложение на Google Play. [Электронный ресурс] URL: https://play.google.com/store/apps/details?id=com.microblink.photomath (дата обращения: 28.02.2018).
15. Pillow. Официальная документация. [Электронный ресурс] URL: http://pillow.readthedocs.io/ (дата обращения: 11.02.2018).
..30

🖼 Скриншоты

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.
Предоставляемые услуги, в том числе данные, файлы и прочие материалы, подготовленные в результате оказания услуги, помогают разобраться в теме и собрать нужную информацию, но не заменяют готовое решение.
Укажите ник или номер. После оформления заказа откройте бота @workspayservice_bot для подтверждения. Это нужно для отправки вам уведомлений.

©2026 Cервис помощи студентам в выполнении работ