📄Работа №197312

Тема: РАЗРАБОТКА СИСТЕМЫ ОБРАБОТКИ МАТЕМАТИЧЕСКИХ РУКОПИСНЫХ ФОРМУЛ С ПРИМЕНЕНИЕМ НЕЙРОСЕТЕВЫХ ТЕХНОЛОГИЙ

📝
Тип работы Дипломные работы, ВКР
📚
Предмет информатика
📄
Объем: 42 листов
📅
Год: 2018
👁️
Просмотров: 38
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание

АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 7
1.1. Распознавание рукописных математических формул 7
1.2. Обзор аналогичных проектов и существующих решений 8
1.3. Обзор готовых решений для создания нейронных сетей 12
1.4. Соревнование по распознаванию математических формул 13
Выводы по первому разделу 14
2. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ 16
2.1. Сверточные нейронные сети 16
2.2. Алгоритм BFS (breadth-first search) 17
Выводы по второму разделу 18
3. ПРОЕКТИРОВАНИЕ 19
3.1. Варианты использования системы распознавания формул 19
3.2. Проектирование графического интерфейса пользователя 21
Выводы по третьему разделу 22
4. РЕАЛИЗАЦИЯ 23
4.1. Формирование обучающей выборки 23
4.2. Топология нейронной сети 27
4.3. Распознавание формулы 28
4.4. Разработка веб-сервиса 30
Выводы по четвертому разделу 32
5. ТЕСТИРОВАНИЕ 33
Вывод по пятому разделу 34
ЗАКЛЮЧЕНИЕ 35
ЛИТЕРАТУРА 36
ПРИЛОЖЕНИЯ 39
Приложение 1. Скриншоты веб-сервиса 39
Приложение 2. Примеры распознавания 41
Приложение 3. Награды 43

📖 Введение

ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ
Искусственные нейронные сети (ИНС) (Artificial neural networks, ANN) — упрощенные модели биологических нейронных сетей [26].
Сверточные нейронные сети (СНС, CNN) очень похожи на обычные нейронные сети: они также построены на основе нейронов, которые обладают изменяющимся весом и смещениями. Каждый нейрон получает некоторые входные данные, выполняет скалярное произведение информации и в отдельных ситуациях сопровождает это нелинейностью. Как и в случае с обычными нейронными сетями, вся CNN выражает одну дифференцируемую функцию взноса (эффективный взнос): с одной стороны, это необработанные пиксели изображения, с другой — вывод класса или группы вероятных классов, характеризующих картинку [29].
Классификация — один из разделов машинного обучения, посвященный решению следующей задачи. Имеется множество объектов (ситуаций), разделенных некоторым образом на классы. Задано конечное множество объектов, для которых известно, к каким классам они относятся. Это множество называется обучающей выборкой. Классовая принадлежность остальных объектов не известна. Требуется построить алгоритм, способный классифицировать произвольный объект из исходного множества [25].
Задача сегментации может быть сформулирована как разбиение исходного изображения на множество непересекающихся связных областей, ассоциируемых с объектами наблюдаемой сцены или их частями в соответствии с некоторыми выбранными критериями [30].
LaTeX — наиболее популярный набор макрорасширений системы компьютерного набора TeX [24].
АКТУАЛЬНОСТЬ ТЕМЫ ИССЛЕДОВАНИЯ
Задача распознавания печатного и рукописного текста приобрела актуальность в связи с широким распространением компьютерной техники. Существует множество решений задачи распознавания текста, вплоть до онлайн-сервисов [22]. Уровень распознавания существующих инструментов позволяет автоматизировать обработку машинописного текста и свести к минимуму необходимость постобработки человеком. Например, такими возможностями обладает программа ABBYY FineReader [27] и программа InftyReader [4]. Обе эти программы практически точно распознают печатные математические формулы. Однако в распознавании рукописных математических формул этот уровень еще достигнут.
C 2011 по 2016 год проводилось ежегодное соревнование по распознаванию математических формул — CROHME (Competition on Recognition of Online Handwritten Mathematical Expressions). Последнее подобное соревнование было проведено в 2016 году. Победу одержала команда «WIRIS» [11]. Для классификации отдельных символов ими были использованы технологии нейронных сетей.
Идея распознавания символов с помощью искусственных нейронных сетей рассматривалась Яном Лекуном и другими исследователями в работе «Handwritten character recognition using neural networks architecture» [8]. Задача распознавания символов является задачей классификации. Для решения этой задачи в основном используются сверточные нейронные сети.
Задача распознавания машинописного текста/формул и рукописного текста практически решена, однако распознавание рукописных математических выражений, по-прежнему, является актуальной задачей на сегодняшний день. Наиболее перспективным подходом к решению данной задачи является применение нейросетевых технологий.
ЦЕЛЬ И ЗАДАЧИ ИССЛЕДОВАНИЯ
Целью данной работы является разработка системы обработки математических рукописных формул, перевода рукописных формул в цифровые форматы LaTeX, MathML. Система должна быть реализована в виде веб-сервиса.
Для осуществления поставленной цели необходимо решить следующие задачи.
1. Провести обзор существующих аналогов и научной литературы по распознаванию рукописного текста и математических формул.
2. Подготовить обучающую и тестовую выборку рукописных символов.
3. Разработать нейронную сеть для распознавания рукописных математических символов.
4. Провести тестирование нейронной сети.
5. Реализовать систему обработки рукописных математических формул в виде веб-сервиса и провести ее тестирование.
СТРУКТУРА И ОБЪЕМ РАБОТЫ
Работа состоит из введения, 5 разделов, заключения, библиографии и трех приложений. Объем работы составляет 43 страницы, объем библиографии — 30 источников, объем приложений — 5 страниц.
В первой главе производится анализ предметной области и обзор существующих аналогов в данной области. Также здесь приведены существующие решения для создания нейронных сетей.
Во второй главе приведены описания алгоритмов, используемых в программной системе.
В третьей главе содержатся требования к классам нейронной сети, функциональные требования к программной системе, а также варианты использования этой системы.
Четвертая глава содержит детали реализации системы распознавания рукописных математических формул.
В пятой главе приведены результаты тестирования нейронной сети и системы распознавания рукописных математических формул.
В заключении приводятся основные результаты работы и рассматриваются направления дальнейших исследований.

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

В рамках дипломного проекта был разработан веб-сервис для распознавания рукописных математических формул.
В ходе разработки были решены следующие задачи.
1. Был проведен обзор существующих аналогов и научной литературы по распознаванию рукописного текста и математических формул.
2. Была подготовлена обучающая и тестовая выборка рукописных символов.
3. Разработана нейронная сеть для распознавания рукописных математических символов.
4. Проведено тестирование нейронной сети.
5. Реализована система обработки рукописных математических формул в виде веб-сервиса и проведено ее тестирование.
Работа апробирована на XIII Уральской выставке научно-технического творчества молодежи «Евразийские ворота России». Получила высокую оценку и диплом первой степени за лучшую творческую работу по информационным технологиям с вручением памятной медали выставки. Диплом представлен в приложении 3.
Дальнейшее направление работы
Планируется продолжать разработку и улучшение веб-сервиса, в частности.
1. Улучшить процент распознавания символов нейронной сетью путем увеличения обучающей выборки.
2. Увеличить количество классов в обучающей выборке.
3. Увеличить скорость распознавания.
4. Повысить удобство использования веб-сервиса.

Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

1. Deepin. Официальный сайт. [Электронный ресурс] URL: https://www.deepin.org/ru/ (дата обращения: 12.01.2018).
2. Detexify LaTeX handwritten symbol recognition. [Электронный ресурс] URL: http://detexify.kirelabs.org/ (дата обращения: 15.02.2018).
3. Google Документы. [Электронный ресурс] URL: http://docs.google.com/ (дата обращения: 15.02.2018).
4. InftyReader. Официальный сайт. [Электронный ресурс] URL: http://www.inftyreader.org/ (дата обращения: 22.02.2018).
5. Keras. Официальная документация. [Электронный ресурс] URL: https://keras.io/ (дата обращения: 13.01.2018).
6. kirel/detexify: Latex Symbol Classifier Web Frontend. [Электронный ресурс] URL: https://github.com/kirel/detexify (дата обращения: 18.02.2018).
7. LeCun Y. LeNet-5, convolutional neural networks. [Электронный ресурс] URL: http://yann.lecun.com/exdb/lenet/ (дата обращения: 19.02.2018).
8. Matan O. Handwritten Character Recognition Using Neural Network Architectures. / O. Matan, R. Kiang, C. Stenard, et al. // Proceedings of the 4th US Postal Service Advanced Technology Conference. - 1990. - Vol. 9. -
P. 1003-1011.
9. Mathematical Expression Recognition. [Электронный ресурс] URL: http://cat.prhlt.upv.es/mer/ (дата обращения: 20.02.2018).
10. Mouchere H. CROHME2011 : Competition on Recognition of Online Handwritten Mathematical Expressions. / H. Mouchere, C. Viard-Gaudin, D. H. Kim, et al. // 2011 International Conference on Document Analysis and Recognition. - 2011. - Vol. 4. - No. 1. - P. 1497-1500.
11. Mouchere H. ICFHR 2016 CROHME : Competition on Recognition of Online Handwritten Mathematical Expressions. / H. Mouchere, C. Viard- Gaudin, R. Zanibbi, et al. // 2016 15th International Conference on Frontiers in Handwriting Recognition (ICFHR). - 2016. - Vol. 5. - No. 1. - P. 607-612.
12. NumPy. Официальный сайт. [Электронный ресурс] URL: http://www.numpy.org/ (дата обращения: 18.01.2018).
13. Offline Mathematical Expression Recognition. [Электронный ресурс] URL: http://vision.soic.indiana.edu/b657/sp2016/ (дата обращения: 18.02.2018).
14. Photomath. Приложение на Google Play. [Электронный ресурс] URL: https://play.google.com/store/apps/details?id=com.microblink.photomath (дата обращения: 28.02.2018).
15. Pillow. Официальная документация. [Электронный ресурс] URL: http://pillow.readthedocs.io/ (дата обращения: 11.02.2018).
..30

🖼 Скриншоты

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.

©2026 Cервис помощи студентам в выполнении работ