ВВЕДЕНИЕ 5
1. Анализ требований на разработку системы 7
1.1 Описание объекта исследования 7
1.2 Разработка модели BPMN 8
1.3 Анализ существующих решений 9
1.3.1 Метод сравнения с шаблоном 10
1.3.2 Метод распознавания с использованием критериев, распознаваемого
объекта 10
1.3.3 Распознавание при помощи самообучающихся алгоритмов, в том
числе при помощи нейронных сетей 15
1.3.3.1 Сверточные нейронные сети 16
1.3.3.2 Самоорганизующиеся карты 21
1.3.3.3 «Классические» нейронные сети 24
1.4 Разработка требований к системе 26
1.4.1 Постановка задачи 26
1.4.2 Функциональные требования 27
1.4.3 Нефункциональные требования 28
1.5 Разработка сценариев использования 28
1.6 Вывод по главе «Анализ требований на разработку системы» 30
2 Проектирование информационной системы 32
2.1 Получение и предварительная обработка изображения 32
2.2 Сегментация текста на изображении 33
2.3 Распознавание символов 33
2.4 Вывод по главе «Проектирование информационной системы» 35
3 Реализация системы 36
3.1 Структура системы 36
3.2 Архитектура системы 37
3.2.1 Класс Segmentation 38
3.2.1 Класс Net 38
3.2.3 Класс Neuron 39
3.2.4 Класс Holder 40
3.3 Пример использования 41
3.3.1 Открытие графического изображения 42
3.3.2 Сегментация текста 43
3.3.3 Обучение нейронной сети 44
3.3.4 Автоматическое распознавание текста 49
3.4 Вывод по главе «Реализация системы» 50
ЗАКЛЮЧЕНИЕ 52
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 53
ПРИЛОЖЕНИЕ А 54
Последние несколько столетий бумажные документы являлись основным инструментом для слежения за постоянным прогрессом человечества. На сегодняшний день большая часть информации до сих пор записывается, сохраняется или распространяется только в бумажной форме. После широкого использование распространения компьютеров и использования их для редактирования документов, ожидалось уменьшение важности бумажных носителей и переход к их электронным формам. Однако объем информации, хранящейся на бумаге, наоборот, не сократился, а увеличился. Даже если современные технологические тенденции
продвигаются к идее «безбумажного мира», некоторые исследования показали, что использование бумаги в качестве носителя для обмена информацией все также возрастает.
Во второй половине 20 века была создана концепция «безбумажного предприятия». Эта концепция дала импульс для развития технологий анализа, обработки и распознавания текстовой информации, но до сих пор она не реализована в полной мере. Изначально перед создателями была проблема с решением задач зрительного анализа, однако сегодня возникла новая крупномасштабная проблема — перевод больших объемов информации с бумажных носителей на компьютер, как печатных, так и рукописных.
На сегодняшний день сканирование текста с бумажного носителя и сохранение его в памяти компьютера является решённой задачей. Не смотря на это, после сканирования документов, текст на них хранится в виде изображения, что делает сложными некоторые операции по работе с ним. К таким операциям относятся:
- ориентирование в тексте;
- поиск необходимого текста;
- редактирование текстовой информации;
- форматирование текста.
Для решения подобных проблем необходимо распознать текст на изображении и перевести его в более удобный текстовый формат. Механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные, использующиеся для представления символов в компьютере, называется распознаванием текста. Задача по распознаванию машинописного текста называется оптическим распознаванием текста(орйса1 character recognition, OCR).
Данная работа посвящена именно оффлайновому распознаванию машинописного текста. При оффлайновом распознавании текста системе доступна только графическая информация.
Целью данной работы является решение задачи автоматического распознавания машинописного текста.
Для достижения цели необходимо решить некоторые задачи:
- анализ процесса распознавания текста;
- разработать модель процесса распознавания текста;
- изучить существующие методы распознавания машинописного текста;
- выбрать метод и использовать его распознавания текста;
- разработать архитектуру системы;
- разработать программный продукт для распознавания машинописного текста.
В настоящей выпускной квалификационной работе была исследована проблема оптического распознавания символов.
Целью ВКР являлась решение задачи автоматического распознавания машинописного текста. В настоящее время, несмотря на старания руководства предприятий перейти на «безбумажное производство», количество бумажной документации только увеличивается.
Актуальность ВКР обусловлена необходимостью перевода большого количества документов в электронный вид для последующего упрощения навигации по тексту, редактирования и обработки текста.
В результате проделанной выпускной квалификационной работы были решены задачи:
- проведен анализ требований к системе;
- разработана BPMN модель процесса автоматического распознавания
машинописного текста;
- проведен анализ существующих решений процесса распознавания
текста. Были выделены три основных метода: метод сравнения с шаблоном, метод распознавания с использованием критериев распознаваемого объекта и метод распознавания с помощью самообучающихся алгоритмов;
- разработаны функциональные и нефункциональные требования к
системе;
- разработан сценарий использования системы;
- выполнено проектирование и реализация системы автоматического
распознавания текста на основе нейронной сети.
Задача была полностью реализована на языке программирования C#.
1. Lyman P., Varian H. How much information 2003?. - 2004.
2. Schantz H. F. History of OCR, optical character recognition. - Recognition Technologies Users Association, 1982.
3. Mori S., Suen C. Y., Yamamoto K. Historical review of OCR research and development //Proceedings of the IEEE. - 1992. - Т. 80. - №. 7. - С. 1029-1058.
4. Арлазаров В. Л. и др. Адаптивное распознавание символов //В сб." Интеллектуальные технологии ввода и обработки информации. - 1998. - С. 39-56.
5. Ткач К. Ю. Нейронная сеть для идентификации объектов на изображениях //ОРГАНИЗАЦИОННЫЙ КОМИТЕТ. - 2017. - С. 86.
6. LeCun Y. et al. Convolutional networks for images, speech, and time series //The handbook of brain theory and neural networks. - 1995. - Т. 3361. - №. 10. - С. 1995.
7. Макаренко А. А, Калайда В. Т: Методика локализации изображения лица для систем видео контроля на основе нейронной сети / Известия Томского политехнического университета. 2006. Т. 309. №8
8. Горбаченко В. И. Сети и карты Кохонена //Научно-исследовательский центр самоорганизации и развития систем. - 2010.- [Электронный ресурс]:http://gorbachenko.self-organization.ru.- 2010.