Тип работы:
Предмет:
Язык работы:


Реализация алгоритма распознавания Бумажного документа в Шаблон электронного документа (в формате Jasper или другой библиотеки для создания отчётов)

Работа №120616

Тип работы

Бакалаврская работа

Предмет

информационные системы

Объем работы46
Год сдачи2021
Стоимость4700 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
41
Не подходит работа?

Узнай цену на написание


Аннотация 2
Введение 5
Глава 1 Анализ существующих технологий оптического распознавания
символов 7
1.1 Понятие и процесс оптического распознавания символов 7
1.2 Обзор существующих приложений по оптическому
распознаванию символов 10
1.3 Механизм распознавания Tesseract 12
Глава 2 Проектирование алгоритма оптического распознавания символов и разработка приложения 16
2.1 Выбор средств реализации 16
2.2 Реализация программы 19
Глава 3 Тестирование разработанного алгоритма 27
3.1 Тестирование разработанного алгоритма с использованием
различных изображений 27
3.2 Подведение итогов тестирования разработанного алгоритма • 35
Заключение 41
Список используемой литературы и используемых источников 43
Приложение А Сравнение популярных решений 45
Приложение Б Код программы 46


Аннотация
Темой выпускной квалификационной работы (ВКР) является «Реализация алгоритма распознавания Бумажного документа в Шаблон электронного документа (в формате Jasper или другой библиотеки для создания отчётов)».
ВКР состоит из введения, трех глав, заключения и списка литературы.
Во введении описывается актуальность данной работы.
Первая глава посвящена описанию понятия и процесса оптического распознавания символов, а также обзору методов и анализу реализаций алгоритмов распознавания.
Во второй главе описывается теоретическая схема работы алгоритма, выбор средств его программной реализации и сама программная реализация системы.
В третьей главе проводится тестирование разработанной системы при различных входных данных. Также приводятся таблицы и графики о работе разработанной системы.
В заключение вынесены выводы о проделанной работе.
Был сделан вывод, что для более точной работы алгоритма расстояние между символами должно быть таким, чтобы их контуры не соприкасались. Также на процесс распознавания в достаточной мере влияет фон документа (его цвет относительно цвета текста, различные помехи и так далее). Данный недочёт возможно в большей мере исправить, используя предварительную обработку и преобразование исходного изображения в монохромное (чёрно-белое). Для увеличения скорости распознавания символов алгоритм возможно усовершенствовать, используя параллельное распознавание.
Данная выпускная квалификационная работа содержит в себе пояснительную записку, состоящую из 42 страниц, 22 рисунков, 3 таблиц и списка литературы из 20 источников.
В то время как компьютерное зрение - это та область искусственного интеллекта, о которой все любят говорить, типы аннотаций данного семейства, которые работают с текстом, обходят стороной. Однако на самом деле технологии распознавания текста приносят намного больше пользы для современного бизнеса. Это особенно верно для средних и крупных компаний, которые обычно имеют дело с огромными объемами данных. Следует только подумать обо всех отчетах и протоколах, презентациях, корпоративных письмах и юридических формах, счетах, квитанциях и так далее.
Средний документооборот современной компании действительно огромен. На самом деле, исследования показывают, что сотрудники компаний обычно тратят треть своего рабочего времени на поиск необходимой информации. Естественно, документ с текстом, доступным для поиска, лучше, чем фотография или скан документа.
Статистические данные, полученные Бобылевой М.П. [1], подтверждают, что бумажные документы обходятся бизнесу дороже, чем процесс создания цифровых копий и управления ими. Не говоря уже о том, что зависимость от бумажных документов является одной из самых больших уязвимостей информационной безопасности. Эти факты говорят сами за себя: современный бизнес сэкономил бы довольно приличную сумму, просто перейдя с аналоговых на цифровые рабочие процессы. Тем не менее, хотя статистика выступает против использования бумаги, исследования показывают, что она не исчезнет в ближайшем будущем. И именно здесь появляются алгоритмы оптического распознавания символов, чтобы спасти положение. Использование соответствующих программ распознавания значительно упрощает процесс ввода текстовых данных в компьютер, тем самым освобождая значительное время. Это особенно актуально, например, при переводе больших потоков архивных документов в электронный вид для их компактного хранения на современных носителях. Следующим этапом развития приложений этого класса будет разработка и совершенствование алгоритмов распознавания рукописного текста, что особенно актуально для ввода в компьютер информации с заполненных таможенных деклараций, квитанций, бланков и других отчетных документов.
В любом случае, потребность в распознавании текстов и электронном хранении документов существует практически в каждом офисе, что также подтверждают исследования, производимые Kissell J. [11], потому и столь актуальна данная тема.
Объектом исследования являются приложения оптического распознавания символов с изображений.
Предметом исследования являются алгоритмы распознавания символов при работе с изображениями с текстом.
Цель исследования - разработка программы с алгоритмом высокой точности оптического распознавания символов с изображений документов, полученных в результате сканирования, и иных «текстовых» изображений на ОС Windows для облегчения перевода бумажного документа в текстовый формат.
Задачи исследования:
- Изучить и проанализировать существующие методы и программные решения по распознаванию печатных символов;
- Описать работу алгоритма распознавания;
- Сравнить существующие методы распознавания символов;
- Рассмотреть существующий программный инструментарий;
- Реализовать рабочий прототип приложения, способный распознавать текстовые данные с отсканированного документа и сохранять эти данные в шаблон электронного документа;
- Протестировать приложение с использованием различных изображений.

Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


Выпускная квалификационная работы посвящена разработке алгоритма распознавания текста на изображении про помощи метода Tesseract и библиотеки EmguCV, являющейся кроссплатформенной обёрткой
библиотеки компьютерного зрения OpenCV. В результате ее выполнения был спроектирован, реализован и протестирован алгоритм, позволяющий распознать на изображении буквы, слова и перевести распознанные символы в печатный текст с возможностями:
- Сохранения его в шаблон документа формата rtf;
- Копирования текста в буфер обмена;
- Редактирования распознанного текста.
Исходный код программы представлен в приложении Б.
Во время выполнения данной работы были успешно завершены следующие задачи:
- Изучены и проанализированы существующие методы и программные решения по распознаванию печатных символов;
- Описана общая схема работы алгоритмов распознавания;
- Произведено сравнение методов распознавания символов для выбора наиболее подходящего к реализации приложения;
- Рассмотрен существующий программный инструментарий для реализации приложения;
- Реализован прототип приложения, способный распознавать текстовые данные с отсканированного документа и сохранять эти данные в шаблон электронного документа;
- Реализованное приложение было протестировано с использованием различных графических изображений текста.
Для тестирования работоспособности алгоритма на вход системы подавались изображения, имеющие различные особенности, такие как:
- Цвет символов;
- Размер символов;
- Цвет фона изображения.
По окончанию тестирования были построены таблицы и графики, показывающие эффективность алгоритма. По результатам тестирования полученной программы были выявлены ее недостатки, а также предложены варианты ее улучшения.
Хотя это и не часто обсуждается за пределами индустрии машинного обучения, оптическое распознавание символов имеет один из самых высоких рейтингов использования в сфере искусственного интеллекта. Предприятия по-прежнему работают на основе огромных объемов бумажной документации, что является устаревшей и почти вредной практикой. OCR может помочь бизнесу справиться с этим путем оцифровки рабочего процесса.
Более того, сфера применения для OCR на этом не заканчивается. Любой текст, будь то аккуратно организованный отчет, случайный знак магазина или рукописная записка, может быть обработан и преобразован OCR в машиночитаемый текст. Это шаг к автоматизации больших данных.
Любопытно, что, несмотря на то, что создание алгоритмов распознавания текста не является новой технологией, это сложно, как никогда. Конечно, общественность имеет доступ к открытым исходным кодам OCR алгоритмов. Но если необходима модель распознавания текста, которая будет служить конкретным целям, то лучше построить ее самостоятельно.



1. Бобылева М.П. Эффективный документооборот: от традиционного к электронному / М.П. Бобылева. - М.: Издательство МЭИ, 2004, - 172 с.
2. Оптическое распознавание символов [Электронный ресурс]:
Википедия. Свободная энциклопедия. - URL:
ййр8://ги^1к1реШа.огц^1к1/Оптическое распознавание символов
3. Типовые проблемы, связанные с распознаванием символов
[Электронный ресурс]: Студенческая библиотека онлайн. - URL:
https://studbooks.net/2250220/informatika/tipovye problemy svyazannye raspozn avaniem simvolov
4. Форматы изображения [Электронный ресурс]: FOTODIZART. Дизайн и разработка сайтов. - URL: https: //fotodizart.ru/formaty- izobrazheniya.html
5. ABBYY FineReader 10 Home Edition [Электронный ресурс]: PC, Mobile Utilites. - URL: https://pcutilites.com/43-abbyy-finereader-10-home- edition.html
6. C#: Перевод изображения в монохром [Электронный ресурс]: Блог доброго программиста. - URL: https://blog.foolsoft.ru/c-perevod-izobrazheniya- v-monoxrom/
7. Computer Vision Toolbox. Design and test computer vision, 3D vision, and video processing systems [Электронный ресурс]: MathWorks. - URL: https: //www. mathworks. com/products/computer-vision. html
8. EmguCV: API Documentation [Электронный ресурс]: Emgu. - URL: https: //www. emgu. com/wiki/index.php/Documentation
9. Huang D. Optical Character Recognition Technology. Application of ABBYY FineReader 11 Kindle Edition / D. Huang. - Kindle Store. - 2013. - Jule. - 253 с.
10. IMAQ. IMAQ Vision for LabVIEW. User Manual [Электронный ресурс]: National Instruments. - URL: https://www.ni. com/pdf/manuals/371007a
11. Kissell J. Take Control of Your Paperless Office, 3rd Edition - Kindle Edition / J. Kissell. - Kindle Store. - 2017 - Mar. - 178 с.
12. LabVIEW - первое знакомство [Электронный ресурс]: habr. - URL: https://habr.com/ru/post/57859/
13. Martin J. Visual Studio 2015 Cookbook - Second Edition / J. Martin. - Kindle Store. - 2016. - Aug. - 368 с.
14. OCR CuneiForm [Электронный ресурс]: PC, Mobile Utilites. - URL: https://pcutilites.com/356-ocr-cuneiform.html
15. OCRopus - OCRopus [Электронный ресурс]: Википедия, бесплатная энциклопедия. - URL: https: //ru.xcv .wiki/wiki/OCRopus
16. OpenCV: API Documentation [Электронный ресурс]: OpenCV Documentation. - URL: https://docs.opencv.org/2.4/modules/refman.html
17. Sells C. Windows Forms Programming in C# - Illustrated Edition / C. Sells. - Amazon. - 2003. - Sep. - 682 c.
... Всего источников – 20.


Работу высылаем на протяжении 30 минут после оплаты.




©2024 Cервис помощи студентам в выполнении работ