Тип работы:
Предмет:
Язык работы:


Алгоритм извлечения текстовой информации из графических данных

Работа №77527

Тип работы

Дипломные работы, ВКР

Предмет

информационные системы

Объем работы60
Год сдачи2016
Стоимость4290 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
366
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 3
Актуальность 3
Цель дипломной работы 5
АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ И ПОСТАНОВКА ЗАДАЧИ 6
Основные понятия OCR-технологии 6
Основные этапы работы OCR-приложения 10
Предобработка изображения 10
Анализ изображения и сегментация 18
Процесс распознавания (классификации) символов 21
Постобработка 25
Особенности разработки OCR-приложения для задачи распознавания формул 27
Постановка задачи 31
ПРИКЛАДНАЯ РЕАЛИЗАЦИЯ АЛГОРИТМА 32
Инструментарий 32
Основные технологии 32
Вспомогательные инструменты 32
Итоги разработки 34
Исследование аналогов 39
ЗАКЛЮЧЕНИЕ 41
Список источников и используемой литературы 42
Приложение. Листинг 45

Одной из главных целей создания вычислительных устройств была возможность заменить человеческие ресурсы машинными при выполнении некоторых трудоемких или рутинных операций. К подобным задачам можно отнести обработку больших структур данных, криптографические процедуры, а также распознавание образов, в частности распознавание текстовых документов.
Идеи устройства, распознающего некоторый класс символов, зародились еще в начале ХХ в. В 1929 году в Германии был зарегистрирован первый патент на метод оптического распознавания символов [1]. С появлением первых компьютеров область распознавания образов стала развиваться и расширяться — первые коммерческие системы внедрялись для чтения кредитных карт для работы с чеками и для распознавания имен адресатов на почтовых отправлениях. В настоящее время цифровые устройства используют технологии распознавания во многих сферах повседневной жизни, например, при распознавании автомобильных номеров камерами-регистраторами на дорогах или при оцифровке текстовой информации. Распознавание текста в контексте данной задачи существенно облегчает хранение и манипулирование данными — в качестве конечного результата будет файл в текстовом формате, который можно импортировать в привычный для пользователя редактор и осуществлять ориентирование, правки и поиск по документу.
Задача распознавания машинописного текста носит название оптического распознавания символов (Optical Character Recognition). В настоящее время создано немало систем распознавания текста, но многие проблемы до сих пор остаются нерешенными — например, проблема распознавания математических выражений, формул и специализированных символов, а также распознавание текста при плохом качестве исходного изображения.
Новая ветвь развития OCR-технологий — создание и использование инструментов для мобильных платформ. Развитие вычислительной мощности техники и доступность смартфонов на рынке позволили создавать специализированные приложения для распознавания образов и внедрять их в качестве вспомогательных инструментов для решения более крупных задач, позволяя оптимизировать временные и ресурсные затраты. Согласно исследованиям международной компании Newzoo, на апрель 2017 года в мире насчитывается около 3 млрд. людей, которые систематически используют смартфоны в повседневной жизни [2]. Предполагается, что их число будет только расти.
На данный момент существует немало технологических решений для распознавания текста (наиболее популярные из них: ABBYY FineReader, CuneiForm, Tesseract, OmniPage, Microsoft Office Document Imaging). Лишь малая их часть пригодна для использования на мобильных платформах. Доступные для использования варианты в основном решают заранее строго определенный класс задач (распознавание только букв, цифр и стандартных символов; распознавание штрих кодов; распознавание паспортных данных). Нерешенной остается проблема распознавания математических формул, так как инструмента, способного распознавать структуру подобного рода выражений с помощью технологии OCR, не существует.
Цель дипломной работы
Цель работы — разработка алгоритма извлечения текстовой информации из графических данных (алгоритма распознавания текста) и его программная реализация.
Задачи работы:
• Провести обзор этапов и основных методов технологии оптического распознавания символов, выявить факторы, оказывающие влияние на точность распознавания
• Сформировать собственный алгоритм на основе приведенного
исследования
• Разработать программную реализацию алгоритма для мобильной ОС и привести в дипломной работе результаты разработки


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Данная работа посвящена разработке и реализации алгоритма извлечения текстовой информации из графических данных на базе мобильной платформы OS Android.
В ходе выполнения работы был произведен анализ области оптического распознавания символов, а также были выделены основные этапы и методы, применяемые в практических реализациях алгоритма. Далее в работе были рассмотрены вопросы структурного анализа математических формул и обозначены особенности и проблемы работы с математическими выражениями в задачах распознавания текста.
Практическая часть данной работы состоит из постановки задачи, выделения требований к разрабатываемому приложению, результатов работы и анализу приложения со схожими разработками.
В качестве результата, с использованием средств Java, OS Android, Tesseract и Leptonica был реализован алгоритм извлечения данных из изображений, полученных с камеры мобильного телефона. Корректное распознавание достигалось более чем в 80% случаев.
В качестве доказательства актуальности разработки был произведен анализ приложений, имеющих схожую концепцию. Было доказано, что проектов с полностью аналогичной концепцией не существует.
Описанную в дипломной работе разработку планируется развивать и улучшать. Среди возможных перспектив развития — создание нового, уникального .traineddata-файла, увеличение класса распознаваемых выражений, проработка модуля распознавания (для корректного распознавания дробных и подкоренных выражений) и расширение функционала вычислительного модуля.



1. The reading Machine (first OCR device) of Gustav Tauschek [Электронный ресурс]. - Режим доступа: http://history-computer.com/ModernComputer/Basis/OCR.html. -History of Computers and Computing, Birth of the Modern Computer, OCR. - (Дата обращения: 14.05.2017).
2. Top countries by Smartphone users and Penetration [Электронный ресурс]. - Режим доступа: https://newzoo.com/insights/rankings/top-50-countries-by-smartphone-penetration-and-users/. - Top countries by smartphone users and penetration | Newzoo. - (Дата обращения: 14.05.2017).
3. Колесников С. Распознавание образов. Общие сведения [Электронный ресурс] / С.Колесников. // Газета "Компьютер-Информ". Программное обеспечение. - Режим доступа -http://www.ci.ru/. - (Дата обращения 3.03.2017).
4. Ту Дж., Гонсалес Р. Принципы распознавания образов / Пер. с англ. Гуревич И.Б. - М.: «Мир», 1978. - 412 с.
5. Оптическое распознавание символов (OCR). [Электронный ресурс] //Wiki - техническое зрение. - Режим доступа: http://wiki.technicalvision.ru/index.php, - Загл. с экрана. (11.05.2017).
6. Травин А. Технологии оптического распознавания текстов [Электронный ресурс]// Газета "Электронный офис". - 10.1996. - Режим доступа:
http://travin.msk.ru/arc/OCR.html. - (Дата обращения: 2.05.2017).
7. Л Шапиро, Дж Стокман. Компьютерное зрение / Пер. с англ. - М.: Лаборатория знаний, 2006. - 752 с.
8. Суясов Д.И. Разработка алгоритмов распознавания текста на основе клеточных автоматов. СПбГУ ИТМО. [Электронный ресурс] - 2007. -
Режим доступа:http://is.ifmo.ru/papers/28 07 2007 Sujasov- (Дата обращения: 5.05.2017).
9. Калиниченко Ю.В., Ищенко Я.С. Алгоритм поворота растрового изображения на произвольный угол. — Тезисы доклада / MODERN PROBLEMS AND WAYS OF THEIR SOLUTION IN SCIENCE, TRANSPORT, PRODUCTION AND EDUCATION. — 2012 г.
10. Масалович А.А., Местецкий Л.М. Использование патча Безье для аппроксимации искажения изображений текстовых документов // ГРАФИКОН-2007, Москва
11. Сегментация изображения [Электронный ресурс]. - Режим доступа: https://habrahabr.ru/post/128768/. - Сегментация изображения | Хабрахабр.
- (Дата обращения: 15.05.2017).
12. Надеран Э. Онлайн распознавание рукописных математических 6. формул. - ITHEA, Applicable Information Models №22, 2011. - c. 70-75.
13. Новейшие методы обработки изображений. : А.Потапов [и др.]; - M.: Физматлит, 2008. - 496 с.
14. Jacob R. Bruce Mathematical Expression Detection and Segmentation in Document Images. - Virginia Polytechnic Institute and State University, 2014./ thesis for the degree of Master of Science In Computer Engineering. - 157 с.
15. Кудрина М. А., Мурзин А.В. Аффинные преобразования объектов в компьютерной графике // Пенза: Издательство ПГУ, 2014. С. 307-310
16. Методы обработки изображений: лабораторный практикум. Ч. 1 / сост.: С. В. Воронов, А. Г. Ташлинский, И. В. Горбачев. - Ульяновск : УлГТУ, 2016. - 50 с.
17. Глумов Н.И., Мясников Е.В., Коненков В.Н. Метод быстрой корреляции с использованием тернарных шаблонов при распознавании объектов на изображениях // Компьютерная оптика, том 32, №3, 2008, стр. 277-282
18. Кучуганов А.В. Распознавание рукописных текстов / А.В. Кучуганов, Г.В.
Лапинская - Материалы международной научной конференции Ижевск, 13-17 июля 2006 г.
19. Фролов И. И., Садыхов P. X. Построение классификатора на основе машины опорных векторов для распознавания символов // Докл. Белорусского гос. ун-та информатики и радиоэлектроники. 2008. № 1. С. 103—108.
20. Крылов В.Н., Максимов М.В., Щербакова Г.Ю. Помехоустойчивая классификация бинаризованных изображений символов // Труды Одесского политехнического университета. — 1998. — Вып. 2. — С. 108-111.
21. Спицын, В.Г. Применение вейвлет-преобразования Хаара, метода главных компонент и нейронных сетей для оптического распознавания символов на изображениях в присутствии импульсного шума / В.Г.
Спицын, Ю.А. Болотова, Н.Х. Фан, Т.Т.Ч. Буй // Компьютерная оптика. - 2016. - Т. 40, № 2. - С. 249-257.
22. Ицкович Л.А., Кузнецов С.О., Методы машинного обучения в задаче распознавания символов. / Труды 12-й Национальной Конференции по Искусственному Интеллекту (КИИ 2010). - М., Физматлит, Т. 2, С. 124-132, 2010.
23. Л.Н.Чабан. Теория и алгоритмы распознавания образов. Учебное пособие. - М.МИИГАиК, 2004. - 70 с

Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ