Введение 4
1. Постановка задачи 2
1.1. Существующие методики распознавания текста 8
1.2. Схемы функционирования систем распознавания 13
1.3. Язык Сетевых онтологий OWL 21
2. Изучение метода распознавания 25
2.1. Анализ фреймворков распознавания информации 25
2.2. Фреймовая OWL-модель представления текста 30
2.3. Разработка приложения распознавания информации 41
2.3.1. Структура программного приложения 42
2.3.2. Алгоритмы работы приложения 46
2.3.3. Тестирование и анализ результатов 55
Заключение 59
Список Литературы
Приложение
Концепция «безбумажного предприятия», получившая широкую известность уже во второй половине XX века и давшая импульс для создания и развития особых технологий обработки и распознавания текстовой информации, до сих пор не реализована в полной мере. Следует заметить, что проблема распознавания текстовой информации, возникшая первоначально в связи с необходимостью решать задачи зрительного анализа, сегодня поставила перед создателями автоматизированных систем новую крупномасштабную задачу - ввод огромных объемов информации с бумажных документов в компьютер.
В связи с повсеместным распространением технологий обработки и хранения информации в электронном виде, перед создателями программного обеспечения возник широкий комплекс задач, связанных с распознаванием образов: от распознавания рисунка радужной оболочки человеческого глаза, дактилоскопических линий и лиц, автомобильных номеров до распознавания речи и печатных или рукописных документов.
Темой исследования является решение задачи автоматизированного перевода рукописных символов и, в перспективе, текстов в электронное текстовое представление. В настоящее время в действующих библиотеках накоплено большое количество полезных рукописных и печатных документов различного прикладного применения.
Для обеспечения возможности компьютерного анализа и электронного переиздания таких документов требуется их перевод в электронный вид.
Значительный объем задачи, а также весьма узкий круг специалистов, обладающих знаниями в данной сфере, порождают необходимость в автоматизации указанного процесса.
Необходимость исследования зачастую связана со спецификой используемого в рукописях языка и стиля письма, а также качеством входных изображений.
Эти факторы затрудняют использование применительно произвольным рукописным документам существующих средств распознавания текста, ориентированных на различные языки и способы представления текстовой информации на бумажных носителях.
Актуальность исследования обусловлена необходимостью перевода рукописных документов в электронный вид с возможностью последующего автоматизированного анализа. Большую роль зачастую здесь играет специфика используемых в документах языков, круг пользователей которого может охватывать различные направления деятельности [18].
Целью исследования является изучение, анализ и адаптация методик автоматизированного перевода текстов из растровых изображений в вид электронных текстов и основанного на этой методике программного продукта.
Назначением подобного продукта является сокращение времени получения электронных текстовых документов за счёт замены этапа ручного ввода автоматизированным распознаванием. Продукт предназначается для специалистов, исследующих и обрабатывающих рукописные документы различного назначения вида. Также возможно использование продукта при подготовке разнообразных мультимедийных электронных изданий указанных рукописных и печатных документов [19].
Задачи исследования:
• изучение особенностей распознавания рукописных и печатных документов;
• анализ существующих методов распознавания рукописных и печатных текстов;
• построение онтологических OWL-диаграмм, описывающих проблемную область;
• разработка алгоритмов анализа изображений;
• проектирование и реализация программного продукта.
Дипломная работа состоит из введения, двух глав и заключения.
В настоящей дипломной работе исследована проблема автоматического ввода рукописных документов в компьютер. На примере типичной системы ручного ввода данных было показано, что решающее значение на эффективность процесса ввода оказывает точность распознавания одиночных рукописных символов.
Темой исследования является решение задачи автоматизированного перевода рукописных символов и, в перспективе, текстов в электронное текстовое представление. В настоящее время в действующих библиотеках накоплено большое количество полезных рукописных и печатных документов различного прикладного применения.
Необходимость исследования зачастую связана со спецификой используемого в рукописях языка и стиля письма, а также качеством входных изображений.
Эти факторы затрудняют использование применительно к произвольным рукописным документам существующих средств распознавания текста, ориентированных на различные языки и способы представления текстовой информации на бумажных носителях.
Актуальность исследования обусловлена необходимостью перевода рукописных документов в электронный вид с возможностью последующего автоматизированного анализа.
Целью исследования в рамках работы являлось изучение, анализ и адаптация методик автоматизированного перевода текстов из растровых изображений в вид электронных текстов и основанного на этой методике программного продукта.
Назначением подобного продукта является сокращение времени получения электронных текстовых документов за счёт замены этапа ручного ввода автоматизированным распознаванием.
Продукт предназначается для специалистов, исследующих и обрабатывающих рукописные документы различного назначения вида. В рамках произведенного исследования были решены следующие задачи:
• изучены и проанализированы особенности методов
распознавания рукописных и печатных документов;
• были построены группы онтологических OWL-диаграмм,
описывающих проблемную область;
• была произведена разработка алгоритмов анализа изображений;
• выполнено проектирование и реализация программного продукта с последующим тестированием и анализом.
Классификация методов распознавания производится по ряду характерных для данного процесса признаков:
• По способу описания распознаваемых объектов;
• По процедуре предъявления выборок обучающих множеств;
• По виду правила классификации;
• По способу ввода распознаваемых объектов:
Основным видом и методикой распознавания текста является сегментация и нормализация текста. На этом этапе текст разделяется, или сегментируется, на удобные для анализа составные части.
Онтология описывает понятия, используемые для того, чтобы описать область знаний. Онтология включает машиночитаемые определения основных понятий предметной области и отношения между ними. Они кодируют знания из предметной области и знания из смежных предметных областей. В этом смысле они делают знания возможными для повторного использования.
OWL может представлять комплексную обогащенную информацию о классах индивидов и их свойствах. OWL — это логический язык, где каждая конструкция имеет строго определенный смысл, при этом совокупность таких конструкций позволяет воссоздать некоторую информацию.
Каждая конкретная фреймовая структура сохраняется в отдельном OWL-файле, который может быть, кроме всего, в дальнейшем использован в процессе распознавания, как база знаний.
Подводя итог проведённому сравнению, кратко перечислим особенности рукописного текста:
• Отсутствие ровных строк;
• Разнообразие начертаний одинаковых букв;
• Возможные дополнительные декоративные элементы в буквах;
• Соединение и пересечение букв.
Как следует из приведённых выше особенностей рукописного текста, система распознавания находится в ситуации, когда вариативность начертания распознаваемых символов велика, а их выделение из общего изображения может быть затруднено.
В соответствии с исследуемым методом распознавания, в качестве ключевых понятий базы знаний следует выделить «слово» и «букву» как являющиеся объектами распознавания. Итак, база знаний представляется состоящей из множества фреймов, обозначающих конкретные слова, и множества фреймов, обозначающих буквы. Каждое слово состоит из некоторого количества букв, и все слова используют буквы из одного множества - алфавита языка. Таким образом, фрейм слова содержит набор субфреймов, описывающих вхождения составляющих его букв и связь между ними.
В рамках работы было приведено описание структуры базы знаний, которое подготовлено в виде группы OWL-диаграмм. Такие диаграммы разработаны в среде редактора Protege 4.3.0.
Именно с использованием подобного механизма была создана семантическая структурная OWL-схема процесса распознавания рукописного текста.
В рамках практической части настоящей работы выполнено создание программного приложения средствами среды программирования Delphi, демонстрирующих возможности ЭВМ по выполнению задачи распознавания рукописного текста.
В программе широко использованы стандартные ресурсы Windows, знакомые и привычные для пользователя, предусмотрены разнообразные управляющие элементы - кнопки, диалоги, предусмотрены всевозможные ярлычки подсказки.
Для работы программы необходим и достаточен компьютер, своими ресурсами поддерживающий корректную работу в 32-хразрядных версиях Windows.
Достижение цели осуществляется посредством комплекса задач:
1. При запуске программы на экран выводится диалоговое окно
Windows, на котором расположены, информационные и управляющие элементы, которые дают пользователю возможность понятного восприятия и работы с учебной программой.
2. Для выполнения поставленных заданием требований определены
следующие последовательно выполняющиеся независимые подзадачи:
• Организация внешнего вида программы;
• Настройка требуемых параметров;
• Ввод данных пользователем;
• Выполнение алгоритма распознавания текста;
• Получение и отображение результата
• Получение информации о программе
• Завершение работы приложения
Ввод в систему знаний о структуре букв происходит следующим образом. Эксперт самостоятельно выбирает букву, которую собирается описать. В специальной области экрана он рисует с помощью указателя «мыши» эту букву, «выводя» её линия за линией, тем самым определяя набор элементов.
Когда буква нарисована, эксперт подтверждает ввод и система начинает разбор введённого изображения. После того, как разобраны все элементы изображения, полученная информация сравнивается с шаблонной информацией и, далее, по процентному соотношению совпадений определяется наиболее подходящая буква или символ.
Одновременно, выводится список остальных возможных букв с соответствующими процентными значениями совпадений.
Таким образом, программное приложение позволяет оценить погрешность ввода и погрешность вычислений. Разработанная в рамках настоящей дипломной работы программа выполняет поставленную задачу.
Для оценки перспектив полноценного применения приложения необходимо проведение ряда тестов, вычисление и анализ погрешностей, которые объективно могут иметь место: ввиду нестабильности рукописного ввода исходного символа; ввиду разницы в контрольных фреймах алфавитных наборов; ввиду разницы в начертании шрифтов и различной толщине рисования тестовых символов.
Дальнейшие направления исследований возможны в области развития методов построения и поиска наиболее эффективных средств описания структурных эталонов, в том числе разработке процедур автоматического создания структурных эталонов.
1. Баженова И.Ю. "Delphi 7 Самоучитель программиста" - М.:
"КУДИЦ-ОБРАЗ", 2003. - 448с.
2. Вальвачев А.Н., Сурков К.А., Сурков Д.А., Четырько Ю.М. Программирование на языке Delphi. Учебное пособие. - 2005. - 217с.
3. Вершинина В.В. Метод и алгоритмы анализа контурных
изображений в визуальных информационных системах на остове неоднородной нечёткой семантической сети: Дис. канд. техн. нщк; 05.13.01 / Рыбин. гос. авиац.-технол. акад. Рыбинск, 2004.
4. Гелецян Д. Векторизация растровых изображений //Интеллектуальные технологии и системы: сборник статей
аспирантов и студентов / Под ред. Ю.Н.Филипповича М.:МГТУ, 2010. Вып. 5.
5. Глушаков С.В., Клевцов А.Л. "Программирование в среде Delphi 7.0" - Харьков: "ФОЛИО", 2003. - 528с.
6. Горский Н., Анисимов В., Горская Л. Распознавание рукописного текста: от теории к практике. - СПб.: Политехника, 2007 г.
7. Гофман В., Хомоненко А "Delphi Быстрый старт" - СПб.: "БХВ- Петербург", 2007. - 288с.
8. Грекул В.И. "Проектирование ИС. Курс лекций" Москва 2005. - 303с.
9. Распознавание изображений с автоматическим вычислением геометрических параметров // Интеллектуальные технологии и системы: сборник статей аспирантов и студентов /Под ред. Ю.Н.Филипповича — М.:МГУП, 2001. - Вып. 3.
10. Кадакин М.Ю. Разработка и исследование метода распознавания рукописных текстов / МГТУ им. Н. Э. Баумана. Фак. информатика и системы управления. Каф. Системы обработки информации и управления. М.,2002. Дипломный проект.
11. Кафтанников, И. Л. Перспективы использования онтологий в учебном процессе / 2003
12. Коуд П., Норт Д.,Мейфилд М. «Объектные модели. Стратегии, шаблоны и приложения» - М:, 2009.
13. Крылов А.Б. Способ выбора растровых объектов на монохромном
14. Лингер Р., Миллс Х., Уитт Б. Теория и практика структурного программирования. - М., 2004.
15. Парижский С.М. Книга Delphi. Учимся на примерах. П18 Delphi. "Учимся на примерах" / Под ред. Шпака Ю.А. - К.: "МК-Пресс", 2005. - 216с, ил. ISBN 966-8806-02-6.
16. Петров С.А. Исследование и разработка методов и средств создания
эталонов для оценки защищённости корпоративных программных систем/ФГБОУ ВПО «Национальный исследовательский
университет «МЭИ». М.,2014. Диссертация на соискание учёной степени кандидата технических наук.
17. Рубенкинг Нил Дж. Введение в Borland Delphi 2006 - М.: Диалектика, 2007. - 336 с. - ISBN 0-7645-0179-8
18. Семенов А. С. Информационные технологии: обьективно-
ориентированное моделирование: Учеб. пособие для вузов.-М. :
СТАНКИН, 2002.-82с.: ил.
19. Филиппович А.Ю. Исследование эффективности системы
оптического распознавания текстов // Интеллектуальные технологии и системы: сборник статей аспирантов и студентов / Под ред. Ю.Н.Филипповича Вып. 7.
20. Шаров А.Г. Технологии работы с текстовой и фактографической информацией. / // Интеллектуальные технологии и системы: сборник статей аспирантов и студентов. М.,2007. Словарь - справочник.