Тема: РАСПОЗНАВАНИЕ РУКОПИСНОЙ ИНФОРМАЦИИ. ДИАГРАММЫ OWL
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1. Постановка задачи 2
1.1. Существующие методики распознавания текста 8
1.2. Схемы функционирования систем распознавания 13
1.3. Язык Сетевых онтологий OWL 21
2. Изучение метода распознавания 25
2.1. Анализ фреймворков распознавания информации 25
2.2. Фреймовая OWL-модель представления текста 30
2.3. Разработка приложения распознавания информации 41
2.3.1. Структура программного приложения 42
2.3.2. Алгоритмы работы приложения 46
2.3.3. Тестирование и анализ результатов 55
Заключение 59
Список Литературы
Приложение
📖 Введение
В связи с повсеместным распространением технологий обработки и хранения информации в электронном виде, перед создателями программного обеспечения возник широкий комплекс задач, связанных с распознаванием образов: от распознавания рисунка радужной оболочки человеческого глаза, дактилоскопических линий и лиц, автомобильных номеров до распознавания речи и печатных или рукописных документов.
Темой исследования является решение задачи автоматизированного перевода рукописных символов и, в перспективе, текстов в электронное текстовое представление. В настоящее время в действующих библиотеках накоплено большое количество полезных рукописных и печатных документов различного прикладного применения.
Для обеспечения возможности компьютерного анализа и электронного переиздания таких документов требуется их перевод в электронный вид.
Значительный объем задачи, а также весьма узкий круг специалистов, обладающих знаниями в данной сфере, порождают необходимость в автоматизации указанного процесса.
Необходимость исследования зачастую связана со спецификой используемого в рукописях языка и стиля письма, а также качеством входных изображений.
Эти факторы затрудняют использование применительно произвольным рукописным документам существующих средств распознавания текста, ориентированных на различные языки и способы представления текстовой информации на бумажных носителях.
Актуальность исследования обусловлена необходимостью перевода рукописных документов в электронный вид с возможностью последующего автоматизированного анализа. Большую роль зачастую здесь играет специфика используемых в документах языков, круг пользователей которого может охватывать различные направления деятельности [18].
Целью исследования является изучение, анализ и адаптация методик автоматизированного перевода текстов из растровых изображений в вид электронных текстов и основанного на этой методике программного продукта.
Назначением подобного продукта является сокращение времени получения электронных текстовых документов за счёт замены этапа ручного ввода автоматизированным распознаванием. Продукт предназначается для специалистов, исследующих и обрабатывающих рукописные документы различного назначения вида. Также возможно использование продукта при подготовке разнообразных мультимедийных электронных изданий указанных рукописных и печатных документов [19].
Задачи исследования:
• изучение особенностей распознавания рукописных и печатных документов;
• анализ существующих методов распознавания рукописных и печатных текстов;
• построение онтологических OWL-диаграмм, описывающих проблемную область;
• разработка алгоритмов анализа изображений;
• проектирование и реализация программного продукта.
Дипломная работа состоит из введения, двух глав и заключения.
✅ Заключение
Темой исследования является решение задачи автоматизированного перевода рукописных символов и, в перспективе, текстов в электронное текстовое представление. В настоящее время в действующих библиотеках накоплено большое количество полезных рукописных и печатных документов различного прикладного применения.
Необходимость исследования зачастую связана со спецификой используемого в рукописях языка и стиля письма, а также качеством входных изображений.
Эти факторы затрудняют использование применительно к произвольным рукописным документам существующих средств распознавания текста, ориентированных на различные языки и способы представления текстовой информации на бумажных носителях.
Актуальность исследования обусловлена необходимостью перевода рукописных документов в электронный вид с возможностью последующего автоматизированного анализа.
Целью исследования в рамках работы являлось изучение, анализ и адаптация методик автоматизированного перевода текстов из растровых изображений в вид электронных текстов и основанного на этой методике программного продукта.
Назначением подобного продукта является сокращение времени получения электронных текстовых документов за счёт замены этапа ручного ввода автоматизированным распознаванием.
Продукт предназначается для специалистов, исследующих и обрабатывающих рукописные документы различного назначения вида. В рамках произведенного исследования были решены следующие задачи:
• изучены и проанализированы особенности методов
распознавания рукописных и печатных документов;
• были построены группы онтологических OWL-диаграмм,
описывающих проблемную область;
• была произведена разработка алгоритмов анализа изображений;
• выполнено проектирование и реализация программного продукта с последующим тестированием и анализом.
Классификация методов распознавания производится по ряду характерных для данного процесса признаков:
• По способу описания распознаваемых объектов;
• По процедуре предъявления выборок обучающих множеств;
• По виду правила классификации;
• По способу ввода распознаваемых объектов:
Основным видом и методикой распознавания текста является сегментация и нормализация текста. На этом этапе текст разделяется, или сегментируется, на удобные для анализа составные части.
Онтология описывает понятия, используемые для того, чтобы описать область знаний. Онтология включает машиночитаемые определения основных понятий предметной области и отношения между ними. Они кодируют знания из предметной области и знания из смежных предметных областей. В этом смысле они делают знания возможными для повторного использования.
OWL может представлять комплексную обогащенную информацию о классах индивидов и их свойствах. OWL — это логический язык, где каждая конструкция имеет строго определенный смысл, при этом совокупность таких конструкций позволяет воссоздать некоторую информацию.
Каждая конкретная фреймовая структура сохраняется в отдельном OWL-файле, который может быть, кроме всего, в дальнейшем использован в процессе распознавания, как база знаний.
Подводя итог проведённому сравнению, кратко перечислим особенности рукописного текста:
• Отсутствие ровных строк;
• Разнообразие начертаний одинаковых букв;
• Возможные дополнительные декоративные элементы в буквах;
• Соединение и пересечение букв.
Как следует из приведённых выше особенностей рукописного текста, система распознавания находится в ситуации, когда вариативность начертания распознаваемых символов велика, а их выделение из общего изображения может быть затруднено.
В соответствии с исследуемым методом распознавания, в качестве ключевых понятий базы знаний следует выделить «слово» и «букву» как являющиеся объектами распознавания. Итак, база знаний представляется состоящей из множества фреймов, обозначающих конкретные слова, и множества фреймов, обозначающих буквы. Каждое слово состоит из некоторого количества букв, и все слова используют буквы из одного множества - алфавита языка. Таким образом, фрейм слова содержит набор субфреймов, описывающих вхождения составляющих его букв и связь между ними.
В рамках работы было приведено описание структуры базы знаний, которое подготовлено в виде группы OWL-диаграмм. Такие диаграммы разработаны в среде редактора Protege 4.3.0.
Именно с использованием подобного механизма была создана семантическая структурная OWL-схема процесса распознавания рукописного текста.
В рамках практической части настоящей работы выполнено создание программного приложения средствами среды программирования Delphi, демонстрирующих возможности ЭВМ по выполнению задачи распознавания рукописного текста.
В программе широко использованы стандартные ресурсы Windows, знакомые и привычные для пользователя, предусмотрены разнообразные управляющие элементы - кнопки, диалоги, предусмотрены всевозможные ярлычки подсказки.
Для работы программы необходим и достаточен компьютер, своими ресурсами поддерживающий корректную работу в 32-хразрядных версиях Windows.
Достижение цели осуществляется посредством комплекса задач:
1. При запуске программы на экран выводится диалоговое окно
Windows, на котором расположены, информационные и управляющие элементы, которые дают пользователю возможность понятного восприятия и работы с учебной программой.
2. Для выполнения поставленных заданием требований определены
следующие последовательно выполняющиеся независимые подзадачи:
• Организация внешнего вида программы;
• Настройка требуемых параметров;
• Ввод данных пользователем;
• Выполнение алгоритма распознавания текста;
• Получение и отображение результата
• Получение информации о программе
• Завершение работы приложения
Ввод в систему знаний о структуре букв происходит следующим образом. Эксперт самостоятельно выбирает букву, которую собирается описать. В специальной области экрана он рисует с помощью указателя «мыши» эту букву, «выводя» её линия за линией, тем самым определяя набор элементов.
Когда буква нарисована, эксперт подтверждает ввод и система начинает разбор введённого изображения. После того, как разобраны все элементы изображения, полученная информация сравнивается с шаблонной информацией и, далее, по процентному соотношению совпадений определяется наиболее подходящая буква или символ.
Одновременно, выводится список остальных возможных букв с соответствующими процентными значениями совпадений.
Таким образом, программное приложение позволяет оценить погрешность ввода и погрешность вычислений. Разработанная в рамках настоящей дипломной работы программа выполняет поставленную задачу.
Для оценки перспектив полноценного применения приложения необходимо проведение ряда тестов, вычисление и анализ погрешностей, которые объективно могут иметь место: ввиду нестабильности рукописного ввода исходного символа; ввиду разницы в контрольных фреймах алфавитных наборов; ввиду разницы в начертании шрифтов и различной толщине рисования тестовых символов.
Дальнейшие направления исследований возможны в области развития методов построения и поиска наиболее эффективных средств описания структурных эталонов, в том числе разработке процедур автоматического создания структурных эталонов.



