Глава 1. Постановка задачи
Глава 2. Объекты предметной области 7
2.1. Валидация 7
2.2. Семантическая валидация 7
2.3. Метаданные 8
2.4. Извлечение метаданных 9
2.5. Регулярные выражения 11
2.6. OfficeOpenXML: генерация документа и сравнение по шаблону 13
Глава 3. Схема проверки (валидация) 17
3.1. Общая схема 17
3.2. Что такое шаблон 17
3.3. Структура статьи в терминах ИоСО 19
Глава 4. Общий алгоритм валидации 23
4.1. Алгоритм валидации для статьи 24
3.3. Алгоритм валидации для выпускной квалификационной работы 26
4.3. Проверка шрифтового оформления документа 27
Глава 5. Реализация алгоритма 29
Глава 6. Заключение 31
Список литературы 32
Приложение 36
В наш век информации, новых идей люди стремятся усовершенствовать технологии, свести к минимуму работу, требующую ручное вмешательство человека. С целью экономии времени и сил создаются все новые и новые способы облегчения и ускорения технического процесса. Так, например, в нашем университете была создана цифровая математическая библиотека [1]. В основу была положена идея оцифровать математические документы, тем самым, сделать доступными базу информации.
Любая система, в частности цифровая библиотека, должна иметь четкую структуру и строгий порядок. Для пользователя важно найти ту или иную информацию в кратчайшее время. Поиск осуществляется по разным полям, таким как название статьи, имя и фамилия автора, год издания и др. Для ускорения метода информационного поиска и для организованности самой системы необходимо следовать определенным требованиям, представленным в стандартах в соответствии с существующими правилами оформления.
Имея определенные требования по стандартам того или иного типа работы, необходимо придерживаться таковых. Однако исправление ошибок, часто требует кропотливости и трату времени. Например, при обработке одной текстовой страницы выявляются примерно 10 ошибок типографического характера (ссылки на литературу и т.д.). Для современного человека последнее играет важную роль. На смену корректорам в частности в век информационных технологий пришли специальные методы валидации, позволяющие проверить документ/ веб-сайт на соответствие тем или иным требованиям.
В изложенной работе рассматривается такая задача, как автоматическая проверка документов соответствию правилам, заданным определенным шаблонам. В качестве шаблонов могут быть правила оформления статей в журналах (например, заданных стилевыми файлами). Также шаблоном может быть образец выпускной работы (бакалаврской, магистерской и т.д.).
Формализованная постановка задачи содержится в следующей главе.
Инструментом для решения данной задачи представляется сервис обработки научных публикаций и проверки их на выполнение требований ГОСТа, реализованный на языке C#.
В первой главе описаны цели и задачи дипломной работы, а также сформулирована математическая постановка задачи.
Во второй главе дан обзор объектов предметной деятельности, пояснения ключевым словам, часто встречающимся в тексте.
В данной работе:
• Рассмотрены основные требования ГОСТа по оформлению ВКР и статей
• Изучены объекты предметной деятельности
• Разобрана схема валидации цифровых математических документов
• Представлен алгоритм валидации
• Проведен эксперимент работы алгоритма
• Реализована программа на языке С#