Глава 1. Постановка задачи
Глава 2. Объекты предметной области 7
2.1. Валидация 7
2.2. Семантическая валидация 7
2.3. Метаданные 8
2.4. Извлечение метаданных 9
2.5. Регулярные выражения 11
2.6. OfficeOpenXML: генерация документа и сравнение по шаблону 13
Глава 3. Схема проверки (валидация) 17
3.1. Общая схема 17
3.2. Что такое шаблон 17
3.3. Структура статьи в терминах ИоСО 19
Глава 4. Общий алгоритм валидации 23
4.1. Алгоритм валидации для статьи 24
3.3. Алгоритм валидации для выпускной квалификационной работы 26
4.3. Проверка шрифтового оформления документа 27
Глава 5. Реализация алгоритма 29
Глава 6. Заключение 31
Список литературы 32
Приложение 36
В наш век информации, новых идей люди стремятся усовершенствовать технологии, свести к минимуму работу, требующую ручное вмешательство человека. С целью экономии времени и сил создаются все новые и новые способы облегчения и ускорения технического процесса. Так, например, в нашем университете была создана цифровая математическая библиотека [1]. В основу была положена идея оцифровать математические документы, тем самым, сделать доступными базу информации.
Любая система, в частности цифровая библиотека, должна иметь четкую структуру и строгий порядок. Для пользователя важно найти ту или иную информацию в кратчайшее время. Поиск осуществляется по разным полям, таким как название статьи, имя и фамилия автора, год издания и др. Для ускорения метода информационного поиска и для организованности самой системы необходимо следовать определенным требованиям, представленным в стандартах в соответствии с существующими правилами оформления.
Имея определенные требования по стандартам того или иного типа работы, необходимо придерживаться таковых. Однако исправление ошибок, часто требует кропотливости и трату времени. Например, при обработке одной текстовой страницы выявляются примерно 10 ошибок типографического характера (ссылки на литературу и т.д.). Для современного человека последнее играет важную роль. На смену корректорам в частности в век информационных технологий пришли специальные методы валидации, позволяющие проверить документ/ веб-сайт на соответствие тем или иным требованиям.
В изложенной работе рассматривается такая задача, как автоматическая проверка документов соответствию правилам, заданным определенным шаблонам. В качестве шаблонов могут быть правила оформления статей в журналах (например, заданных стилевыми файлами). Также шаблоном может быть образец выпускной работы (бакалаврской, магистерской и т.д.).
Формализованная постановка задачи содержится в следующей главе.
Инструментом для решения данной задачи представляется сервис обработки научных публикаций и проверки их на выполнение требований ГОСТа, реализованный на языке C#.
В первой главе описаны цели и задачи дипломной работы, а также сформулирована математическая постановка задачи.
Во второй главе дан обзор объектов предметной деятельности, пояснения ключевым словам, часто встречающимся в тексте.
В данной работе:
• Рассмотрены основные требования ГОСТа по оформлению ВКР и статей
• Изучены объекты предметной деятельности
• Разобрана схема валидации цифровых математических документов
• Представлен алгоритм валидации
• Проведен эксперимент работы алгоритма
• Реализована программа на языке С#
1. Цифровая математическая библиотека [Электронный ресурс] Режим доступа: http://lobachevskii-dml , свободный
2. Консорциум www.w3c.org
3. Preparation of the article/contents.- URL: http: //lj m.ksu.ru/preparation.html
4. Кириллов А. В. Математическое моделирование и программная реализация семантического преобразования поисковых запросов : диссертация ... кандидата технических наук : 05.13.18 / Кириллов Антон Владимирович; [Место защиты: Нац. исслед. ун-т "Высш. шк. экономики"].- Москва, 2012.¬251 с.: ил. РГБ ОД, 9 12-3/1016
5. Кристофер Д. Маннинг, Прабхакар Рагхаван, Хайнрих Шютце // Введение в информационный поиск // Издательский дом “Вильямс”, 2011
6. Scientific American [Электронный ресурс] URL: http: //www.scientificamerican. com/
7. Bagley P. Extension of Programming Language Concepts. Philadelphia: University City Science Center, November 1968
8. Wikipedia. Metadata. http://en.wikipedia.org/wiki/Metadata [Обращение: 2012¬12-06]
9. Mealy G.H. Another Look at Data. Proc. AFIPS’67, Fall Joint Computer Conference, p. 525-534. http://dl.acm.org/citation.cfm/idM465682 [Обращение: 2012-12-06]
10. Grotschel M., Lugger J. Scientific Information System and Metadata. Konrad- Zuse-Zentrum fur Informationstechnik, Berlin.
http://www.zib.de/groetschel/pubnew/paper/groetschelluegger 1999.pdf
11. Metadata Standards and Applications. Introduc-tion: Background, Goals, and Course Outline. ALCTS.
http: //www.loc.gov/catworkshop/courses/metadatastandards/pdf/MSA Instructor Manual.pdf
12. The Making of America II. http://sunsite3.berkeley.edu/MOA2/
13. Uniform Resource Identifier (URI): Generic Syntax.
http: //tool s. ietf.org/html/rfc3986
14. Когаловский М.Р., Метаданные в компьютерных системах/М.Р.
Когаловский // Программирование, МАИК «Наука/Интерпериодика», 2013. — Т. 39, № 4. — с. 28-46.
15. Trust J.P.G., Introduction to Metadata 3.0 / J.P.G. Trust // Getty Research Institute, Los Angeles Getty Publications, 2008. — 176 p
16. Francesco R.,Horacio S. Dr. Inventor Framework: Extracting Structured Information from Scientic Publications // TALN Research Group, Universitat Pompeu Fabra, 2015. -p. 132-149.
17. Greenberg J. Metadata Extraction and Harvesting: A Comparison of Two Automatic Metadata Generation Applications// Journal of Internet Cataloging, 2004. -p. 59-82.
18. Peng F., McCallum A. Accurate Information extraction from research papers using conditional random elds //Inf. Process. Manage, 2006. -p. 963-979.
19. Halshofer B., Klas W. A Survey of Techniques for Achieving Metadata Interoperability //ACM Computing Surveys, Vol. 42, No. 2, Article 7, February 2010. -p. 121-133.
20. Jeusfeld M.A. Metadata. In: Encyclopedia of Database Systems, Springer, 2009. - 201 p.
21. Елизаров А.М., Веб-технологии для математика: основы MathML. Практическое руководство. / А.М. Елизаров, Е.К. Липачев, М.А. Малахальцев // М.: ФИЗМАТЛИТ, 2010. — 192 с.
22. Гойвертс Я., Левитан С., Регулярные выражения. Сборник рецептов. / Пер. с англ. - СПб.: Символ-Плюс, 2010. - C .608.
23. Фридл Д. Регулярные выражения / Пер. с англ. - СПБ.: Символ-Плюс, 2008.-608с.,ил.
24. Воутер В.В.Open XML -Кратко и доступно. OpenXMLTechnicalEvange-list, Microsoft, 2007. 101 с.
25.Standard ECMA-376: Office Open XML File Рогша18[Электронный
ресурс] URL: http://www.ecmaintemational.org/publications/standards/Ecma-
376.htm.
26. Вставить статью Розниченко Концепт модель науч публикации 2012
27. Сильвио Перони Семантик Веб текнологис оттуда картинку вставить
28. Митрофанова О.А., Онтологии как системы хранения знаний / Н.С.
Константинова, О.А. Митрофанова // Всероссийский конкурсный отбор обзорно-аналитических статей по приоритетному направлению «Информационно-телекоммуникационные системы», 2008. — 54 с.
29. Ruiz-Iniesta Almudena and Corcho Oscar «A review of ontologies for describing scholarly and scientic documents»
30. Corcho O. Ontology based document annotation: trends and open research problems //Intern. Journal of Metadata, Semantics and Ontologies, 2006. -p. 26¬45
31. Ахметов Д. Ю., Елизаров А. М., Липачёв Е. К. Автоматизация
редакционных процессов в информационной системе управления электронными научными журналами./ Russian Digital Libraries Journal. 2015. V. 18. No 1-2
32. Todeschini R., Baccini A. Handbook of Bibliometric Indicators: Quantitative Tools for Studying and Evaluating Research. Wiley-VCH Verlag, 2016.
33. Гасфилд Д., Строки, деревья и последовательности в алгорит- мах: Информатика и вычислительная биология / Д. Гасфилд // Пер. с англ. И.В. Романовского. — СПб.: Невский Диалект; БХВ- Петербург, 2003. — 654 с.
34. Албахари Дж., С# 6.0. Справочник. Полное описание языка, 6-е изд. / Б. Албахари, Дж. Албахари // Пер. с англ. — М.: ООО «И.Д. Вильямс», 2016. — 1040 с.
35. Виссер Дж., Разработка обслуживаемых программ на языке C# / Дж. Виссер, Г. Винхолдс, П. ван Экк, Р. ван дер Лик, С. Ригаль // пер. с англ. Р.Н. Рагимова. — М.: ДМК Пресс, 2017. — 192 с.:
36. Yu L., A Developer’s Guide to the Semantic Web / L. Yu // SpringerVerlag, 2014. — 841 p