Тип работы:
Предмет:
Язык работы:


МОДЕЛЬ ФАБРИКИ МЕТАДАННЫХ ЦИФРОВЫХ МАТЕМАТИЧЕСКИХ БИБЛИОТЕК

Работа №42380

Тип работы

Магистерская диссертация

Предмет

математика

Объем работы74
Год сдачи2019
Стоимость4900 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
256
Не подходит работа?

Узнай цену на написание


Введение 4
2 Предварительные сведения 7
3 Цифровые математические библиотеки 8
3.1 EuDML 8
3.2 DBLP 9
3.3 Numdam 9
3.4 MathNet 10
3.5 Lobachevskii DML 11
3.6 Форматы представления метаданных для цифровых математических библиотек 11
3.6.1 EuDML 12
3.6.2 DBLP 12
3.6.3 AMSBib 13
3.7 Форматы цитирования 13
4 Классические формы публикаций 15
4.1 Проблемы экстракции метаданных классических форм публикаций 15
5 Новые формы публикаций 17
5.1 Основные проблемы экстракции метаданных новых форм публикаций 18
6 Фабрика метаданных 20
6.1 Основная структура 21
6.2 Экстракция первого уровня 21
6.2.1 Задачи связанные с экстракцией первого уровня ... 21
6.3 Верификация метаданных 22
6.3.1 Правила верификации 22
6.3.2 Правила остановки фабрики метаданных 23
6.4 Экстракция второго уровня 24
6.4.1 Задачи связанные с экстракцией второго уровня ... 24
6.5 Нормализация 25
6.6 Фабрика метаданных как инструмент пользователя цифровой математической библиотеки 25
7 Реализация фабрики метаданных 26
7.1 Экстракция с MathNet 26
7.1.1 Цель 26
7.1.2 Реализация 27
7.1.3 Итог 29
7.2 Нормализация в формате цитирования 31
7.2.1 Цель 31
7.2.2 Реализация 31
7.2.3 Итог 31
7.3 Нормализация метаданных из формата представления OJS в
формат DBLP 33
7.3.1 Цель 33
7.3.2 Реализация 33
7.3.3 Итог 35
7.4 Пользовательское приложение 35
8 Заключение 37
Список литературы


В настоящее время в научной сфере активно растет роль информационных технологий. Для того, чтобы по максимуму задействовать их потенциал и идти в ногу со временем, современное научное сообщество постепенно переходит в сеть Интернет. С этой целью была разработана концепция открытого знания (Open Science) [1]. Концепция открытого знания гласит о том, что знание должно быть открытыми и доступным. Одним из основных источников научного знания являются специализированные научные издания. Однако, из-за авторских прав у многих журналов недоступны полные тексты статей. Сборники научных публикаций в сети интернет лежат в специализированных научных библиотеках и хранилищах. Система электронных библиотек является важной частью электронного образования.
В связи с тем, что чаще всего пользователи не имеют свободного доступа к полному тексту публикаций, в математической среде была разработана концепция WDML(World Digital Mathematical Library) [2]. По концепции WDML для организации электронной библиотеки необходимо хранить основные метаданные цифровых документов. Таким образом, система цифровых математических библиотек позволяет дать ознакомительную информацию о статье, так как одним из видов метаданных является аннотация статьи.
По концепции WDML цифровые математические библиотеки должны обмениваться друг с другом информацией о публикациях, что позволит создать всеобъемлющую собрание математических знаний.
Организация цифровой математической библиотеки сопряжена с проблемой сбора метаданных [3], [4]. Подготовка метаданных без автоматизации процесса сбора информации нерациональна из-за большого объема существенных метаданных. Одним из вариантов решения данной проблемы является создание программного комплекса, который может осуществить автоматическую подготовку метаданных для цифровой математической библиотеки. Таким комплексом является фабрика метаданных. Фабрика метаданных - это программный комплекс, позволяющий экстрагировать, дополнять и нормализовать метаданные из различных источников согласно выбранному заранее виду [5].
Целью работы является построение модели фабрики метаданных, а также реализация методов фабрики метаданных [6].
В первой главе приводятся предварительные сведения по имеющимся в работе терминам.
Во второй главе приводится описание цифровых математических библиотек. Приведены описания таких цифровых математических библиотек как EuDML, DBLP, MathNet, Numdam, Lobachevskii DML, приведены схемы метаданных данных библиотек, некоторые форматы библиографического цитирования. В этой главе приведены некоторые системы управления библиографическим контентом.
В третьей главе описаны классические формы математических публикаций. К ним можно отнести: стать, монографии, книги. Рассмотрены основные проблемы извлечения и представления метаданных классических форм математических публикаций цифровой и до цифровой эпохи.
В четвертой главе рассмотрены основные формы новых публикаций. Это такие публикации как: блоги, форумы, видеоконтент, живые публикации. Рассмотрены основные проблемы экстракции метаданных из данных видов публикаций..
В пятой главе описана модель фабрики метаданных, описаны этапы из которых она состоит, задачи связанные с данной моделью на каждом вопросе. Представлены правила формирования правил верификации. Приведены основные преимущества фабрики метаданных. Также обсуждаются решенные и нерешенные задачи, включенные в фабрику метаданных.
В шестой главе приведены методы, реализованные в процессе реализации фабрики метаданных. К таким методам относятся: метод экстракции метаданных с веб-страниц, метод нормализации метаданных в другие форматы

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В настоящей работе были рассмотрены вопросы, связанные с проблемами интеллектуалвной обработки математических текстов, извлечения метаданных из математических документов, исследованы различные форматы представления метаданных цифровых математических библиотек. Дан обзор различных подходов к созданию цифровой математической библиотеки. Был проведен сравнительный анализ положительных и отрицательных сторон классических и новых форм научных публикаций.
Представлена модель фабрики метаданных как инструмента автоматического сбора и представления метаданных математических документов. Реализованы алгоритмы автоматического извлечения, нормализации и верификации метаданных.
Дальнейшее исследование предполагает добавление новых методов и возможностей в фабрику метаданных. Данная работа актуальна в связи с переходом научной активности в Интернет-пространство.



[1] Bartling S., Friesike S. Towards Another Scientific Revolution // In: Bartling S., Friesike S. (Eds) Opening Science. The Evolving Guide on How the Internet is Changing Research, Collaboration and Scholarly Publishing. Springer International Publishing, 2014. - P. 3-15. - https://doi.org/10.1007/978-3-319-00026-8_l.
[2] Ion P. D. F., Watt S. M. The Global Digital Mathematics
Library and the International Mathematical Knowledge Trust // ICM 2017: Intelligent Computer Mathematics, 2017. Lecture Notes in Artificial Intelligence, 10383, Springer, 2017. - P. 56-69. - https://doi.org/10.1007/978-3-319-62075-6_5.
[3] Elizarov A. M., Kirillovich A. V., Lipachev E. K., Nevzorova O. A. Mathematical Knowledge Management: Ontological Models and Digital Technology // CEUR Workshop Proceedings. - 2016. - Vol. 1752. - P. 44-50.
[4] Watt S. M. How to build a global digital mathematics
library / / 18th Int. Symposium on Symbolic and Numeric
Algorithms for Scientific Computing, SYNASC 2016. - P. 37-40. - http://synasc.ro/2016/invited-speakers-2/ stephan-watt/index.html.
[5] Developing a 21st Century Global Library for Mathematics Research.- Washington: The National Academies Press, 2014. - 131 p.
[6] Bouche T., Labbe O. The New Numdam platform // CICM 2017: Intelligent Computer Mathematics, 2017. - P. 70-82. - https://zenodo.org/record/581405/hit's DML2017.pdf.
[7] Гафурова П. О. Форумы в системе научных коммуникаций
/ / Международная научно-практическая конференция «Информационные технологии в образовании и науке» ИТОН-2018, 2018. - С. 102-103.
[8] Gafurova P. О., Lipachev E.K. Methods for the Semantic Representation of Mathematical Collections of Lobachevskii Digital Mathematics Library // Tr. Math. Center of N.I.Lobachevskii, 2018. - Vol. 56. - P. 90-93.
[9] Гафурова П. О., Елизаров A. M.. Липачцв Е. К. Методы нормализации электронных математических коллекций // УЧЕНЫЕ ЗАПИСКИ ИНСТИТУТА СОЦИАЛЬНЫХ И ГУМАНИТАРНЫХ ЗНАНИЙ 1(17), 2019 - С.141-148.
[10] Gartner R. Metadata. Shaping Knowledge from Antiquity to the Semantic Web. - Basel: Springer International Publishing, 2016.
[11] Елизаров A. M., Липачев E. К., Малахалвцев M. А. Веб-технологии для математика: основы MathML Практическое руководство. М.: ФИЗМАТЛИТ, 2010.
[12] Bouche Т. Scripta Manent: The digital mathematics library as of 2014 // Not. Am. Math. Soc. - 2014. - V. 61 (9). - P. 1085-1088. - http: / / www.ams.org/notices /201409/ rnoti-pl085.pdf.
[13] Elizarov A. M, Khaidarov S. M., Lipachev E. K., Zaitseva N. V, Zuev D. S. Services for formation of digital documents metadata in the formats of international science-based databases // CEUR Workshop Proceedings. - 2018. - Vol. 2260. - P. 175-185.
[14] Elizarov A. M., Lipachev E. K., Zuev D. S. Digital Mathematical Libraries: Overview of Implementations and Content Management Services // CEUR Workshop Proceedings. - 2017. - Vol. 2022. - P. 317-325.
[15] Bouche T., Rakosnik J. Report on the EuDML External Cooperation Model // In: Kaiser K., Krantz S.G.,
Wegner B. (Eds.) Topics and Issues in Electronic Publishing, JMM, Special Session, San Diego, 2013. - P. 99-108.
https://www.emis.de/proceedings/TIEP2013/07bouche_rakosnik.pdf.
[16] Bouche T. Reviving the free public scientific library in the
digital age? the EuDML project // In: Kaiser K., Krantz S.G., Wegner B. (Eds.) Topics and Issues in Electronic Publishing
JMM/AMS Special Session. FIZ Karlsruhe, 2013. - P. 57-80. -
https://www.emis.de/proceedings/TIEP2013/05bouche.pdf.
[17] Ackermann M. R., Reitz F. Homonym Detection in Curated
Bibliographies: Learning from dblpYs Experience // Int. Conf. on Theory and Practice of Digital Libraries, 2018. - P. 59-65.
[18] Chebukov D. E., Izaak A. D., Misyurina O. G., Pupyrev Yu. A., Zhizhchenko A. B. Math-Net.Ru as a digital archive of the Russian mathematical knowledge from the XIX century to today // Intelligent Computer Mathematics, Lecture Notes in Comput. Sci., 7961, Springer, 2013. - P. 344-348. - https://doi.org/10.1007/978-3-642-39320-4_26
[19] Chebukov D., Izaak A., Misyurina O., Pupyrev Y. Math-Net.Ru Video Library: creating a collection of scientific talks // Lecture Notes in Comput. Sci., 9725, Springer, 2016. - P. 447-450. - https://doi.org/10.1007/978-3-319-42432-3_57.
[20] Елизаров A. M., Липачев E. К. Семантические методы и инструменты электронной математической библиотеки Lobachevskii-DML / / Научный сервис в сети Интернет: труды XIX Всероссийской научной конференции. Москва: ИПМ им. М. В. Келдыша, 2017. - С. 130-136.
[21] Elizarov А. М., Lipachev Е. К. Lobachevskii DML: Towards a Semantic Digital Mathematical Library of Kazan University // CEUR Workshop Proceedings. - 2017. - Vol. 2022. - P. 326-333.
[22] Jost M., Bouche T., Goutorbe C., Jorda J. P. D3.2: The EuDML metadata schema. - http://www.mathdoc.fr/publis/d3.2-vL6.pdf.
[23] Journal Article Tag Suite. NISO JATS VI.0. https://jats.nlm.nih.gov/LO/.
[24] Elizarov A. M., Khaydarov Sh. M., Lipachev E. K. Automated System of Services for Processing of Large Collections of Scientific Documents // CEUR Workshop Proceedings. - 2016. - Vol. 1752. - P. 58-64.
[25] Elizarov A. M., Lipachev E. K., Nevzorova O. A., Solov’ev V. D. Methods and means for semantic structuring of electronic mathematical documents // Doklady Mathematics. - 2014. - Vol. 90 (1). - P. 521-524. - https://doi.org/10.1134/S1064562414050275.
[26] David C., Ginev D., Kohlhase M., Corneli J. eMath 3.0: building blocks for a social and semantic Web for online mathematics & elearning // 1st International Workshop on Mathematics and ICT: Education, Research and Applications, 2010. - http://civile.utcb.ro/malog/wp.pdf.
[27] Кириллович А. В. Информационная архитектура блогов // Электронные библиотеки. Ц- 2017. Ц- Т. 20 (2). - С. 147-162.
[28] Елизаров А. М., Кириллович А. В., Липачев Е. К. Блоги в системе научных коммуникаций // Ученые записки ИСГЗ. - 2017. - el (15).
- С. 209-214.
[29] Heller L., The R., Bartling S. Dynamic Publication Formats
and Collaborative Authoring // In: Bartling S., Friesike S.
(Eds.) Opening Science. The Evolving Guide on How the Internet is Changing Research, Collaboration and Scholarly Publishing. Springer International Publishing, 2014. - P. 191-211.
- https://doi.org/10.1007/978-3-319-00026-8_13.
[30] Puschmann C. (Micro)Blogging Science? Notes on Potentials and Constraints of New Forms of Scholarly Communication // In: Bartling S., Friesike S. (Eds.) Opening Science. The Evolving Guide on How the Internet is Changing Research, Collaboration and Scholarly Publishing. Springer International Publishing, 2014. - P. 89-106. https://doi.org/10.1007/978-3-319-00026-8_6.
[31] Excerpts from Video Documentary Towards a Semantic Language of Mathematics, Full Form, https:/ www.youtube.com wateh?v HOtpYlJVFMckfeature youtu.be: https://youtu.be/psSyMlzp82k.
[32] Elizarov A. M., Khaydarov Sh. M., Lipachev E. K. Scientific Documents Ontologies for Semantic Representation of Digital Libraries // Proc. of the 2nd Russia and Pacific Conf. on Computer Technology and Applications, 2017. - P. 1-5.- https://doi.org/10.1109/RPC.2017.8168064.
[33] Elizarov A. M., Kirillovich A. V., Lipachev E. K., Nevzorova O. A. Digital Ecosystem OntoMath: Mathematical Knowledge Analytics and Management // XVIII Int. Conf. on Data Analytics and Management in Data Intensive Domains (DAMDID/RCDL 2016). Communications in Computer and Information Science, vol. 706, Cham: Springer, 2017. - P. 33-46. - https://doi.org/10.1007/978-3-319-57135-5_3.
[34] Elizarov A. M., Kirillovich A. V., Lipachev E. K.,
Nevzorova O. A. Semantic Formula Search in Digital Mathematical Libraries // Proc. of the 2nd Russia and Pacific Conf. on Computer Technology and Applications, 2017. - P. 39 43.
https://doi.org/10.1109/RPC.2017.8168063.
[35] Elizarov A. M., Kirillovich A. V., Lipachev E. K., Nevzorova O. A., Solovyev V. D., Zhiltsov N. G. Mathematical knowledge representation: semantic models and formalisms / / Lobachevskii Journal of Mathematics. - 2014. - Vol. 35 (4). - P. 348-354. - https://doi.org/10.1134/S1995080214040143.
[36] Elizarov A. M., Kirillovich A. V., Lipachev E. K., Zhizhchenko A. B., Zhil’tsov N. G. Mathematical Knowledge Ontologies and Recommender Systems for Collections of Documents in Physics and Mathematics // Doklady Mathematics. - 2016. - Vol. 93 (2). - P. 231-233. -https://doi.org/10.1134/S1064562416020174.
[37] MacGregor J., Stranack K., Willinsky J. The Public Knowledge Project: Open Source Tools for Open Access to Scholarly Communication //In: Bartling S., Friesike S. (Eds.) Opening Science. The Evolving Guide on How the Internet is Changing Research, Collaboration and Scholarly Publishing. Springer International Publishing, 2014. - P. 165-178. https://doi.org/10.1007/978-3-319-00026-8_7.
[38] Nevzorova O., Zhiltsov N., Kirillovich A., Lipachev E. OntoMathPRO Ontology: A Linked Data Hub for Mathematics // Proc. of the 5th Int. Conf. on Knowledge Engineering and Semantic Web (KESW 2014). Communications in Computer and Information Science, vol. 468 (P. Klinov, D. Mouromstev, eds.), Cham: Springer, 2014. - P. 105-119. - https://doi.org/10.1007/978-3-319-11716-4_9.


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ