Тема: МОДЕЛЬ ФАБРИКИ МЕТАДАННЫХ ЦИФРОВЫХ МАТЕМАТИЧЕСКИХ БИБЛИОТЕК
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
2 Предварительные сведения 7
3 Цифровые математические библиотеки 8
3.1 EuDML 8
3.2 DBLP 9
3.3 Numdam 9
3.4 MathNet 10
3.5 Lobachevskii DML 11
3.6 Форматы представления метаданных для цифровых математических библиотек 11
3.6.1 EuDML 12
3.6.2 DBLP 12
3.6.3 AMSBib 13
3.7 Форматы цитирования 13
4 Классические формы публикаций 15
4.1 Проблемы экстракции метаданных классических форм публикаций 15
5 Новые формы публикаций 17
5.1 Основные проблемы экстракции метаданных новых форм публикаций 18
6 Фабрика метаданных 20
6.1 Основная структура 21
6.2 Экстракция первого уровня 21
6.2.1 Задачи связанные с экстракцией первого уровня ... 21
6.3 Верификация метаданных 22
6.3.1 Правила верификации 22
6.3.2 Правила остановки фабрики метаданных 23
6.4 Экстракция второго уровня 24
6.4.1 Задачи связанные с экстракцией второго уровня ... 24
6.5 Нормализация 25
6.6 Фабрика метаданных как инструмент пользователя цифровой математической библиотеки 25
7 Реализация фабрики метаданных 26
7.1 Экстракция с MathNet 26
7.1.1 Цель 26
7.1.2 Реализация 27
7.1.3 Итог 29
7.2 Нормализация в формате цитирования 31
7.2.1 Цель 31
7.2.2 Реализация 31
7.2.3 Итог 31
7.3 Нормализация метаданных из формата представления OJS в
формат DBLP 33
7.3.1 Цель 33
7.3.2 Реализация 33
7.3.3 Итог 35
7.4 Пользовательское приложение 35
8 Заключение 37
Список литературы
📖 Введение
В связи с тем, что чаще всего пользователи не имеют свободного доступа к полному тексту публикаций, в математической среде была разработана концепция WDML(World Digital Mathematical Library) [2]. По концепции WDML для организации электронной библиотеки необходимо хранить основные метаданные цифровых документов. Таким образом, система цифровых математических библиотек позволяет дать ознакомительную информацию о статье, так как одним из видов метаданных является аннотация статьи.
По концепции WDML цифровые математические библиотеки должны обмениваться друг с другом информацией о публикациях, что позволит создать всеобъемлющую собрание математических знаний.
Организация цифровой математической библиотеки сопряжена с проблемой сбора метаданных [3], [4]. Подготовка метаданных без автоматизации процесса сбора информации нерациональна из-за большого объема существенных метаданных. Одним из вариантов решения данной проблемы является создание программного комплекса, который может осуществить автоматическую подготовку метаданных для цифровой математической библиотеки. Таким комплексом является фабрика метаданных. Фабрика метаданных - это программный комплекс, позволяющий экстрагировать, дополнять и нормализовать метаданные из различных источников согласно выбранному заранее виду [5].
Целью работы является построение модели фабрики метаданных, а также реализация методов фабрики метаданных [6].
В первой главе приводятся предварительные сведения по имеющимся в работе терминам.
Во второй главе приводится описание цифровых математических библиотек. Приведены описания таких цифровых математических библиотек как EuDML, DBLP, MathNet, Numdam, Lobachevskii DML, приведены схемы метаданных данных библиотек, некоторые форматы библиографического цитирования. В этой главе приведены некоторые системы управления библиографическим контентом.
В третьей главе описаны классические формы математических публикаций. К ним можно отнести: стать, монографии, книги. Рассмотрены основные проблемы извлечения и представления метаданных классических форм математических публикаций цифровой и до цифровой эпохи.
В четвертой главе рассмотрены основные формы новых публикаций. Это такие публикации как: блоги, форумы, видеоконтент, живые публикации. Рассмотрены основные проблемы экстракции метаданных из данных видов публикаций..
В пятой главе описана модель фабрики метаданных, описаны этапы из которых она состоит, задачи связанные с данной моделью на каждом вопросе. Представлены правила формирования правил верификации. Приведены основные преимущества фабрики метаданных. Также обсуждаются решенные и нерешенные задачи, включенные в фабрику метаданных.
В шестой главе приведены методы, реализованные в процессе реализации фабрики метаданных. К таким методам относятся: метод экстракции метаданных с веб-страниц, метод нормализации метаданных в другие форматы
✅ Заключение
Представлена модель фабрики метаданных как инструмента автоматического сбора и представления метаданных математических документов. Реализованы алгоритмы автоматического извлечения, нормализации и верификации метаданных.
Дальнейшее исследование предполагает добавление новых методов и возможностей в фабрику метаданных. Данная работа актуальна в связи с переходом научной активности в Интернет-пространство.



