Тема: Система автоматизированного получения и анализа открытых данных культурного наследия
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1 Проблема работы с большими объемами культурных данных 6
1.1 Цифровые музеи и цифровые коллекции 6
1.2 Использование API для взаимодействия с большими объемами
культурных данных 8
1.3 Агрегатор культурного наследия России 9
1.4 Портал открытых данных Минкультуры России 10
2 Разработка программного решения для работы с культурными данными
Госкаталога 13
2.1 Идея создания программы 13
2.2 Модуль сбора данных программы SGAT 13
2.3 Модуль предобработки данных программы SGAT 18
2.4 Модуль визуализация данных программы SGAT 23
3 Примеры практического применения программы SGAT 30
3.1 Создание набора данных для обучения нейронной сети 30
3.2. Анализ пропусков в метаданных объектов Госкаталога 32
Заключение 36
Список использованных источников 37
📖 Введение
В нашей стране существует Государственный каталог Музейного фонда РФ, который является крупнейшим агрегатором культурного наследия России. На данный момент он включается в себя коллекцию, состоящую из 37 миллионов объектов. На сайте Госкаталога имеются возможности просмотра и поиска объектов культурного наследия по различным параметрам. Однако, существует ли доступный и автоматизированный способ получения набора данных объектов культурного наследия России для исследователей? В данной работе мы утверждаем, что использование данных из Госкаталога для проведения исследований сейчас не представляется возможным без создания программного кода, что существенно снижает процент исследований о культурном наследии России. Поэтому данная работа посвящена созданию программы для автоматизации процесса получения метаданных культурных объектов Госкаталога, а также их обработки и визуализации.
Актуальность работы обусловлена труднодоступностью и сложностью работы с метаданными культурных объектов Госкаталога для исследователей.
Объект исследования - цифровая коллекция объектов культурного наследия Государственного каталога музейного фонда Российской Федерации.
Предметом исследования являются технологии сбора, обработки и визуализации метаданных объектов культурного наследия Государственного каталога музейного фонда России
Цель настоящей работы - создать программу для автоматизированного сбора, обработки и визуализации культурных данных, а также показать примеры ее использования для исследований.
Задачи исследования:
- Изучить существующие подходы к организации данных в цифровых коллекциях;
- Провести анализ и оценку существующих методов получения данных из коллекции Государственного каталога Музейного фонда РФ;
- Разработать программное решение для автоматизированного получения, обработки и визуализации метаданных культурных объектов;
- Продемонстрировать на реальных примерах пользу созданного нами программного продукта.
Выпускная квалификационная работа состоит из введения, трёх глав, заключения, списка использованной литературы и приложения.
В первой главе, состоящей из четырех параграфов, были рассмотрены цифровые музеи и цифровые коллекции на примере двух крупных агрегаторов культурного наследия: Европеаны и Метрополитен музея. Была поднята проблема работы с большими объемами данных, а также были описаны преимущества решения этой проблемы с помощью применения технологии API. Далее были рассмотрены все возможные способы взаимодействия с культурными данными коллекции Государственного каталога Музейного фонда РФ. Изучив все недостатки этих способов взаимодействия с данными, было принято решение о создании собственного программного решения.
Во второй главе, состоящей из четырех параграфов, был определен необходимый набор функций в создаваемой программе. Далее были описаны все разработанные модули программы SGAT: модуль сбора данных, модуль предобработки данных, модуль визуализации данных. Кроме того, каждый модуль был протестирован на наборе данных Красноярского краевого краеведческого музея по запросу «Красноярск».
В третьей главе, состоящей из двух параграфов, были продемонстрированы два примера реального применения программы SGAT в разных областях. В первом примере рассматривается задача создания набора данных для обучения нейросети. Во втором примере рассматривается изучение пропусков и распределения культурных данных коллекции Госкаталога.
Заключение кратко излагает результаты исследования. В список литературы включены библиографические данные об источниках, использованных в работе.
✅ Заключение
Далее планируется улучшать алгоритмы обработки и визуализации, добавлять новые компоненты. Также программа SGAT является хорошим инструментом-фундаментом, с помощью которого мы планируем решить проблему стандартизации данных, пропусков данных, а также получать новые знания в сфере цифровых гуманитарных наук.
Программа опубликована и находится в открытом доступе на github, поэтому каждый исследователь, желающий работать с культурными данными Госкаталога, может беспрепятственно ей воспользоваться.



