Введение 3
1 Проблема пропусков и визуализация культурно значимых данных в
цифровых копиях 5
1.1 Литературный корпус как основа для исследования пропусков
культурных данных 6
1.2 Визуализация неопределенностей 6
1.3 Метод визуализации неопределенностей Оливии Вейн 8
1.4 Проблема неопределенности в гуманитарных науках 9
2 Культурно значимые данные в цифровых копиях книг Минусинской
общественной библиотеки 10
2.1 Минусинская общественная библиотека 11
2.2 Анализ стратифицированной выборки при помощи
агрегаторов 14
2.3 Метод визуализации пропусков культурно значимых данных
раздела «Книги для детского чтения» 27
3 Результаты исследования 29
3.1 Яндекс таблицы 29
3.2 Процентное соотношение «доступности» книг 30
3.3 Визуализация данных раздела
«Книги для детского чтения» 35
Заключение 40
Список использованных источников 41
Приложение А «Яндекс таблицы» 43
Минусинская общественная библиотека - культурно-образовательное учреждение, основанное в 1877 году. На основе анализа оцифрованных книг, представленных в каталоге библиотеки, можно выяснить, что интересовало сибирских читателей, какие идеи, люди и места были популярны в этой части мира далекой от культурных центров. Однако, действительно ли полученные цифровые копии книг станут основой цифрового анализа в гуманитарных науках? В этой работе я утверждаю, что доступных нам данных недостаточно для того, чтобы составить целостную историческую картину. Также данных не будет достаточно для того, чтобы определить, какие страны интересовали читателей, что они знали о мире.
Выпускная квалификационная работа посвящена пропускам культурно значимых данных среди цифровых копий книг Минусинской общественной библиотеки.
Достоверность результатов, полученных в ходе научного исследования, обусловлена использованием официальных ресурсов и источников.
Проблема исследовательской работы заключалась в том, что в записях каталога Минусинской общественной библиотеки были неполные данные об авторах книг. Это затрудняло поиск, а в некоторых случаях книги так и не удалось найти.
Объект исследования - цифровые копии книг из каталога Минусинской общественной библиотеки.
Предметом исследования являются пропуски культурно значимых данных среди копий книг из каталога Минусинской общественной библиотеки.
Цель настоящей работы - выявить пропуски культурно значимых данных среди цифровых копий книг из каталога Минусинской общественной библиотеки.
Задачи исследования:
- проанализировать стратифицированную выборку разделов библиотеки с помощью агрегаторов;
- выявить процентное соотношение категорий доступности в каждом из исследуемых разделов;
- визуализировать процентные соотношения и результаты;
- сравнить полученные результаты с результатами других исследований.
Выпускная квалификационная работа состоит из введения, трёх глав, заключения, списка использованной литературы и приложения.
Первая глава «Проблема пропусков и визуализация культурно значимых данных в цифровых копиях» кратко предоставляет информацию научных работ и диссертаций, которые были взяты за основу при работе над этой квалификационной работой...
Главным результатом этой работы является уникальный метод для обнаружения неопределенностей и неточностей в текстовом корпусе. Уникальным метод считается из-за применения визуализации для представления пропусков данных культурного характера среди художественной литературы. Методы визуализации неопределенностей Оливии Вейн и Стефана Янике применялись на археологические экспонаты и музыкальных исполнителей, а литература оставалась без внимания. Таким образом, взяв за основу их подход визуализации неопределенностей и приспособив под особенности изучения метаданных художественной литературы, удалось получить новый метод. Обнаружить неточности получилось при сравнении цифровых копий, имеющихся в агрегаторах, со списком физических книг из каталога Минусинской общественной библиотеки. Это дало нам возможность систематически и широко посмотреть на большой корпус текстов и создать новый подход. Он дополняет более узкий и глубокий анализ, указывая на ограничения в нем, а также этот подход указывает, где конкретно находятся пропуски данных.
Если говорить о конкретных результатах использования метода, то стоит упомянуть о том, что художественные произведения фиксируются в корпусе, а произведения научные, справочные и лингвистические пропадают. Таким образом, наши результаты наводят на мысль о том, что дальнейшее распространение нашего метода, корпуса и результатов дадут более подробное понимание работы с пропусками данных в научной, справочной или других жанрах художественных произведений.
Созданный в этой работе метод можно использовать при исследовании других сибирских и даже европейских библиотек. Еще одним направлением исследования может быть определение популярных тем и географических названий. Это позволит еще лучше понять, что читали и узнавали люди в XIX веке.