Введение 3
1 Проблема пропусков и визуализация культурно значимых данных в
цифровых копиях 5
1.1 Литературный корпус как основа для исследования пропусков
культурных данных 6
1.2 Визуализация неопределенностей 6
1.3 Метод визуализации неопределенностей Оливии Вейн 8
1.4 Проблема неопределенности в гуманитарных науках 9
2 Культурно значимые данные в цифровых копиях книг Минусинской
общественной библиотеки 10
2.1 Минусинская общественная библиотека 11
2.2 Анализ стратифицированной выборки при помощи
агрегаторов 14
2.3 Метод визуализации пропусков культурно значимых данных
раздела «Книги для детского чтения» 27
3 Результаты исследования 29
3.1 Яндекс таблицы 29
3.2 Процентное соотношение «доступности» книг 30
3.3 Визуализация данных раздела
«Книги для детского чтения» 35
Заключение 40
Список использованных источников 41
Приложение А «Яндекс таблицы» 43
Минусинская общественная библиотека - культурно-образовательное учреждение, основанное в 1877 году. На основе анализа оцифрованных книг, представленных в каталоге библиотеки, можно выяснить, что интересовало сибирских читателей, какие идеи, люди и места были популярны в этой части мира далекой от культурных центров. Однако, действительно ли полученные цифровые копии книг станут основой цифрового анализа в гуманитарных науках? В этой работе я утверждаю, что доступных нам данных недостаточно для того, чтобы составить целостную историческую картину. Также данных не будет достаточно для того, чтобы определить, какие страны интересовали читателей, что они знали о мире.
Выпускная квалификационная работа посвящена пропускам культурно значимых данных среди цифровых копий книг Минусинской общественной библиотеки.
Достоверность результатов, полученных в ходе научного исследования, обусловлена использованием официальных ресурсов и источников.
Проблема исследовательской работы заключалась в том, что в записях каталога Минусинской общественной библиотеки были неполные данные об авторах книг. Это затрудняло поиск, а в некоторых случаях книги так и не удалось найти.
Объект исследования - цифровые копии книг из каталога Минусинской общественной библиотеки.
Предметом исследования являются пропуски культурно значимых данных среди копий книг из каталога Минусинской общественной библиотеки.
Цель настоящей работы - выявить пропуски культурно значимых данных среди цифровых копий книг из каталога Минусинской общественной библиотеки.
Задачи исследования:
- проанализировать стратифицированную выборку разделов библиотеки с помощью агрегаторов;
- выявить процентное соотношение категорий доступности в каждом из исследуемых разделов;
- визуализировать процентные соотношения и результаты;
- сравнить полученные результаты с результатами других исследований.
Выпускная квалификационная работа состоит из введения, трёх глав, заключения, списка использованной литературы и приложения.
Первая глава «Проблема пропусков и визуализация культурно значимых данных в цифровых копиях» кратко предоставляет информацию научных работ и диссертаций, которые были взяты за основу при работе над этой квалификационной работой...
Главным результатом этой работы является уникальный метод для обнаружения неопределенностей и неточностей в текстовом корпусе. Уникальным метод считается из-за применения визуализации для представления пропусков данных культурного характера среди художественной литературы. Методы визуализации неопределенностей Оливии Вейн и Стефана Янике применялись на археологические экспонаты и музыкальных исполнителей, а литература оставалась без внимания. Таким образом, взяв за основу их подход визуализации неопределенностей и приспособив под особенности изучения метаданных художественной литературы, удалось получить новый метод. Обнаружить неточности получилось при сравнении цифровых копий, имеющихся в агрегаторах, со списком физических книг из каталога Минусинской общественной библиотеки. Это дало нам возможность систематически и широко посмотреть на большой корпус текстов и создать новый подход. Он дополняет более узкий и глубокий анализ, указывая на ограничения в нем, а также этот подход указывает, где конкретно находятся пропуски данных.
Если говорить о конкретных результатах использования метода, то стоит упомянуть о том, что художественные произведения фиксируются в корпусе, а произведения научные, справочные и лингвистические пропадают. Таким образом, наши результаты наводят на мысль о том, что дальнейшее распространение нашего метода, корпуса и результатов дадут более подробное понимание работы с пропусками данных в научной, справочной или других жанрах художественных произведений.
Созданный в этой работе метод можно использовать при исследовании других сибирских и даже европейских библиотек. Еще одним направлением исследования может быть определение популярных тем и географических названий. Это позволит еще лучше понять, что читали и узнавали люди в XIX веке.
1. Н. Булгакова. Что такое корпус? [Электронный ресурс] - Режим доступа: https://lingvomaster.org/ru/cto-takoe-korpus-
2. О корпусе. Национальный корпус русского языка. 2022. [Электронный ресурс] - Режим доступа: https: //ruscorpora.ru/page/corpora-about/
3. Nauta G. J., van den Heuvel W. Cultural institutions are increasingly digitising their holdings, 4, 2015.
4. Hughes, L. M. Digitizing collections: strategic issues for the information manager. Facet Publishing, 2004
5. Friendly, M. The Golden Age of Statistical Graphics, Statistical Science, 2008, 23, 502-535. https://arxiv.org/pdf/0906.3979.pdf
6. Brehmer, M., Lee, B., Bach, B., Riche, N.H. & Munzner, T. Timelines revisited: A design space and considerations for expressive storytelling. IEEE transactions on visualization and computer graphics, 23(9), pp.2151-2164, 2017
7. Windhager F., Salisu S. & Mayr E., and others. Uncertainty of What and for Whom -And Does Anyone Care? Propositions for Cultural Collection Visualization, 2019.
8. Gershon, N. Visualization of an Imperfect World. IEEE Computer Graph-ics and Applications, 18(4):43-45, 1998.
9. Vane, O. Timeline design for visualising cultural heritage data. PhD dissertation. Royal College of Art, UK, 2019. https: //www.oliviavane.co.uk/phd
10. Nyhan, J. and Flinn, A. Computation and the Humanities. Towards an Oral
History of Digital Humanities, 2016.
https://www.researchgate.net/publication/310795050_Computation_and_the_Humani ties_Towards_an_Oral_History_of_Digital_Humanities
11. Moltrup, M. Herstory of Graphic Design: Elaine Lustig Cohen. Collections: A Journal for Museum and Archives Professionals 15 (2-3): 167-177. 2019.
12. Klein, Lauren F. The Image of Absence: Archival Silence, Data Visualization, and James Hemings. American Literature 85 (4): 661-688. 2013.
13. Boyd Davis, S, and Krautli F. The Idea and Image of Historical Time: Interactions Between Design and Digital Humanities. Visible Language 49 (3): Special issue ‘Critical Making: Design and the Digital Humanities’ 100-119, 2015.
14. LwM. 2019a. Living with Machines: Rethinking Research to Illuminate Our Past. Living with Machines, 2020. http://livingwithmachines.ac.uk/.
15. Boyd Davis, S., Vane, O. & Krautli, F. Can I believe what I see? Data visualization and trust in the humanities, 2021...22