Тип работы:
Предмет:
Язык работы:


Компьютерное зрение для разделения изображений и текста в журнале «Курьер ЮНЕСКО»

Работа №170091

Тип работы

Бакалаврская работа

Предмет

прикладная информатика

Объем работы55
Год сдачи2023
Стоимость4600 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
1
Не подходит работа?

Узнай цену на написание


Введение 3
1. Источник данных: изображения и тексты в журнале
«Курьер ЮНЕСКО» 7
1.1 История создания журнала «Курьер ЮНЕСКО» 7
1.2 Многоплановость изображений в журнале «Курьере ЮНЕСКО» 13
1.3 Мультимодальный анализ: исследование взаимодействия изображений и
текстов 15
2. Анализ и извлечение изображений компьютерными способами 17
3. Методология процесса извлечения изображений и текста из журналов
«Курьер ЮНЕСКО» и последующая их группировка 21
3.1 Создание датасетов и выбор библиотек для анализа 21
3.2 Этапы создания алгоритма 23
4. Результаты исследования 34
4.1 Сравнение созданного алгоритма с другими методами 34
4.2 Неуниверсальность извлечения изображений в рамках нашего метода .... 38
4.3 Классификация стилистических особенностей оформления в журналах и
как с ними справляется компьютерное зрение 42
4.4 Сравнение результатов исследования с предшествующими работами 47
Заключение 49
Список использованных источников 51
Приложение А 51


Долгое время компьютерный анализ текста являлся наиболее актуальным и важным направлением исследований в цифровых гуманитарных науках. Ученые добились значительных результатов в компьютерном анализе текста. Появились такие технологии как OCR (оптическое распознавание текста), тематическое моделирование, поиск именованных сущностей и другие. Тем не менее ученые, концентрируясь на тексте, упускают огромное значение визуальных форм репрезентации. За последние 10 лет быстрое развитие технологий компьютерного зрения позволило цифровым гуманитариям заниматься изучением изображений. Стали использоваться нейронные сети для выявления тенденций в больших коллекциях изображений [1], что позволило говорить о дальнем чтении для визуальных форм.
Однако, изучение текстов и изображений в исторических документах, таких как газета, журнал, книга, не может быть изучено отдельно, т.е. как только визуальное или только текстовое представление. Французский семиотик Ролан Барт уже в 1961 году заметил, что фотография не существует в изоляции, она всегда связана по меньшей мере с одной другой структурой, а именно - с текстом [2]. Поэтому следующий этап цифровых гуманитарных исследований - это совместное изучение текстов и изображений.
Для исследований, где будет изучаться текст и изображения совместно, требуется подготовка: извлечение текстовой и визуальной части объекта исследования. В данной работе извлекается визуальная и текстовая часть журнала «Курьер ЮНЕСКО».
«Курьер ЮНЕСКО» - это журнал, выпускаемый с 1948 г. по наши дни, созданный Организацией Объединенных Наций для образования, науки и культуры (ЮНЕСКО), основной задачей которого является информирование общественности о важных событиях в области образования, науки, культуры и коммуникаций. Исследование материалов журнала, особенно сочетание изучения как визуальной части журнала, так и текстовой, дает возможность получить целостную картину, как и предполагает классическая гуманитарная традиция. Однако возникает вопрос, как получить текст и изображения из журналов так, чтобы была возможность изучать их совместно, а также быть уверенными в том, что в данных нет пропусков? Получение текста не является само по себе сложной задачей, но можем ли мы получить изображения быстрым способом и сразу перейти к анализу?
В этой работе мы утверждаем, что извлечение изображений из сложных исторических документов, таких как журнал «Курьер ЮНЕСКО», неуниверсальная и трудная задача, требующая создания собственного метода, настроенного конкретно под объект исследования.
Выпускная квалификационная работа посвящена разделению текста и изображений на примере журнала «Курьер ЮНЕСКО».
Достоверность результатов, полученных в ходе научного исследования, обусловлена большим набором данных, точностью создания выборки, сочетанием разных способов извлечения изображений, сравнением результатов с результатами работы других алгоритмов...

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В этой работе был создан алгоритм для извлечения изображений и текстовых блоков из журналов «Курьер ЮНЕСКО». Кроме того, программа группирует изображения и тексты для мультимодального анализа. Алгоритм представляет собой комбинацию из инструментов библиотеки компьютерного зрения OpenCV, нейронной сети, созданной с помощью Fast.Ai и других вспомогательных библиотек: PyPDF2, PyMuPDF и PIL. Такой подход позволил достичь максимальной точности извлечения изображений (97% Accuracy), что и представляло основную сложность. Созданный алгоритм учитывает особенности журналов «Курьер ЮНЕСКО», например, то, что текст располагается на цветных подложках, которые можно было бы принять за изображения. Разработанный подход дает возможность успешно отделить сложные случаи оформления текстовых блоков и не включать их в результат извлечения изображений. При этом работа демонстрирует, что инструменты платформы Transcribus, программа PDF24 Tools, т.е. более универсальные способы, не справляются с извлечением изображений из исторических документов («Курьер ЮНЕСКО»), и дают не более 41% точности (Accuracy).
Не менее важно и то, что работа показывает неуниверсальность задачи извлечения изображений не только с помощью «ненастроенных» методов, но и в рамках созданного алгоритма. Эксперимент, где были взяты изображения на похожих серых подложках, показал, что настроить алгоритм для одной из таких картинок, не значит настроить для всех таких случаев. Это показывает, что задача извлечения изображений все еще является сложным и важным этапом подготовки к мультимодальному анализу.
Анализ работ в области изучения изображений показал, что этапу извлечения изображений отводится мало внимания. Однако процент извлеченных изображений является ключевой информацией для того, чтобы определить возможность проведения исследований, формулирования выводов и гипотез, на основе предоставленных данных. Благодаря этому станет возможно осуществить анализ изображений и их сопоставление с текстовыми данными.
Код программы: https://github.com/Alina-meow/courier



1. Wevers M., Smits T. The visual digital turn: Using neural networks to study historical images //Digital Scholarship in the Humanities. - 2020. - Т. 35. - №. 1. - С. 194-207.
2. Barthes R. Le message photographique //Communications. - 1961. - Т. 1. - №. 1. - С. 127-138.
3. «Устав ООН» [Электронный ресурс] - Режим доступа: https://www.un.org/en/about-us/un-charter/full-text - Дата доступа: 2023.
4. UNESCO and the Issue of Cultural Diversity - Review and Strategy 1946¬2000. A Study Based on Official Documents. [Электронный ресурс] - Режим доступа:https://unesdoc.unesco.org/ark:/48223/pfO000125248?posInSet=1&queryId =243c8e04-7cec-4e80-84ba-43e5c752ed98 - Дата доступа: 2023
5. Stoczkowski W. UNESCO's doctrine of human diversity: a secular soteriology? //Anthropology Today. - 2009. - Т. 25. - №. 3. - С. 7-11.
6. UNESCO. Draft Programme and Budget, 2002-2003: General Conference, Thirty-first Session, Paris 2001. - UNESCO, 2001.
7. Nielsen B. UNESCO and the ‘right’ kind of culture: Bureaucratic production and articulation //Critique of Anthropology. - 2011. - Т. 31. - №. 4. - С. 273-292.
8. Our Creative Diversity: Report of the World Commission on Culture and
Development. [Электронный ресурс] - Режим доступа:
https://unesdoc.unesco.org/ark:/48223/pf0000105586?posInSet=4&queryId=ca5ea1b 5-b3c3-4b73-8fb7-fa11149c0095 - Дата доступа: 2023
9. Zizek S. The sublime object of ideology Verso. - 1989.
10. «Курьер ЮНЕСКО» [Электронный ресурс] - Режим доступа: https://ru.unesco.org/courier/about - Дата доступа: 2023
11. «UNESDOC» [Электронный ресурс] - Режим доступа: https://unesdoc.unesco.org/ark:/48223/pf0000261279_rus - Дата доступа: 2023.
12. «Архив журналов "Курьер ЮНЕСКО"» [Электронный ресурс] - Режим доступа: https://ru.unesco.org/courier/archives - Дата доступа: 2023.
13. Barthes R. Rhetoric of the Image //Visual culture: The reader. - 1999. - С.
33-40.
14. Baudrillard J. Simulacra and simulation. - University of Michigan press, 1994.Baudrillard J. Simulacra and simulation. - University of Michigan press, 1994
15. Yanoshevsky G., Michaeli M. On recurring images and nation branding: the case of Israel's albums and tourist guidebooks //Image & Narrative. - 2021. - Т. 22. - №. 2...30


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ