Аннотация
Введение 6
Глава 1. Оцифровка документов культурного наследия: российский и зарубежный опыт 20
1.1. Электронный документ как источник. Электронное издание и
электронное факсимиле 20
1.2. Нормы и стандарты в процессах оцифровки 31
1.3. Российский и зарубежный опыт оцифровки культурного наследия 38
Глава 2. Оцифровка и проблемы доступа/представления газетной периодики фонда Научной библиотеки ТГУ на платформе электронной библиотеки университета 48
2.1. Характеристика фонда периодической печати НБ ТГУ 48
2.2. Процесс оцифровки газетной периодики в НБ ТГУ.
Этапы и оборудование 51
2.3. Проблемы доступа газетной периодики на платформе Электронной
библиотеки ТГУ 61
Г лава 3. Создание электронного приложения для монографии
«Книжная культура Томска (XIX-начало XX века.)» 75
Заключение 87
Список литературы 91
Приложение 1. Иллюстрации отсканированных, отреставрированных и обработанных газет 99
Приложение 2. Анкета 101
Приложение 3. Инструкция по оцифровыванию газет в Научной библиотеке ТГУ.. 102 Приложение 3. CD-диск (электронная версия монографии с оцифрованным газетным контентом)
Активная фаза процесса информатизации, в которую современное общество вступило в 1970-х гг., в последние годы приобрела глобальный характер. Сегодня этот процесс охватил практически все мировое сообщество. Под воздействием информатизации происходят масштабные изменения всех сфер жизни и профессиональной деятельности людей, в том числе науки, образования и культуры. Известно, что с развитием общества меняются и основные ориентиры, соответствующие этим переменам, в эпоху развития индустрии главными в жизни человека оказывались плоды его интеллектуального и физического труда, сейчас все настолько изменилось, что на первое место выступает информация и умение владеть ею.
Исторические данные свидетельствуют о том, что около 1,5 млн. лет назад, с появлением членораздельной человеческой речи, стали возможными процессы абстрактного мышления и началось зарождение интеллектуальной деятельности людей, что в результате дало возможность накопления и распространения информации. Именно в это время человек начал не только создавать, но и передавать накопленную информацию. Сегодня мы можем говорить об истории человечества как о закономерной последовательности технологических этапов развития.
Первый этап: с момента появления языка и человеческой речи до изобретения письменности.
Второй: от появления письменности до изобретения книгопечатания. Книгопечатание - это одна из первых эффективных информационных технологий, которая позволила фиксировать, хранить и передавать накопленные веками знания.
Третий виток: от эпохи Возрождения до середины XIX века. К этому времени общество накопило достаточное количество научных знаний и активно стало распространять информацию с помощью более совершенных технологий книгопечатания.
Четвертый: вторая половина XIX века - первая половина ХХ века. Изобретены новые средства информационной коммуникации: радио, телефон и телевидение. Новые коммуникационные каналы позволили многократно увеличить не только объемы передаваемой и используемой информации, но и повысить оперативность процесса коммуникации.
Пятый, 1950-е - конец 1990-х гг., характеризуется появлением цифровой и персональной вычислительной техники, что позволило повысить эффективность использования информационных ресурсов во всех сферах человеческой деятельности.
Шестой этап длится с начала XXI века по настоящее время. Это, прежде всего, активного внедрения сети Интернет, а также практически неограниченные возможности по хранению, поиску, обработке и передаче информации.
По мнению Степанова В.К., сегодня мы живем в эпоху, когда становится невозможным существование без «цифры» . Все, что
человечество имело раньше, весь накопленный опыт должен быть трансформирован и влияние такой трансформации будет вызывать серьезнейшие изменения во всех сферах общественной жизни, перешагнув по значимости все прежние исторические изменения.
В современном мире, в условиях тотальной цифровизации мы можем наблюдать смену культурной парадигмы, она становится «цифровой». Предельно важным условием развития современного общества является историческая память человечества, если оно заинтересовано в дальнейшем процветании. Двигаться вперед можно только при условии почитания и сохранения своих нравственных ценностей, традиций, языка, всего того, что попадает под определения культурного кода нации.
Культурной политикой Российской Федерации определено «сохранение исторического и культурного наследия и его использование для воспитания и образования; передача от поколения к поколению
традиционных для российской цивилизации ценностей и норм, традиций, обычаев и образцов поведения; создание условий для реализации каждым человеком его творческого потенциала; обеспечение доступа граждан к знаниям, информации, культурным ценностям и благам». В соответствии с этим учреждения культуры различных уровней все активнее включаются в формирование цифрового культурного контента. В федеральной целевой программе «Культура России (2012-2018 годы)», утвержденной постановлением Правительства РФ от 03.03.2012 № 186, подчеркнута
важность создания и сохранения культурного наследия. Подразумевается «создание цифрового контента о значимых событиях российской культуры и искусства, электронных ресурсов библиотек, информационных порталов, мультимедийных информационных ресурсов, интерактивных карт исторических мест, культурных и природных ландшафтов, а также изучение проблемы безопасности сохранения культурного наследия и его доступности» . Министерством культуры РФ предложено создание многофункциональных культурных центров для обеспечения доступа граждан Российской Федерации к информационным ресурсам, в том числе к размещенным в интернете.
Одним из таких центров является Национальная электронная библиотека (далее НЭБ), важная роль которой заключается в создании унитарного электронного портала на базе электронного контента, полученного от организаций - партнеров, интегрированных в этот целостный проект. С поставленными задачами все участники этого проекта неплохо справились, и к концу 2015 года на платформе НЭБ уже становится возможным поиск информации в общем каталоге из любой точки доступа. К
настоящему времени общее количество электронных документов в фондах НЭБ - 4 667 983.В общественном достоянии - 3 986 901, охраняемые
авторским правом - 615 223.
В Российской Федерации вопросу сохранения и доступности цифрового культурного наследия уделяется достаточно внимания. Во многих регионах страны создаются каталоги памятников истории и культуры, открытые в общедоступном режиме. Не является исключением и наш регион. Научная библиотека ТГУ является крупнейшим информационным центром Сибири и лидером по количеству оцифрованных документов. Электронная библиотека НБ ТГУ в настоящее время содержит более 58000 оцифрованных изданий, и эта цифра постоянно растет.
Одним из важнейших аспектов подготовки электронного контента на основе документов культурно-исторического наследия является оцифровка газетной периодики, выступающей своеобразной летописью той или иной исторической эпохи.
Таким образом, актуальность данной темы обусловлена:
1) значимостью сохранения уникального культурно-исторического
наследия как важнейшей общегосударственной задачи;
2) объективной потребностью читателей, в том числе научного сообщества, в широком, удобном и оперативном доступе к оцифрованным документам;
3) необходимостью систематизации накопленного зарубежного и отечественного опыта оцифровки газетной периодики с целью
выявления ключевых проблем и путей их решения;
4) возможностью популяризации газетного фонда НБ ТГУ посредством оцифровки редких документов и их представления на платформе Электронной библиотеки.
Термин «цифровизация» (англ. digitalization) пришел из западной экономики и переводится как «оцифровывание» или «приведение в цифровую форму». Широкое распространение цифровизация получила в 609
70-е годы XX века благодаря появлению цифровых форматов, что в дальнейшем, безусловно, способствовало разработке всемирной сети Интернет.
Цифровизацию с точек зрения экономики, культуры и потребностей общества рассматривали как отечественные, так и зарубежные исследователи: Джейсон Меркоски «Книга 2.0. Прошлое, настоящее и будущее электронных книг глазами создателя Kindle», Аксель Бранс «Blogs, Wikipedia, Second Life, and Beyond: From Production to Produsage», Дэвид Голамбиа «The Cultural Logic of Computation», Лев Манович «Soft ware takes command», Пэлфри Д. «Дети цифровой эры», Кирия И.В., Новикова А.А. «История и теория медиа» и др.
Нужно сказать, что в настоящее время вопросы применения цифровых технологий в сфере сохранения наследия культуры, выбора формата и методов оцифровки, доступности цифровых копий находятся в процессе осмысления, методы и технологии вырабатываются путем проб и ошибок и являются основным объектом обсуждения на конференциях, библиотечных форумах, что привлекает внимание исследователей как в России, так и за рубежом.
Создание цифровых аналогов произведений искусства, литературы, исторических документов, прежде всего, подразумевает создание цифровых копий. Последние годы в научном сообществе активно ведутся дискуссии: считать ли их электронными документами, чем отличаются цифровые копии от электронных, и вообще, можно ли их отнести к понятию электронный документ? В данном исследовании мы будем опираться на национальный стандарт СИБИД «Электронные документы. Основные виды, выходные сведения, технологические характеристики», разработанный специалистами Российской государственной библиотеки, Российской национальной библиотеки и Президентской библиотеки им. Б. Н. Ельцина, и на работы А.
И. Земскова и Я. Л. Шрайберга , которые считают, что понятие «электронный документ» распространяется на весь искусственно созданный контент, зафиксированный на машиночитаемом носителе.
В качестве вида электронного документа национальный стандарт СИБИД «Электронные издания. Основные виды и выходные сведения» выделяет понятие «электронного издания». В данном исследовании мы будем неоднократно обращаться к данной дефиниции, необходимым теоретическим базисом для этого послужат научные публикации А. Б. Антопольского, М. Э. Жебит, Е. П. Шеметовой, Е. В. Динер и И. М. Чикунова.
Роль культурного наследия в определении национальной самобытности, новые цифровые возможности в области сохранения, охраны и популяризации культурно-исторических документов - это вопросы, связанные с интеллектуальной собственностью, которые требуют широкомасштабного стратегического планирования культурной политики включая защиту культурного наследия. Вопрос об авторском праве в зарубежных странах является одним из самых обсуждаемых. В первую очередь, это является определяющим мотивом при выборе материала для оцифровки: выбор материалов для оцифровки требует учета множества факторов, включая статус авторского права, формат и размер оригиналов. Эта проблематика рассматривается различными зарубежными
исследователями: Владой Бориссовой в статье «Cultural heritage digitization and related intellectual property issues, Александрой Хорват в «Copyright Issues Related to the Digitization of Cultural Heritage in Croatia», Karen Coyle, Sharon Q. Yang и Lili Li и др. Статья А. Хорват показывает, как вопросы авторского права, связанные с оцифровкой, осуществляемой государственными учреждениями, такими как библиотеки и архивы, решались в Хорватии. Учреждения демонстрируют разные подходы к цифровым копиям, которые они производят; некоторые считают себя издателями и правообладателями новых цифровых изданий произведений, тогда как другие считают оцифровку главным образом средством защиты оригиналов. Они используют водяные знаки в качестве меры технической защиты.
В статье J. Dryden «The Role of Copyright in Selection for Digitization» сообщается о результатах эмпирического исследования (интервью с работниками, отвечающими за оцифровку, анкетирование и анализ оцифрованного и выложенного материала с учетом политики сайтов по вопросам авторского права), в ходе которого выяснилось, что авторское право влияет на выбор американских архивных хранилищ материала для оцифровки. В связи с этим автор описывает ситуации, в которых они запрашивают разрешение у правообладателей.
В России проблема авторского права цифрового контента также достаточно обсуждаема в исследовательских кругах: необходимо ли выделять цифровую форму как самостоятельную объективную форму произведения или обособить произведение в цифровом формате в отдельное понятие «цифровое произведение»? И будет ли оно в этом случае попадать под закон о защите интеллектуальной собственности? Такие исследователи, как Я. А. Карев, Р.Ш. Рахматулина, считают, что электронный документ отличается от традиционного бумажного документа особенностью формы его представления и оснований считать «цифровые произведения» отдельным объектом авторского права нет. И наоборот, многие авторы имеют противоположное мнение и не видят разницу между произведениями в электронной форме и цифровой, исходя из этого, и те, и другие должны охраняться законом об авторском праве.
Дискуссии возникают и в вопросе правомочности оцифровки библиотеками своих фондов, где мнения также разделяются. Некоторые исследователи считают, что библиотеки для своих нужд могут оцифровывать документы из собственных фондов без публикации их в открытом доступе, другие считают, что закон разрешает библиотекам только
«репродуцирование», и в это понятие оцифровка не входит. Соответственно вся оцифровка, которая происходит в библиотеках по охраняемым произведениям, происходит незаконно.
Массово обсуждаемым вопросом за последние несколько лет стал вопрос принципов организации хранения и обеспечения доступа к цифровому контенту в библиотеках. Значимыми работами по этой проблематике являются исследования А.Н. Авдеева, А. В. Скалабана, О.Л.
отсканированного материала и доступа к нему для широкого круга пользователей электронных библиотек, а также выбора программного обеспечения, реализующего основные функции управления цифровым контентом, и организации интерфейсов доступа к этому контенту.
Также, проблемы по оцифровке и доступности фондов, с которыми приходится сталкиваться библиотекам, и пути их решения анализируются в статьях: А. И. Вислого «Об оцифровке фондов, авторском праве и не только» , И. К. Фомичевой «Цифровые коллекции вузовской
библиотеки...» , «Цифровые проекты в современной информационной среде: наука и практика. » и других.
В данной работе будут описаны механизмы резервного хранения оцифрованных документов из фондов научной библиотеки ТГУ, и в рассмотрении возможных вариантов решения возникающих проблем мы будем опираться, в том числе и на эти исследования.
Усилия по оцифровке газет привлекают к сайтам национальных библиотек максимальное количество пользователей, несмотря на то, что национальные библиотеки во всем мире больше заинтересованы в оцифровке своих фондов редких и ценных изданий. Сегодня большинство крупнейших библиотек занимаются оцифровкой коллекций именно газетной периодики, потому что они не преследуются авторским правом и попадают под категорию «общественного достояния».
Газетам, как историческим источникам и концепциям их сохранения, посвящены работы Н. В. Жиляковой «Периодическая печать Томской губернии (1857-1916)...», О. В. Манерновой «Подходы к сохранению коллекции сибирских газет в научной библиотеке Томского государственного университета» , С. И. Корниенко «Университет и библиотека: сотрудничество в области сохранения и изучения губернской периодики, А. И. Сапожникова «Газетные публикации как исторический источник» .....
Оцифровка культурно-исторического наследия давно стала реалией нашего времени, но, несмотря на накопленный в этой области опыт, столь значимая для общества деятельность во многом остается проблемной. В первую очередь, это обуславливается двойственным характером развития тенденций в данном процессе. С одной стороны, сохранение исторического фонда - вопрос, абсолютно осмысленный обществом, с другой - возникающие сопутствующие проблемы теоретического и технологического характера, осложняющие создание цифрового контента.
Изучение теоретической базы позволило установить основные сложности процесса оцифровки: отсутствие нормативно-правовых
документов, регламентирующих на государственном уровне механизмы по оцифровке и все сопутствующие этому процессу экономические, юридические, общественно-правовые аспекты. Несмотря на то, что в последние годы активно предпринимаются попытки регламентировать действия по оцифровке архивных и библиотечных фондов силами крупнейших специалистов страны, ключевой проблемой остается отсутствие государственной нормативной базы, которая накладывала бы обязательства на соответствующие учреждения и организации на должном уровне реализовывать государственную программу по сохранению общезначимой информации в электронном виде. Выходом из этого положения становится инициатива организаций, занимающихся оцифровкой, по составлению инструкций по оцифровыванию документов, которые позволили бы унифицировать процесс. При этом важно избегать субъективной трактовки алгоритма. Изучение опыта по этому вопросу в Научной библиотеке ТГУ показывает, что преодолеть субъективизм можно с помощью выработки общих критериев, с учетом технологических и кадровых ресурсов. В библиотеке создана инструкция по оцифровыванию, все положения которой
успешно реализуются при сканировании объектов библиотечных фондов, обеспечивая высокий результат за определенно запланированные сроки.
Проблемы технологического характера связаны с возможностями и техническими характеристиками сканирующего оборудования и программного обеспечения. Проведенный анализ проблемной ситуации позволил установить, что далеко не все организации могут приобрести дорогостоящее сканирующее оборудование, нет программного обеспечения для качественного распознавания текста. Описанная на материале опыта оцифровки газет в Научной библиотеке ТГУ модель технологического процесса дала основание заключить, что наличие широкоформатного сканера, позволяющего создавать цифровые копии документов наивысшего качества с разрешением до 1000 dpi, делает возможным донести до пользователя абсолютно идентичный, «факсимильный» электронный вариант документа газетной периодики.
Оцифровка газет сибирского региона стала приоритетным направлением при создании электронной библиотеки ТГУ. Основное требование — формирование качественного цифрового контента, максимально приближенного к оригинальному источнику. При этом качество оцифрованного материала обеспечивается несколькими факторами:
1. уникальностью состава фонда газет Научной библиотеки;
2. наличием высокотехнологичного сканирующего оборудования;
3. унификацией норм и требований при оцифровывании газет;
4. квалификацией сотрудников отдела Электронной библиотеки.
В ходе исследования удалось выявить проблемную область при формировании репозитория электронных документов, связанную с форматом доступа и представления отсканированных газет на платформе электронной библиотеки университета. В качестве обоснования данной проблемы был проведен системный анализ характеристик электронной платформы VTLS- VITAL, который показал, что данная платформа - программное обеспечение с закрытым исходным кодом, что затрудняет создание модификаций 88
программы. Как следствие, в работе с оцифрованными газетами, загруженными на платформу, это проявляется в невозможности онлайн- доступа к определенному выпуску газеты. Отсутствие постатейного поиска приводит к тому, что при поиске программа отправляет пользователя к названию издания с перечнем всех годов выпуска, а не к искомому тексту, содержащему поисковый запрос. Таким образом, платформа обеспечивает только функцию хранения цифрового контента, что в современных реалиях интернет-интеграций цифрового документа оказывается недостаточным, в первую очередь для исследователей, заинтересованных в доступности и наглядности исторических источников.
В качестве одного из вариантов решения указанных проблем предложен проект создания электронного приложения к научному изданию, контент которого включает оцифрованные газеты, на которые есть гиперссылки в тексте монографии как на исторические источники. Выбор направленности проекта был обусловлен результатами проведенного в рамках данного исследования социологического опроса, позволившего выявить читательские интересы в отношении функционального использования электронной коллекции сибирских газет. Проект электронного приложения в рамках одного конкретного издания направлен на реализацию задачи по облегчению доступа к конкретным номерам газет из коллекции «Сибирь. Томск» Электронной библиотеки университета. Таким образом, возможности использования газет из фонда библиотеки расширяются, и газета из цифровой копии переходит в статус составного элемента электронного издания.
Возможными перспективами настоящего исследования в теоретическом аспекте представляется дальнейшее изучение особенностей оцифровки периодики, в частности журналов из редкого фонда, в практическом плане — дальнейшая работа по усовершенствованию контента электронного приложения за счет наполнения его различными мультимедийными элементами: графикой, иллюстрациями, аудио/видео 89
рядом; интерактивными навигационными элементами, такими как голосовой поиск или слайд-шоу иллюстративных объектов.
1. Восточное обозрение: газета литературная и политическая. - Иркутск: [б. и.],
Санкт-Петербург: [б. и.], 1885. [Электронный ресурс]. - URL:
http://vital.lib.tsu.rU/vital/access/manager/Repository/vtls:000349167 (дата обращения
14.06.2019)
2. Народная газета: орган Томской губернской земской управы. Томск: [б. и.], 1918. [Электронный ресурс]. - URL: http://sun.tsu.ru/mminfo/2017/000416477/index.html (дата обращения 14.06.2019)
3. Сибирская газета: первое частное периодическое издание Западной Сибири. -
Томск: [б. и.], 1882-1888. [Электронный ресурс]. - URL:
http://sun.tsu.ru/mminfo/000351029/index.html (дата обращения 14.06.2019)
4. Сибирская жизнь: газета политическая, литературная и экономическая. -
Томск: [б. и.], 1898-1915. [Электронный ресурс]. - URL:
http://chamo.lib.tsu.ru/lib/item?id=chamo:349025&theme=system (дата обращения
14.06.2019)
5. Сибирские отголоски: политическая, общественная и литературная газета. -
Томск: [б. и.], 1908. [Электронный ресурс]. - URL:
http://sun.tsu.ru/mminfo/2018/000417640/index.html (дата обращения 14.06.2019)
6. Сибирский вестник политики, литературы и общественной жизни. - Томск: [б.
и.], 1886-1905. [Электронный ресурс]. - URL:
http://sun.tsu.ru/mminfo/000349027/index.html (дата обращения 14.06.2019)
7. Тобольские епархиальные ведомости: части официальные и неофициальные / изд. Тобольской епархии ; ред. П. Д. Головин. - Тобольск: [б. и.]. 1882. [Электронный ресурс]. - URL: http://vital.lib.tsu.ru/vital/access/manager/Repository/vtls:000580869 (дата обращения 17.06.2019)
8. Томские губернские ведомости. - Томск: [б. и.], 1868-1894. [Электронный
ресурс]. - URL: http://chamo.lib.tsu.ru/lib/item?id=chamo:349050&theme=system (дата обращения 14.06.2019)
9. Томские епархиальные ведомости: издается по благословению
Высокопреосвященнейшего Ростислава, архиепископа Томского и Асиновского. - Томск:
[б. и.], 1883. [Электронный ресурс]. - URL:
http://chamo.lib.tsu.ru/lib/item?id=chamo:349391&theme=system (дата обращения
17.06.2019)
10. Томский листок. - Томск, 1895, 1897. [Электронный ресурс]. - URL:
http://sun.tsu.ru/mminfo/000349025/index.html (дата обращения 25.05.2020)
11. Томский справочный листок. Томск, 1894-1895. [Электронный ресурс]. - URL: http://sun.tsu.ru/mminfo/000349025/index.html (дата обращения 25.05.2020)
Официально - нормативные документы
12. ГОСТ Р 7.0.83-2013 СИБИД. Электронные издания. Основные виды и выходные сведения. [Электронный ресурс] URL: http://docs.cntd.ru/document/1200104766 (дата обращения 17.04.2020)
13. ГОСТ Р 7.0.95-2013 Система стандартов по информации, библиотечному и
издательскому делу. Электронные документы. Основные виды, выходные сведения, технологические характеристики. [Электронный ресурс]. [Б. г.].
URL:http://docs.cntd.ru/document/1200108447 (дата обращения 01.06.2020)
14. Государственный доклад о состоянии культуры в Российской Федерации в
2015 году. С.62. URL: https://www.mkrf.ru/activities/reports/report2015/ (дата обращения 17.06.2019)
15. О концепции федеральной целевой программы «Развитие телерадиовещания в
Российской Федерации на 2009-2015 годы»: Распоряжение Правительства РФ от 21.09.2009 № 1349-р // СПС Консультант Плюс.URL: http://www.consultant.ru/document/cons_doc_LAW_91825/ (дата обращения
17.06.2019)...88