Введение 4
Глава 1. Журналистика данных в мировой и отечественной медиапрактиках
1.1. Исследования журналистики данных 8
1.2. Использование данных в мировой медиапрактике 19
1.2.1 Первые примеры использования данных в журналистике 19
1.2.2 Мировое законодательство в области раскрытия данных 21
1.2.3 Журналистика данных и ведущие мировые СМИ 23
1.2.4 Международные премии для дата-журналистов 26
1.3. Использование данных в отечественной медиапрактике 29
1.3.1 Российский опыт: законодательный и практический
аспекты 29
1.3.2 Общественные проекты с использованием открытых
данных 32
Выводы по главе 1 39
Глава 2. Журналистские расследования на основе данных в России
2.1. Подход к анализу 40
2.2. Методика анализа 45
2.3. Основные характеристики журналистских расследований
на основе данных 51
2.4. Журналистские расследования на основе данных
в «Новой газете» 61
2.5. Журналистские расследования на основе данных в
«Трансперенси Интернешнл Россия» 69
2.6. Журналистские расследования на основе данных в «ФБК»
2.7. Журналистские расследования на основе данных в «ФБК» 76
2.8. Журналистские расследования на основе данных в «РБК» 79
2.9. Самые яркие примеры российских дата-расследований 82
Выводы по главе 2 89
Заключение 90
Библиографический список 94
Приложения 100
Благодаря развитию современных компьютерных технологий и Интернета журналисты могут находить и анализировать огромные массивы данных с помощью алгоритмов, а посредством графических редакторов - наглядно визуализировать эти данные для читателей.
Мировое законодательство также способствовало формированию журналистики данных как самостоятельного направления, потребовав от правительств раскрывать государственные данные. Как следствие журналисты получили огромный материал для проведения журналистских расследований.
Как пишут авторы «Настольной книги по журналистике данных», теперь данные могут служить источником для дата-журналистики (равноценно журналистике данных; от англ. “data” - данные), инструментом, дополняющим журналистскую историю, или же и тем, и другим.
Наша гипотеза состоит в том, что данные существенно изменили расследовательскую журналистику. Теперь журналист может проводить расследования, опираясь на наборы данных в Интернете или же с помощью специальных алгоритмов самостоятельно находить информацию для расследования.
Государство, общественные организации, компании располагают большими объемами данных, которыми они готовы или вынуждены (по законодательству) делиться. Для журналистов-рассследователей это возможность узнать то, что ранее было недоступно, и рассказать о результатах своей аудитории.
В мире журналистика на основе данных развивается в течение последних десяти лет. В России дата-журналистика как направление только зарождается. Этим обосновывается выбор темы, а также ее актуальность.
Научная новизна данной работы заключается в том, что в российском академическом сообществе на данный момент уделяется недостаточно внимания использованию открытых данных, больших данных, визуализаций на основе данных, а также программных алгоритмов в журналистских материалах. А тот аспект дата-журналистики, который мы намереваемся рассмотреть - то, как данные повлияли на журналистские расследования, - мало изучен в принципе.
Объектом исследования выступают журналистские расследования на основе данных.
Предметом исследования являются особенности расследовательской дата-журналистики в России.
В данной ВКР мы ставим себе цель рассмотреть особенности журналистских расследований на основе данных в России и выявить типичные характеристики, свойственные подобным материалам.
Для достижения цели нам необходимо решить следующие задачи:
• найти расследования на основе данных в российских медиа;
• выявить тематику дата-материалов;
• охарактеризовать источники данных для расследований;
• проанализировать наборы данных, которыми пользовался журналист;
• охарактеризовать визуализации, используемые в материалах;
• выявить алгоритм работы журналиста с данными;
• отследить общие паттерны в расследованиях на основе данных.
Теоретически журналистика на основе данных слабо изучена в мире и в России. Автор данной ВКР в основном будет опираться на англоязычные источники - научные и публицистические статьи профессоров американских и европейских университетов (Рич Гордон, Брюс Гаррисон, Марк Коддингтон и др.), а также экспертов в области (Эдриан Головатый, Эрик Юлкен, Саймон Роджерс и др.). К работам русскоязычных исследователей (Шилина М.Г., Симакова С.И., Неренц Д.В. и др.) и экспертов (Бегтин И., Богачев А., Дорожный А. и др.) мы также обращались во время написания ВКР.
При работе над исследованием мы решили использовать комплекс ме-тодов, таких как сопоставление, систематизация и классификация, контент- анализ.
Эмпирической базой для ВКР послужили 54 расследования (или материалы с признаками расследования) на основе данных в 15-ти различных отечественных медиа, которые нам удалось найти. Среди данных медиа оказались: «Новая газета», «Трансперенси Интернешнл Россия», «Проект», «ФБК», «РБК», «Деловой Петербург», «Инфометр», “The Bell”, OCCRP, Ivan Begtin Blog, фонд «Нужна помощь», «Открытые медиа», Институт проблем правоприменения, «Другой город», “Meduza”.
В качестве положений на защиту автор выделяет следующие тезисы:
• «Новая газета» - главное российское медиа, занимающееся расследовательской журналистикой на основе данных; большинство расследований на основе данных публикуются данным СМИ в настоящий момент;
• Для проведения расследования на основе данных в среднем требуется 2 источника данных; журналисты стремятся находить вспомогательные наборы данных, чтобы дополнить свои истории;
• В большинстве случаев расследования строятся на государственных источниках данных; к общественным, коммерческим и альтернативным источникам данных журналисты обращаются существенно реже;
• Редакции стремятся сделать свои расследования более прозрачными для читателей, чтобы не потерять доверие той части аудитории, которая может усомниться в дата-материале;
• Расследований на основе больших данных в российском медиапространстве почти нет, материалы, которые строятся на малых данных, существенно доминируют
Первые примеры использования данных в журналистике можно найти еще в XIX веке. Однако в качестве самостоятельного направления дата- журналистику выделили только в 2010 году. Журналисты осознали, что с помощью данных и программных алгоритмов можно создавать уникальные истории. Находить их было бы невозможно без современного мирового законодательства, требующего от правительств раскрытия данных, компьютерных мощностей и Интернета.
Использование данных в журналистике может поставить точку в противостоянии между профессиональными и гражданскими журналистами. Блогеры могут оказываться на местах происшествий быстрее уважаемых СМИ, однако они не обладают специальными компетенциями, необходимыми для написания дата-материала. В настоящий момент данные совершают революцию в журналистике.
Главные мировые редакции уже включают данные в свои истории, некоторые из них создают специализированные дата-отделы. Спрос на журналистов, обладающих навыками программирования и анализа данных, возрастает во всем мире.
В России дата-журналистика также активно развивается, российские журналисты выигрывают престижные международные премии в области журналистики данных. В 2016 году появилась первая магистерская программа (в НИУ ВШЭ) по подготовке дата-журналистов в России. С 2017 года стали проходить Дни открытых данных, в ходе которых можно прослушать лекции от экспертов в области дата-журналистики, а также посетить мастер-классы. В 2018 году был создан первый российский дата- отдел (в «Новой газете»), в котором начали работать выпускники магистратуры НИУ ВШЭ Ирина Долинина, Алеся Мароховская и Алексей Смагин. В реальности данные пришли в отечественные медиа еще раньше, однако тогда в России никто еще не выделял дата-журналистику в отдельное направление.
Крайне существенно данные повлияли на расследовательскую журналистику. Наша гипотеза подтвердилась. В ходе исследования мы смогли обнаружить 54 материала, соответствующих заданным критериям, в 15-ти различных медиа. Большинство расследований было бы невозможно провести без помощи данных.
Больше всего расследований на основе данных (17 материалов) опубликовала «Новая газета», став основным российским медиа, занимающимся дата-расследовательской журналистикой. Расследования «Новой» по большей части рассказывают об опасных тенденциях в обществе, а не о конкретных преступлениях, что является одной из особенностей расследований на основе данных в целом.
Кроме того, пример «Новой газеты» показателен с точки зрения того, как СМИ удается не превращать свои материалы в сухую статистику. Журналисты добавляют эмоции и личные истории героев в свои материалы: к примеру, приводят выдержки из уголовных дел, если анализируют определенную судебную практику.
Тематика. Если посмотреть в целом на дата-расследования, то среди всех тематик существенно доминирует политика (21 материал), на втором месте - правосудие (12 материалов), после идут экономика и городская среда (по 5 материалов). Правосудие оказалось на втором месте, потому что, благодаря публикации фабул дел в открытом доступе, у журналистов наконец-таки появилась возможность изучить реальную судебную практику и понять, как судят в России по разным уголовным статьям.
Источники данных. Для проведения расследования на основе данных российским медиа требовалось в среднем два источника данных. Значит, зачастую одного источника бывает недостаточно, журналисту приходится задумываться о том, какие еще наборы данных можно найти, чтобы дополнить историю. Государственные источники данных для журналистов- расследователей на данный момент приоритетны. К ним обращались в 41 случае. Общественные источники данных также важны для журналистской деятельности, ими пользовались в 17 материалах. Коммерческие оказались менее востребованы: их мы смогли обнаружить в 9 расследованиях. К альтернативным источникам данных российские медиа прибегали, но только в двух случаях.
Реплицируемость. 63% расследований нам удалось признать реплицируемыми, из чего следует сделать вывод, что в большинстве своем редакции стремятся делать свои расследования как можно более прозрачными для читателей.
Доступность данных. 76% расследований строятся на свободно доступных данных, для которых не требуется особый статус или платная подписка. Это означает, что читатели могут сами проверить достоверность заявляемых журналистом фактов. К тому же, в большинстве случаев журналисту не приходилось искать недоступное: все необходимые наборы данных опубликованы в Интернете в свободном доступе.
Публикация данных. В тех случаях, когда данные были недоступны для читателей или с ними производились вычисления, данные можно опубликовать. Это делается для того, чтобы читатели могли сами удостовериться в верности материала, а также для того, чтобы другие журналисты могли раскрыть ту же историю с другой стороны, найдя в наборе данных новые факты. Мы пришли к выводу, что авторы материалов публиковали данные только в 26% случаев, в остальных 74% - нет. Мы рассматриваем это скорее как негативную тенденцию в журналистике данных.
Визуализации данных. Оказалось, что не для каждого дата- расследования необходимы визуализации. Почти в 15% материалов визуализаций не было. В среднем на одно расследование пришлось 4,5 визуализации. Самыми часто встречаемыми оказались столбиковая диаграмма, таблица, фоновая картограмма (хороплет). На наш взгляд, данные визуализации довольно легко воспринимаются самыми разными аудиториями, поэтому их большинство. Сложные визуализации, такие как диаграмма Санкея и укладка круга, встречались лишь однократно.
Интерактивность. Оказалось, что в основном журналисты предпочитали не делать свои материалы интерактивными. Только 33% публикаций мы смогли признать интерактивными. Под интерактивными мы понимаем любые нестатичные визуализации, с которыми может взаимодействовать читатель.
Комментарии экспертов. В 55% публикаций журналисты обращались за комментариями к экспертам. Несмотря на то, что расследования строятся на данных, которые, казалось бы, сами могут все «рассказать», роль эксперта все еще значительна.
Большие данные против малых. Среди анализируемых нами 54 материалов нашлись также те, которые были основаны на больших данных (от 1 миллиона строк), однако таких расследований оказалось всего два, или менее 4% всех публикаций. В основном журналисты оперировали малыми данными (десятки, сотни, тысячи строк).
1. Бегтин И. Открытое государство. История и новый смысл // Полит.ру. 2012. [Электронный ресурс]URL:https://polit.ru/article/2012/06/28/open_gov/
2. Бегтин И. Памятка по журналистике данных // Сайт Ивана Бегтина.
2011.[Электронный ресурс].
URL:http://ivan.begtin.name/2011/05/22/datajournalism/
3. Бегтин И. Ivan Begtin Blog. [Электронный ресурс]. URL: https: //begtin.tech
4. Бегтин И. Ivan Begtin. [Электронный ресурс]. URL: https://t.me/begtin
5. Богачев А. Графики, которые убеждают всех. 2020. [Электронный ресурс].
6. Бублик М., Тоганова Н. Преступность в тени // Институт проблем
правоприменения. 2019. [Электронный ресурс] URL:
https://readymag.com/u85821431/russiancrimesurvey/
7. Бюллетень по открытым данным. 2015. №1. [Электронный ресурс] URL: https ://ac. gov .ru/archive/files/publ ication/a/5572.pdf
8. Деловой Петербург. [Электронный ресурс].URL:https://www.dp.ru
9. День открытых данных. [Электронный ресурс].
URL: https: //opendataday.ru
10. Другой город. [Электронный ресурс]. URL: https://drugoigorod.ru
11. ГосЗатраты. [Электронный ресурс].URL:https://clearspending.ru
12. Госрасходы. [Электронный ресурс].URL:https://spending.gov.ru
13. Декларатор. [Электронный ресурс]. URL:https://declarator.org
14. День открытых данных. 2020.
15. Дорожный А. Data-вебинары с Андреем Дорожным: данные для начинающих // Теплица социальных технологий. 2020.
16. Если быть точным // Фонд нужна помощь. [Электронный ресурс]. URL: https://tochno.st/
17. Журналистика данных. [Электронный ресурс].
URL: https: //t.me/digitalfan
18. Информационная культура. [Электронный ресурс].
URL: https: //www.infoculture .ru
19. Каталог визуализации данных. [Электронный ресурс].
URL: https: //datavizcatalogue.com/RU/
20. Комитет гражданских инициатив. [Электронный
ресурс]. URL: https: //komitetgi.ru/
21. Консультант Плюс. 2006. [Электронный ресурс].
URL: http: //www.consultant .ru
22. Курс Как стать дата-журналистом? // Институт Стрелка. 2020.
23. URL:https://www.rbc.ru/society/11/03/2019/5c6c0ae49a79477703d915b7
24. Лисицин М.Е. Понятие журналистика данных в освещении российских
и зарубежных СМИ. 2018. [Электронный ресурс].
URL: http: //www2. rsuh. ru/binary/obj ect_28.1551881843.02622. pdf
25. Лисицин М. Е. Понятие "журналистика данных" в современных научных публикациях // Коммуникативные исследования. 2018. №3 (17). C. 145. [Электронный ресурс]. URL:https://cyberleninka.ru/article/n/ponyatie- zhurnalistika-dannyh-v-sovremennyh-nauchnyh-publikatsiyah
26. Лисицин М.Е. Проекты в области журналистики данных в российских
СМИ (на примере газеты «Деловой Петербург») // Знак: проблемное поле медиаобразования. 2018. №4 (30). [Электронный ресурс].
URL: https: //cyberleninka.ru/article/n/proekty-v-oblasti-zhurnalistiki-dannyh-v-rossiyskih-smi-na-materiale-gazety-delovoy-peterburg/viewer
27. Лисицин М.Е. Феномен журналистики данных в зарубежных СМИ //
Litera. 2019. № 1. С. 102-115 [Электронный ресурс].URL:https://e-
notabene.ru/fil/article_29056.html
28. Лоббизм в Госдуме. [Электронный ресурс].URL:https://dumabingo.ru/
29. Майер-Шенбергер В., Кукьер К. Большие данные: революция, которая изменит то, как мы живем, работаем и мыслим. М., 2014.
30. Макеенко М., Шилина А. Журналистика данных в качественной прессе: жанровые и тематические особенности // МедиаАльманах. 2019. №6. [Электронный ресурс]. URL: http://mediaalmanah.ru/upload/iblock/2e8/22-35-6- 95.pdf
31. Медуза. [Электронный ресурс]. URL:https://meduza.io/
32. Методические рекомендации по публикации открытых данных Версия
3.0 // Открытые данные России. 2014. [Электронный ресурс].
URL: https: //data. gov. ru/metodicheskie-rekomendacii-po-publikacii-otkrytyh-dannyh-versiya-30
33. Неренц Д.В.. Data journalism: новые возможности для журналистов- расследователей? // Вестник ВГУ. Серия: Филология. Журналистика. 2018. №3. С 147-150.
34. Новая газета. Электронный ресурс. URL:https://novayagazeta.ru
35. Открытая полиция. [Электронный ресурс].URL:https://openpolice.ru
36. Открытые данные России. [Электронный ресурс]
URL: https: //data.gov .ru
37. Открытые НКО. [Электронный ресурс].URL:https://openngo.ru
38. Официальный интернет-портал правовой информации [Электронный ресурс]. URL:http://pravo.gov.ru/
39. Пархимович О., Бегтин И. Данные неверны: почему российские госсайты вводят граждан в заблуждение // РБК. 2019. [Электронный ресурс]. URL:https://www.rbc.ru/opinions/society/20/12/2019/5dfb4e169a79470b46b4f98c
40. Проект. [Электронный ресурс].URL:https://www.proekt.media
41. Проектный центр Инфометр. [Электронный ресурс]. URL: https://read.infometer.org/
42. РБК. URL:https://www.rbc.ru
43. Симакова С. И. Дата-журналистика как медиатренд // Вестн. Нижегородского ун-та им. Н. И. Лобачевского. 2014. № 2 (2). С. 481-485. [Электронный ресурс]. URL: https://cyberleninka.ru/article/n/data-zhurnalistika-kak-mediatrend/viewer
44. Симакова С.И. Журналистика данных как объективное требование
времени и ее влияние на формирование визуальной журналистики // Знак: проблемное поле медиаобразования. 2016. №1 (18). С. 18-25. [Электронный ресурс] URL: https: //cyberleninka. ru/article/n/zhurnalistika-dannyh-kak-
obektivnoe-trebovanie-vremeni-i-eyo-vliyanie-na-formirovanie-vizualnoy-zhurnalistiki/viewer
45. ТАСС. [Электронный ресурс]. URL: https://tass.ru
46. Тертычный А.А. Расследовательская журналистика: учебное пособие для вузов. М.: Ас-пект Пресс. 2002.
47. Трансперенси Интернешнл Россия. [Электронный ресурс]. URL: https://transparency.org.ru/
48. Филиппова А. Что такое дата-журналистика и чем она может помочь любой редакции. Журналист. 2019. [Электронный ресурс]. URL: https: //jrnlst.ru/data-j ournalism-novaya
49. Фонд борьбы с коррупцией. [Электронный ресурс].URL:https://fbk.info
50. Шилина М.Г. Data Journalism - дата-журналистика, журналистика
метаданных - в структуре медиакоммуникации: к вопросу формирования теоретических исследовательских подходов. Электронный научный журнал Медиаскоп. 2013. № 1 [Электронный ресурс].
URL: http: //www. mediascope. ru/node/1263
51. Экспертный совет при Правительстве РФ. [Электронный ресурс]. URL: https: //opendata.open. gov.ru/
52. American Statistical Association. URL:https://thisisstatistics.org/
53. Bradshow P. What Is Data Journalism? // Data Journalism Handbook 1.
URL: https: //dataj ournalism.com/read/handbook/one/introduction/what-is-data-
journalism
54. Coddington M. Clarifying Journalism’s Quantitative Turn // Digital
Journalism. Vo.3. 2015. №3. P. 331-348.
URL:https://www.tandfonline.com/doi/full/10.1080/21670811.2014.976400
55. Data-driven journalism: What is there to learn. 2010.
URL: http: //mediapusher.eu/datadrivenj ournalism/pdf/ddj_paper_final .pdf
56. Data Journalism Awards. URL:https://datajournalismawards.org
57. Data Journalism. URL:https://datajournalism.com
58. Gambini L. A decade of working in data journalism: what has changed? Interview with Simon Rogers, data editor at the Google News Lab // Medium. 2019. URL:https://medium.com/we-are-the-european-journalism-centre/a-decade-of-working-in-data-journalism-what-has-changed-8d950d99935e
59. Garrison, B. (2001). Diffusion of Online Information Technologies in Newspaper Newsrooms. Journalism, 2(2). P. 221-239.
60. Gordon R. What Will Journalist- Programmers Do? // Mediashift. 2007. URL: http://mediashift.org/2007/11/what-will-j ournalist-programmers-do005/
61. Hahn O., Stalph F. Digital Investigative Journalism: Data, Visual Analytics and Innovative Methodologies in International Reporting. Palgrave Macmillan, 2018.
62. Holovaty A. A Fundamental Way Newspaper Sites Need to Change. 2006.
URL: http://www.holovaty.com/writing/fundamental-change/
63. Infoculture.
URL:https://www.youtube.com/channel/UCve6269kQEJ1LW52HXKtTng
64. Kopf E.W. Florence Nightingale as Statistician // Publications of the
American Statistical Association. Vol. 15, No. 116. 1916. P. 388-404.
URL:https://www.jstor.org/stable/2965763?seq=3#metadata_info_tab_contents
65. Kantar Information is beautiful awards.
URL: https: //informationisbeautiful. net
66. Multiple Journalism. URL:http://multiplejournalism.org/case/the-guardian- datablog
67. OCCRP. [Электронный ресурс].URL:https://www.occrp.org
68. Online Journalism Awards. URL:https://awards.journalists.org
69. Online Journalism Blog. URL:https://onlinejournalismblog.com
70. Open Data Barometer. URL:https://opendatabarometer.org
71. Open Government Partnership. URL:https://www.opengovpartnership.org
72. Quartz. URL:https://qz.com
73. The Bell. [Электронный ресурс].URL:https://thebell.io/
74. The Guardian. URL:https://www.theguardian.com/
75. The New York Times. URL:https://www.nytimes.com
76. Ulken E. Building the data desk: lessons from the L.A. Times // Online Journalism Review. 2008. URL:http://www.ojr.org/p1581/