ВВЕДЕНИЕ 6
1 ТЕОРЕТИЧЕСКИЕ АСПЕКТЫ ЖУРНАЛИСТИКИ ДАННЫХ 6
1.1 Журналистика данных: понятие и история развития 6
1.2 Понятие big data и его основные характеристики 15
1.3 Big data на службе СМИ 24
2 ПРАКСИС ЖУРНАЛИСТИКИ ДАННЫХ 39
2.1 Опыт использования журналистики данных в зарубежных СМИ 39
2.2 Журналистика данных в России: перспективы развития 48
ЗАКЛЮЧЕНИЕ 60
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
С наступлением цифровой эры, с каждым годом становится возможным передавать, хранить и анализировать все большие и большие массивы данных. Эта тенденция привела к возникновению в начале 2000-х годов термина «большие объемы данных» (big data). Появление этого термина обозначает начало формирования кардинально новых инструментов, заточенных под работу с большими объемами данными и, вместе с этим, понимания того, какие возможности работа с крупными массивами данных способна привнести в журналистику. Несмотря на то, что понятие больших объемов данных не имеет конкретно очерченных границ, следует разделять работу с данными в общем смысле слова от работы именно с крупными массивами данных в силу разницы в подходе и использовании для работы с ними новых инструментов и методов.
Появление все новых журналистских проектов и материалов, основанных на работе с крупными массивами данных, все больший доступ к массивам открытых данных и распространение в Интернете в открытом виде крупных объемов информации (в том числе, считавшейся до недавнего времени секретной) представляет совершенно новые задачи и дает уникальные возможности для развития современной журналистики. Эти изменения в журналистском процессе объясняют актуальность выбранных задач исследования.
Сейчас, когда у каждого пользователя Интернета появляется все больший доступ к данным, к возможностям для поиска, сбора и обработки огромного объема информации, вопросы работы с данными становится как никогда актуальны. При этом, получить необходимые данные стало возможно как из открытых источников, так и в результате журналистских запросов или поиска данных через не открытые источники.
Следует понимать, что направление «журналистики данных» включает в себя весь спектр работ над журналистским материалом, в основе которого
лежит анализ большого объема данных. То есть, это и поиск изначальных данных, и очистка массива данных, и его последующая аналитика, трактовка и визуальное представление для читательской аудитории. В результате, можно отметить, что, по своей сути, журналистика данных служит связующим звеном для двух различных направлений работы — технической (которая предполагает проведение работ по сбору и аналитике большого объема данных) и журналистской (которая предполагает исследование темы, а также трактовку и подготовку концепции для наилучшего представления выводов исследования).
Сейчас, когда журналисты все чаще сталкиваются с наборами «сырых» данных, для профессионального журналиста необходимым становится умение работать с ними, ориентироваться в данных, анализировать и получать из них новые сюжеты. Понимание данных как в ключе возможности углубиться в уже существующий сюжет, так и в ключе основы для создания сюжета «с нуля», по итогам изучения имеющегося массива информации, служит новым этапом в развитии современной журналистики. Вышеизложенное указывает на актуальность темы исследования.
Степень разработанности: тема была изучена такими западными
исследователями и практикующими дата-журналистами, как Джонатан Грей, Лилиана Бунегру, Люси Чемберс (авторы книги The Data Journalism Handbook), Эва Контрастас (автор учебника «Как стать дата-журналистом»)
Объектом исследования является журналистика данных.
Предмет исследования - практика использования big data в журналистике данных.
Цель работы - изучение процесса применения big data в профессиональной деятельности, в основе которого лежит обработка и использование данных для создания журналистского материала.
Задачи работы - в том, чтобы:
1) раскрыть феномен журналистики данных и изучить историю его развития;
2) дать основные характеристики big data;
3) рассмотреть применение big data в средствах массовой информации; исследовать опыт использования журналистики данных в зарубежных СМИ;
4) выявить перспективы развития журналистики данных в России.
Научная новизна выпускной квалификационной работы заключается в рассмотрении использования big data в деятельности средств массовой информации.
Практическая значимость данного научного труда заключается в том, что он может представлять интерес для изучающих перспективы развития журналистики данных, для действующих журналистов этой области журналистики; также он может оказаться полезной студентам факультета журналистики при подготовке к семинарским занятиям.
Данная выпускная квалификационная работа не была апробирована на каких-либо конференциях.
Библиографический список выпускной квалификационной работы состоит из 19 наименований. Среди них - работа пионера данного направления, Флоренс Найтингейл, написанная в 1858 году. Внушительное по тем временам 54-страничное исследование называется «Смертность британской армии» и представляет собой нарисованную от руки инфографику, посвящённую анализу состояния и ежегодных потерь в штате британской армии в 1858 году, а также конкретным причинам смертей солдат в цифро-процентном соотношении. Также здесь представлены материалы The Guardian Datablog - ещё одних пионеров журналистики данных, но уже в ее современном понимании.
Работа состоит из двух глав. Первая глава называется «Теоретические аспекты журналистики данных» и состоит из трех параграфов: «Журналистика данных: понятие и история развития», «Понятие big data и его основные характеристики» и «Big data на службе СМИ». Данная глава исследования посвящена изучению истории появления и развития журналистики данных, понятия открытых данных, анализу актуальности работы с данными для журналистики на современном этапе, а также феномену явления big data в
журналистике данных и журналистике в целом. В третьем параграфе проводится анализ работы с данными на каждом из этапов, начиная со сбора информации и поиска источников данных, и заканчивая очисткой, обработкой и анализом полученного массива данных.
Название второй главы — «Праксис журналистики данных». Она состоит из двух параграфов: «Опыт использования журналистики данных в зарубежных СМИ» и «Журналистика данных в России: перспективы развития». Вторая часть исследования посвящена анализу применения big data в журналистике данных зарубежных и российских практикующих специалистов в этой области. Проанализированы множественные работы таких печатных и интернет-изданий, как The Guardian, New York Times, Las Vegas Sun, а также slon.ru, LookAtMe, The Village и «Афиша-Рамблер-SUP»; также изучен опыт международной некоммерческой организации Wikileaks.
В заключении работы подводятся итоги исследования.
Все большее распространение открытых массивов данных и увеличение количества журналистских материалов, основанных на их обработке, анализе и визуализации позволяют определенно назвать направление журналистики данных одним из перспективных направлений в развитии журналистики на ближайшие годы, как для российских, так и для зарубежных СМИ.
Проведенное исследование соответствует логике целей и задач, определенных в введении к данной работе. По итогам исследования, можно сделать следующие выводы:
• Использование больших объемов данных становится все более значимым направлением работы для журналистов по всему миру. Умение работать с данными, анализировать и понимать их для получения новых журналистских сюжетов становится все более важной частью журналистского процесса
• Появление полностью открытых источников данных, а также бесплатных инструментов для очистки, обработки и визуализации данных позволяет делать прогноз об увеличении количества журналистских материалов на основе аналитики больших объемов данных в ближайшие годы
• Планомерное развитие концепции свободы доступа к информации в США, а также определенные подвижки в развитии инициатив концепции «Открытого правительства» в РФ позволяют давать оптимистичные прогнозы на улучшение качества и количества публикуемых в открытом доступе наборов данных из официальных источников
Несмотря на то, что многие крупные журналистские проекты в направлении
журналистики данных реализованы целой командой, в которую также входят дизайнеры и разработчики, на текущий момент можно констатировать, что сегодня в Интернете в распоряжении каждого журналиста есть весь необходимый инструментарий и набор источников данных для проведения полноценного журналистского исследования с использованием больших объемов данных. Таким образом, можно сказать, что появление все большего числа сюжетов в направлении журналистики данных является закономерным шагом для развития журналистики в цифровую эпоху.
Наконец, несмотря на то, что журналистика данных не является по своей сути панацеей от возможных злоупотреблений по части представления выводов в искаженном виде, следует отметить, что данное направление журналистики делает очередной шаг в сторону прозрачности контента и повышения ответственности к валидности публикуемой информации для всего журналистского сообщества.
1. “The Data Journalism Handbook. How Journalists Can Use Data to Improve the News.”, Jonathan Gray, Lucy Chambers and Liliana Bounegru, O'Reilly Media, August 2012
2. “Transparency in three dimensions”, Frederick Schauer, University of Illinois Law Review, January 2011
3. “Best Practices in Data Cleaning: Debunking Decades of Quantitative Mythology”, Jason W. Osborne, SAGE Publications, January 2012
4. “Bad Data Handbook: Cleaning Up The Data So You Can Get Back To Work”,
Q. Ethan McCallum, O'Reilly Media, November 2012
5. “Interactive Data Visualization for the Web”, Scott Murray, O'Reilly Media, March 2013
6. “The Visual Display of Quantitative Information”, Graphics Press UK, November 2003
7. “A Brief History of Open Data”, Simon Chignard, Paris Tech Review, March 2013
8. “Mortality of the British Army”, Florence Nightingale, Harrisons and Sons, 1858
9. “The development of computer-assisted reporting”, Melisma Cox, School of Communication University of Miami, March 2013
10. “Application Delivery Strategies”, Doug Laney, META Group, February 2001
11. “Emerging Issues in Internet Regulation: The Unstable Role of Wikileaks and Cyber-Vigilantism”, Alison Powell, University of Oxford, September 2011
12. “Open Government: Transparency, Collaboration and Participation in Practice”, Danel Lathrop, Laurel Ruma, O'Reilly Media, February 2010
13. “Open Data in Data Journalists' Workflow”, Uldis Bojars and Edgars Celms, University of Latvia, March 2013
14. “A full-text visualization of the Iraq War Logs”, Jonathan Stray, April 2012, http://j onathanstrav.com/a-full-text-visualization-of-the-iraq -war-logs
15. “How to Lie With Data Visualization”, Ravi Parikh, April 2014, http:// gizmodo.com/how-to-lie-with-data-visualization-1563576606
16. “Data normalization par excellence-the gift of Freebase Gridworks”, Chicago Tribune, May 2010 http://blog.apps.chicagotribune.com/ 2010/05/17/the- gift-of-freebase-gridworks/
17. “Python Data Tools”, Data Science Central, March 2013 http:// www.datasciencecentral.com/profiles/blogs/python-data-tools
18. Указ Президента РФ от 07.05.2012 N 601 "Об основных направлениях совершенствования системы государственного управления" http:// graph.document.kremlin.ru/page.aspx?1;1610860
19. Материалы The Guardian Datablog http://www.theguardian.com/news/
datablog, блогов по журналистике данных на Quartz http://qz.com/ 189703/the- problem-with-data-j ournalism/#/, блога компании Яндекс
http://blog.yandex.ru/post/77309/