Введение 4
1. Основные понятия 5
2. Обзор существующих решений 6
3. Технологии 7
4. Описание решения 8
4.1. Регистрация приложения 8
4.2. Авторизация пользователя 8
4.3. Поиск онлайн-сообществ 10
4.4. Построение социальной сетевой схемы сообщества 12
4.5. Построение социальной сетевой схемы набора сообществ 15
4.6. Визуализация 16
4.7. Создание CSV файла 23
4.8. Анализ графа 25
4.9. Пример использования 26
Заключение 36
Список литературы 38
В наши дни социальные сети стали неотъемлемой частью нашей жизни. Они являются источником данных и средством распространения информации. Поэтому в последнее время увеличилось количество исследований, проводимых в социальных сетях. При этом огромное внимание уделяется изучению онлайн-сообществ как особых социальных общностей [4], включая, например, вопросы, можно ли считать формальные онлайн-группы сообществами [8], исследования типов онлайн-сообществ [9], и другие исследования, основанные на особенностях структуры сообществ [16]. Также изучение сообществ позволяет выявлять как активных пользователей, вносящих существенный вклад в деятельность группы [5], так и «молчащих» пользователей, регулярно читающих публикуемый контент, но не участвующих в обсуждениях [10]. Причем именно вторая группа пользователей часто интересует исследователей, как с точки зрения изучения механизмов мотивации [2], так и с точки зрения потенциального рекрутирования в проводимые исследования [7].
Для проведения исследований онлайн-сообществ необходимы программы способные собирать необходимую информацию о группах. Но зачастую исследователям бывает недостаточно существующих инструментов для решения поставленных задач. Специалисты, составившие план изучения сообществ в социальных сетях, вынуждены тратить время и средства на сбор и анализ данных. Поэтому возникла необходимость в программном обеспечении, которое позволит собирать необходимые данные онлайн-сообществ, а также предоставит набор инструментов для их базового анализа.
Постановка задачи
Цель данной работы — автоматизировать сбор, обработку и визуализацию информации об онлайн-сообществах социальной сети «ВКонтакте» (в рамках поставленных ниже задач).
Для достижения цели были поставлены следующие задачи:
• обеспечить сбор данных о структурах онлайн-сообществ социальной сети «ВКонтакте», включая список контактов, город, ссылки, страну и информацию об участниках;
• визуализировать структуру сообщества в виде графа, вершинами которого являются участники этого сообщества, а ребрами — соответствующие связи между этими пользователями (дружба, обучение в одном вузе, город, родной город, обучение в одной школе, наличие общих сообществ);
• визуализировать структуру связей между несколькими сообществами в виде графа, вершинами которого являются эти сообщества, а ребрами — соответствующие связи между ними (город, ссылки на одни и те же ресурсы или на друг друга, страна, наличие общих пользователей в графе контакты);
• предоставить инструменты для базового анализа полученных графов (вычисление показателей центральности, среднего для показателей центральности, количества вершин и ребер, вычисление количества изолированных вершин, количества компонент связности, количества вершин максимальной компоненты связности и др.) ;
• предоставить возможность импортировать данные о структурах в виде CSV файлов.
Таким образом были решены все поставленные задачи. Был обеспечен сбор данных о структурах онлайн-сообществ социальной сети «ВКонтакте», включая список контактов, город, ссылки, страна и информацию об участниках. Была обеспечена визуализация структуры сообщества в виде графа, вершинами которого являются участники этого сообщества, а ребрами — соответствующие связи между этими пользователями (дружба, обучение в одном вузе, город, родной город, обучение в одной школе, наличие общих сообществ). Была обеспечена визуализация структуры связей между несколькими сообществами в виде графа, вершинами которого являются эти сообщества, а ребрами — соответствующие связи между ними (город, ссылки на одни и те же ресурсы или на друг друга, страна, наличие общих пользователей в графе контакты). Были предоставлены инструменты для базового анализа полученных графов (вычисление показателей центральности, среднего для показателей центральности, количества вершин и ребер, вычисление количества изолированных вершин, количества компонент связности, количества вершин максимальной компоненты связности и др.). Была предоставлена возможность импортировать данные о структурах в виде CSV файлов.
Таким образом, цель — автоматизировать сбор, обработку и визуализацию информации об онлайн-сообществах в социальной сети «ВКонтакте», можно считать достигнутой.
Работа выполнялась в рамках исследований, проводимых в лаборатории теоретических и междисциплинарных проблем информатики СПИИРАН. Результаты работы были представлены на конференции СПИСОК-2017, доклад «Интер- и интрасетевые связи:визуализация и анализ».
[1] Gephi - The Open Graph Viz Platform. — URL: http://gephi.org (дата обращения: 9.11.2016).
[2] Hummel H. G. K. et al. Encouraging contributions in learning networks using incentive mechanisms // Journal of computer assisted learning. — 2005. — Vol. 21, no. 5. — P. 355-365.
[3] IQBuzz. — URL: http://iqbuzz.pro/ (дата обращения: 5.05.2017).
[4] Martinez M. G., Walton B. The wisdom of crowds: The potential of online communities as a tool for data analysis // Technovation. — 2014. — Vol. 34, no. 4. — P. 203-214.
[5] Quercia D. et al. The personality of popular facebook users // Proceedings of the ACM 2012 conference on computer supported cooperative work. — 2012.
[6] R.NET - Home. — URL: http://rdotnet.codeplex.com (дата обращения: 19.11.2016).
[7] Ramo D. E., Prochaska J. J. Broad reach and targeted recruitment using Facebook for an online survey of young adult substance use // Journal of medical Internet research. — 2012. — Vol. 14, no. 1. — P. e28.
[8] Ren Y. et al. Building Member Attachment in Online Communities: Applying Theories of Group Identity and Interpersonal Bonds // Mis Quarterly. — 2012. — Vol. 36, no. 3. — P. 841-864.
[9] Smith M.A., Rainie L., Shneiderman B. Mapping twitter topic networks: From polarized crowds to community clusters // Pew Research Internet Project. — 2014.
[10] Sun N., Rau P.P.L., Ma L. Understanding lurkers in online communities: A literature review // Computers in Human Behavior. — 2014. —Vol. 38. —P. 110-117.
[11] Wasserman S., Faust K. Social networks analysis: Methods and applications. — New York: Cambridge University, 2005.
[12] Wikipedia.— URL: https://en.wikipedia.org/wiki/VK_Csocial_ networking) (дата обращения: 20.05.2017).
[13] YouScan.— URL: https://youscan.io/ (дата обращения: 20.05.2017).
[14] igraph - Network analysis software. — URL: http://igraph.org/ (дата обращения: 25.11.2016).
[15] Разработчикам | ВКонтакте. — URL: https://vk.com/dev (дата обращения: 20.11.2016).
...