Тип работы:
Предмет:
Язык работы:


Определение эффективных подгрупп в социальной группе на основе применения методологии анализа социальных сетей (ЗИЛ-методологии)

Работа №100200

Тип работы

Магистерская диссертация

Предмет

информационные системы

Объем работы77
Год сдачи2020
Стоимость4800 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
177
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 7
ОПРЕДЕЛЕНИЯ, ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ 10
1 МЕТОДОЛОГИЯ ИССЛЕДОВАНИЯ СОЦИАЛЬНЫХ СЕТЕЙ (8ИА-МЕТОДОЛОГИЯ) 12
1.1 Типы малых социальных групп 15
1.2 Инструментарий 8ИА 16
1.2.1 Программный инструмент Pajek 17
1.2.2 Программный инструмент UCInet 19
1.2.3 Программный инструмент NetworkX 19
1.2.4. Сравнение программных инструментов: общие принципы . 21
1.2.5 Сравнение основных функциональных возможностей 21
1.2.6 Сравнение функционала визуализации, предоставляемого
программными инструментами 23
1.3 Выбор программных инструментов для проведения детального
сравнения 27
2 ИНФОРМАЦИОННАЯ БАЗА ИССЛЕДОВАНИЯ 29
2.1 Сбор информации 29
2.2 Формирование социоматрицы 30
2.3 Результаты подготовки исходных данных 32
3 РАЗНОВИДНОСТИ ПОДГРУПП 34
3.1 Подход «снизу вверх» 35
3.1.1 Клика 35
3.1.2 И-клика 36
3.1.3 И-Клан 37
3.1.4 К-сплетение 37
3.2 Подход «сверху вниз» 39
3.2.1 Компоненты 40
3.2.2 Блоки и точки среза (бикомпоненты) 40
3.2.3 Лямбда-наборы и мосты 41
3.2.4 Фракции 41
3.3 Сравнение популярных алгоритмов кластеризации графов ... 43
4 АНАЛИЗ ФУНКЦИОНАЛЬНЫХ ВОЗМОЖНОСТЕЙ
ПРОГРАММНЫХ ИНСТРУМЕНТОВ ПО ВЫЯВЛЕНИЮ ПОДГРУПП 44
4.1 Программный инструмент ИС1пе1 44
4.1.1 Выявление клик 44
4.1.2 Выявление п-клик 45
4.1.3 Выявление п-кланов 46
4.1.4 Выявление к-сплетений 47
4.1.5 Выявление лямбда-наборов 48
4.1.6 Выявление сообществ алгоритмом Гирвана-Ньюмана 49
4.2 Программный инструмент Ра)ек 50
4.2.1 Степени центральности 50
4.2.2 Бикомпоненты 51
4.2.3 Метод к-ближайших соседей 51
4.2.4 Обобщенное к-ядро 52
4.2.5 Острова 54
4.2.6 Блочная модель 55
4.2.7 Р-клики 55
4.3 Программный инструмента ОерЫ 57
4.3.1 Лувенский алгоритм 57
4.3.2 Лейденский алгоритм 58
4.3.3 Алгоритм О1гуап-Ие’№шап 59
4.4 Библиотека NetworkX 60
4.4.1 Алгоритм разбиения графа на две части 61
4.4.2 Алгоритм выявления к-клик 62
4.4.2 Алгоритм выявления «модульных» сообществ 62
4.4.3 Метод распространения меток 63
4.4.4 Алгоритм выявления «жидких» сообществ 64
4.4.5 Алгоритм Гирвана-Ньюмана 65
4.5 Сравнительный анализ программных инструментов 66
ЗАКЛЮЧЕНИЕ 67
СПИСОК ИСТОЧНИКОВ 69
ПРИЛОЖЕНИЕ А 72
ПРИЛОЖЕНИЕ Б 73
ПРИЛОЖЕНИЕ В 76
ПРИЛОЖЕНИЕ Г

Математическую модель, отражающую взаимоотношения между людьми построить или сложно, или вообще невозможно: такая модель должна учитывать элемент случайности, множество индивидуальных характеристик, большинство из которых нельзя оценить численно. Основная сложность в том, как можно количественно оценить дружбу или антипатию. Часто опыт, или, как это называет кибернетика - «предыстория», должен быть принят во внимание для построения наиболее адекватной модели.
Важно определить, каким образом можно оценить характер взаимодействия, его силу и качество, для решения этой задачи можно использовать как аналитический, так и эмпирический подход. Например, как поступит обычный человек, если окажется в незнакомой ситуации и будет вынужден строить взаимоотношения с людьми, которых видит впервые? Если бы человек рассуждал как машина, то наиболее логичным было бы использование системы мер и весов, сбор начальных данных и их оценка в рамках установленной системы мер. Однако люди поступают иначе, они ориентируются на собственный опыт и интуицию. Понимание этого необходимо для построения правильной модели исследователем.
Задача определения подгрупп в некотором рабочем коллективе важна особенно с точки зрения формирования в будущем в этом коллективе успешно работающих команд.
Одной из основных проблем в изучении социальных структур является их субструктура с точки зрения группировок. Количество, размер и соединения между подгруппами в сети могут многое сказать нам о вероятном поведении сети в целом. Как быстро все будет происходить через акторов в сети? Будут ли конфликты, затрагивать несколько групп или фракций. В какой степени подгрупп перекрывают друг друга? Все эти аспекты структуры подгруппы могут быть очень важны для прогнозирования поведения сети в целом.
Сетевой подход при изучении социальной группы может многое сказать о том, как существует этот человек в некоторой социальной группе (сети). Некоторые люди могут действовать как «мосты» между подгруппами, другие могут быть изолянтами; некоторые действующие лица могут быть космополитами, а другие - местными с точки зрения их групповой принадлежности. Такие различия в способах, которыми индивиды связаны с группами, могут быть весьма важны для их поведения.
Один из наиболее распространенных интересов структурных аналитиков заключается в «подструктурах», которые могут присутствовать в сети. Диады, триады и эгоцентричные окрестности, можно рассматривать как субструктуры.
Многие из подходов к пониманию структуры сети подчеркивают, как плотные связи строятся от простых диад и триад до более расширенных плотных кластеров, таких как «клики». Этот взгляд на социальную структуру акцентирует внимание на том, как солидарность и связь крупных социальных структур могут быть построены из мелких и тесных компонентов: своего рода подход «снизу вверх». Сетевые аналитики разработали ряд полезных определений алгоритмов, которые определяют, как большие структуры составляются из меньших, таких как клики, п-клики, п-кланы, к-сплетения и др.
Разделение действующих лиц на группы и подструктуры может быть очень важным аспектом социальной структуры. Это может быть важно для понимания того, как может вести себя сеть в целом. Предположим, что участники одной сети образуют две непересекающиеся группы; и предположим, что участники другой сети также образуют две группы, но членство в них частично совпадает (некоторые люди являются членами обеих групп). Там, где группы перекрываются, можно ожидать, что конфликт между ними менее вероятен, чем когда группы не перекрываются. Там, где группы перекрываются, мобилизация и распространение могут быстро распространяться по всей сети; там, где группы не пересекаются, черты могут встречаться в одной группе и не распространяться на другую.
Также можно искать субструктуру «сверху вниз». Рассматривая всю сеть, можно думать о подструктурах как об областях графа, которые кажутся локально плотными, но в некоторой степени отделенными от остальной части графа.
Идея о том, что некоторые области графа могут быть менее связаны с целым, чем другие, может привести к пониманию линий расщепления и деления. Более слабые стороны в «социальной ткани» также создают возможности для брокерских и менее ограниченных действий. Таким образом, количество и размеры регионов, а также их «топология соединения» могут быть важны для прогнозирования как возможностей и ограничений, с которыми сталкиваются группы и участники, так и для прогнозирования эволюции самого графа.
Обнаружение подгруппы — это описательная задача локального анализа шаблонов, целью которой является поиск подмножеств данного набора данных, в которых распределение двоичной целевой переменной существенно отличается от ее распределения во всех данных, измеряемых мерой качества. Как правило, подгруппы описываются сочетаниями условий на атрибутах набора данных.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе работы были рассмотрены популярные программные инструменты, поддерживающие методологию анализа социальных систем, такие как: Pajek, UCInet, Gephi и библиотека для языка Python NetworkX. Были изучены их функциональных возможности, которые можно применить для решения задач определения подгрупп. Помимо этого, также были рассмотрены встроенные механизмы визуализации графов.
Было проведено исследование для определения производственных связей в реальных социальных группах. На основе проведенных опросов была создана информационная база исследования.
Были изучены наиболее популярные методики к определению подгрупп, а также степень их поддержки существующими программными инструментами и удобство использования.
Были рассмотрены основные разновидности «подгрупп», разработанные теоретически, реальность их существования была подтверждена их обнаружением в реально существующих социальных группах.
При сравнительном анализе программных инструментов было установлено, что в системе Pajek реализовано большее число алгоритмов, также можно настраивать большее число параметров, что позволяет получить более точные результаты. Этот инструмент более удобен для решения задач, связанных с выявлением подгрупп, поскольку предоставляет пользователю дополнительную возможность визуального отображения полученных результатов. Стоит отметить, что Pajek работает с сетью как с набором векторов и в некоторых случаях это может стать значимым ограничением, однако для решения поставленной задачи этот инструмент подходит лучше всего.
Было установлено что программный инструмент Gephi обладает хорошими встроенными средствами визуализации, помимо этого, он обладает удобными средствами проведения аналитических вычислений базовых характеристик. Однако, в сравнении с другими рассмотренными инструментами имеет, у него достаточно небольшой функционал аналитических функций. Для решения поставленной задачи он не подходит.
Было выявлено, что коммерческий программный инструмент UCInet имеет самую большую и подробную документацию, очень большой перечень доступных алгоритмов анализа графов, однако, имеет не очень удобный интерфейс. Для решения задачи выявления подгрупп в социальной группе этот инструмент подходит.
Наравне с существующими программными инструментами также была рассмотрена библиотека NetworkX. Было выявлено, что эта библиотека хорошо справляется с решением типовых аналитических задач, помимо этого, в ней имеются средства визуализации сетей. Этот пакет обладает достаточно подробной и качественной документацией. Для решения поставленной задачи рассмотренный программный пакет также может быть использован, при этом требуется знание языка Python на базовом уровне.
Было проведено сравнение различных алгоритмов кластеризации для определения подгрупп как более плотных кластеров, в результате удалось установить, что для используемой выборки наиболее эффективно работает алгоритм Лувена.
Исходя из выше сказанного можно заключить, что цель работы была достигнута.



1. Social network analysis // Wikipedia / Page Version ID: 954907676. - 2020.
2. СОЦИОМАТРИЦА [Электронный ресурс]. - URL:
https: //dic.academic.ru/dic. nsf/dic_new_philosophy/115 5/%D0%A 1 %D0%9 E%D0%A6%D0%98%D0%9E%D0%9C%D0%90%D0%A2%D0%A0%D0 %98%D0%A6%D0%90 (дата обращения: 22.05.2020).
3. Клика (теория графов) // Википедия / Page Version ID: 105833641. - 2020.
4. Кластерный анализ // Википедия / Page Version ID: 103549142. - 2019.
5. Инструментальное программное обеспечение // Википедия / Page Version ID: 97482468. - 2019.
6. Актор (социальные науки) // Википедия / Page Version ID: 105257456. - 2020.
7. ДИАДА И ТРИАДА [Электронный ресурс]. - URL: https://explanatory_sociological .academic.ru/467/%D0%94%D0%98%D0% 90%D0%94%D0%90_%D0%98_%D0%A2%D0%A0%D0%98%D0%90% D0%94%D0%90 (дата обращения: 22.05.2020).
8. Anaconda (Python distribution) // Wikipedia / Page Version ID: 953681663. - 2020.
9. Плагин // Википедия / Page Version ID: 105772347. - 2020.
10. GNU General Public License // Wikipedia / Page Version ID: 958100539. - 2020.
11. Ольга Зверева. Управление сетями коммуникаций в социальных и экономических системах, обладающих свойством аутопоэза: Диссертация на соискание ученой степени кандидата технических наук / Ольга Зве-рева. - Новосибирск: ФГБОУ ВО СибГУТИ, 2017. - 207 с.
12. Types of social groups // Wikipedia / Page Version ID: 953971867. - 2020.
13. Description [Электронный ресурс]. - URL:
http://www.analytictech.com/ucinet/description.htm(дата обращения: 22.05.2020).
14. Networks / Pajek [Электронный ресурс]. - URL: http://vlado.fmf.uni- lj.si/pub/networks/pajek/(дата обращения: 21.05.2020).
15. Gephi - The Open Graph Viz Platform [Электронный ресурс]. - URL: https://gephi.org/(дата обращения: 22.05.2020).
16. Overview of NetworkX — NetworkX 2.4 documentation [Электронный ресурс]. - URL: https://networkx.github.io/documentation/stable/(дата обращения: 22.05.2020).
17. Batagelj V. Pajek Manual / V. Batagelj, A. Mrvar. - P. 98.
18. Mrvar A. Analysis and visualization of large networks with program package Pajek / A. Mrvar, V. Batagelj // Complex Adaptive Systems Modeling. - 2016. - Т. 4. - № 1. - С. 6.
19. Gephi Plugin [Электронный ресурс]. - URL: https://gephi.org/plugins/#/(дата обращения: 22.05.2020).
20. Introduction to soical network methods: Chapter 11: Cliques and sub-groups
[Электронный ресурс]. - URL: https://faculty.ucr.edu/~han-
neman/nettext/C11_Cliques.html#Bottom (дата обращения: 22.05.2020).
21. Networks -> Subgroups -> N-Cliques [Электронный ресурс]. - URL: http://www.analytictech.com/ucinet/help/attepv.htm(дата обращения: 22.05.2020).
22. Bron-Kerbosch algorithm // Wikipedia / Page Version ID: 946251277. - 2020.
23. Метод Гирвана-Ньюмана [Электронный ресурс]. - URL: /2015726/in- formatika/metod_girvana_nyumana (дата обращения: 22.05.2020).
24. Pajek NET Format [Электронный ресурс]. - URL: https://gephi.org/users/supported-graph-formats/pajek-net-format/(дата об-ращения: 22.05.2020).
25. Stochastic block model // Wikipedia / Page Version ID: 951038379. - 2020.
26. Using the Leiden algorithm to find well-connected clusters in networks [Электронный ресурс]. - URL: https://www.cwts.nl:443/blog?article=n- r2u2a4(дата обращения: 22.05.2020).
27. Project Jupyter [Электронный ресурс]. - URL: https://www.jupyter.org(дата обращения: 22.05.2020).
28. Особенности Jupyter Notebook, о которых вы (может быть) не слышали
[Электронный ресурс]. - URL:
https://habr.com/ru/company/wunderfund/blog/316826/(дата обращения: 22.05.2020).
29. networkx.algorithms.
community.label_propagation.label_propagation_communities — NetworkX 2.4 documentation [Электронный ресурс]. - URL:
https : //networkx. github. io/documentation/stable/reference/algorithms/genera ted/networkx.algorithms.community.label_propagation.label_propagation_c ommunities.html (дата обращения: 22.05.2020).
30. Модульное разложение // Википедия / Page Version ID: 101597927. - 2019.
31. networkx.algorithms. community.label_propagation.asyn_lpa_communities — NetworkX 2.4 documentation [Электронный ресурс]. - URL: https : //networkx. github. io/documentation/stable/reference/algorithms/genera ted/networkx.algorithms .community.label_propagation.asyn_lpa_communiti es.html#networkx.algorithms.community.label_propagation.asyn_lpa_comm unities (дата обращения: 22.05.2020).
32. networkx.algorithms. community.asyn_fluid.asyn_fluidc — NetworkX 2.4
documentation [Электронный ресурс]. - URL:
https : //networkx. github. io/documentation/stable/reference/algorithms/genera ted/networkx.algorithms.community.asyn_fluid.asyn_fluidc.html (дата об-ращения: 22.05.2020).


Работу высылаем на протяжении 30 минут после оплаты.




©2024 Cервис помощи студентам в выполнении работ