Тип работы:
Предмет:
Язык работы:


Построение и анализ графа профессиональных сообществ социальной сети

Работа №43867

Тип работы

Магистерская диссертация

Предмет

информатика

Объем работы77
Год сдачи2019
Стоимость5700 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
295
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 5
1. Теоретические аспекты анализа социальной сети 7
1.1 Основная теория анализа социальной сети 7
1.2 Основные проблемы и подходы анализа социальных сетей 11
1.3. Обзор существующих программных продуктов для анализа
социальных сетей. 15
2. Формирование модели социальной сети в виде взвешенного графа. 19
2.1 Структура графа. Оценка весов ребер графа. 19
2.2 Построение эмпирического закона распределения значений
весов рёбер. 21
2.3 Оценка параметров теоретического закона распределения значений
весов рёбер. 23
3 Кластеризация исследуемых данных. 27
3.1 Описание алгоритма кластеризации и определение его сложности. 27
3.2 Методы преобразования графов для проведения более
информативной кластеризации, используемые в работе. 30
3.3 Результаты кластеризации данных при применении различных
методов преобразования графа. 41
ЗАКЛЮЧЕНИЕ 50
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 52
ПРИЛОЖЕНИЕ 5

Социальные сети как группы людей, связанные друг с другом, существовали всегда. В социологии это явление выделялось и стало изучаться задолго до появления Интернета. Однако именно специализированные интернет-ресурсы позволили в одночасье собрать огромную базу данных социальных взаимодействий, ценных для изучения.
Анализ социальных данных быстро набирает популярность во всем мире благодаря появлению в 1990-х годах онлайновых социальных сетей (Facebook, Instagram, Twitter и др.). С этим связано явление социализации персональных данных: факты биографии, фото, видео, аудио, информация об интересах и принадлежности к сообществам стали общедоступными. Таким образом, социальные сети являются уникальным источником данных о личной жизни и интересах реальных людей. Это открывает беспрецедентные возможности для решения исследовательских задач.
Социальная сеть, как и любая сеть, может быть математически смоделирована с помощью графа, в котором вершины представляют сетевые объекты, а ребра являются взаимосвязями. В отличие от классических методов анализа, которые исследуют индивидуальные свойства объектов, основной целью анализа социальных сетей является изучение взаимодействий между социальными объектами. Для этого используется ряд количественных и качественных понятий, таких как степень кластеризации, связность и другие.
Анализ социальных сетей является активно развивающимся направлением западной социологии. Интерес исследователей к этой области обусловлен тем, что она предоставляет новый набор моделей и аналитических инструментов, которые выходят за рамки обычных количественных методов.
Новизна магистерской диссертации заключается в следующих аспектах:
1) предлагается новый способ построения графа с использованием различных метрик весов ребер;
2) выявлена взаимосвязь различных оценок весов ребер графа с точностью кластеризации;
3) выявлено влияние различных методов семплирования графа на точность кластеризации;
4) выявлена доля профессиональных сообществ определенной группы пользователей социальной сети.
Целью магистерской диссертации является построение модели взвешенного графа и реализация кластеризации данных с учетом их специфики на основе материалов социальной сети.
Перед началом работы был поставлен ряд задач.
1. Раскрыть теоретические аспекты анализа социальной сети.
2. Сформировать модель социальной сети в виде взвешенного графа.
3 .Кластеризовать данные с применением различных методов
преобразования графа.
4. Провести сравнительный анализ результатов кластеризаций.
Данная диссертация состоит из введения, теоретических, алгоритмических, практических глав и выводов. В конце работы находятся приложения, в которых можно найти дополнительные изображения и исходный код для построения, анализа и визуализации графов.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Основные результаты работы следующие:
1. были исследованы методы анализа социальной сети;
2. была рассмотрена тема теории анализа социальной сети. Сформулированы проблемы, которые могут возникнуть при анализе.
3. В работе исследованы основные особенности и подходы анализа социальной сети.
4. Были рассмотрены существующие программы для исследования графа социальной сети.
Основной целью работы являлось построение модели взвешенного графа и реализация кластеризации данных с учетом их специфики на основе материалов социальной сети. Таким образом, основные аспекты анализа графа были исследованы и проанализированы.
1. На основе изученных материалов и особенностей анализа социальной сети была сформирована модель социальной сети в виде взвешенного графа. Был проведен анализ выбора весов в графе.
2. Для анализа полученных весов были построены эмпирический и теоретический законы распределения весов ребер. Это позволило облегчить анализ структуры графа в дальнейшем.
3. В ходе работы для более информативной кластеризации необходимо было преобразовать граф. Для этого были применены различные методы семплирования графа и выявлен подходящий метод подсчета весов ребер.
4. Кроме того, по полученной модели провели кластеризацию графа. После визуализации кластеризованного графа были проанализированы полученные результаты о том, в каких типах сообществ состоят студенты Казанского федерального университета и есть ли среди них кластер профессиональных сообществ. В результатом исследования был выявлен
кластер профессиональных сообществ, проанализирована структура этого кластера и его взаимосвязь с другими.
Что касается дальнейших исследований, есть несколько возможных направлений. Первое - это построение методики оптимального выбора кластеризации графа социальной сети в зависимости от характера обрабатываемых данных. Второе - это выявление зависимости успеваемости студента от кластера, к которому принадлежат интересные страницы, на которые подписан студент. Третье - это построение графа, в вершинах которого находятся другие данные профиля пользователя сети для более полного анализа успеваемости. Планируется рассмотреть более сложные формы зависимостей. Для этого потребуется построение совместного закона многомерного распределения вероятностей значений изучаемых величин.


[1] Гусарова Н.Ф. “Анализ социальных сетей. Основные понятия и метрики”. Университет информационных технологий, механики и оптики (ИТМО), Санкт-Петербург, 2016. - 152с.
[2] М. Newman. “ Modularity and community structure in networks”, PNAS Vol. 103, N 23, 2006, pp. 8577-8578.
[3] K. Crowston, J. Howison, A. Wiggins. “Validity Issues in the Use of Social Network Analysis for the Study of Online Communities”. Under Second Round Revision for the Journal of the Association of Information Systems (JAIS), 2010. pp. 12 - 18, pp. 20-23.
[4] M. Newman. "The physics of networks”. Physics Today, Vol. 61, Issue 11, 10.1063/1.3027989, 2008.
[5] Porter, Mason A., Jukka-Pekka Onnela, and Peter J. Mucha. "Communities in Networks". Notices of the AMS, Vol. 56 N 9, 2009, pp.1083 - 1091.
[6] Коэффициент сходства. - Режим доступа:
[1й1р8://т^Ыре01а.о^Л¥1кРКоэффициент_сходства]
[7] Метод наименьших квадратов - Режим доступа:
[https://ru.wikipedia.org/wiki/MeTOfl_HaHiYieHbLHHx_KBaflpaTOB]
[8] Hae-Sang Park, Jong-Seok Lee and Chi-Hyuck Jun. “A K-means-like Algorithm for K-medoids Clustering and Its Performance.” Department of Industrial and Management Engineering, POSTECH San 31 Hyoja-dong, Pohang 790-784, S. Korea
[9] Hae-Sang Park, Chi-Hyuck Jun. “A simple and fast algorithm for K-medoids clustering” , H.-S. Park, C.-H. Jun / Expert Systems with Applications 36 (2009) 3336-3341
[10] Force-graph library. - Режим доступа:
[https: //github. com/vasturiano/ force-graph]

Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ