Тема: ПРИМЕНЕНИЕ СЕТЕВОГО АНАЛИЗА В ПРОГНОЗИРОВАНИИ ЛИЧНОСТНЫХ ХАРАКТЕРИСТИК ПОЛЬЗОВАТЕЛЯ СОЦИАЛЬНОЙ СЕТИ
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
ВВЕДЕНИЕ 7
1 Постановка задачи 9
2 Теоретическая часть 10
2.1 Критерии качества данных и методы предварительной обработки данных 10
2.1.1 Очистка данных 11
2.1.2 Сокращение данных 12
2.1.3 Интеграция данных 14
2.1.4 Преобразование данных 15
2.2 Сетевой анализ эго-графов «друзей» 16
2.2.1 Сообщества в эго-графе 18
2.2.2 Предобработка графа для задачи выделения сообществ 19
2.2.3 Алгоритмы кластеризации 20
2.2.3.1 Лувенский алгоритм 21
2.2.3.2 Алгоритм Гирван-Ньюмона 23
2.2.3.3 Алгоритм обнаружения сообщества кликовой перколяции 24
2.3 Построение модели прогнозирования 26
2.3.1 Логистическая регрессия 26
2.3.2 Решающие деревья 27
2.3.3 Метрики качества 27
3 Практическая часть 29
3.1 Подготовка и предобработка данных с результатами тестирования и публичной
информации из социальной сети 29
3.1.1 Структура данных 29
3.1.2 Предобработка данных и подготовка датасета 31
3.2 Анализ графа «друзей» и вычисление его структурных характеристик 35
3.2.1 Предобработка эго-графа 36
3.2.2 Выделение сообществ в эго-графе 37
3.2.3 Расчет структурных характеристик эго-графа 44
3.3 Построение моделей прогнозирования 45
3.3.1 Модели прогнозирования с применением Лувенского метода 48
3.3.2 Модели прогнозирования с применением алгоритма перколяции клики 53
3.4 Программная реализация 54
3.4.1 Алгоритм построения модели прогнозирования и вычисления метрик качества 57
ЗАКЛЮЧЕНИЕ 60
ЛИТЕРАТУРА 61
ПРИЛОЖЕНИЕ А (Описание структуры данных из профиля социальной сети) 64
ПРИЛОЖЕНИЕ Б (Программная реализация загрузки данных) 67
ПРИЛОЖЕНИЕ В (Программная реализация предобработки эго-графов) 68
ПРИЛОЖЕНИЕ Г (Программная реализация применения алгоритмов выделения сообществ) 69
ПРИЛОЖЕНИЕ Д (Программная реализация вычисления структурных сетевых характеристик) 74
📖 Введение
Во многих работах были выявлены устойчивые взаимосвязи между индивидуально¬психологическими характеристиками и поведением людей в Интернете. Так, черты личности влияют на уровень общей интернет-активности человека в социальных сетях и используемую лексику. [5] Кроме того было проведено множество исследований, в результате которых стало понятно, что индивидуальные черты характера человека имеют значительное влияние на формирование его круга общения в сети. [6]
Сегодня все больше ученных задается вопросом: можно ли, используя цифровой след, выявить личные черты и эмоциональное состояние человека?
Основным источником цифровых следов выступают социальные сети (Facebook, Вконтакте, Twitter, Инстаграм, и другие). На основании цифровых следов чаще всего осуществляется прогноз личностных черт (в основном это черты, относящиеся к «Большой пятерке»: открытость опыту, добросовестность, экстраверсия, дружелюбие, нейротизм) [2] и эмоциональных состояний (тревоги, депрессии и др.) [3]
В данной работе рассматриваются различные варианты выявления взаимосвязи между поведением пользователей в социальной сети «Вконтакте» и их личностными характеристиками. Исследование включает анализ различных методов предобработки и подготовки данных цифрового следа, анализ структуры эго-сетей, сформированных на основе информации о «дружбе», путем выделения сообществ и расчета структурных сетевых характеристик, а также подбор классических алгоритмов машинного обучения для задачи классификации, подбор их гиперпараметров и настройку.
В зарубежной литературе можно найти множество исследований, которые описывают разные подходы и методы для прогнозирования психологических характеристик на основе социальных сетей, как правило, это Facebook или Twitter. Среди работ подобного плана можно отметить работы «Our Twitter Profiles, Our Selves: Predicting Personality with Twitter» David Stillwell, Jon Crowcroft [7]. В данном исследовании была проанализирована взаимосвязь между личностью и различными типами пользователей Twitter. В работе описывается способ точного прогнозирования личностных черт пользователя на основе трех общедоступных признаков в профиле: подписок, подписчиков и перечисленных показателей. В статье Lambiotte R., Kosinski M. «Tracking the digital footsprints of personality» представлен обзор литературы, показывающей, как широко распространенные записи цифровых следов, такие как профиль в Facebook могут использоваться для прогнозирование психологических характеристик человека. [8]
Большинство отечественных исследований сосредоточено на взаимосвязи цифрового следа и обучающего процесса. В работе Мацута В.В., Киселева П.Б., Фещенко А.В., Гойко В.Л. «Исследование потенциала социальных сетей для выявления одаренных старшеклассников» рассматривается структура и содержание социальной сети «Вконтакте» для оценки компонентов одаренности. [9] Есть и работы, направленные на определения уровня выраженности личностных черт пользователя на основании персональных профилей социальной сети. Например, работа Станкевича М. А., Смирновой И. В., Игнатьева Н. А., Кисельникова Н. В. «Выявление личностных черт у пользователей социальной сети Вконтакте». [10] Однако в этой работе, как и многих других, взаимосвязи определяются на основе лингвистического анализа текстов пользователя и открытых данных из профиля, не беря во внимание структуру связей между пользователями.
Исследований, в которых прогнозируются личностные характеристики на основе сетевого анализа, сравнительно не много, или же они опираются не на данные, полученные из социальных сетей, а из других источники. К примеру, в работе J. Statiano, B. Lepri, F. Pianesi, N. Sebe «Friends don't Lie - Inferring personality traits from social network structure» исследуется взаимосвязь между структурными сетевыми характеристиками (включая эго¬сети) и личностью, на основании данных полученных из смартфона человека (метаданные входящих звонков и сообщений). [11]
Таким образом, актуальность работы заключается в синтезе различных подходов к прогнозирование личностных характеристик на основе цифровых следов из социальной сети. Немаловажно, что данные, используемые в исследовании, являются абсолютно уникальными и реальными. Результаты такого анализа могут быть использованы в разных целях: повышение качества образования, прием сотрудников на работу, выдача банковских кредитов и другое.
✅ Заключение
Также был проведен сетевой анализ эго-графов «друзей» респондентов из социальной сети «Вконтакте», в рамках которого было рассмотрено три метода выделения сообществ (Лувенский метод, алгоритм Гирван-Ньюмона, метод перколяции клик), проведен их сравнительный анализ и предложены сетевые структурные характеристики, которые могут выступать в качестве признаков для моделей прогнозирования личностных характеристик.
Для построения моделей прогнозирования было рассмотрено два классических алгоритма машинного обучения (Логистическая регрессия и Решающие деревья). Чтобы улучшить модели были подобраны их гиперпараметры, а также наиболее значимые признаки, поступающие на вход.
При оценке качества прогнозирования, на основании построенных моделей, использовалось три метрики (precision, recall и Fl-мера), которые рассчитывались при перекрестной проверки.
Таким образом, в рамках данной работе были выявлены взаимосвязи между цифровым следом (публичная информация из профиля и эго-граф «друзей») пользователей социальной сети «Вконтакте» и их личностными характеристиками, а также построены модели прогнозирования личностных характеристик на основании выявленных взаимосвязей.





