Тема: Компромиссное решение в конкурентной модели по выявлению скрытых сообществ в социальной сети YouTube
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Глава 1. Обзор литературы 6
Глава 2. Алгоритмы выявления скрытых сообществ 16
2.1. Математические обозначения 16
2.2. Алгоритм поиска ядер графа 17
2.3. Алгоритм поиска клик графа 19
2.4. Алгоритмы поиска кластеров графа 20
2.4.1. MST 20
2.4.2. NAG 21
Глава 3. Компромиссное решение 23
Глава 4. Программная реализация 27
4.1. Архитектура 27
4.2. Обработка данных 28
Глава 5. Апробация 31
5.1. Ядра графа 32
5.2. Клики графа 34
5.3. Кластеры графа (MST) 35
5.4. Кластеры графа (NAG) 37
5.5. Компромиссное решение 38
5.6. Тестирование 39
Заключение 46
Список литературы 47
📖 Введение
Анализ социальных сетей на сегодняшний день развивается достаточно быстро. Одной из центральных задач анализа социальной сети является задача выявления скрытых сообществ на основе исследования взаимодействий между пользователями. Под скрытыми сообществами понимаются группы людей, которые невозможно определить без применения специальных математических алгоритмов.
Объектом исследования является социальная сеть YouTube. По статистике на 2020 год она охватывает 2 миллиарда пользователей в мире (69.1% населения в России). Это говорит о том, что в YouTube присутствует достаточно большое количество пользователей, из которых формируются крупные сообщества, что интересно исследовать в дальнейшем.
Задача выявления скрытых сообществ относится к классу задач кластеризации. Одним из интересных направлений исследования является определение пересекающихся сообществ (overlapping community), случай, когда один и тот же пользователь может относиться сразу к нескольким скрытым группам.
Актуальность данного направления исследований обусловлена популярностью использования социальной сети YouTube. Если изначально данная социальная сеть была создана с целью распространения видео по Всемирной паутине, то сейчас ее используют для распространения какой-либо информации, начиная с рекламы и спама, заканчивая сообщениями для участников скрытой группы людей. Поэтому считается, что в данном исследовании может быть заинтересовано большое количество физических лиц или организаций, что смогут выбрать конкретный алгоритм для использования его в своих целях в дальнейшем.
Применяя разные алгоритмы по выявлению таких сообществ, мы получаем несколько результатов для дальнейшего исследования со стороны агентов (физическое лицо или организация). Интересно было бы оценивать их эффективность и рассматривать их применение в социологии, политике, экономике. У каждого агента есть собственная оценка алгоритмов, он расставляет эти алгоритмы в порядке приоритета. Таким образом, между множеством агентов возникает противоречие в выборе конкретного алгоритма по поиску скрытых сообществ. В связи с этим в данной работе рассматривается задача поиска компромиссного решения, что основывается на теории игр. Оптимальное решение задачи позволяет найти компромисс для агентов в возникающей конфликтной ситуации.
На сегодняшний день существует большое количество инструментов, направленных на выявление кластеров пользователей в социальной сети с использованием теории графов, однако ни один из них не является универсальным. Обусловлено это тем, что в данных решениях можно подчеркнуть либо высокую стоимость, либо отсутствие открытого доступа к исходному коду и, как следствие, невозможность направления компонентов программы на решение определенных задач.
Целью исследовательской работы является разработка программного продукта, что позволяет:
1. Выявить скрытые сообщества;
2. Визуализировать результаты;
3. Сохранить полученные результаты для дальнейшей оценки со стороны агентов;
4. Найти компромиссное решение по полученным оценкам.
В данной работе использованы идеи из статьи [1]. Отсюда наследуется способ сбора необходимых для исследования данных и математическая модель.
Сформулируем задачи для достижения поставленной цели:
1. Модифицировать алгоритм сбора данных;
2. Реализовать/включить в проект новые алгоритмы по выявлению скрытых сообществ и протестировать их;
3. Реализовать возможность настройки параметров для алгоритмов;
4. Реализовать визуализацию c отображением сообществ;
5. Реализовать пользовательский интерфейс для знакомства и оценки результатов алгоритмов со стороны агентов;
6. Реализовать алгоритм поиска компромиссного решения;
7. Провести апробацию и тестирование на реальных данных социальной сети YouTube.
В результате разработано программное решение, что предоставляет для ознакомления агентам несколько подходов по выявлению скрытых сообществ и помогает выбрать им совместное оптимальное решение, решить конфликтную ситуацию.
✅ Заключение
• реализованы алгоритмы по выявлению скрытых сообществ;
• реализована возможность выбора параметров для конкретного алгоритма;
• модифицирован алгоритм сбора данных;
• реализована визуализация выявленных групп;
• реализован User Interface для знакомства и оценки результатов алгоритмов агентами;
• реализован алгоритм поиска компромиссного решения;
• проведена апробация и тестирование на актуальных данных за 2020 год социальной сети YouTube.
Отметим, что в качестве скрытых сообществ можно считать отдельные ядра, клики, кластеры или же разделять на некоторые классы тех пользователей, которые относятся сразу к нескольким ядрам или кликам. Используя рассмотренные алгоритмы, мы можем разбивать множество вершин на группы, а затем находить среди них узлы, которые входят сразу в несколько сообществ или же относятся к достаточно крупным кластерам.
В перспективе данную работу можно использовать как в поиске террористических группировок в социальной сети YouTube, так и в направлении каких-либо других социальных исследований. Для увеличения спроса на рынке в будущем программный продукт необходимо модифицировать по следующим пунктам:
• производительность;
• параметры алгоритмов выявления скрытых сообществ.
Результаты исследовательской работы частично опубликованы в статье [2].





