Тема: АНАЛИЗ СООБЩЕНИЙ ПО ЗАДАННОЙ ТЕМАТИКЕ ИЛИ АВТОРУ ДЛЯ ВЫЯВЛЕНИЯ АВТОМАТИЧЕСКИХ КОММЕНТАРИЕВ В СОЦИАЛЬНЫХ СЕТЯХ
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
ГЛАВА 1. НЕЙРОННАЯ СЕТЬ 5
1.1 Машинное обучение 5
1.2 Виды машинного обучения 7
1.3 Нейронная сеть 9
1.4 Нейроны 11
1.5 Распространение сигналов по нейронной сети 15
1.6 Метод градиентного спуска 17
1.7 Подготовка данных 19
ГЛАВА 2. ПРАКТИЧЕСКАЯ ЧАСТЬ 21
2.1 Типы фейковых аккаунтов 21
2.2 Выбор социальной сети 24
2.3 Класс нейронной сети 25
2.4 Входные параметры 27
2.5 Анализ текстовых сообщений 29
2.6 Обучение нейронной сети 36
2.7 Тестирование нейронной сети 38
ЗАКЛЮЧЕНИЕ 41
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 43
ПРИЛОЖЕНИЕ
📖 Введение
Злоумышленник, проанализировав дату рождения или имена детей, может попытаться подобрать пароль к учетной записи пользователя. Кроме того, он может использовать методы социальной инженерии (фишинг, претекстинг и др.) для проведения атак на страницы пользователей.
Социальная сеть агрегирует данные о своих пользователях, что позволяет злоумышленникам определять их потребности.
В связи с этим, возникает проблема возникновения и распространения в социальных сетях фейковых (англ. fake — «подделка») аккаунтов, ботов для хищении личных данных пользователей.
Объект работы — взаимодействие пользователей социальной сети посредством сообщений и комментариев.
Предмет работы — информация на страницах пользователей социальной сети «ВКонтакте».
Цель работы — разработать систему обнаружения ботов и фейковых аккаунтов в выбранной социальной сети, анализирующей текстовые сообщения.
Задачи:
1. Изучить теоретические основы нейронных сетей и рассмотреть основные принципы и существующие методы решения задач машинного обучения.
2. Разработать модель нейронной сети.
3. Разработать набор скриптов для анализа пользователей социальной сети.
4. Создать нейронную сеть и провести ее обучение на подготовленной выборке пользователей.
5. Проверить эффективность системы обнаружения ботов и фейковых аккаунтов
Работа состоит из двух основных глав. В первой главе рассматриваются теоретические основы нейронной сети, во второй — этапы программной реализации и полученные результаты, подведение итогов.
✅ Заключение
В связи с этим, проанализировано взаимодействие пользователей социальной сети «ВКонтакте» посредством сообщений и комментариев. Выбор социальной сети обусловлен наибольшей популярностью в России, а также предоставлением гибкого инструментария и документации для работы с сервером vk.com.
Для решения актуальной проблемы разработана система обнаружения фейковых аккаунтов, анализирующей текстовые сообщения. Эффективным инструментом семантического анализа текста является глубокое машинное обучение, а именно, нейронные сети.
При разработке системы:
1. Изучены теоретические основы нейронной сети и рассмотрены основные принципы и существующие методы решения задач МО.
2. Разработана модель нейронной сети, состоящая из 21 входных узлов, 1 скрытого слоя из 10 узлов и 2 выходных узлов.
3. Разработан набор скриптов, позволяющий с помощью API Вконтакте проанализировать пользователей социальной сети. С каждой тестовой страницы получен набор атрибутов, характеризующих пользователя.
4. По полученным атрибутам собрана обучающая выборка, состоящая из 10 примеров, и тестовая выборка, состоящая из 20 примеров. На основе полученной выборки проведено обучение и тестирование сети.
5. Проверена эффективности системы, которая равна 65%, что значит, из 20 тестов верный ответ получен в 13 случаях. Остальные 35% составляют ошибки первого и второго рода, в процентном соотношении 71,4% и 28,6% соответственно.
Полученная эффективность нейронной сети позволяет сделать вывод о том, что система распознавания фейковых аккаунтов в социальной сети «ВКонтакте» позволяет классифицировать пользователей. Все поставленные задачи выполнены и цель работы достигнута.
Сложностями данной работы является подготовка входных параметров, позволяющих точно описать страницу пользователя.
Данная система может быть внедрена в социальную сеть «ВКонтакте» и использована для показания уровня доверия к пользователю, например, при поступлении заявки в друзья.
Для повышения показателя эффективности сети и дальнейшего улучшения системы необходимо протестировать сеть при различных условиях. Изменять коэффициент обучения, увеличить количество примеров в наборе тренировочных данных, многократно повторить тренировочных циклы, изменять конфигурацию сети. Также сменить ключ доступа с серверного на пользовательский или секретный, что позволит получить больше информации о пользователе, расширит входные параметры. Помимо анализа текстовых сообщений на спам, необходимо проанализировать сообщения на бессмысленный поток символов, наличие ссылок, а также подключить поддержку иностранных слов.



