Тип работы:
Предмет:
Язык работы:


АНАЛИЗ СООБЩЕНИЙ ПО ЗАДАННОЙ ТЕМАТИКЕ ИЛИ АВТОРУ ДЛЯ ВЫЯВЛЕНИЯ АВТОМАТИЧЕСКИХ КОММЕНТАРИЕВ В СОЦИАЛЬНЫХ СЕТЯХ

Работа №36028

Тип работы

Дипломные работы, ВКР

Предмет

информатика

Объем работы49
Год сдачи2019
Стоимость4900 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
275
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 3
ГЛАВА 1. НЕЙРОННАЯ СЕТЬ 5
1.1 Машинное обучение 5
1.2 Виды машинного обучения 7
1.3 Нейронная сеть 9
1.4 Нейроны 11
1.5 Распространение сигналов по нейронной сети 15
1.6 Метод градиентного спуска 17
1.7 Подготовка данных 19
ГЛАВА 2. ПРАКТИЧЕСКАЯ ЧАСТЬ 21
2.1 Типы фейковых аккаунтов 21
2.2 Выбор социальной сети 24
2.3 Класс нейронной сети 25
2.4 Входные параметры 27
2.5 Анализ текстовых сообщений 29
2.6 Обучение нейронной сети 36
2.7 Тестирование нейронной сети 38
ЗАКЛЮЧЕНИЕ 41
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 43
ПРИЛОЖЕНИЕ

В настоящее время большинство людей имеет аккаунт в социальных сетях. Социальная сеть — онлайн-платформа, используемая для передачи информации, общения, работы, а также для развлечений. Пользователи, регистрируясь в сети, по собственному желанию публикуют информацию о себе: возраст, местоположение, увлечения, образование и т.п., имея возможность скрыть данные настройками приватности. Тем самым, актуальность работы состоит в том, что информация, открыто опубликованная в социальных сетях, может быть использована в корыстных целях посторонними людьми.
Злоумышленник, проанализировав дату рождения или имена детей, может попытаться подобрать пароль к учетной записи пользователя. Кроме того, он может использовать методы социальной инженерии (фишинг, претекстинг и др.) для проведения атак на страницы пользователей.
Социальная сеть агрегирует данные о своих пользователях, что позволяет злоумышленникам определять их потребности.
В связи с этим, возникает проблема возникновения и распространения в социальных сетях фейковых (англ. fake — «подделка») аккаунтов, ботов для хищении личных данных пользователей.
Объект работы — взаимодействие пользователей социальной сети посредством сообщений и комментариев.
Предмет работы — информация на страницах пользователей социальной сети «ВКонтакте».
Цель работы — разработать систему обнаружения ботов и фейковых аккаунтов в выбранной социальной сети, анализирующей текстовые сообщения.
Задачи:
1. Изучить теоретические основы нейронных сетей и рассмотреть основные принципы и существующие методы решения задач машинного обучения.
2. Разработать модель нейронной сети.
3. Разработать набор скриптов для анализа пользователей социальной сети.
4. Создать нейронную сеть и провести ее обучение на подготовленной выборке пользователей.
5. Проверить эффективность системы обнаружения ботов и фейковых аккаунтов
Работа состоит из двух основных глав. В первой главе рассматриваются теоретические основы нейронной сети, во второй — этапы программной реализации и полученные результаты, подведение итогов.


Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


Популярность социальных сетей, добровольное размещение пользователями информации о себе порождает проблему возникновения фейковых аккаунтов и ботов, которые являются инструментом злоумышленников для хищения информации. Фейковые аккаунты представляют угрозу информационной безопасности пользователей.
В связи с этим, проанализировано взаимодействие пользователей социальной сети «ВКонтакте» посредством сообщений и комментариев. Выбор социальной сети обусловлен наибольшей популярностью в России, а также предоставлением гибкого инструментария и документации для работы с сервером vk.com.
Для решения актуальной проблемы разработана система обнаружения фейковых аккаунтов, анализирующей текстовые сообщения. Эффективным инструментом семантического анализа текста является глубокое машинное обучение, а именно, нейронные сети.
При разработке системы:
1. Изучены теоретические основы нейронной сети и рассмотрены основные принципы и существующие методы решения задач МО.
2. Разработана модель нейронной сети, состоящая из 21 входных узлов, 1 скрытого слоя из 10 узлов и 2 выходных узлов.
3. Разработан набор скриптов, позволяющий с помощью API Вконтакте проанализировать пользователей социальной сети. С каждой тестовой страницы получен набор атрибутов, характеризующих пользователя.
4. По полученным атрибутам собрана обучающая выборка, состоящая из 10 примеров, и тестовая выборка, состоящая из 20 примеров. На основе полученной выборки проведено обучение и тестирование сети.
5. Проверена эффективности системы, которая равна 65%, что значит, из 20 тестов верный ответ получен в 13 случаях. Остальные 35% составляют ошибки первого и второго рода, в процентном соотношении 71,4% и 28,6% соответственно.
Полученная эффективность нейронной сети позволяет сделать вывод о том, что система распознавания фейковых аккаунтов в социальной сети «ВКонтакте» позволяет классифицировать пользователей. Все поставленные задачи выполнены и цель работы достигнута.
Сложностями данной работы является подготовка входных параметров, позволяющих точно описать страницу пользователя.
Данная система может быть внедрена в социальную сеть «ВКонтакте» и использована для показания уровня доверия к пользователю, например, при поступлении заявки в друзья.
Для повышения показателя эффективности сети и дальнейшего улучшения системы необходимо протестировать сеть при различных условиях. Изменять коэффициент обучения, увеличить количество примеров в наборе тренировочных данных, многократно повторить тренировочных циклы, изменять конфигурацию сети. Также сменить ключ доступа с серверного на пользовательский или секретный, что позволит получить больше информации о пользователе, расширит входные параметры. Помимо анализа текстовых сообщений на спам, необходимо проанализировать сообщения на бессмысленный поток символов, наличие ссылок, а также подключить поддержку иностранных слов.



1. Машинное обучение // MachineLearning.ru URL: http://www.machineleaming.ru (дата обращения: 06.06.2019).
2. Дж. Г. Николлс, А. Р. Мартин, Б. Дж. Валлас, П. А. Фукс От нейрона к мозгу. — М.: Едиториал УРСС, 2003. — 672 с.
3. Рашид Т. Создаем нейронную сеть. — СПб.: Альфа-книга, 2017. — 272 с.
4. Николенко С., Кадурин А., Архангельская Е. Глубокое обучение. — СПб.: Питер, 2018. — 480 с.
5. Fatima Salahdine, Naima Kaabouch Social Engineering Attacks: A Survey // Future Internet. — 2019. — №11(4)
6. Каждому возрасту — свои сети // Всероссийский центр изучения
общественного мнения (ВЦИОМ) URL:
https://wciom.ru/index.php?id=236&uid=116691 (дата обращения:
27.05.2019) .
7. Каталог пользователей ВКонтакте // ВКонтакте URL: https://vk.com/catalog.php (дата обращения: 06.06.2019).
8. Знакомство с API ВКонтакте // ВКонтакте URL:
https://vk.com/dev/first_guide (дата обращения: 06.06.2019).
9. NumPy Documentation // NumPy URL: https://www.numpy.org/ (дата обращения: 06.06.2019).
10. Special functions (scipy.special) // SciPy.org URL:
https://docs.scipy.org/doc/scipy/reference/special.html (дата обращения:
06.06.2019) .
11. JSON Response Content // Requests: HTTP for Humans™ URL: https://2.python-requests.org/en/master/user/quickstart/#json-response- content (дата обращения: 06.06.2019).
12. Ключи доступа, токены // ВКонтакте URL: https://vk.com/page- 777107_53251758 (дата обращения: 06.06.2019).
13. Получение ключа доступа // ВКонтакте URL: https://vk.com/dev/access_token (дата обращения: 06.06.2019).
14. Пользователь // ВКонтакте URL: https://vk.com/dev/objects/user (дата обращения: 06.06.2019).
15. wall.get // ВКонтакте URL: https://vk.com/dev/wall.get (дата
обращения: 06.06.2019).
16. Mikhail Korobov Morphological Analyzer and Generator for Russian and Ukrainian Languages // Analysis of Images, Social Networks and Texts. 2015. — p. 320-332.
17. users.get // ВКонтакте URL: https://vk.com/dev/users.get (дата
обращения: 06.06.2019).
18. wall.getComments // ВКонтакте URL:
https://vk.com/dev/wall.getComments (дата обращения: 06.06.2019).


Работу высылаем на протяжении 30 минут после оплаты.




©2024 Cервис помощи студентам в выполнении работ