📄Работа №214902

Тема: Разработка приложения для анализа сетевого трафика в режиме реального времени на основе ансамблевых методов машинного обучения

📝
Тип работы Дипломные работы, ВКР
📚
Предмет программирование
📄
Объем: 75 листов
📅
Год: 2022
👁️
Просмотров: 8
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание

ГЛОССАРИЙ 3
ВВЕДЕНИЕ 6
1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 9
2. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ 23
2.1. Задача классификации трафика 23
2.2. Ансамблевые методы машинного обучения 23
2.3. Устройство сети 25
2.4. Анализатор пакетов 26
2.5. Набор данных 27
3. ПРОЕКТИРОВАНИЕ ПРИЛОЖЕНИЯ 31
3.1. Функциональные требования 31
3.2. Нефункциональные требования 31
3.3. Варианты использования приложения 31
3.4. Диаграмма компонентов 32
4. РЕАЛИЗАЦИЯ 34
4.1. Среда выполнения и программные средства разработки 34
4.2. Предобработка набора данных 34
4.3. Реализация ансамблевых алгоритмов 38
4.3.1. Реализация Random Forest 38
4.3.2. Реализация AdaBoost 39
4.4. Оценка качества алгоритмов 41
4.5. Реализация анализатора пакетов 42
4.6. Реализация интерфейса взаимодействия 43
5. ТЕСТИРОВАНИЕ 47
5.1. Функциональное тестирование 47
5.2. A/B тестирование 48
5.3. Подбор параметров модели 49
5.4. Тестирование анализатора пакетов 49
ЗАКЛЮЧЕНИЕ 52
ГЛОССАРИЙ 3
ВВЕДЕНИЕ 6
1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 9
2. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ 23
2.1. Задача классификации трафика 23
2.2. Ансамблевые методы машинного обучения 23
2.3. Устройство сети 25
2.4. Анализатор пакетов 26
2.5. Набор данных 27
3. ПРОЕКТИРОВАНИЕ ПРИЛОЖЕНИЯ 31
3.1. Функциональные требования 31
3.2. Нефункциональные требования 31
3.3. Варианты использования приложения 31
3.4. Диаграмма компонентов 32
4. РЕАЛИЗАЦИЯ 34
4.1. Среда выполнения и программные средства разработки 34
4.2. Предобработка набора данных 34
4.3. Реализация ансамблевых алгоритмов 38
4.3.1. Реализация Random Forest 38
4.3.2. Реализация AdaBoost 39
4.4. Оценка качества алгоритмов 41
4.5. Реализация анализатора пакетов 42
4.6. Реализация интерфейса взаимодействия 43
5. ТЕСТИРОВАНИЕ 47
5.1. Функциональное тестирование 47
5.2. A/B тестирование 48
5.3. Подбор параметров модели 49
5.4. Тестирование анализатора пакетов 49
ЗАКЛЮЧЕНИЕ 52
ЛИТЕРАТУРА 53
ПРИЛОЖЕНИЯ 58
Приложение А. Результаты обучения 58
Приложение Б. Спецификация вариантов использования 61
Приложение В. Исходный коды анализатора пакетов 63
Приложение Г. Матрицы возмущений 73
Приложение Д. График зависимости ошибки классификации 76

📖 Введение

Актуальность
В настоящее время продолжается рост количества пользовательских устройств, умных устройств, объединяющихся в системы умных домов, камер наблюдения. Одновременно с этим увеличивается объем трафика, используемого людьми и системами. Любое из представленных выше устройств может быть подвержено взломам и использовано при проведении DDoS-атак злоумышленниками.
В связи с этим, разработка новых систем обнаружения вторжений в последние годы становится все более и более приоритетной задачей для многих компаний.
Проведя анализ данных ресурсов «securelist.ru» и отчеты «Лаборатории Касперского» за период с 2020 по 2022 год [8-9], можно сделать вывод, что за это время выросло как общее количество атак, так и доля умных атак среди них. За первый квартал 2022 года количество атак выросло в 4-4,5 раза по сравнению с первым кварталом 2021 года, а в сравнении только с четвертым кварталом 2021 года, количество атак выросло в 1,5 раза. Сравнительная гистограмма представлена на рисунке 1. Помимо причин, описанных выше, росту способствует продолжающаяся пандемия и карантины в отдельных регионах. В следствии чего, люди больше пользуются интернетом. Почти вся жизнь людей за этот период перешла в сеть, что определенно сказалось на количестве атак в первом и втором квартале 2020 года, гистограммы представлены на рисунке 2.
Исходя из этих данных, можно сделать вывод о необходимости развития новых систем защиты с использованием алгоритмов машинного обучения.
Постановка задачи
Целью данной работы является разработка приложения для анализа сетевого трафика в режиме реального времени на основе ансамблевых методов машинного обучения.
Для достижения поставленной цели необходимо выполнить следующие задачи:
1) провести обзор научной литературы;
2) выбрать алгоритмы классификации;
3) реализовать выбранные алгоритмы классификации;
4) осуществить оценку качества использованных алгоритмов;
5) реализовать приложение для анализа трафика в реальном времени;
6) провести тестирование разработанного приложения.
Структура и объем работы
Работа состоит из введения, пяти глав, заключения и списка литературы. Объем работы составляет 76 страниц, объем списка литературы – 45 источников.
В первой главе описывается предметная область и производится анализ научной литературы.
Вторая глава посвящена рассмотрению алгоритмов Random Forest и AdaBoost, проведению анализа набора данных. Была рассмотрена задача классификации трафика, архитектура сети TCP/IP и анализаторы пакетов.
В третьей главе были определены основные требования к системе и разработаны диаграммы вариантов использования и компонентов.
Четвертая глава посвящена реализации ансамблевых моделей машинного обучения и приложения.
В пятой главе описывается процесс тестирования и оценки качества разработанного приложения и обученных моделей.
В приложениях содержатся спецификации вариантов использования, исходный код, графики ошибок и таблицы результатов.

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

В рамках данной работы было разработано приложения для анализа сетевого трафика в режиме реального времени на основе ансамблевых методов машинного обучения.
В ходе работы были решены следующие задачи:
1) произведен обзор научной литературы;
2) реализованы выбранные методы машинного обучения;
3) осуществлена оценка качества реализованных алгоритмов;
4) реализован анализатор пакетов;
5) осуществлена оценка качества разработанного приложения.
По итогам проделанной работы была опубликована статья и сделан доклад в рамках международной конференции: G. Panyushkin and V. Varkentin, «Network Traffic and Ensemble Models in Machine Learning». International Conference on Quality Management, Transport and Information Security, Information Technologies (IT&QM&IS), 2021, pp. 526-532, doi: 10.1109/ITQMIS53292.2021.9642907.
В будущем планируется совершенствование разработанного приложения, улучшение качества классификации,
расширение функциональности.

Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

1. Машинное обучение. [Электронный ресурс] URL:
http://www.machinelearning.ru/wiki/index.php?title=%D0%9C%D0%B0%D1 %88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1% D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5 (дата обращения 19.05.2022 г.).
2. Ensemble methods: bagging, boosting and stacking. [Электронный ресурс] URL: https://towardsdatascience.com/ensemble-methods-bagging- boosting-and-stacking-c9214a10a205 (дата обращения 19.05.2022 г.).
3. Распределенные сетевые атаки / DDoS. [Электронный ресурс] URL: https://www.kaspersky.ru/resource-center/threats/ddos-attacks (дата обращения 19.05.2022 г.).
4. What Is an Intrusion Detection System? Latest Types and Tools. [Электронный ресурс] URL: https://www.dnsstuff.com/intrusion-detection- system (дата обращения 19.05.2022 г.).
5. Connection Flood. [Электронный ресурс] URL: https://www.f5.com/services/resources/glossary/connection-flood (дата обращения 19.05.2022 г.).
6. CICFlowMeter (formerly ISCXFlowMeter). [Электронный ресурс] URL: https://www.unb.ca/cic/research/applications.html#CICFlowMeter (дата обращения 19.05.2022 г.).
7. Chi-Square Test for Feature Selection in Machine learning. [Электронный ресурс] URL: https://towardsdatascience.com/chi-square-test- for-feature-selection-in-machine-learning-206b1f0b8223 (дата обращения 19.05.2022 г.).
8. DDoS-атаки в первом квартале 2022 года. [Электронный ресурс] URL: https://securelist.ru/ddos-attacks-in-q1-2022/105045/ (дата обращения 19.05.2022 г.).
9. DDoS-атаки во втором квартале 2020 года. [Электронный ресурс] URL: https://securelist.ru/ddos-attacks-in-q2-2020/97701/ (дата обращения 19.05.2022 г.).
10. Pei J., Chen Y., Ji W. A DDoS Attack Detection Method Based on Machine Learning // J. Phys. Conf. Ser. 2019. Т. 1237. С. 032040.
11. Iwendi C. и др. The Use of Ensemble Models for Multiple Class and Binary Class Classification for Improving Intrusion Detection Systems // Sensors. 2020. Т. 20. № 9. С. 2559.
12. Shahraki A., Abbasi M., Haugen Ø. Boosting algorithms for network intrusion detection: A comparative evaluation of Real AdaBoost, Gentle AdaBoost and Modest AdaBoost // Eng. Appl. Artif. Intell. 2020. Т. 94. С. 103770.
13. Yuan Y. и др. Semi-supervised tri-Adaboost algorithm for network intrusion detection // Int. J. Distrib. Sens. Networks. 2019. Т. 15. № 6. С. 155014771984605.
14. Alsamiri J., Alsubhi K. Internet of Things Cyber Attacks Detection using Machine Learning // Int. J. Adv. Comput. Sci. Appl. 2019. Т. 10. № 12.
15. D’hooge L. и др. In-depth Comparative Evaluation of Supervised Machine Learning Approaches for Detection of Cybersecurity Threats // Proceedings of the 4th International Conference on Internet of Things, Big Data and Security. SCITEPRESS - Science and Technology Publications, 2019. С. 125–136..45

🖼 Скриншоты

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.

©2026 Cервис помощи студентам в выполнении работ