Тип работы:
Предмет:
Язык работы:


Прогнозирование состояния сложных сетевых систем с использованием методов машинного обучения

Работа №143035

Тип работы

Дипломные работы, ВКР

Предмет

математика

Объем работы80
Год сдачи2023
Стоимость4600 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
15
Не подходит работа?

Узнай цену на написание


Введение 4
Обзор литературы 6
Постановка задачи 8
Глава 1. Анализ временных рядов 9
1.1. Основные определения 9
1.2. Прогнозирование временных рядов на сетях 11
Глава 2. Описание алгоритмов 14
2.1. Алгоритмы прогнозирования 14
2.1.1 Авторегрессионная модель 15
2.1.2 Векторная авторегрессионная модель 17
2.1.3 Методы градиентного бустинга 18
2.2. Алгоритмы сглаживания 25
2.3. Алгоритм валидации 30
Глава 3. Анализ данных 33
3.1. Abilene 33
3.2. Totem 39
3.3. PeMSD7 44
3.4. Вывод 49
Глава 4. Вычислительные эксперименты 50
4.1. Подготовка среды 50
4.2. Тестирование и выбор основных методов 51
4.3. Результаты валидации 53
4.3.1 Одномерные модели 53
4.3.2 Многомерные модели 55
4.4. Анализ результатов 57
Заключение 59
Список литературы 61
Приложение А. Обзор литературы 64
Приложение Б. Результаты валидации одномерных моделей для трафика по узлам 68
Приложение В. Результаты валидации многомерных моделей для трафика по узлам 74
Приложение Г. Визуализация результатов прогнозирования 80

С появлением и быстрым развитием компьютерных технологий и Интернета к сети подключается все большее количество устройств, что приводит к увеличению ее масштабов и сложности, а запросы пользователей к качеству связи только повышаются. Разумно распределяя сетевые ресурсы, можно оптимизировать маршрутизацию, тем самым уменьшить задержку связи, предотвратить перегрузку сети и обеспечить качество услуг. Однако для диагностики сети, обнаружения аномалий и эффективного использования имеющихся ресурсов необходимо точное прогнозирование ключевых показателей сети, таких как трафик, задержки, вызовы и т. д. Таким образом, прогнозирование сетевого трафика является основой для улучшения качества обслуживания пользователей.
С телекоммуникационной точки зрения сетевой трафик представляет собой матрицу, описывающую объем потока данных между всеми парами узлов сети в данный момент времени. Задачу прогнозирования сетевого трафика можно сформулировать как предсказание данной матрицы в определенный момент времени в будущем на основе исторических данных. Для решения поставленной задачи используют методы, которые можно разделить на две группы: линейные и нелинейные. Линейные методы, такие как авторегрессионные модели [19, 23], моделируют характеристики временной последовательности трафика на основе математической статистики. К нелинейным относятся модели прогнозирования, основанные на вейвлет-анализе [7, 2], байесовских сетях [21], нейронных сетях [20, 5, 6] и так далее. Поскольку одна линейная или нелинейная модель не может точно описать динамику сетевого трафика, то для решения подобных задач в последнее время все чаще стали использовать комбинированные методы [12], основанные на нейронных сетях, способных моделировать пространственные и временные признаки. Однако и у данных методов есть свои недостатки. Например, в некоторых случаях сначала извлекаются пространственные характеристики с использованием графовой нейронной сети (GNN [24, 11]), а затем захватываются временные признаки. Методы на основе GNN создают статическую матрицу смежности для моделирования топологии сети, где каждый узел передает сообщения только своим непосредственным соседям. При этом не учитывается тот факт, что пространственные зависимости сети динамичны, то есть важность различных узлов меняется со временем, что делает структуру графа более сложной. Такие методы могут сильно ограничивать возможности моделирования сложного сетевого трафика...

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Целью данного исследования была разработка эффективных алгоритмов для прогнозирования сетевого трафика. Созданная библиотека содержит методы как для сглаживания временных рядов, так и для их предсказания и валидации построенных моделей (одномерных или многомерных). Были получены следующие результаты: на примере набора данных PeMSD7 в одномерном случае лучшие показатели, а именно МАРЕ = 0.098, МАЕ = 4.5, были достигнуты авторегрессионной моделью с логарифмическим преобразованием данных, а среди многомерных алгоритмов - LightGBM с логарифмированием (МАРЕ = 0.044, МАЕ = 2.065). Реализованные многомерные методы прогнозирования превосходят одномерные аналоги, а также они способны конкурировать с современными нейросетевыми подходами и при некоторых условиях даже превосходить их. Например, точность предсказания модели LightGBM с использованием логарифмирования на наборе данных PeMSD7 сравнима с моделью, основанной на графовых нейронных сетях, из работы [24].
Точность моделей прогнозирования напрямую зависит от данных, их зашумленности, а также от размера обучающей выборки. Результаты работы алгоритмов улучшались с использованием различных способов фильтрации, особенно их комбинаций.
В ходе работы были выполнены следующие задачи:
1. изучены возможные решения данной проблемы;
2. найдены и проанализированы открытые наборы данных, имеющие сетевую структуру;
3. реализованы все необходимые алгоритмы прогнозирования, сглаживания и валидации;
4. проведено обучение, тестирование и валидация моделей;
5. проанализированы полученные результаты, выполнено сравнение реализованных моделей и сделаны соответствующие выводы.
Подводя итог, можно отметить, что задача прогнозирования трафика сетевой системы является довольно сложной и требует не только разработки алгоритмов предсказания, но и тщательного анализа данных, поиска пространственных зависимостей элементов сети, адаптации моделей к смене динамики, устойчивости к выбросам.


[1] Alasmar, M., Parisis, G., Clegg, R., and Zakhleniu, N. On the distribution of traffic volumes in the internet and its implications. In IEEE INFOCOM 2019- IEEE Conference on Computer Communications (2019), IEEE, pp. 955-963.
[2] Alrumaih, R. M., and Al-Fawzan, M. A. Time series forecasting using wavelet denoising an application to saudi stock index. Journal of King Saud University - Engineering Sciences 14, 2 (2002), 221-233.
[3] Brockwell, P. J., and Davis, R. A. Introduction to time series and forecasting. Springer, 2002.
[4] Chen, X., Wang, H., Wei, Y., Li, J., and Gao, H. Autoregressive-modelbased methods for online time series prediction with missing values: an experimental evaluation. ArXiv abs/1908.06729 (2019).
[5] Chen, Y.-y., Yisheng, L., and Li, Z. Long short-term memory model for traffic congestion prediction with online open data. pp. 132-137.
[6] Cortez, P., Rio, M., Rocha, M., and Sousa, P. Multi-scale internet traffic forecasting using neural networks and time series methods. Expert Systems 29 (05 2012), 143-155.
[7] Deineko, Z. Wavelet coherence as a tool for visualization of complex physical processes.
[8] Direction Generale des Technologies, d. l. R. e. d. l. o. t. W. g. Totem dataset, 2008.
[9] Du, Y., Wang, J., Feng, W., Pan, S. J., Qin, T., Xu, R., and Wang, C. Adarnn: Adaptive learning and forecasting of time series. Proceedings of the 30th ACM International Conference on Information & Knowledge Management (2021).
[10] Friedman, J. H. Greedy function approximation: A gradient boosting machine. The Annals of Statistics 29, 5 (2001), 1189-1232.
[11] Jiang, W., and Luo, J. Graph neural network for traffic forecasting: A survey.
Expert Systems with Applications 207 (2022), 117921.
[12] Lu, Z., Lv, W., Xie, Z., Du, B., and Huang, R. Leveraging graph neural network with lstm for traffic speed prediction. In 2019 IEEE SmartWorld, Ubiquitous Intelligence and Computing, Advanced and Trusted Computing, Scalable Computing and Communications, Cloud and Big Data Computing, Internet of People and Smart City Innovation (SmartWorld/SCALCOM/UIC/ATC/CBDCom/IOP/SCI) (2019), pp. 74-81.
[13] Lutkepohl, H. New introduction to multiple time series analysis. Springer Science & Business Media, 2005.
[14] Makridakis, S., Spiliotis, E., and Assimakopoulos, V. The m4 competition: Results, findings, conclusion and way forward. International Journal of Forecasting 34, 4 (2018), 802-808.
[15] Makridakis, S., Spiliotis, E., and Assimakopoulos, V. M5 accuracy competition: Results, findings, and conclusions. International Journal of Forecasting (2022)...26


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ