Тип работы:
Предмет:
Язык работы:


Прогнозирование иерархических временных рядов

Работа №127451

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы32
Год сдачи2022
Стоимость4375 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
33
Не подходит работа?

Узнай цену на написание


Введение 3
Постановка задачи 4
Обзор литературы 5
Глава 1. Подходы к согласованию прогнозов 7
1.1 Структура иерархического временного ряда 7
1.2 Восходящий подход 8
1.3 Нисходящий подход 9
1.4 Срединный подход 10
1.5 Подход оптимального согласования 11
Глава 2. Используемые прогнозные модели 14
2.1 ARIMA 14
2.2 SARIMAX 15
2.3 Prophet 16
Глава 3. Исходные данные 17
3.1 Описание данных 17
3.2 Предобработка данных 17
Глава 4. Моделирование 20
4.1 Описание реализации 20
4.2 Результаты 20
Выводы 29
Заключение 30
Список литературы 31

Прогнозирование — это распространенная задача науки о данных, которая помогает организациям в планировании распределения ресурсов, постановке целей и обнаружении аномалий.
Временной ряд — это упорядоченная во времени последовательность значений какого-либо показателя. Существует множество методов и подходов к прогнозированию временных рядов. Главное отличие и преимущество прогнозирования на основе применения технологий машинного обучения перед традиционными статистическими методами в том, что такие решения постоянно сопоставляют сделанный прогноз с фактическими данными - именно это позволяет модели обучаться и повышать точность прогноза в будущем.
Временные ряды часто можно естественным образом дезагрегировать по различным интересующим атрибутам. Так иерархические временные ряды часто возникают из-за географического деления. Например, общие продажи товаров могут быть дезагрегированы по странам, затем в каждой стране по штатам, в каждом штате по региону и так далее до уровня торговых точек.
Обычно на основе дезагрегированных временных рядов составляются дезагрегированные прогнозы, и требуется, чтобы прогнозы складывались так же, как и данные, т. е. удовлетворяли структуре иерархии. Например, прогнозы региональных продаж должны складываться, чтобы давать прогнозы продаж по штатам, которые, в свою очередь, должны суммироваться, чтобы давать прогноз продаж по стране.
В данной выпускной квалификационной работе будут рассмотрены и применены основные подходы к согласованию прогнозов иерархических временных рядов для данных туризма Российской Федерации с географической иерархией.
Постановка задачи
Целью работы является исследование прогнозных моделей и подходов к согласованию прогнозов иерархических временных рядов на данных о численности граждан Российской Федерации, размещенных в коллективных средствах размещения для различных субъектов РФ. Данные получены с официального сайта федерального агентства по туризму.
Задачами работы являются:
• предобработка полученных данных,
• обучение моделей,
• анализ точности моделей,
• определение наиболее эффективных моделей и подходов, их комбинаций,
• получение прогнозов численности граждан РФ, размещенных в коллективных средствах размещения, для каждого уровня географической иерархии на два последующих временных промежутка - года или квартала, в зависимости от разбиения входных данных.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Таким образом, были изучены подходы к согласованию прогнозов иерархических временных рядов, все подходы были реализованы в программе, написанной на языке Python с использованием библиотеки scikit- hts, и исследованы применительно к данным о количестве граждан РФ, размещенных в коллективных средствах размещения. Поставленные задачи выполнены, проведен сравнительный анализ эффективности указанных подходов и прогнозных моделей, получены прогнозы на 2021-2022 годы и I¬II кварталы 2022 года.


1. Montgomery D. C., Jennings C. L., Kulahci M. Introduction to time series analysis and forecasting. - John Wiley & Sons, 2015.
2. Nielsen A. Practical time series analysis: Prediction with statistics and machine learning. - O'Reilly Media, 2019.
3. Hyndman R. J., Athanasopoulos G. Forecasting: principles and practice. - OTexts, 2018.
4. Gross C. W., Sohl J. E. Disaggregation methods to expedite product line forecasting //Journal of forecasting. - 1990. - Т. 9. - №. 3. - С. 233-254.
5. Hyndman R. J. et al. Optimal combination forecasts for hierarchical time series //Computational statistics & data analysis. - 2011. - Т. 55. - №. 9. - С. 2579-2589.
6. Athanasopoulos G., Ahmed R. A., Hyndman R. J. Hierarchical forecasts for Australian domestic tourism //International Journal of Forecasting. - 2009. - Т. 25. - №. 1. - С. 146-166.
7. Hyndman R. J., Lee A. J., Wang E. Fast computation of reconciled forecasts for hierarchical and grouped time series //Computational statistics & data analysis. - 2016. - Т. 97. - С. 16-32.
8. Wickramasuriya S. L., Athanasopoulos G., Hyndman R. J. Optimal forecast reconciliation for hierarchical and grouped time series through trace minimization //Journal of the American Statistical Association. - 2019. - Т. 114. - №. 526. - С. 804-819.
9. Athanasopoulos G. et al. Forecasting with temporal hierarchies //European Journal of Operational Research. - 2017. - Т. 262. - №. 1. - С. 60-74.
10. Taylor S. J., Letham B. Forecasting at scale //The American Statistician. - 2018. - Т. 72. - №. 1. - С. 37-45.
11. The ARIMAX model muddle //Rob J Hyndman [Электронный ресурс] —
URL: https://robjhyndman.com/hyndsight/arimax/(дата обращения:
12.05.2022)
12.SARIMAX: Introduction //statmodels [Электронный ресурс] — URL: https://www.statsmodels.org/dev/examples/notebooks/generated/statespace_ sarimax_stata.html (дата обращения: 12.05.2022)
13. Библиотека Prophet [Электронный ресурс] — URL:
https://facebook.github.io/prophet/(дата обращения: 22.02.2022)
14. Численность граждан Российской Федерации, размещенных в
коллективных средствах размещения (Росстат) //Федеральное агентство по туризму [Электронный ресурс] — URL:
https://tourism.gov.ru/contents/analytics/statistics/chislennost-grazhdan- rossiyskoy-federatsii-razmeshchennykh-v-kollektivnykh-sredstvakh- razmeshcheniya/(дата обращения: 11.05.2022)
15. Документация библиотеки pandas [Электронный ресурс] — URL: https://pandas.pydata.org/docs/(дата обращения: 16.04.2022)
16. Документация библиотеки для работы с иерархическими временными
рядами scikit-hts [Электронный ресурс] — URL: https://scikit-
hts.readthedocs.io/en/latest/ (дата обращения: 03.12.2021)
17. Wickramasuriya S. L., Turlach B. A., Hyndman R. J. Optimal non-negative forecast reconciliation //Statistics and Computing. - 2020. - Т. 30. - №. 5. - С. 1167-1182.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ