Тип работы:
Предмет:
Язык работы:


Прогнозирование временных рядов при небольших объемах исходных данных

Работа №129187

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы50
Год сдачи2020
Стоимость4380 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
60
Не подходит работа?

Узнай цену на написание


Введение 3-4
Постановка задачи 5
Обзор литературы 6-8
Глава 1. Модели прогнозирования временных рядов 9
1.1 Модель Naive 9
1.2 Авторегрессионная модель (AR) 10
1.3 Модель скользящего среднего (MA) 10-11
1.4 Модель авторегрессии — скользящего среднего (ARMA) 11
1.5 Интегрированная модель авторегрессии — скользящего среднего
(ARIMA) 11
1.6 Модель векторной авторегрессии (VAR) 12
1.7 Модель экспоненциального сглаживания (SES) 12
1.8 Модель авторегрессионной условной гетероскедастичности
(ARCH) 13
1.9 Модель обобщенной авторегрессионной условной
гетероскедастичности (GARCH) 13-14
1.10 Нейронная сеть на основе многослойного перцептрона(MLP) 14-15
1.11 Рекуррентная нейронная сеть на основе долгой кратковременной
памяти^ S TM) 15-16
1.12 Сверточная нейронная сеть (CNN) 16-17
Глава 2. Реализация выбранных моделей 18
2.1 Обзор и предобработка исходных данных 18-20
2.2 Выбор программных инструментов 20
2.3 Структура программной реализации 20-22
Глава 3. Экспериментальное исследование моделей 23
3.1 Исследование моделей с учетом их параметров 23-30
3.2 Общий результат 31
Заключение 32
Список литературы 33-34


Прогнозирование посредством представления временными рядами рассматриваемых процессов, изменяющихся характеристик или других данных, зависящих от времени, используется во многих областях: это и бизнес, экономика, инженерия, физика, химия, метеорология, социология и др. В частности, наблюдения в каком-либо химическом процессе, цены акций конкретной компании на бирже, прогноз погоды, количество дорожно-транспортных происшествий, данные о количестве проданных товаров и полученной прибыли и многое другое можно охарактеризовать временными рядами. Тем самым, прогнозирование этих рядов является очень важной задачей, т.к. она позволяет нам получить оценку будущих наблюдений заранее, что несет выгоду разного характера.
Временные ряды обычно моделируются посредством счетного стохастического процесса Y(t), tEN,то есть счетной совокупности случайных величин, при этом, этот процесс зависит от времени. В условиях прогнозирования мы находимся в момент времени t,и мы заинтересованы в оценке Y(£нач+ t), £нач, tEN,используя только информацию, доступную в полуинтервале времени [£нач; £нач+ f).Длиной временного ряда чаще всего обозначают количество наблюдений или время от начала до конца процесса. Подробно об этом в учебнике Броквелла и Девиса [1].
Точность при прогнозировании будущих наблюдений зависит от количества известных нам наблюдений, то есть от длины полуинтервала [£нач; £нач+ t). Чаще всего, компании, имеющие данные о продажах своего товара за несколько лет, могут спрогнозировать прибыль в следующем месяце намного лучше, чем только что открывшиеся компании, проработавшие пару месяцев. Подобную закономерность можно увидеть и в других сферах жизни. Именно в этом кроется проблема небольших объемов исходных данных- не в количестве рядов, а в их длине.
Для прогнозирования временных рядов используются десятки методов: от наивных и регрессионных моделей до нейронных сетей. Все эти модели при большом количестве наблюдений дают лучший результат (за исключением наивных моделей), и есть очень много материалов об их эффективности на рядах большой длины, что позволяет выбрать, какую модель лучше использовать. Но что делать, если количество наблюдений крайне мало, и какую модель регрессии выбрать для прогнозирования будущих значений? В этой работе будут рассмотрены данные вопросы.


Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


В рамках данной работы был проведен экспериментальный анализ работы 12-ти самых часто используемых моделей прогнозирования рядов с точки зрения небольших исходных данных, эти модели были реализованы и протестированы на большом количестве рядов небольшой длины, каждой модели были подобраны параметры, при которых они показывают лучший результат прогноза. По результатам анализа работы всех рассмотренных моделей было выявлено, что наилучшая модель для прогнозирования временных рядов малой длины для представленных исходных данных является сверточная нейронная сеть (CNN), при этом, если ставится задача прогнозирования всех временных рядов, без возможности их разбиения на выборки, то наилучшей моделью для прогнозирования является интегрированная модель авторегрессии — скользящего среднего (ARIMA).


1. “Introduction to Time Series and Forecasting, Second Edition” Peter J.
Brockwell and Richard A. Davis, p. 7-9
2. “Forecasting: Principles and Practice” Rob J Hyndman and George Athanasopoulos, Some practical forecasting issues ch. 12.1-12.7
3. “An overview of time series forecasting models” Davide Burba
4. “Econometrics of Short and Unreliable Time Series ” Thomas Url and Andreas Worgotter, ch.III
5. “Time series analysis: forecasting and control, Fourth Edition” George E. P. Box, Gwilym M. Jenkins and Gregory C. Reinsel, part II
6. “Deep Learning for Time Series Forecasting” Jason Brawlee
7. “Forecasting: Principles and Practice” Rob J Hyndman and George Athanasopoulos, Naive method ch. 3.1
8. “How to best understand the Naive Forecast” Shaun Snapp
9. “STAT 501: Regression methods” Dr. Iain Pardoe, lesson 14.1
10. ‘ ‘Applied Time Series Analysis for Fisheries and Environmental Sciences”
E. E. Holmes, M. D. Scheuerell, and E. J. Ward, ch. 4.7-4.9
11. ‘ ‘Statistical forecasting: notes on regression and time series analysis” Robert Nau, Introduction to ARIMA: nonseasonal models
12. “Introduction to Econometrics with R” Christoph Hanck, Martin Arnold, Alexander Gerber and Martin Schmelzer, ch. 16.1
13. ‘ ‘Statistical forecasting: notes on regression and time series analysis ” Robert Nau, Brown's Simple Exponential Smoothing (exponentially weighted moving average)
14. ‘ ‘Introduction to ARCH & GARCH models ” Roberto Perrelli
15. ‘ ‘Как работает нейронная сеть: алгоритмы, обучение, функции активации и потери” Станислав Исаков
16. ‘ ‘Understanding LSTM Networks” Christopher Olah
17. ‘ ‘Как работает сверточная нейронная сеть: архитектура, примеры, особенности” Станислав Исаков
18. ‘ “KPSS Test for Stationary ” Selva Prabhakaran


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ