Введение 4
Глава 1 Временные ряды 7
1.1 Одномерные и многомерные временные ряды 7
1.2 Проблема пробелов данных во временных рядах 8
1.3 Основные компоненты временных рядов 10
1.4 Автокорреляционная функция 12
1.5 Стационарность временных рядов 13
1.5.1 Критерий KPSS 14
1.5.2 Критерий Дики-Фуллера 14
1.6 Дифференцирование временного ряда 15
1.7 Логарифмирование временного ряда 17
Глава 2 Фрактальные и мультифрактальные временные
2.2 История фракталов и самоподобных структур 21
2.3 Математическая модель 22
2.4 Фрактальная размерность 22
2.5 Показатель Херста и долговременная память 25
2.6 Методы расчёта показателя Херста 30
2.6.1 Клеточный метод 30
2.6.2 Поточечный метод 31
2.6.3 Метод R/S анализа 33
2.6.4 Оценка показателя Херста 36
2.7 Самоподобные процессы 37
2.7.1 Введение в самоподобные процессы и их классификации 37
2.7.2 Свойства самоподобия и долговременной памяти 39
2.8 Фрактальное Броуновское движение и Гауссовский шум 42
Глава 3 Алгоритмы и методы 47
3.1 Моделирование временного ряда 47
3.2 Модель FARIMA 48
3.3 Модель HAR-RV 51
3.4 Вейвлет-модель 56
3.5 Модель Average-VAR 66
Глава 4 Исследования и компьютерная реализация 68
4.1 Описание данных 68
4.1.1 Индекс волатильности 68
4.1.2 Данные артериального давления крови 70
4.2 Компьютерная реализация 71
4.3 Подготовка данных 72
4.4 Выбор оптимальных агрегированных уровней для модели HAR-
RV и модели Average-VAR 76
4.5 Критерии оценки эффективности 78
4.5.1 Показатели ошибки 78
4.5.2 ROC-кривая 79
4.6 Результаты исследований 81
4.6.1 Сравнение графиков 82
4.6.2 Численные сравнения 84
4.6.2 Сравнение ROC-кривых 86
Заключение 89
Список использованной литературы 92
Приложение А 96
Показатели ошибок и время выполнения для других сигналов 96
Приложение Б 97
Графики ROC-кривых для других сигналов
Исторически сложилось, что практически любые объекты и явления можно описать при помощи простейших геометрических форм и привычных математических уравнений, но существует такая область познаний, которая не поддаются стандартным инструментам математического анализа. Данную область математики называют хаосом.
Хаос - это состояние или последовательность состояний, имеющих нелинейное или детерминированное поведение. Долгое время считалось, что хаотичные явления - это лишь редкое исключение из непрерывного представления развития природы. Всё изменилось в 1975 году, когда американский учёный с польскими корнями Беуна Мандельброт выпустил свою первую работу, посвящённую изучению хаоса, под названием «Фрактальная геометрия природы» [1].
Понятие фрактала - это определение, которое придумал сам Мандельброт от латинского «fractus», означающее дробленную, ломанную, изрезанную структуру [1].
Математическое понятие фрактала включает в себя объекты, структура которых схожа при разных масштабах изучения.
Не редко человек встречается с фрактальными структурами, как, например, график фондовой биржи, длина границ береговой линии, граф МРТ, компьютерное моделирование природных объектов (горы, деревья и так далее). Для изучения свойств подобных явлений и выделение зависимостей, благодаря которым можно будет предсказать поведение хаотичного множества на определённом промежутке времени, существуют методы анализа, отличные от привычных методов.
Описание проблемы. Теория хаоса по-прежнему остаётся самым распространённым качественным способом прогнозирования и исследования устойчивости состояний динамических систем. Главной задачей такого анализа является выявление всех стационарных состояний. Если одно из таких состояний отклоняется от нормы (является не желательным), то можно спрогнозировать переход системы в данное состояние.
При анализе временных рядов используются методы, дающие точечный или интервальный количественный прогноз. Но для рядов, которые не имеют трендовой зависимости (гипотеза о существовании тренда не подтверждается), такие методы крайне непродуктивны. Поэтому для обнаружения тренда и качественного анализа временных рядов предлагается использовать фрактальный анализ.
Многие проблемы любых научных теорий заключаются во влиянии неких внешних нелинейных закономерностей, которые не способны распознать статистические методы.
Обычно динамические системы имеют фрактальные аттракторы, то есть их неустойчивые фазовые траектории со временем стремятся стать фракталами [2]. Реальные фрактальные временные ряды, как отображение реального случайного процесса, трудно прогнозируемы, но по известному поведению в прошлом, можно предположить их поведение в будущем. Но, как правило, в реальной природе чистых фракталов не существует, поэтому говоря о фракталах, подразумеваются некие фрактальные явления. Для анализа их следует рассматривать как некую модель, обладающую фрактальными свойствами.
Актуальность. Фрактальная геометрия, как наука, достаточно молодое направление, которое имеет большой потенциал для изучения. На сегодняшний день для изучения свойств хаотичных множеств широко используются методы статистического анализа случайных функций и величин. Лишь недавно для обработки сигналов наряду с ними стали пользоваться методами анализа, основанными на фрактальных и вейвлет преобразованиях. Преимуществом таких методов заключается в том, что они способны проанализировать не только глобальные свойства хаотических множеств, но и их локальные, что делает такие методы более универсальными. Актуальность данной темы заключается в новизне исследуемого направления и в его теоретическом превосходстве над стандартными методами статистического анализа.
Объектом исследования являются временные ряды, предметом исследования - фрактальные методы моделирования временных рядов.
Цель данной работы - исследование методов компьютерного моделирования и прогнозирования фрактальных временных рядов.
Гипотеза магистерской работы состоит в том, что для анализа и прогнозирования фрактальных временных рядов можно выбрать подходящий метод моделирования, если будет произведено исследование и последующий сравнительный анализ компьютерных реализаций методов моделирования фрактальных временных рядов.
Задачи магистерской работы:
- Исследовать методы моделирования и прогнозирования фрактальных временных рядов;
- Осуществить компьютерную реализацию методов моделирования и прогнозирования фрактальных временных рядов;
- Произвести сравнительный анализ методов моделирования и прогнозирования фрактальных временных рядов и сделать выводы на основе оценок методов и выбрать наиболее подходящую модель оценки и предсказания фрактальных временных рядов.
В данной диссертационной работе исследуются самоподобные процессы и процессы с долговременной памятью, а также исследуются некоторые из их основных свойств. Одним из основных вкладов данной диссертационной работы является предоставление концепций самоподобия и долговременной памяти. Эти две концепции тесно связаны, но теоретически различаются.
Помимо этого, были исследованы алгоритмы компьютерного моделирования фрактальных рядов. Всего было исследовано четыре модели: FARIMA, HAR-RV, вейвлет-модель и Average-VAR.
Модель FARIMA достаточно популярная, описанная во многих источниках и лучше всех позволяет учесть параметр долговременной памяти. Но она очень сложна в реализации и использовании, а так же требует много времени для анализа. Её точность не особо превосходит остальные модели, но она способна лучше всех уловить моменты изменения направления будущих значений.
Модель HAR-RV была первоначально предложена для моделирования процессов с долговременной памятью при анализе реализованной волатильности. Но при расширении данной модели для моделирования физиологических сигналов, производительность оказалась достаточно хорошей, по сравнению с другими моделями предсказаний, и при этом модель обладает небольшим временем вычислений. Однако проблема заключается в численном подборе масштабов агрегации для каждого временного ряда. Это порядком усложняет реализацию модели и её время выполнения.
Модель на основе вейвлетов была впервые предложена для моделирования самоподобных процессов. К сожалению, на практике многие фрактальные временные ряды оказываются стационарными с долговременной памятью, а не самоподобными. Из-за этого появилась необходимость в усложнении модели для её обобщения и использования для 89
временных рядов с долговременной памятью. Хоть и результаты работы такой модели кажутся не столь удовлетворительными, по сравнению с результатами других моделей, они дают некоторую информацию для будущих исследований, в которых можно будет пересмотреть вейвлет- модель и учесть ошибки модели, описанной в данной диссертации.
Модель Average-VAR - это достаточно новый подход, предложенный совсем недавно как альтернатива более громоздким моделям, как например FARIMA. Она использует свойство масштабирования сигналов с долговременной памятью. Эта модель теоретически проста и может обеспечить неплохую производительность по сравнению с другими моделями, описанными в данной диссертации. Но Average-VAR, как и модель HAR-RV, требует численного определения уровней масштабирования, а так же её показатели ошибок немного хуже, чем у остальных моделей.
Таки образом можно подвести итоги, что самой быстрой моделью является HAR-RV и Average-VAR, если подобрать подходящие уровни масштабирования заранее, но при этом результаты будут иметь большую погрешность по сравнению с остальными моделями. Если необходимы более точные прогнозы за чуть большее время работы, то лучшим решением будет использование моделей вейвлет-модели. А если же необходимы самые точные результаты, а время работы модели не критично, то стоит использовать модель FARIMA.
Так же сравнение кривых-ROC показало, что обнаружение уменьшения будущего значения временного ряда более точно, чем обнаружение увеличения будущего значения, что стоит учитывать при интерпретировании результатов моделирования временного ряда.
В ходе выполнения магистерской диссертационной работы были решены следующие задачи:
- Исследованы методы моделирования и предсказания фрактальных временных рядов, такие как FARIMA, HAR-RV, вейвлет- модель и Average-VAR;
- Была осуществлена компьютерная реализация исследованных алгоритмов моделирования и прогнозирования фрактальных временных рядов;
- Был произведён сравнительный анализ реализованных алгоритмов для выявления сильных и слабых сторон каждой из моделей и сделаны соответствующие выводы по каждой модели.
1. Андриенко В.М. Фрактальные свойства фондовых рынков / В.М. Андриенко, О.В. Варчук // Одесский национальный политехнический университет. - Одесса, Украина. - 2010, 4 с.
2. Бокс Д. Анализ временных рядов / Дженкинс Г - М.: Мир, 1974.
3. Божокин, С.В. Фракталы и мультифракталы / С.В. Божокин, Д.А. Паршин. - Ижевск: НИЦ «Регулярная и хаотическая динамика», 2001. - 126 - 128 с.
4. Боровской И.Г. Исследование прогнозной способности показателя Херста применительно к российскому фондовому рынку / И.Г. Боровской, А.О. Жучков // Доклады ТУСУР. - 2017, №2. - 3 с.
5. Мандельброт Б. Фрактальная геометрия природы. - М.: Институт компьютерных исследований, 2002. - 656 с.
6. Малинецкий Г.Г. Нелинейная динамика. Подходы, результаты, надежды / Г.Г. Малинецкий, А.В. Потапов, А.В. Подлазов. - М.: Комкнига, 2006. - 216 с.
7. Масловская А. Г. Применение фрактальных методов для анализа динамических данных / А.Г. Масловская, Т.Р. Осокина, Т.К. Барабаш // Вестник Амурского государственного университета, №12, 2017, с. 51 - 59.
8. Ньюи У.К. Простая, положительно полуопределенная оценка асимптотической матрицы ковариаций, состоятельная при наличии гетероскедастичности и автокорреляции / У.К. Ньюи, Д.В. Кеннет // № 33 (1), 2014
9. Наследов А. IBM SPSS 20 Statistics и AMOS профессиональный статистический анализ данных // Москва - 2013.
10. Порунов А.Н. Mathcad в руках экономиста: Бокс-Кокс
преобразование и иллюзия «нормальности» макроэкономического ряда // Бизнес-информатика №2(12) - 2010.
11. Скроботов А.А. Тестирование единичных корней в панельных данных против неоднородной альтернативы с приложением к региональным индексам потребительских цен РФ // Том 18, Номер 2,2017
12. Федер Е. Фракталы // М.: Мир, 1991. - 262 с
13. Цель А. В. Компьютерная реализация фрактального ряда //
Тольятти: Тольяттинский государственный университет, Институт
математики, физики и информационных технологий, Кафедра Прикладная математика и информатика, 2019, 55 стр.
14. Шайдук А.М. Влияние фрактальной размерности сигнала на распределение энергии в его спектре / А.М. Шайдук, С.А. Останин // Журнал радиоэлектроники. - 2016. - №2.
15. Яковлев А. Н. Введение в вейвлет-преобразования // Новосибирск: Министерство образования Российской Федерации Новосибирский Государственный Технический Университет, 2003, 104 стр.
16. Andersen T. G. "Roughing it up: Including jump components in the measurement, modeling, and forecasting of return volatility,"/ T. G. Andersen, T. Bollerslev, and F. X. Diebold // The Review of Economics and Statistics, vol. 89, pp. 701-720 2007.
17. Andersen T. G. "Roughing it up: Including jump components in the measurement, modeling, and forecasting of return volatility," / T. G. Andersen, T. Bollerslev, and F. X. Diebold // The Review of Economics and Statistics, vol. 89, pp. 701-720 2007.
18. Burrus C. S., "Introduction to wavelets and wavelet transforms: a primer,"/ C. S. Burrus, R. A. Gopinath, and H. Guo // 1997.
19. Box G. E. Time series analysis: forecasting and control / G. E. Box, G. M. Jenkins, G. C. Reinsel // John Wiley & Sons, 2013.
20. Bollerslev T. "Modeling and pricing long memory in stock market volatility," / T. Bollerslev, H. Ole Mikkelsen // Journal of Econometrics, vol. 73, pp. 151-184, 1996.
21. Corsi F. "A simple long memory model of realized volatility," Manuscript, University of Southern Switzerland, 2004
22. Corsi F. "A simple approximate long-memory model of realized volatility," Journal of Financial Econometrics, vol. 7, pp. 174-196, 2009.
23. Doukhan P. Theory and applications of long-range dependence / P. Doukhan, G. Oppenheim, and M. S. Taqqu // Springer, 2003.
24. Embrechts P. "An introduction to the theory of self-similar stochastic processes," / P. Embrechts and M. Maejima // International Journal of Modern Physics B, vol. 14, pp. 1399-1420, 2000.
25. Fawcett T., "An introduction to ROC analysis," Pattern recognition letters, vol. 27, pp. 861-874, 2006.
26. Gao R. X. Theory and Applications for manufacturing / R. X. Gao, R. Yan, Wavelets // Springer, 2010
27. Goldberger A. L. "Physiobank, physiotoolkit, and physionet components of a new research resource for complex physiologic signals,"/ A. L. Goldberger, L. A. Amaral, L. Glass, J. M. Hausdorff, P. C. Ivanov, R. G. Mark // Circulation, vol. 101, pp. e215-e220, 2000.
28. Goldberger A. L. "Science in pictures: Chaos and fractals in human physiology," / A. L. Goldberger, D. R. Rigney, and B. J. West // Scientific American, vol. 262, pp. 42-49, 1990
29. Giron-Nava A. Circularity in fisheries data weakens real world prediction / Giron-Nava, A., Munch, S. B., Johnson, A. F., Deyle, E., James, C. C., Saberski, E., Sugihara, G. // 2020
30. Hastings H. M. "Fractals. A user's guide for the natural sciences,"/ H. M. Hastings and G. Sugihara //Oxford Science Publications, Oxford, New York: Oxford University Press,| c1993, vol. 1, 1993.
31. Hausdorf F. Dimesion und A usseres Mass / F. Hausdorf // Matematishe Annalen. - 1919. - 79. - P.157-179.
32. Provata A. Abstract Phase-space Networks Describing Reactive Dynamics / A. Provata, E.Panagakou // National Center for Scientific Research «Demokritos». - Greece. - 2018, 10 c.
33. Reider R. "Volatility forecasting I: GARCH models," New York, 2009
34. Tewfik A. H. "Correlation structure of the discrete wavelet coefficients of fractional Brownian motion," / A. H. Tewfik, M. Kim // IEEE transactions on information theory, vol. 38, pp. 904-909, 1992
35. Wang R. Self-Similar Based Time Series Analysis and Prediction // University of Toronto, 2016