Тема: Прогнозирование фондовых индексов с использованием методов машинного обучения
Характеристики работы
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Постановка задачи 6
Обзор литературы 8
Глава 1. Авторегрессионный подход 10
1.1. Модель авторегрессионного скользящего среднего 10
1.2. Стационарность временного ряда 12
1.3. Выбор оптимального порядка модели 15
1.4. Оценка параметров модели 16
1.5. Проверка остатков модели 16
Глава 2. Нейросетевой подход 17
2.1. Свёрточные нейронные сети 17
2.2. Перевод временного ряда в серию изображений 21
2.2.1 Предобработка и разметка данных 22
2.2.2 Gramian Angular Field 23
2.2.3 Moving Average Mapping 25
Глава 3. Программная реализация и эксперименты 27
3.1. Метрики 28
3.2. Особенности реализации 29
3.3. Реализация авторегрессионного подхода 30
3.4. Реализация нейросетевого подхода 32
3.4.1 Эксперименты с одноканальными моделями 34
3.4.2 Эксперименты с многоканальными моделями 36
3.5. Сравнение моделей 38
Выводы 42
Заключение 44
Список литературы
📖 Введение
Прогнозирование фондовых индексов — это попытка предсказать вероятное изменение их значений в будущем. Даже прогнозирование с точностью немногим выше случайного угадывания вызывает интерес, так как эта небольшая разница в долгосрочной перспективе может принести прибыль трейдерам или инвесторам. Целью разработок новых методов является повышение этой точности и, как следствие, увеличение прибыли.
Существует множество методов прогнозирования фондовых индексов и акций, среди которых можно выделить 2 большие группы: фундаментальный анализ и технический анализ.
В основе фундаментального анализа лежит сам объект прогнозирования (фондовый индекс, акция компании): его финансовые показатели, макроэкономические и политические факторы, влияющие на объект. Фундаментальный анализ — всеобъемлющий инструмент, он проводится на разных уровнях: от геополитических событий, состояния мировой экономики до отдельной отрасли или компании. На прогноз могут влиять, например, цены на нефть, темпы роста ВВП страны, уровень инфляции, курс валюты, ставка Центрального Банка. Фундаментальный анализ хорошо подходит для долгосрочных стратегий, поэтому его активно используют инвесторы, которые отбирают наиболее выгодные компании для составления своего инвестиционного портфеля.
Для позиционного трейдинга, то есть для краткосрочных стратегий, лучше подходит технический анализ. Технический анализ использует только ценовой ряд, прогноз составляется на основе закономерностей изменения цен в прошлом в похожих обстоятельствах. Инструменты технического анализа — графики (тиковые, японские свечи, пункт-цифровые), паттерны — устойчивые повторяющиеся сочетания цен (например, «голова-плечи», «вымпел», «двойная вершина») [1], а также технические индикаторы — функции от значений ценового ряда (скользящая средняя, индекс относительной силы, MACD, линии Болинджера, японские свечи) [2]. В настоящее время также успешно применяются авторегрессионные модели и современные методы глубокого обучения.
Среди авторегрессионных моделей наиболее популярна модель авто-регрессионного скользящего среднего (ARMA), предложенная в 1951 году Питером Уайтли в работе «Hypothesis Testing in Time Series Analysis» [3]и впоследствии доработанная и популяризованная Джорджем Боксом и Гвилимом Дженкинсом в 1970-х.
С середины 2000-х годов глубокое обучение набирает популярность как эффективный способ решения многих задач в различных сферах. Глубокие нейронные сети достигли значительного успеха в решении задач компьютерного зрения и распознавания речи в 2011-2012 годах, после чего стали активно использоваться повсеместно.
Успех глубоких нейронных сетей подтолкнул исследователей к идее их применения к решению задач технического анализа, ведь вполне возможно, что нейронные сети смогут заметить такие закономерности, которые остаются незамеченными человеком. Свёрточные нейронные сети должны получать двумерные данные в качестве входных, поэтому их неэффективно применять непосредственно к временным рядам. В 2015 году появилась идея кодирования временных рядов в виде изображений и применения к ним свёрточных нейронных сетей для «визуального» распознавания и изучения закономерностей [4].
В 2015-2016 годах были разработаны разные типы кодирования временных рядов в изображения, такие как Gramian Angular Field [4], Moving Average Mapping, Double Moving Average Mapping [5] и другие. Свёрточная нейронная сеть обучалась на изображениях, полученных с помощью кодировщиков. Сеть находила закономерности между изображением и её классом. Данный подход можно использовать в прогнозировании фондовых индексов: обучившись на достаточном количестве изображений, сеть сможет предсказывать к какому классу относится новое изображение.
Экспериментируя с обработкой временного ряда, методами кодирования, в том числе их комбинированием, а также с архитектурой свёрточной нейронной сети можно добиться относительно высокого качества прогнозирования.
✅ Заключение
В качестве данных были выбраны 2 фондовых индекса: S&P 500 и Nikkei. Для каждого подхода была проведена предобработка и разметка данных.
Реализация авторегрессионного подхода включала в себя построение модели авторегрессионного скользящего среднего с предварительной проверкой временного ряда на стационарность и подбором оптимальных пара-метров, остатки модели проверялись на соответствие белому шуму. Спрогнозированные моделью значения были соотнесены одному из рассматриваемых классов.
Для реализации нейросетевого подхода временной ряд был переведён в серию изображений с использованием методов кодирования Gramian Angular Field, Moving Average Mapping и Double Moving Average Mapping. Была построена свёрточная нейронная сеть, на основе которой были реализованы 3 одноканальные модели, использующие в качестве входных данных изображения, полученные кодировщиками GAF, MAM или DMAM, а также 4 многоканальные модели, использующие комбинации этих кодировщиков.
Построенные модели сравнивались с помощью метрик оценки качества классификации precision, recallи accuracy.Авторегрессионный подход на тестовых данных показал себя лучше нейросетевого. Многоканальные нейросетевые модели оказались лучше одноканальных.



