Аннотация
ВВЕДЕНИЕ 3
1 АНАЛИЗ МОДЕЛЕЙ ДЛЯ ПРЕДСКАЗАНИЯ ЦЕНЫ НА АКЦИИ 4
1.1 Обучение нейронных сетей 5
1.1.1 Методы обучения нейронных сетей 5
1.1.2 Алгоритм оптимизации Adam 5
1.2 Выборки 8
1.3 Сверточные нейронные сети 9
1.4 Рекуррентные нейронные сети 10
1.4.1 LSTM 12
1.4.2 GRU 13
1.5 Генеративно-состязательные сети (GAN) 14
2 НАБОР ДАННЫХ И ХАРАКТЕРИСТИКИ 17
3 МЕТОДОЛОГИЯ 21
3.1 Генератор GAN 21
3.2 Дискриминатор GAN 22
3.3 Архитектура GAN 24
4 РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТОВ 25
4.1 Обучение модели 25
4.2 Эксперименты и результаты 25
ЗАКЛЮЧЕНИЕ 34
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ 36
ПРИЛОЖЕНИЕ А. ОПИСАНИЕ ТЕХНИЧЕСКИХ ИНДИКАТОРОВ 39
ПРИЛОЖЕНИЕ Б. ОБЩАЯ ТАБЛИЦА РЕЗУЛЬТАТОВ ПРИМЕНЕНИЯ МОДЕЛЕЙ 44
Сегодня машинное обучение применяется практически во всех сферах деятельности: от анализа поведения пользователей в интернете до исследования генетической предрасположенности человека к серьезным заболеваниям и социального моделирования.
Многие исследования показали, что цены на акции предсказуемы. В статье «Stock price prediction using Generative Adversarial Networks» авторы используют новый, перспективный подход, основанный на применении технологии генеративносостязательных сетей (Generative Adversarial Networks, GAN). В данной статье авторы используют модели для предсказания цены акции Apple, обученные с GAN, и получают результаты лучше, чем у моделей, обученных классическими методами. Однако, выводы, полученные в конце рассматриваемой статьи вызывают достаточный уровень сомнения в том, являются ли достигнутые показатели достижимы ровно за счёт предлагаемого подхода. Поскольку рассматриваемая прикладная отрасль, а именно торговля ценными бумагами, это сфера экономики, в которой ежедневно совершаются сделки на миллиарды долларов, то любое потенциальное достижение в этой области должно быть верифицируемым. Что и предлагается проделать в данной работе.
В результате, предлагается проверить эффективность модели для предсказания цены на акции, построенной на основе GAN в комбинации с такими рекуррентными нейронными сетями как GRU и LSTM .
Таким образом, можно сформулировать задачи данной работы:
1. собрать набор данных и провести их предобработку;
2. разработать архитектуру нейронной сети;
3. применить GAN для обучения моделей;
4. сравнить модели, обученные методом Adam с моделями GAN;
5. сделать вывод о преимуществах и недостатках подхода основанного на GAN.
В данной работе было решено прогнозировать цену закрытия наиболее волатильных компаний, которые входят в S&P 500 (Intel, Nvidia...). Для этой цели будут использованы дневные цены закрытия с 1 января 2010 г. по 1 января 2022 г. Обучение модели будет осуществляться на данных с 1 января 2010 г. по 1 января 2019 г., проверка результатов будет осуществляться на данных за с 1 января 2019 г. по 1 января 2022 г.
Цель данной работы заключалась в исследовании преимуществ применения искусственных нейронных сетей генеративно-состязательной архитектуры (GAN) в задаче прогнозирования временных рядов, связанных с финансовыми показателями ценных бумаг, а именно ценой закрытия.
В работе [3] было продемонстрировано, что GAN-модели способны улучшить качество предсказания целевого признака в смысле таких метрик, как RMSE.
Была реализована модель GRU, состоящая из пяти слоев, где два слоя состоят из элементов GRU, а остальные слои - полносвязные. Для сравнения результатов были выбраны акции таких компаний как Intel и Nvidia. В качестве базового алгоритма обучения был выбран Adam. Для акций Intel был получен результат RMSE 2.12, а для акций Nvidia 14.24.
Модель LSTM, также состоящая из пяти слоев, где два слоя состоят из элементов LSTM, а остальные слои - полносвязные. В качестве базового алгоритма обучения также был выбран Adam. Для акций Intel был получен результат RMSE 2.78, а для акций Nvidia 14.71. Данный результат хуже, чем у модели с использованием GRU.
Для сравнения с этими моделями были реализованы сети такой же архитектуры только с использованием генеративно-состязательного обучения. В качестве сети дискриминатора была использована модель, содержащая сверточные слои. Данный подход показал интересные результаты при сравнении с Adam. Для сравнения результаты GRU для Intel 2.25 против 2.12, а для Nvidia 7.99 против 14.24. Сети LSTM для Intel показывают RMSE 2.24 против 2.78, а также 23.53 против 14.71.
Суммарный результат MAPE для моделей GRU, обученных с применением GAN, на 0.317 больше, чем у моделей, обученных оптимизатором Adam, а суммарный результат MAPE для моделей LSTM на 1.644 больше, чем у моделей, обученных оптимизатором Adam. Результаты противоречат результатам, полученным в статье [3], где в среднем модели, обученные генеративно-состязательным методом, показывают лучшие результаты на тестовых данных.
В данной статье модели с применением GAN показывают лучший результат по сравнению с моделями обучаемыми методом Adam. Скорее всего это связано с тем, что для сети генератора в GAN они используют более сложную архитектуру и обучают ее 165 эпох в сравнении с более простой моделью, которую обучают методом Adam 50 эпох. Возможно, результаты оказались хуже, чем в статье из-за того, что в статье авторы используют разные архитектуры для сетей, обучаемыми методом GAN и методом Adam. Сети, обучаемые методом GAN, имели более сложную архитектуру, что давало им преимущество при решении данного вида задач.