Аннотация
ВВЕДЕНИЕ 3
1 АНАЛИЗ МОДЕЛЕЙ ДЛЯ ПРЕДСКАЗАНИЯ ЦЕНЫ НА АКЦИИ 4
1.1 Обучение нейронных сетей 5
1.1.1 Методы обучения нейронных сетей 5
1.1.2 Алгоритм оптимизации Adam 5
1.2 Выборки 8
1.3 Сверточные нейронные сети 9
1.4 Рекуррентные нейронные сети 10
1.4.1 LSTM 12
1.4.2 GRU 13
1.5 Генеративно-состязательные сети (GAN) 14
2 НАБОР ДАННЫХ И ХАРАКТЕРИСТИКИ 17
3 МЕТОДОЛОГИЯ 21
3.1 Генератор GAN 21
3.2 Дискриминатор GAN 22
3.3 Архитектура GAN 24
4 РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТОВ 25
4.1 Обучение модели 25
4.2 Эксперименты и результаты 25
ЗАКЛЮЧЕНИЕ 34
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ 36
ПРИЛОЖЕНИЕ А. ОПИСАНИЕ ТЕХНИЧЕСКИХ ИНДИКАТОРОВ 39
ПРИЛОЖЕНИЕ Б. ОБЩАЯ ТАБЛИЦА РЕЗУЛЬТАТОВ ПРИМЕНЕНИЯ МОДЕЛЕЙ 44
Сегодня машинное обучение применяется практически во всех сферах деятельности: от анализа поведения пользователей в интернете до исследования генетической предрасположенности человека к серьезным заболеваниям и социального моделирования.
Многие исследования показали, что цены на акции предсказуемы. В статье «Stock price prediction using Generative Adversarial Networks» авторы используют новый, перспективный подход, основанный на применении технологии генеративносостязательных сетей (Generative Adversarial Networks, GAN). В данной статье авторы используют модели для предсказания цены акции Apple, обученные с GAN, и получают результаты лучше, чем у моделей, обученных классическими методами. Однако, выводы, полученные в конце рассматриваемой статьи вызывают достаточный уровень сомнения в том, являются ли достигнутые показатели достижимы ровно за счёт предлагаемого подхода. Поскольку рассматриваемая прикладная отрасль, а именно торговля ценными бумагами, это сфера экономики, в которой ежедневно совершаются сделки на миллиарды долларов, то любое потенциальное достижение в этой области должно быть верифицируемым. Что и предлагается проделать в данной работе.
В результате, предлагается проверить эффективность модели для предсказания цены на акции, построенной на основе GAN в комбинации с такими рекуррентными нейронными сетями как GRU и LSTM .
Таким образом, можно сформулировать задачи данной работы:
1. собрать набор данных и провести их предобработку;
2. разработать архитектуру нейронной сети;
3. применить GAN для обучения моделей;
4. сравнить модели, обученные методом Adam с моделями GAN;
5. сделать вывод о преимуществах и недостатках подхода основанного на GAN.
В данной работе было решено прогнозировать цену закрытия наиболее волатильных компаний, которые входят в S&P 500 (Intel, Nvidia...). Для этой цели будут использованы дневные цены закрытия с 1 января 2010 г. по 1 января 2022 г. Обучение модели будет осуществляться на данных с 1 января 2010 г. по 1 января 2019 г., проверка результатов будет осуществляться на данных за с 1 января 2019 г. по 1 января 2022 г.
Цель данной работы заключалась в исследовании преимуществ применения искусственных нейронных сетей генеративно-состязательной архитектуры (GAN) в задаче прогнозирования временных рядов, связанных с финансовыми показателями ценных бумаг, а именно ценой закрытия.
В работе [3] было продемонстрировано, что GAN-модели способны улучшить качество предсказания целевого признака в смысле таких метрик, как RMSE.
Была реализована модель GRU, состоящая из пяти слоев, где два слоя состоят из элементов GRU, а остальные слои - полносвязные. Для сравнения результатов были выбраны акции таких компаний как Intel и Nvidia. В качестве базового алгоритма обучения был выбран Adam. Для акций Intel был получен результат RMSE 2.12, а для акций Nvidia 14.24.
Модель LSTM, также состоящая из пяти слоев, где два слоя состоят из элементов LSTM, а остальные слои - полносвязные. В качестве базового алгоритма обучения также был выбран Adam. Для акций Intel был получен результат RMSE 2.78, а для акций Nvidia 14.71. Данный результат хуже, чем у модели с использованием GRU.
Для сравнения с этими моделями были реализованы сети такой же архитектуры только с использованием генеративно-состязательного обучения. В качестве сети дискриминатора была использована модель, содержащая сверточные слои. Данный подход показал интересные результаты при сравнении с Adam. Для сравнения результаты GRU для Intel 2.25 против 2.12, а для Nvidia 7.99 против 14.24. Сети LSTM для Intel показывают RMSE 2.24 против 2.78, а также 23.53 против 14.71.
Суммарный результат MAPE для моделей GRU, обученных с применением GAN, на 0.317 больше, чем у моделей, обученных оптимизатором Adam, а суммарный результат MAPE для моделей LSTM на 1.644 больше, чем у моделей, обученных оптимизатором Adam. Результаты противоречат результатам, полученным в статье [3], где в среднем модели, обученные генеративно-состязательным методом, показывают лучшие результаты на тестовых данных.
В данной статье модели с применением GAN показывают лучший результат по сравнению с моделями обучаемыми методом Adam. Скорее всего это связано с тем, что для сети генератора в GAN они используют более сложную архитектуру и обучают ее 165 эпох в сравнении с более простой моделью, которую обучают методом Adam 50 эпох. Возможно, результаты оказались хуже, чем в статье из-за того, что в статье авторы используют разные архитектуры для сетей, обучаемыми методом GAN и методом Adam. Сети, обучаемые методом GAN, имели более сложную архитектуру, что давало им преимущество при решении данного вида задач.
1. Kamalov F., Smail L., Gurrib I. Forecasting with Deep Learning: S&P 500 index //
arXiv.org. - 2021. - URL: https://arxiv.org/abs/2103.14080 (дата обращения:
11.05.2022).
2. Li Y., Pan Y. A Novel Ensemble Deep Learning Model for Stock Prediction Based on Stock Prices and News // arXiv.org. - 2020. - URL: https://arxiv.org/abs/2007.12620 (дата обращения: 11.05.2022).
3. Lin, H., Chen, C., Huang, G. & Jafari, A. (2021). Stock price prediction using Generative
Adversarial Networks. Journal of Computer Science, 17(3), 188-196.
https://doi.org/10.3844/jcssp.2021.188.196
4. Dutta A., Kumar S., Basu M. A Gated Recurrent Unit Approach to Bitcoin Price Prediction // // arXiv.org. - 2019. - URL: https://arxiv.org/abs/1912.11166 (дата обращения: 12.05.2022).
5. Sen J., Mehtab S., Dutta A., Mondal S. Precise Stock Price Prediction for Optimized
Portfolio Design Using an LSTM Model // arXiv.org. - 2022. - URL:
https://arxiv.org/abs/2203.01326 (дата обращения: 12.05.2022).
6. Tang Q., Fan T., Shi R., Huang J., Ma Y. Prediction of financial time series using LSTM
and data denoising methods // arXiv.org. - 2021. - URL:
https://arxiv.org/abs/2103.03505 (дата обращения: 12.05.2022).
7. Apple // apple.com - 2022. - URL: https://www.apple.com/ (дата обращения: 11.05.2022).
8. Araci D. FinBERT: Financial Sentiment Analysis with Pre-trained Language Models //
arXiv.org. - 2019. - URL: https://arxiv.org/abs/1908.10063 (дата обращения:
12.05.2022).
9. S&P 500® | S&P Dow Jones Indices - S&P Global // spglobal.com - 2022. - URL: https://www.spglobal.com/spdji/en/indices/equity/sp-500/#overview (дата обращения: 11.05.2022).
10. Kingma D., Ba J. Adam: A Method for Stochastic Optimization // arXiv.org. - 2014. - URL: https://arxiv.org/abs/1412.6980 (дата обращения: 12.05.2022).
11. J. Duchi, E. Hazan, and Y. Singer. Adaptive subgradient methods for online learning and stochastic optimization. Journal of Machine Learning Research, 12:2121-2159, 2011.
12. T. Tieleman and G. Hinton. Lecture 6.5-rmsprop: Divide the gradient by a running average of its recent magnitude. COURSERA: Neural Networks for Machine Learning, 4:2, 2012.
13. Денисенко, А. А. Решение задачи бинарной классификации при помощи свёрточных
нейронных сетей с использованием фреймворка Tensorflow / А. А. Денисенко. — Текст : непосредственный // Актуальные вопросы технических наук : материалы V Междунар. науч. конф. (г. Санкт-Петербург, февраль 2019 г.). — Санкт-Петербург : Свое издательство, 2019. — С. 1-4. — URL:
https://moluch.ru/conf/tech/archive/324/14834/ (дата обращения: 10.06.2021).
14. Сверточная нейронная сеть, часть 1: структура, топология, функции активации и обучающее множество [Электронный ресурс] // Habr.com: [сайт]. [2018]. URL: https://habr.com/ru/post/348000 (дата обращения: 10.06.2021).
15. Друки Алексей Алексеевич, Спицын Владимир Григорьевич, Болотова Юлия
Александровна, Башлыков Артём Андреевич Семантическая сегментация данных дистанционного зондирования Земли при помощи нейросетевых алгоритмов // Известия ТПУ. 2018. №1. URL: https://cyberleninka.ru/article/n/semanticheskaya-
segmentatsiya-dannyh-distantsionnogo-zondirovaniya-zemli-pri-pomoschi-neyrosetevyh- algoritmov (дата обращения: 10.06.2021).
... всего 25 источников