🔍 Поиск готовых работ

🔍 Поиск работ

ПРИМЕНЕНИЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ АНАЛИЗА И ПРОГНОЗИРОВАНИЯ ВРЕМЕННЫХ РЯДОВ В АВТОМАТИЗИРОВАННЫХ ТОРГОВЫХ СИСТЕМАХ НА СПОТОВОМ И СРОЧНОМ РЫНКАХ

Работа №196434

Тип работы

Магистерская диссертация

Предмет

информатика

Объем работы81
Год сдачи2025
Стоимость4975 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
23
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 4
1 Теоретические основы функционирования фондового рынка и его сегментов 6
1.1 Фондовый рынок в структуре финансовых рынков 6
1.2 Типы рынков внутри фондового рынка 7
1.3 Спотовый рынок: определение, особенности и ключевые инструменты 8
1.4 Срочный рынок: определение, особенности и ключевые инструменты 11
2 Автоматизированные торговые системы (АТС) 17
2.1 Определение и роль автоматизированных торговых систем в современной биржевой
торговле 17
2.2 Классификация автоматизированных торговых систем 18
2.3 Этапы проектирования и реализации автоматизированной торговой системы 20
2.4 Специфика АТС на основе машинного обучения для краткосрочного
прогнозирования 22
3 Применение методов машинного обучения в задачах анализа и прогнозирования на
финансовых рынках 25
3.1 Машинное обучение в контексте финансовых рынков и автоматизированных
торговых систем 25
3.2 Основные классы задач машинного обучения в трейдинге 26
3.3 Прогнозирование финансовых временных рядов методами машинного обучения ....27
3.4 Роль машинного обучения в повышении эффективности и автономности АТС 32
4 Временные ряды и методы их прогнозирования на финансовых рынках 33
4.1 Понятие и характеристики временных рядов 33
4.2 Специфика финансовых временных рядов 34
4.3 Методологические подходы к прогнозированию временных рядов 36
4.4 Проблемы и вызовы прогнозирования финансовых временных рядов 39
5 Методологические основы моделей прогнозирования финансовых временных рядов,
применяемых в исследовании 41
5.1 Аддитивные (статистические) модели прогнозирования 41
5.1.1 Модель ARIMA (Autoregressive Integrated Moving Average) 41
5.1.2 Модели GARCH (Generalized Autoregressive Conditional Heteroskedasticity) 43
5.1.3 Модель Prophet 44
5.2 Модели классического машинного обучения 46
5.2.1 Линейная регрессия (Linear Regression) 46
5.2.2 Дерево решений (Decision Tree) 47
5.2.3 Бэггинг и Случайный лес (Bagging and Random Forest) 48
5.2.4 Бустинговые алгоритмы (Boosting) 48
5.2.5 Стекинг (Stacking / Stacked Generalization) 50
5.3 Оценка и валидация моделей прогнозирования временных рядов 51
5.3.1 Функции потерь и метрики оценки качества для задач регрессии 51
5.3.2. Кросс-валидация на временных рядах 53
5.4. Проблемы и методы повышения робастности моделей 54
5.4.1. Переобучение (Overfitting) и недообучение (Underfitting) 54
5.4.2 Методы борьбы с переобучением для методов классического МО 55
6 Получение и предобработка данных для построения прогнозных моделей 56
6.1 Цель и спецификация сбора данных 56
6.2 Источники и программные средства для сбора данных 57
6.3 Оптимизация процесса загрузки данных 58
6.4. Генерация признаков (Feature Engineering) 58
6.5 Отбор признаков (Feature Selection) 61
7 Обучение моделей прогнозирования и оценка результатов 64
7.1 Аддитивные модели прогнозирования 64
7.1.1 Модель ARIMA (Autoregressive Integrated Moving Average) 64
7.1.2 Модель GARCH (Generalized Autoregressive Conditional Heteroskedasticity) 65
7.1.3 Модель Prophet 66
7.2 Модели классического машинного обучения 66
7.2.1 Линейная регрессия (Linear Regression) 66
7.2.2 Дерево решений (Decision Tree) 67
7.2.3 Случайный лес (Random Forest) 67
7.2.4 Бустинговые алгоритмы (Boosting Algorithms) 68
7.2.5 Стекинг (Stacking) 68
7.3 Сравнительная оценка моделей и анализ результатов 69
ЗАКЛЮЧЕНИЕ 73
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ 75


Современные финансовые рынки характеризуются беспрецедентной динамикой, высокой степенью конкуренции и постоянно растущими объемами данных. В этих условиях традиционные подходы к принятию торговых решений, основанные на интуиции или ручном анализе, становятся все менее эффективными. Возрастает потребность в автоматизированных системах, способных оперативно обрабатывать большие потоки информации, выявлять сложные закономерности и генерировать торговые сигналы с минимальным участием человека. Автоматизированные торговые системы (АТС) стали неотъемлемой частью инфраструктуры как спотового, так и срочного рынков, позволяя участникам реализовывать сложные стратегии и повышать эффективность торговых операций.
Ключевую роль в развитии интеллектуальных АТС играют методы машинного обучения (ML). Способность алгоритмов машинного обучения обучаться на исторических данных, адаптироваться к изменяющимся рыночным условиям и моделировать нелинейные зависимости открывает новые возможности для анализа и прогнозирования финансовых временных рядов. Применение машинного обучения позволяет перейти от систем, основанных на жестко заданных правилах, к более гибким и адаптивным решениям, способным выявлять скрытые паттерны в ценовой динамике акций, фьючерсов и других финансовых инструментов. Данная работа посвящена исследованию и разработке подходов к построению моделей прогнозирования на основе машинного обучения и их интеграции в АТС для краткосрочной торговли.
Ниже перечислены объект, предмет, цель и задачи исследования, которые были поставлены перед началом работы.
Объект исследования - Временные ряды рыночных котировок акций и фьючерсов.
Предмет исследования - Методы и алгоритмы машинного обучения, применяемые для прогнозирования временных рядов рыночных цен.
Цель исследования - Разработка и адаптация методов машинного обучения для прогнозирования рыночных цен на спотовом и срочном рынках.
Задачи исследования:
1. Проанализировать теоретические основы функционирования финансовых
рынков, концепции автоматических торговых систем (АТС) и роль машинного обучения в трейдинге.
2. Исследовать характеристики финансовых временных рядов и методологические подходы к их прогнозированию, включая классические статистические модели и современные алгоритмы машинного обучения.
3. Разработать конвейер для сбора, предобработки данных и генерации многофакторного набора признаков (статистических, технических, вейвлет-признаков, календарных) из 10-минутных котировок.
4. Обучить и сравнить различные модели прогнозирования (ARIMA, GARCH, Prophet, линейную регрессию, дерево решений, случайный лес, градиентный бустинг — XGBoost, CatBoost, LightGBM) для предсказания цены на горизонте одного часа вперёд.
5. Реализовать и протестировать стекинг-ансамбль, объединяющий прогнозы моделей Prophet, CatBoost и линейной регрессии с использованием LightGBM в качестве мета-алгоритма.
6. Оценить качество моделей на основе метрик MAE, MAPE, RMSE с использованием процедуры скользящей кросс-валидации и провести анализ их устойчивости и вычислительной эффективности.
Научная новизна и практическая значимость работы заключаются в комплексном подходе к построению системы прогнозирования, включающем формирование расширенного признакового пространства, применение байесовской оптимизации для настройки гиперпараметров ML-моделей и использование стекинг- ансамбля для повышения точности и робастности прогнозов на краткосрочных временных горизонтах. Разработанные методики и полученные результаты могут быть использованы для создания и совершенствования алгоритмических торговых стратегий.
Автор выражает глубокую благодарность научному руководителю, доктору технических наук Замятину А.В., за ценное руководство и всестороннюю поддержку на всех этапах подготовки выпускной квалификационной работы. Особая признательность адресуется научному консультанту, ассистенту кафедры теоретических основ информатики Кареву С.В., за плодотворные консультации и оказанную помощь. Автор также выражает искреннюю благодарность Исакову А.С., руководителю группы ML-разработки Яндекс Лавки, за предоставленные практические рекомендации и обучающие материалы, обогатившие исследование производственным опытом.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Результаты настоящей магистерской диссертации демонстрируют эффективность применения методов машинного обучения для краткосрочного прогнозирования временных рядов финансовых инструментов и их потенциальную применимость в автоматизированных торговых системах.
Основные научные и практические результаты исследования заключаются в следующем:
1. Установлено превосходство ансамблевых методов машинного обучения: Экспериментально доказано, что ансамблевые модели, в частности градиентный бустинг и разработанный в ходе исследования стекинг-ансамбль (Prophet, CatBoost, линейная регрессия с мета-алгоритмом LightGBM), обеспечивают статистически более высокую точность прогнозирования ценовой динамики акций и фьючерсов на часовом горизонте по сравнению с традиционными аддитивными моделями. Данный вывод подтверждается уменьшением значений метрик ошибок прогнозов.
2. Выявлено, что модели типа ARIMA склонны приближать свой прогноз к предыдущим усреднённым значениям, а модели типа GARCH плохо подходят для прогнозов самих временных рядов активов.
3. Разработан и апробирован эффективный конвейер подготовки данных для ML- моделей: Сформирован комплексный подход к инжинирингу признаков, включающий генерацию статистических, технических, вейвлет- и календарных предикторов. Применение байесовской оптимизации для настройки гиперпараметров моделей позволило повысить их прогностическую способность. Эффективность данного конвейера подтверждена на исторических данных различных финансовых инструментов.
4. Выявлены ограничения ML-прогнозирования на финансовых рынках: несмотря на достигнутые улучшения в точности, исследование выявило сохраняющуюся сложность прогнозирования финансовых временных рядов, обусловленную их стохастической природой, особенно для активов с высокой волатильностью (например, криптовалют). Количественно охарактеризованы проблемы переобучения моделей, нестабильности их предсказательной силы в условиях изменяющейся рыночной конъюнктуры, а также продемонстрировано значимое влияние транзакционных издержек на реализуемость прибыльных торговых стратегий.
Практическая значимость полученных результатов заключается в предложении методологических подходов и конкретных модельных решений, которые могут быть использованы при разработке адаптивных автоматизированных торговых систем.
Продемонстрирована важность тщательного отбора и валидации моделей, оптимизации признакового пространства и критической оценки потенциальной прибыльности с учетом реальных рыночных ограничений.
В качестве перспективных направлений дальнейших исследований можно выделить разработку более сложных гибридных архитектур, методов динамической адаптации моделей к изменениям рыночных режимов (включая онлайн-обучение), интеграцию альтернативных источников данных и углубленное изучение влияния микроструктуры рынка на эффективность краткосрочных прогнозов.
Таким образом, выполненное исследование вносит вклад в теорию и практику применения машинного обучения для анализа финансовых временных рядов, предоставляя эмпирически обоснованные выводы о преимуществах и ограничениях современных ML- подходов в задачах краткосрочного прогнозирования.


1 Fabozzi F. J. Capital Markets: Institutions and Instruments / F. J. Fabozzi, F. Modigliani, F. J. Jones. - 3rd ed. - Upper Saddle River : Pearson College Div, 2002. - 644 p.
2 Галанов В. А. Рынок ценных бумаг : учебник / В. А. Галанов. - 2-е изд. - Москва : ИНФРА-М, 2025. - 414 с.
3 Harris L. Trading and Exchanges: Market Microstructure for Practitioners / L. Harris. - New York : Oxford University Press, 2002. - 656 p.
4 CFA Institute. CFA Program Curriculum Level I. Volume 5: Equity and Fixed Income / CFA Institute. - Charlottesville, VA : CFA Institute, 2012. - 657 p.
5 CFA Institute. CFA Program Curriculum Level II. Volume 6: Derivatives and Alternative Investments / CFA Institute. - Charlottesville, VA : CFA Institute, 2012. - 300 p.
6 Hull J. C. Options, Futures, and Other Derivatives / J. C. Hull. - 9th ed. - London : Pearson Education, 2021. - 896 p.
7 Chan E. P. Quantitative Trading: How to Build Your Own Algorithmic Trading Business / E. P. Chan. - Hoboken, NJ : John Wiley & Sons, 2008. - 181 p.
8 Jansen S. Machine Learning for Algorithmic Trading: Predictive models to extract signals from market and alternative data for systematic trading strategies with Python / S. Jansen. - 2nd ed. - Birmingham : Packt Publishing, 2020. - 820 p.
9 Aldridge I. High-Frequency Trading: A Practical Guide to Algorithmic Strategies and Trading Systems / I. Aldridge. - 1st ed. - Hoboken, NJ : Wiley, 2009. - 339 p.
10 De Prado M. L. Advances in Financial Machine Learning / M. L. De Prado. - Hoboken, NJ : John Wiley & Sons, 2018. - 400 p.
11 Магнус Я. Р. Эконометрика. Начальный курс : учебник / Я. Р. Магнус, П. К. Катышев, А. А. Пересецкий. - Москва : Дело, 2021. - 504 с.
12 Носко В. П. Эконометрика : учебник для бакалавров и магистров / В. П. Носко. - Москва : Дело, 2021. - 704 с.
13 Prophet: Forecasting at scale / Facebook. - [S. l.], [n. d.]. - URL:
https://facebook.github.io/prophet/ (access date: 05.04.2025).
14 LightGBM Documentation / Microsoft. - [S. l.], [n. d.]. - URL:
https://lightgbm.readthedocs.io/en/latest/ (access date:: 07.04.2025).
15 CatBoost Documentation / Yandex. - [S. l.], [n. d.]. - URL:
https://catboost.ai/en/docs/ (access date: 10.04.2025).
16 XGBoost, LightGBM or CatBoost - which boosting algorithm should I use? /
Riskified. - [S. l.], 2019. - URL: https://www.riskified.com/resources/article/boosting-
comparison/ (дата обращения: 19.04.2025).
17 Mastering Stacking in Machine Learning / Number Analytics. - [S. l.], 2025. - URL: https://www.numberanalytics.com/blog/mastering-stacking-in-machine-learning (access date: 27.04.2025).
18 12 Important Model Evaluation Metrics for Machine Learning Everyone Should
Know / Analytics Vidhya. - [S. l.], 2025. - URL:
https://www.analyticsvidhya.com/blog/2019/08/11-important-model-evaluation-error-metrics/ (access date: 03.04.2025).
19 MAPE Techniques for Time Series Forecasting / Number Analytics. - [S. l.], 2025. - URL: https://www.numberanalytics.com/blog/mape-techniques-time-series (access date: 03.04.2025).
20 The Ultimate Guide to Time Series CV / Number Analytics. - [S. l.], 2025. - URL: https://www.numberanalytics.com/blog/ultimate-guide-time-series-cv (access date: 02.05.2025).
21 Tinkoff Invest Python SDK / RussianInvestments. - [S. l.], 2023. - URL: https://russianinvestments.github.io/invest-python/ (access date: 25.04.2025).
22 Справочник API apimoex / Apimoex. - [S. l.], 2019. - URL:
https://wlm1ke.github.io/apimoex/build/html/api.html(дата обращения: 25.04.2025).
23 MoexAlgo: Получение уникальных данных от MOEX ALGOPACK / MoexAlgo. - [Б. м.], 2024. - URL: https://moexalgo.readthedocs.io/ru/latest/candels.html(дата обращения: 25.04.2025).
24 Binance API / Binance.US. - [S. l.], [n. d.]. - URL:
https://docs.binance.us/#introduction (access date: 27.04.2025).
25 asyncio — Asynchronous I/O / Python Software Foundation. - [S. l.], [n. d.]. - URL: https://docs.python.org/3/library/asyncio.html (access date: 29.04.2025).
26 concurrent.futures — Launching parallel tasks / Python Software Foundation. -
[S. l.], [n. d.]. - URL: https://docs.python.org/3/library/concurrent.futures.html (access date: 29.04.2025).
27 statsmodels: statistical models, hypothesis tests, and data exploration / Statsmodels Development Team. - [S. l.], [n. d.]. - URL: https://www.statsmodels.org/stable/index.html (access date: 02.05.2025).
28 Ta-Lib - Technical Analysis Library / TA-Lib.org. - [S. l.], [n. d.]. - URL: https://ta-lib.org/ (access date: 03.05.2025).
29 Why tsfresh? / tsfresh. - [S. l.], 2023-2025 - URL:
https://tsfresh.readthedocs.io/en/stable/text/introduction.html (access date: 04.05.2025).
30 PyWavelets - Wavelet Transforms in Python / PyWavelets. - [S. l.], [n. d.]. - URL: https://pywavelets.readthedocs.io/en/latest/ (access date: 04.05.2025).
31 sklearn.feature_selection.SequentialFeatureSelector / Scikit-learn developers. -
[S. l.], [n. d.]. - URL: https://scikit-
learn.org/stable/modules/generated/sklearn.feature_selection.SequentialFeatureSelector.html (access date: 08.05.2025).
32 BorutaPy Documentation / scikit-learn-contrib. - [S. l.], [n. d.]. - URL:
https://github.com/scikit-learn-contrib/boruta_py (access date: 14.04.2025).
33 Ultimate Guide to Variance Inflation Factor / Number Analytics. - [S. l.], 2025. -
URL: https://www.numberanalytics.com/blog/ultimate-guide-variance-inflation-factor (access
date: 07.05.2025).
34 BayesianOptimization: A Python implementation of global optimization with gaussian processes / fmfn. - [S. l.], [n. d.]. - URL: https://github.com/fmfn/BayesianOptimization (access date: 08.05.2025).

Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ