ВВЕДЕНИЕ 3
ГЛАВА 1. СБОР ДАННЫХ 6
Макроэкономические показатели 6
Методы сбора данных 7
Парсер PDF-файлов 7
Парсер Excel-файлов 8
1.3 Исходный вид входных данных и полученный набор признаков 9
ГЛАВА 2 ОБАБОТКА И АНАЛИЗ ДАННЫХ 20
Обработка исходного набора данных 20
Анализ взаимосвязей входных признаков 23
ГЛАВА 3 ВЫБОР МЕТРИКИ ОЦЕНКИ КАЧЕСТВА МОДЕЛИ 29
ГЛАВА 4 ПОДБОР ГИПЕРПАРАМЕТРОВ ДЛЯ МОДЕЛЕЙ МАШИННОГО ОБУЧЕНИЯ 32
ГЛАВА 5 ВЫБОР И ПОСТРОЕНИЕ МОДЕЛИ 33
Построение модели случайного леса (RandomForestRegressor) 33
Подбор параметров модели 34
Реализация модели машинного обучения для прогнозирования наличной валюты 35
Реализация модели машинного обучения для прогнозирования показателей долговых ценных
бумаг 37
Построение моделм градиентного бустинга (GradientBoostingRegressor) 41
Подбор параметров модели для прогнозирования наличных средств 41
Реализация модели машинного обучения для прогнозирования наличных средств 42
Подбор параметров модели для прогнозирования показателей долговых ценных бумаг 44
Реализация модели машинного обучения прогнозирования показателей долговых ценных
бумаг 45
Сравнение моделей 49
ЗАКЛЮЧЕНИЕ 51
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 52
Прогнозирование финансовых показателей является одной из ключевых задач в финансовой индустрии, это основа для финансового планирования и бюджетирования, т.е. составления стратегических, текущих и оперативных планов и бюджетов.
Макроэкономические показатели представляют собой сводные, усредненные по экономике в целом показатели объемов производства и потребления, доходов и расходов, структуры, эффективности, уровня благосостояния, экспорта и импорта, темпов экономического роста и др. По своей сути это статистические данные, которые отражают общие тенденции в экономических условиях конкретной страны, региона или сектора экономики. Они оказывают влияние на принятие органами государственной власти решений в политической, социальной, экономической сферах, являются ориентиром для предпринимателей, отдельных граждан, зарубежных партнеров в их хозяйственной деятельности. [14]
В рамках прогнозирования показателей финансового плана применяемые методы разделяют на три группы:
методы экспертных оценок;
методы экстраполяции;
методы экономико-математического моделирования.
Первый метод основан на анализе мнений компетентных специалистов по вопросам динамики финансовых процессов. Проводится в форме специальных процедур анкетирования и интервьюирования. Эксперты должны обладать высокой квалификацией и владеть профессиональными знаниями и навыками в сфере управления финансами.
Второй метод - это распространение на будущее тенденций, которые сложились в ретроспективе. Целесообразность применения метода экстраполяции определяется степенью стабильности или инерционности динамики развития экономической системы. Меньше всего используются финансовые показатели 3
микроэкономики, которые являются менее инерционными. В свою очередь более стабильными считаются динамика развития финансовых индикаторов на уровне макроэкономики. Обычно данный метод используется в совокупности с другими.
Методы экономико-математического моделирования основываются на построении моделей, которые описывают динамику финансовых показателей относительно воздействующих на финансовые процессы факторов.
Выделяют следующие виды экономико-математического моделирования: корреляционное моделирование; оптимизационное моделирование;
многофакторное экономико-математическое моделирование.
Сущность первого вида заключается в определении корреляционной зависимости между двумя исследуемыми показателями в динамике и последующем прогнозировании одного из них относительно изменения другого, принятого за базу.
Традиционные методы прогнозирования, такие как статистические модели и экспертные оценки, имеют свои ограничения и не всегда могут обеспечить высокую точность прогнозов. Одной из проблем традиционных методов прогнозирования является их ограниченность в обработке больших объемов данных. Кроме того, они не всегда учитывают сложные взаимосвязи между различными факторами, которые могут влиять на изменение финансовых показателей. Это может привести к неточным прогнозам и потере денежных средств. Еще одной проблемой является нестабильность финансовых рынков, которая может привести к неожиданным изменениям.
В связи с этим, в последние годы все большее внимание уделяется применению алгоритмов машинного обучения для прогнозирования финансовых показателей.
Целью данной работы является создание модели машинного обучения на основе макроэкономических показателей и взаимодействию с банками физических лиц для прогнозирования таких финансовых активов как:
наличная валюта;
долговые ценные бумаги;...
В ходе проделанной работы была разобрана предметная область, макроэкономические показатели, рассмотрены модели прогнозирования целевых признаков, возможные метрики качества модели.
Результатом проделанной работы стали обученные модели - случайный лес и градиентный бустинг. Проведен анализ и их сравнение на основе сформированной выборки. Предварительно были найдены и изучены первичные источники и разработаны парсеры для сбора данных. Проведен первичный анализ на наличие пропусков и формата показателей, а также корреляционных связей. Полученная модель случайного леса позволяет предсказать показатели со средней ошибкой 25%.
ЕМИСС - единая межведомственная информационно-статистическая
система [Электронный ресурс]. Режим доступа:
https://russia.duck.consulting/maps/104/2017.
Федеральная служба государственной статистики [Электронный ресурс]. Режим доступа: https://rosstat.gov.ru/statistic.
InvestFunds - независимый источник данных для частного инвестора в России [Электронный ресурс]. Режим доступа: https://myfin.by/.
Банкирша.com, Инфляция в России [Электронный ресурс]. Режим доступа: https://bankirsha.com/uroven-inflyacii-v-rossiyskoy-federacii-po-godam.html.
Индекс Мосбиржи [Электронный ресурс]. Режим доступа: https://www.moex.com/ru/index/IMOEX/archive/?from=2013-03- 01&till=2023 -05-01&sort=TRADEDATE&order=desc.
Банк России [Электронный ресурс]. Режим доступа:
https://www.cbr.ru/hd_base/KeyRate/?UniDbQuery.Posted=True&UniDbQuery .From=17.09.2013&UniDbQuery.To=12.05.2023.
Macrotrends - Цена на нефть [Электронный ресурс]. Режим доступа: https://www.macrotrends.net/2516/crude-oil-prices-70-year-historical-chart.
Документация scikit-learn [Электронный ресурс]. Режим доступа:
https://scikit-learn.org/stable/;
Документация TensorFlow [Электронный ресурс]. Режим доступа:
https://www.tensorflow.org/api_docs;
Макроэкономические показатели [Электронный ресурс]. Режим доступа: https://www.banki.ru/;
Средняя цена 1 кв. м. общей площади квартир на рынке [Электронный ресурс]. Режим доступа: https://www.fedstat.ru/indicator/31452.
Индекс Джинни [Электронный ресурс]. Режим доступа: https://russia.duck.consulting/maps/104/2016.
Статистические показатели банковского сектора Российской Федерации
[Электронный ресурс]. Режим доступа:
https://www.cbr.ru/statistics/bank_sector/review/.
Макроэкономические показатели [Электронный ресурс]. Режим доступа: https://www.banki.ru/wikibank/makroekonomicheskie_pokazateli/.
Типы полей [Электронный ресурс]. Режим доступа:
https://www.ibm.com/docs/ru/spss-statistics/saas?topic=tab-field-variable-types....20