Аннотация
Введение 3
1 Цели, виды и основные элементы моделей прогнозирования показателей финансовой
отчетности 6
1.1 Применение предиктивных моделей в финансовом секторе 6
1.2 Прибыль - как ключевой показатель оценки компании 12
1.3 Виды и порядок формирования прибыли 15
2 Методические основы анализа и прогнозирования финансовых результатов компании . 18
2.1 Традиционные методы анализа финансовых результатов 18
2.2 Методы прогнозирования финансовой отчетности 26
3 Анализ и прогнозирование финансовых результатов компаний нефтегазового сектора
США 30
3.1 Формирование выборки компаний и выбор макроэкономических и отраслевых
факторов 30
3.2 Подготовка и оценка данных для использования в моделях машинного обучения 35
3.3 Оценка качества моделей машинного обучения 44
Заключение 54
Список использованной литературы 55
Приложение 58
В современном мире буквально в каждой сфере деятельности общества интегрируются планирование и прогнозирование, так как с помощью предположения о будущем у той или иной организации появляется возможность не только сократить возможные убытки, но и увеличить прибыль. Множество компаний годами скапливают огромные объемы данных, которые представляют большую ценность для статистических исследований, выявления закономерностей и прогнозирования будущих результатов. Однако при экспоненциальном росте количества данных возникают сложности в их обработке и анализе, так как зачастую постановка прямого решения задачи является неэффективным методом. Исходя из этого в последнее десятилетие стали активно использоваться методы машинного обучения.
Машинное обучение - класс методов искусственного интеллекта, характерной чертой которых является не прямое решение задачи, а обучение за счёт применения решений множества сходных задач. Для построения таких методов используются средства математической статистики, численных методов, математического анализа, методов оптимизации, теории вероятностей, теории графов, различные техники работы с данными в цифровой форме.
С помощью машинного обучения искусственный интелект может анализировать данные, запоминать информацию, строить прогнозы, воспроизводить готовые модели и выбирать наиболее подходящий вариант из предложенных.
Особенно полезны такие системы там, где необходимо выполнять огромные объемы вычислений: например, банковский скоринг (расчет кредитного рейтинга), аналитика в области маркетинговых и статистических исследований, бизнес-планирование, демографические исследования, инвестиции, поиск фейковых новостей и мошеннических сайтов.
Способность алгоритмов машинного обучения оперативно справляться с задачами анализа и прогнозирования, определяет важность решения задач прогнозного анализа финансового состояния совершенствованием существующих методов такого прогнозирования и обуславливает актуальность данного исследования.
Целью выпускной квалификационной работы является прогнозирование показателей финансовой отчетности компаний нефтегазовой отрасли с использованием методов машинного обучения.
Для достижения цели были поставлены следующие задачи:
1) Изучить цели, виды и основные элементы моделей прогнозирования показателей финансовой отчетности;
2) Рассмотреть методики анализа финансовых результатов;
3) Определить сущность и подходы к прогнозированию финансовых результатов; сравнить основные методы прогнозирования и оценки точности прогнозов;
4) Проанализировать финансовые результаты компаний нефтегазовой отрасли США и составить их прогноз на будущее.
Объект исследования - финансовые результаты деятельности компаний нефтегазовой отрасли США.
Предмет исследования - прогноз финансовых результатов деятельности компаний.
В работе использовались следующие методы исследования: анализ, синтез, моделирование, сравнение, измерение, статистический метод, методы сбора и обработки данных.
Одним из основополагающих этапов прогнозирования результатов финансовой отчетности является сбор данных, а именно формирование датасета с финансовыми результатами компаний, в которых находятся целевая прогнозная переменная, а также исторические данные. Большую часть датасета с финансовыми отчетностями удалось найти на сайте Kaggle.com1, а оставшуюся - на сайте Smart-lab.ru2 Далее необходимо формирование датасета с факторами, которые предположительно имеют корреляцию, то есть связь с прогнозной переменной. Исторические данные факторов были выгружены с двух источников: Finam.ru3 и Tradingview.com4.
Расчеты в практической части работы выполнялись в несколько этапов, где на каждом этапе в соответствии с задачей применялось то или иное приложение. Язык программирования Python5 был задействован на этапах парсинга данных, построения и оценки моделей машинного обучения. Табличный редактор Microsoft Excel6 7 использовался для упорядочивания и приведения данных в надлежащий для анализа вид. Также использовалось приложение Microsoft Power BI7 для приведения полученных данных к единому таймфрейму.
Цель данной работы предопределила её структуру: во введении определена актуальность темы, обозначены методы исследования и инструментарий. В первой главе рассматриваются цели, виды и основные элементы моделей прогнозирования показателей финансовой отчетности. Во второй главе изучаются методические основы анализа и прогнозирования финансовых результатов компании. Третья глава посвящена практическому исследованию, а именно анализу и прогнозированию финансовых результатов компаний нефтегазового сектора с помощью методов машинного обучения. В заключении приведены основные результаты работы. Список используемых источников и литературы состоит из нормативно-правовых актов, научных статей, учебной литературы и электронных ресурсов. В работе использовались 51 источник из которых 19 на русском языке, 32 на английском.
В выпускной квалификационной работе были рассмотрены теоретические основы моделирования и прогнозирования показателей финансовой отчетности.
Рассмотрены основные этапы прогнозирования элементов финансовой отчетности компаний нефтегазовой отрасли:
• сбор необходимых данных;
• оценка корреляции;
• масштабирование данных;
• сжатие сильно коррелирующих факторов;
• распределение коэффициентов важности;
• прогнозирование с помощью моделей машинного обучения;
• оценка результатов с помощью выбранной метрики
Выборка целевых переменных содержала показатели выручки 50 самых крупных компаний нефтегазовой отрасли США.
Первичный набор факторов осуществлялся на основе общего и экспертного мнения и состоял из 150 показателей. Окончательный выбор переменных при помощи модели машинного обучения «Случайный лес», в итоге которых остались лишь 20 факторов. В окончательную выборку факторов вошли:
• мировые валюты
• фондовые индексы
• цены на товарные инструменты
• исторические данные компаний
На данном множестве были построены модели машинного обучения XGBoost, CatBoost, и модель случайного леса, задачей которых было прогнозирование выручки каждой компании из отрасли.
В итоге построения предиктивных моделей были получены весьма впечатляющие результаты. Метрика, выбранная в качестве оценки качества моделей машинного обучения - средняя абсолютная ошибка в процентах, проявила себя в диапазоне от 0.69 до 0.78, что является достаточно качественным прогнозом. Таким образом, путем решения поставленных задач, удалось достичь цели исследования.