ЗАЯВЛЕНИЕ О САМОСТОЯТЕЛЬНОМ ВЫПОЛНЕНИИ ВЫПУСКНОЙ КВАЛИФИКАЦИОННОЙ РАБОТЫ 2
ВВЕДЕНИЕ 4
ГЛАВА 1. ОБЗОР ИССЛЕДОВАТЕЛЬСКИХ РАБОТ ПО ТЕМЕ ИСКУССТВЕННОГО
ИНТЕЛЛЕКТА И ПРОГНОЗИРОВАНИЯ ФИНАНСОВЫХ РЕЗУЛЬТАТОВ 6
1.1 Подразделы искусственного интеллекта 6
1.2 Модели машинного обучения в прогнозировании 12
1.3 Использование генеративного искусственного интеллекта в финансовом секторе 15
1.4 Показатели для оценки финансовой устойчивости компаний 17
1.5 Формулировка гипотезы исследования 20
ГЛАВА 2. МЕТОДОЛОГИЯ ИССЛЕДОВАНИЯ И РЕЗУЛЬТАТЫ АНАЛИЗА 22
2.1 Методология исследования 22
2.1.1 Построение моделей машинного обучения в среде Google Colab 22
2.1.2 Критерии оценки моделей 26
2.1.3 Построение моделей машинного обучения генеративным искусственным интеллектом 27
2.2 Описание переменных 29
2.3 Описание выборки и описательная статистика 33
2.4 Анализ полученных результатов 34
2.4.1 Полученные результаты оценочных метрик моделей - бенчмарков 34
2.4.2 Полученные результаты индикаторов моделей, построенных ChatGPT 41
2.4.3 Оценка прогностической способности построенных ChatGPT моделей относительно
бенчмарков 47
2.5 Основные элементы предложенной методики 51
ЗАКЛЮЧЕНИЕ 53
ИСТОЧНИКИ 56
ПРИЛОЖЕНИЯ 63
Приложение 1. Код модели Gradient Boosting, построенной в среде Google Colab 63
Приложение 2. Код модели Random Forest, построенной в среде Google Colab 65
Приложение 3. Код модели XGBoost, построенной в среде Google Colab 67
В эпоху, характеризующуюся постоянным изменением технологических тенденций в бизнесе, способность точно прогнозировать финансовые результаты стала ключевым элементом стратегического планирования и конкурентного преимущества.
В этих условиях нельзя переоценить важность точного прогнозирования таких показателей рентабельности, как ROE, ROA и ROS. Эти показатели не только отражают финансовое состояние компании, но и определяют инвестиционные и стратегические решения. Традиционные методы финансового прогнозирования, хотя и являются основополагающими, предоставляют результаты, точность результатов использования которых очень зависит от профессионализма и компетентности экспертов.
Появление искусственного интеллекта (ИИ) открыло многообещающие горизонты для преодоления этих ограничений. Используя возможности ИИ, включая машинное обучение, глубокое обучение и обработку естественного языка, аналитики смогли повысить точность прогнозирования финансовых показателей, в связи с тем, что методологии ИИ могут обрабатывать и анализировать огромные массивы данных, выявлять скрытые закономерности и адаптироваться к новой информации, предлагая динамичный набор инструментов, значительно превосходящий традиционные модели по точности. Относительно недавнее изобретение в виде больших языковых моделей, генерирующих ответы на запросы пользователей, стало катализатором для проведения исследований лимитов их возможностей для анализа данных, так как подобные модели могли бы потенциально предоставлять точные оценки намного быстрее аналитиков, проводящих анализ вручную. Данная дипломная работа посвящена актуальному на сегодняшний день вопросу о том, сможет ли подобный генеративный ИИ оптимизировать процесс прогнозирования показателей рентабельности компаний, рассматривая как возможности, так и проблемы, связанные с интеграцией этих передовых технологий в финансовую аналитику.
Несмотря на значительные достижения в области технологий генеративного ИИ, его применение в финансовом прогнозировании находится на начальной стадии, и значительный потенциал еще предстоит изучить и использовать. Итак, проблемой данного исследования является недостаточная эксплуатация ИИ для оптимизации получения прогнозных данных, которые имеют определяющее значение для принятия стратегических решений. Соответственно, целью данного исследования является оценка прогностических способностей моделей машинного обучения, построенных для финансовых показателей ROA, ROE и ROS с использованием инструментария в виде генеративного искусственного интеллекта ChatGPT на примере китайских компаний.
Данная дипломная работа представляет собой эмпирическое исследование с практическим результатом в виде разработки основных элементов методики применения искусственного интеллекта в прогнозировании финансовых показателей ROA, ROE и ROS. В рамках него были сформулированы следующие задачи для достижения поставленной цели:
• Проведение анализа научных публикаций, рассматривающих применение искусственного интеллекта при оценке компаний и прогнозировании финансовых результатов;
• Выбор моделей машинного обучения, которые впоследствии будут протестированы в данной работе;
• Формирование выборки китайских компаний с их финансовыми результатами для последующего анализа ее выбранными моделями;
• Построение моделей машинного обучения в среде вручную и использование полученных результатов метрик в роли бенчмарка для оценки эффективности построения прогнозных метрик с помощью искусственного интеллекта ChatGPT;
• Построение прогнозных оценок с помощью искусственного интеллекта и анализ полученных результатов;
• Предложение основных элементов методики использования генеративного ИИ для прогнозирования показателей рентабельности.
Объект исследования: финансовые показатели компаний.
...
Целью данного исследования была оценка прогностических способностей моделей машинного обучения, построенных мультимодальной большой языковой моделью, ChatGPT, с практическим результатом в виде разработки основных элементов методики ее применения.
Первая глава данной работы содержит в себе анализ научных работ, посвящённых рассмотрению концепции искусственного интеллекта и его структуры, анализу применения методов машинного обучения для прогнозирования в финансовом секторе, а также исследованию эффективности применения одномодальных и мультимодальных больших языковых моделей в прогнозировании. Особое внимание уделяется их использованию в контексте анализа и прогнозирования в отрасли финансов.
Вторая глава выпускной квалификационной работы посвящена детальному описанию проведенного исследования. В данной главе представлено описание процесса подготовки данных, методов машинного обучения, использованных для построения прогностических моделей показателей рентабельности компаний. Начальный этап исследования включил в себя обзор выборки данных, включенных в нее финансовых показателей компаний и их описательной статистики. В разделе также далее была описана суть ключевых используемых оценочных метрик - RMSE и R2 -, позволяющих оценить построенные модели на разных уровнях, и их принятая в данной работе интерпретация. Особое внимание в разделе было уделено процессу построения моделей машинного обучения с использованием алгоритмов Random Forest, Gradient Boosting и XGBoost в среде Google Colab и процессу тренировки моделей с использованием генеративного искусственного интеллекта ChatGPT, что в дальнейшем позволило оценить прогностическую способность автоматически генерируемых моделей. Заключительный раздел главы был посвящен описанию основных элементов предложенной методики построения прогнозных значений показателей рентабельности с использованием генеративного искусственного интеллекта.
Вклад данного исследования состоит в том, что полученные результаты оценки потенциала применения инструмента ChatGPT при построении моделей машинного обучения, прогнозируемых финансовые показатели ROA, ROE и ROS, дают возможность прийти к заключению, что данный инструмент может быть использован для решения подобных задач регрессии, что открывает перспективы для повышения точности финансовых прогнозов и оптимизации процесса построения прогностических моделей. Дополнительно в этой работе была описана методика применения мультимодальной модели для построения прогнозов с помощью алгоритма случайного леса, который показал наибольшую прогностическую способность из всех протестированных ChatGPT.
Важно отметить, что использованный в данном исследовании инструмент, ChatGPT, не несет в себе угрозы конфиденциальности предоставляемых ему данных, так как обеспечивает шифрование данных как в состоянии покоя, используя алгоритм шифрования AES-256, так и при передаче, используя протокол безопасности транспортного уровня TLS 1.2+). Это делает потенциально возможным использование предложенных в работе элементов методики компаниями для прогнозирования показателей на основе конфиденциальных тренировочных наборов данных.
Так, в настоящий момент более 92% компаний из списка Fortune 500 интегрировали в свои процессы инструмент ChatGPT, что им позволило повысить продуктивность своих работников - они выполняли в среднем на 12,2% больше задач и на 25,1% быстрее [Dell'Acqua F. et al, 2023]. Таким образом, проведенное исследование освещает потенциал больших языковых моделей для оптимизации деятельности аналитиков финансового сектора.
Более того, результаты проведенного исследования продемонстрировали, что при построении модели для конкретной задачи прогнозирования ROA, ROE и ROS в соответствии с предложенной методикой большая языковая модель способна спрогнозировать значения показателей с точностью большей, чем у традиционной модели. Соответственно, использование ИИ при построении прогностических моделей потенциально может оптимизировать принятие управленческих решений в условиях постоянно изменяющейся среды и определяющего значения полученных оценок для поддержания конкурентного преимущества.
...
1. Бунтова Е. В. Методы математической статистики в экономико-математическом моделировании // Известия Института систем управления СГЭУ. - 2017. - № 1. - С. 325328.
2. Воробьева Д. С. Новые алгоритмы поиска Google: технология BERT // Рекламный вектор-2020: smart-коммуникации. - 2020. - С. 263-264.
3. Гребнева М. Е., Кочетова Е. А. Финансовая устойчивость предприятия // Аллея науки. - 2018. - Т. 4. - № 8. - С. 414-417.
4. Высшая Школа Бизнеса: Операционная эффективность предприятия: определение, принципы, управление [Электронный ресурс]. - URL: https://hsbi.hse.ru/articles/operatsionnaya-effektivnost-predpriyatiya-opredelenie-printsipy- upravlenie/ (дата обращения: 22.03.2024).
5. Лейзаренко Д. ChatGPT получил новую модель GPT-4o: что умеет нейросеть и где ее попробовать [Электронный ресурс] // Тинькофф Журнал. - 2024. - 14 мая. - URL: https://journal.tinkoff.ru/news/gpt-4o-release/ (дата обращения: 23.05.2024).
6. Маркс Е. Р. ВЛИЯНИЕ МАШИННОГО ОБУЧЕНИЯ НА ЖИЗНЬ ЧЕЛОВЕКА. В сборнике: ДОСТИЖЕНИЯ И ПЕРСПЕКТИВЫ НАУЧНЫХ ИССЛЕДОВАНИЙ МОЛОДЕЖИ. XXI Международная научно-практическая конференция. Уфа - 2023.- С. 179-184.
7. «Искусственный интеллект» [Электронный ресурс] // Skine.ru. - URL: https://skine.ru/articles/557073/ (дата обращения: 27.03.2024)
8. Шурлаева Е. А. и др. Прогнозирование вегетационного индекса растительности сельскохозяйственных угодий Волгоградской области с помощью нейросетевых методов // Инженерный вестник Дона. - 2022. - № 5 (89). - С. 284-296.
9. Н. Федосеев, Е. Шпрингер, П. Овчинникова, Яндекс Практикум: сайт [Электронный
ресурс]. - URL: https://practicum.yandex.ru/blog/bloknot-google-colab-dlya-
programmirovaniya-python/ (дата обращения: 19.03.2024).
10. Adams S. et al. Mapping the landscape of human-level artificial general intelligence // AI Magazine. - 2012. - Vol. 33, No. 1. - Pp. 25-42.
11. Afgani K. F. et al. The Effect of Liquidity, Leverage, Operating Capacity, Profitability, and Sales Growth as Predictors of Financial Distress: (Property, Real Estate, and Construction Services Companies Listed on the IDX).
12. Aggarwal C.C. Neural Networks and Deep Learning. - Cham: Springer International Publishing, 2018.
13. Alloghani M. et al. A systematic review on supervised and unsupervised machine learning algorithms for data science // In Berry M.W., Mohamed A., Yap B.W. (Eds), Supervised and Unsupervised Learning for Data Science. - Cham: Springer International Publishing, 2020. - Pp. 3-21.
14. Allwright S. How to interpret RMSE [Электронный ресурс]. - URL: https://stephenallwright.com/interpret-rmse/ (дата обращения: 09.01.2024).
15. Antony T. M., Kumar B. S. Predicting of Credit Risk Using Machine Learning Algorithms // International Conference on Artificial Intelligence on Textile and Apparel. - Singapore: Springer Nature Singapore, 2023. - С. 99-114.
... всего 86 источников