Тип работы:
Предмет:
Язык работы:


Предсказание дефолта банков с помощью машинного обучения и нейронных сетей (Новосибирский Национальный Исследовательский Государственный Университет)

Работа №153886

Тип работы

Курсовые работы

Предмет

информационные системы

Объем работы34
Год сдачи2024
Стоимость600 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
12
Не подходит работа?

Узнай цену на написание


Есть приложение (программный код).

ВВЕДЕНИЕ 3
ГЛАВА 1. Обзор предметной области 5
1.1. Дефолт банка и его влияние на экономику страны 5
1.2. Обзор различных подходов к прогнозированию банковского дефолта 7
ГЛАВА 2. Используемые методы машинного обучения 9
2.1 Машинное обучение 9
2.1.1 Определение и базовые понятия 9
2.1.2 Основные алгоритмы моделей машинного обучения 11
2.2 Нейронные сети 12
2.2.1 Определение и базовые понятия 13
2.2.2 Рекуррентные нейронные сети 14
2.3. Оценка качества моделей 15
ГЛАВА 3. Использование методов машинного обучения и нейронных сетей для прогнозирования банковского дефолта. 17
3.1. Сбор данных 17
3.2. Подготовка данных 20
3.3. Предсказание дефолта банков с использованием различных моделей 21
3.4. SHAP-Анализ 23
ЗАКЛЮЧЕНИЕ 28
СПИСОК ЛИТЕРАТУРЫ 30
ПРИЛОЖЕНИЕ А 32


В современности изучение дефолтов банков и их влияния на экономику страны является актуальной и важной задачей, требующей пристального внимания со стороны исследователей и практиков. Важность этого процесса трудно переоценить, так как своевременное выявление потенциальных проблем позволяет принять превентивные меры, направленные на стабилизацию ситуации и предотвращение кризисных явлений. Эффективная система предсказания и предотвращения дефолтов способна не только сохранить стабильность банковской системы, но и обеспечить устойчивый экономический рост, защитить интересы вкладчиков и инвесторов, а также укрепить доверие к финансовым институтам.
Данная работа состоит из трех глав. В первой главе рассмотрены возможные факторы для прогнозирования банковского дефолта, а также объяснена необходимость проведения подобного исследования. Во второй главе приведены теоретические аспекты: описаны модели машинного обучения, применимые для построения прогноза дефолта и метрики для оценки качества их работы. В третьей главе описанные ранее модели применяются на практике для прогнозирования дефолта банков. В заключении произведено сравнение используемых моделей и определена наиболее подходящая для поставленной задачи модель.

Цель работы
Цель исследования – определить влияние архитектуры моделей, временных зависимостей и количества отчетов на итоговое предсказание дефолта, найти зависимости для предсказания дефолта банка, а также определить признаки, которые в большей степени могут влиять на возникновение банковского дефолта.

Для достижения цели в работе поставлены и решены следующие задачи:
1) Применить метод логистической регрессии для предсказания дефолта банка на данных трех разных длительностей;
2) Применить метод LSTU для предсказания дефолта банка на данных трех разных длительностей;
3) Применить метод GRM решений для предсказания дефолта банка на данных трех разных длительностей;
4) Применить метод CatBoost для предсказания дефолта банка на данных трех разных длительностей;
5) Сравнить результаты применения данных методов для предсказания дефолта банков.
Объект исследования
Объектом исследования являются данные отчетностей банков, а также значения макроэкономических показателей в моменты создания отчетов, предоставленные для прогнозирования дефолта банков.

Предмет исследования
Предмет исследования - разработка и сравнительный анализ алгоритмов машинного обучения (логистическая регрессия, LSTU, GRU, CatBoost) для предсказания дефолта банка.

Методология исследования
В работе используются методы логистической регрессии, LSTU, GRU, CatBoost и гардиентный бустинг. Данные для анализа были найдены в формате дата сета, содержащего информацию о финансовых показателях и макроэкономических индикаторах Российских банков с 2010 по 2018 года. Данный дата сет был составлен Иваном, который работает аналитиком данных в Delievery club. Для написания программного кода используется язык программирования Python.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе исследования прогнозирования банковских дефолтов были проанализированы различные модели машинного обучения. Было выяснено, что с ростом объема данных рекуррентные нейронные сети (LSTM и GRU) улучшают свои метрики, в то время как остальные модели ухудшают свои показатели. Разница в метриках между LSTM и GRU показывает, что на малом наборе данных GRU справляется лучше LSTM, однако при увеличении объема данных модели демонстрируют примерно одинаковые результаты. При значительном росте данных все модели показывают ухудшение метрик из-за увеличения шума, однако LSTM и GRU при этом начинают работать лучше, чем CatBoost, что подтверждает их способность эффективно обрабатывать большие объемы данных и временные зависимости. Результаты исследования приведены в таблице:
Число отчетов ROC AUC Accuracy F1 Score Percision Recall
LogisticRegression 5 0,782 0,774 0,685 0,622 0,763
25 0,729 0,730 0,600 0,575 0,629
Весь период 0,719 0,671 0,498 0,490 0,505
CatBoost 5 0,923 0,877 0,776 0,941 0,660
25 0,893 0,814 0,702 0,725 0,680
Весь период 0,783 0,734 0,545 0,608 0,495
LSTM 5 0,689 0,691 0,503 0522 0,485
25 0,818 0,787 0,656 0,685 0,629
Весь период 0,755 0,724 0,621 0,558 0,701
GRU 5 0,813 0,750 0,550 0,657 0,474
25 0,856 0,790 0,631 0,729 0,557
Весь период 0,769 0,688 0,612 0,510 0,763
Таблица 1 – результаты работы программы
Источник: составлено автором
Важными показателями, влияющими на риск дефолта банка, оказался норматив текущей ликвидности (N3) и норматив мгновенной ликвидности (N2). Высокие значения этих коэффициентов указывают на способность банка выполнять свои краткосрочные и мгновенные обязательства, что значительно снижает риск дефолта. Кроме того, высокий норматив достаточности капитала (N1) свидетельствует о хорошей капитализации банка, что также способствует его финансовой устойчивости.
Экономические показатели, такие как инфляция с сезонной корректировкой (INF_SA) и разница в курсе USD/RUB (usd_rub_std_diff), могут существенно влиять на финансовую устойчивость банка. Высокая инфляция может увеличивать затраты и снижать реальную стоимость активов, повышая риск дефолта. Волатильность валютного курса указывает на валютные риски, которые также могут негативно сказываться на устойчивости банка.
Показатели межбанковского кредитования, такие как сумма межбанковских кредитов (miacr_amount) и межбанковские кредиты (ibl), а также стандартное отклонение межбанковской ставки (miacr_std), указывают на зависимость банка от внешних заимствований и нестабильность на межбанковском рынке. Высокие объемы межбанковских кредитов и волатильность межбанковской ставки могут повышать риск ликвидности, особенно в нестабильных рыночных условиях.
Финансовые показатели, такие как рентабельность активов (ROA), чистая прибыль (NI) и рентабельность собственного капитала (ROE), показывают способность банка эффективно использовать свои активы и капитал для генерации прибыли. Высокие значения этих показателей снижают риск дефолта, обеспечивая банку финансовую устойчивость. Кроме того, чистые активы (net_assets) и процент залоговых кредитов (zalog_credit_perc) также играют важную роль в снижении риска, так как наличие залога уменьшает возможные потери по кредитам, а высокие чистые активы указывают на хорошую финансовую устойчивость.
Наконец, анализ разницы в чистом государственном долге (net_gov_debt_diff), спреда розничных ставок (i_retail_spread_diff) и розничного долга с сезонной корректировкой (retail_debt_SA_DETREND_diff) показывает, что изменения в этих показателях могут влиять на банковскую систему и финансовую устойчивость банка. Колебания в стоимости капитала акций (stocks_capital_diff) и изменения в условиях кредитования (miacr_diff) также указывают на рыночные и кредитные риски, которые необходимо учитывать при прогнозировании дефолтов банков.
Таким образом, для точного прогнозирования дефолтов банков необходимо учитывать комплексный анализ различных финансовых показателей и их взаимодействий, что позволяет более точно оценить риски и повысить надежность прогнозов.



Chernykh L., Theodossiou A. (2011) Determinants of Bank Long-Term Lending Behavior: Evidence From Russia // Multinational Finance Journal. 2011. No. 15. P. 193–216.
E Ghosh, Partha & Bose, Sombit & Roy, Sayantan & Mondal, Avisek. (2023). Detection of abnormal human behavior using deep learning. BOHR International Journal of Smart Computing and Information Technology
Fungacova Z., Solanko L. (2009) Risk-taking by Russian banks: Do location, ownership and size matter? BOFIT Discussion Papers 21/2008. Bank of Finland. Institute for Economies in Transition.
Lanine G., Vennet R. (2006) Failure prediction in the Russian bank sector with logit and trait recognition models // Expert Systems with Applications. 2006. Vol. 30. No. 3. P. 463–478.
Peresetsky A.A., Karminsky A.M., Golovan S.V. (2011) Probability of default models of Russian banks // Economic Change and Restructuring. Vol. 44. No. 4.
Арзамасцев С.А., Бгатов М.В., Картышева Е.Н., Деркунский В.А., Семенчиков Д.Н. Предсказание оттока абонентов: сравнение методов машинного обучения, 2018
Горяев В.М., Бурлыков В.Д., Прошкин С.Н., Лиджи-Гаряев В.В., Джахнаева Е.Н. ROC-кривая и матрица путаницы как эффективное средство для оптимизации классификаторов машинного обучения, 2023
Гуськов С.Ю, Лёвин В.В. Интервальные доверительные оценки для показателей качества бинарных классификаторов — ROC-кривых, AUC, 2015
Карминский А.М., Пересецкий А.А., Петров А.Е. (2005) Рейтинги в экономике: методология и практика / под ред. А.М. Карминского. М.: Финансы и статистика, 2005.
Комментарий Аналитического кредитного рейтингового агентства (АКРА). https://www.acra-ratings.ru/press-releases/4800/
Михайличенко А.А. Аналитический обзор методов оценки качества алгоритмов классификации в задачах машинного обучения, 2022
Пересецкий А.А. (2010) Модели причин отзыва лицензий российских банков. Препринт WP/2010/085. М.: Российская экономическая школа, 2010.
Рашка С. Python и машинное обучение. – Litres, 2022.
Российская экономика 1999–2019. Спецпроект «Ведомостей» и «Эксперт РА» https://www.vedomosti.ru/finance/articles/2019/10/29/814907-20-let-rossiya
Сергей Николенко. Глубокое обучение. Погружение в мир нейронных сетей. — «Питер», 2018. — С. 93-123.
Федеральный закон «О банках и банковской деятельности» от 02.12.1990 N 395–1, ст. 20 (http://www.consultant.ru/popular/bank/).
Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных. – Litres, 2022.

Работу высылаем на протяжении 30 минут после оплаты.




©2024 Cервис помощи студентам в выполнении работ