🔍 Поиск работ

Разработка математических моделей для решения задачи классификации потенциальных кредитополучателей в целях уменьшения рисков для банка

Работа №207265

Тип работы

Дипломные работы, ВКР

Предмет

информационные системы

Объем работы86
Год сдачи2020
Стоимость4250 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
13
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 9
1 ГЛАВА 1 МЕТОДИЧЕСКИЕ АСПЕКТЫ ПРОГНОЗИРОВАНИЯ
КРЕДИТНОГО РИСКА 13
1.1 Понятие кредитного риска 13
1.2 Организация процесса кредитования в банках 38
1.3 Управление кредитными рисками 40
1.4 Подходы к анализу и оценке кредитоспособности клиента 43
1.5 Скоринговые модели как средство управления кредитными рисками в
банках 44
1.6 Анализ работ, посвященных прогнозированию вероятности возврата
кредита 44
1.7 Постановка задачи
2 ГЛАВА 2 МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ 27
2.1 Логистическая регрессия 38
2.2 Деревья решений 40
2.2.1 Построение дерева решений 43
2.3 Ансабли 44
2.3.1 Стекинг 44
2.3.2 Бэггинг 44
2.3.3 Бустинг 45
2.4 Ансабли деревьев решений 46
2.4.1 Random Forest 46
2.4.2 Градиентный бустинг деревьев 49
2.4.3 Extra Trees 50
2.5 Extreme Gradient Boosting 51
2.6 Гиперпараметры 52
2.6.1 Настраиваемые гиперпараметры 53
3 ГЛАВА 3 ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ
МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ
ВЕРОЯТНОСТИ ВОЗВРАТА КРЕДИТА НА ПРИМЕРЕ ДАННЫХ БАНКА HOME CREDIT 57
3.1 Понимание проблемы и ознакомление с данными 58
3.2 Exploratory Data Analysis (первичное исследование данных) 60
3.3 Тренировка модели 81
3.3.1 Логистическая регрессия 82
3.3.2 Random Forest 83
3.3.3 Градиентный бустинг 83
3.3.4 Кросс-валидация 88
4 ГЛАВА 4 КОММЕРЦИАЛИЗАЦИЯ ПРОЕКТА 89
4.1 Участники процесса коммерциализации 90
4.2 Выбор способа коммерциализации 93
4.3 Описание продукта 98
4.4 Решаемая проблема 98
4.5 Объем рынка 99
4.6 Дорожная карта коммерциализации проекта 99
4.7 Бизнес-Модель 101
4.8 Команда проекта 102
4.9 Ценообразование 103
ЗАКЛЮЧЕНИЕ 106
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ ЛИТЕРАТУРЫ 107

В настоящее время существует много рисков, связанных с банковскими кредитами, особенно для банков, связанных с потерей капитала. В связи с этим анализ рисков и оценка дефолта становится критически важными. Банки хранят огромные объемы данных о поведении клиентов, из которых они не могут прийти к суждению, может ли заявитель быть неплательщиком или нет, будут ли проблемы с возвратом кредита или нет.
Для банковской сферы применение методов машинного обучения показало высокую эффективность. В частности, применительно к данной работе, анализ больших массивов данных и разработка модели прогнозирования существенно снижают нагрузку на персонал банка, уменьшает время обработки информации и вынесения решения, в целом - уменьшает издержки и практически исключает фактор человеческой ошибки.
В общем - значительно упрощает и автоматизирует процесс анализа и вынесения решения, что в текущей мировой конъюнктуре, в которой популярность банковской сферы, и в целом клиентооборот банков, значительно увеличились, может сыграть серьезную роль в плане повышения конкурентоспособности банка и повышения экономической стабильности через уменьшение потенциальных рисков.
Оценка кредитного риска является критически важной проблемой, с которой сталкиваются банки в настоящее время, и которая помогает им оценить, может ли соискатель кредита быть неплательщиком на более позднем этапе, чтобы они могли принять решение - предоставить кредит или нет. Это помогает банкам минимизировать возможные убытки и может увеличить объем кредитов. Результатом этой оценки кредитного риска будет прогноз категории заявителя - 0 или 1. Следовательно, становится важным создать модель, которая будет учитывать различные аспекты заявителя. Это поможет банку решить, могут ли они предложить кредит заявителю или нет.
В таком сценарии анализируемые данные огромны и сложны, и использование методов интеллектуального анализа данных для получения результата является наиболее подходящим вариантом при условии его эффективной аналитической методологии, которая находит полезные знания.
Целью данной работы является предложение модели анализа данных с использованием методов машинного обучения для прогнозирования категорий для новых заявителей на получение кредита в банке.
Данные, используемые для анализа, содержат много несоответствий, таких как отсутствующие значения, выбросы и несоответствия, и их необходимо обработать перед использованием для построения модели. Лишь немногие из параметров клиента действительно способствуют прогнозированию неплательщика. Таким образом, эти параметры или функции должны быть определены до применения модели.
В ходе выполнения работы, будут опробованы разные методики машинного обучения. В результате - будет определена лучшая.
Теоретической и методологической основой магистерской диссертации являются труды зарубежных и отечественных ученых в области машинного обучения. Так, например в российской литературе известны такие авторы как: Вьюгин В.В.[1], Николенко С.И.[2], Барскир А.Б.[3], Матвеев А.С.[4], Ручкин В.Н.[5], В.А. Фулин[5], Аксенов С.В.[6], Новосельцев В.Б.[6], Воронцов К.В.[7], Лепский А.Е.[8], Броневич А.Г.[8]
В зарубежной литературе: Я.Гудфеллоу[9], И.Бенджио[9], А.Курвилль [9], А. Джули[10], Суджит Пол[10], Мохамед Али,[11] Арно Мейсман[11], Дэви Силен[11], Андреас Мюллер[12], Сара Гвидо[12], Себастьян Рашка[13].Джоэл Грас[13], Дж. Вандер Плас[14],
Рассмотрев различные точки зрения в отечественной и зарубежной литературе, можно прийти к выводу, что существуют различные методы прогнозирования, каждый из которых имеет свои преимущества и недостатки.
Объект исследования - процесс предкредитной оценки и анализа потенциальных кредитополучателей банка.
Предмет исследования - методы прогнозирования вероятности возврата кредита клиентами банка.
Цель исследования - совершенствование методов предкредитной оценки кредитополучателя на основе анализа данных о предшествующих кредитах других клиентов банка, для минимизации рисков и уменьшения объема не возвращенных денежных средств.
Для достижения цели были поставлены следующие задачи:
1) описание понятия предкредитного анализа.
2) провести исследование и анализ современных подходов к проведению предкредитного анализа.
3) анализ имеющихся прогнозных методов машинного обучения.
4) формулировка требований к прогнозной модели.
5) построение прогнозной модели.
6) сравнительный анализ результатов прогнозирования методами машинного обучения.
7) разработка плана коммерциализации.
Новизна работы заключается в том, что на основе комплексного анализа:
1) рассмотрены и проанализированы методы прогнозирования.
2) проведен сравнительный анализ методов.
3) разработана модель для решения задачи классификации потенциальных кредитополучателей в целях уменьшения рисков для банка.
Практическая значимость работы обусловлена применением результатов исследования на практике, для решения задачи классификации потенциальных кредитополучателей в целях уменьшения рисков для банка.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В данной работе был проведен полноценный анализ исходных данных, были построены графики, таблицы и т.д.
В главе 1 было рассмотрено понятие кредитного риска, были проанализированы текущие практики, также приведен анализ работ, посвященных данной тематике.
В главе 2 было рассмотрено понятие машинного обучения, были разобраны методы, которые могут быть применены к текущей задаче.
В главе 3 были проанализированы исходные данные, выполнен первичный анализ данных, проведена работа с недостающими данными, построены модели с использованием различных методов.
В главе 4 был описан потенциальный план коммерциализации, были приведены дорожная карта, таблицы затрат, план по персоналу и т.д.
Лучший результат - Full AUC score 0.754 - был получен с применением методики разделения на фолды и использования методики кросс-валидации.



1) Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: основы моделирования и первичная обработка данных. - М.: Финансы и статистика, 1983.
2) Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: исследование зависимостей. - М.: Финансы и статистика, 1985.
3) Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: классификация и снижение размерности. - М.: Финансы и статистика, 1989.
4) Вапник В. Н. Восстановление зависимостей по эмпирическим данным. - М.: Наука, 1979.
5) Журавлев Ю. И., Рязанов В. В., Сенько О. В. «Распознавание». Математические методы. Программная система. Практические применения. - М.: Фазис, 2006.
6) Загоруйко Н. Г. Прикладные методы анализа данных и знаний. - Новосибирск: ИМ СО РАН, 1999.
7) Флах П. Машинное обучение. - М.: ДМК Пресс, 2015. - 400 с.
8) Шлезингер М., Главач В. Десять лекций по статистическому и структурному распознаванию. - Киев: Наукова думка, 2004.
9) Hastie, T., Tibshirani R., Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. - 2nd ed. - Springer-Verlag, 2009. - 746 P.
10) Mitchell T. Machine Learning. - McGraw-Hill Science/Engineering/Math,
1997.
11) Ryszard S. Michalski, Jaime G. Carbonell, Tom M. Mitchell, Machine Learning: An Artificial Intelligence Approach, Tioga Publishing Company, (Machine Learning: An Artificial Intelligence Approach в «Книгах Google»), 1983.
12) Vapnik V. N. Statistical learning theory. - N.Y.: John Wiley & Sons, Inc.,
1998.
13) Bernhard Scholkopf, Alexander J. Smola Learning with Kernels. Support Vector Machines, Regularization, Optimization, and Beyond. - MIT Press, Cambridge, MA, 2002.
14) I. H. Witten, E. Frank Data Mining: Practical Machine Learning Tools and Techniques (Second Edition). - Morgan Kaufmann, 2005.
15) Liang Wang, Li Cheng, Guoying Zhao. Machine Learning for Human Motion Analysis. - IGI Global, 2009. - 318 p.
16) http://edoc.bseu.by:8080/bitstream/edoc/10164/
17) Lysyuk_R_S_Metodiki_analiza_i_otsenki_s_31-32_ocr.pdf
18) https://scienceproblems.ru/analiz-kreditnyh-riskov-v-kommercheskom- banke/2.html
19) https: / / en.wikipedia.org/wiki/Credit_ri sk
20) https://ru.wikipedia.org/wiki/KpegnTHbin_pncK
21) https://en.wikipedia.org/wiki/Credit_analysis
22) https://en.wikipedia.org/wiki/Machine_learning
23) https://ru.wikipedia.org/wiki/MamnHHoe_o6y4eHne
24) http://www.machinelearning.ru/wiki/index.php?
25) Bluhm, Christian; Ludger Overbeck & Christoph Wagner. An Introduction to Credit Risk Modeling. Chapman & Hall/CRC, 2002.
26) Damiano Brigo and Massimo Masetti. Risk Neutral Pricing of Counterparty Risk, in: Pykhtin, M. (Editor), Counterparty Credit Risk Modeling: Risk Management, Pricing and Regulation. Risk Books, 2006.
27) de Servigny, Arnaud; Olivier Renault. The Standard & Poor's Guide to Measuring and Managing Credit Risk. McGraw-Hill, 2004.
28) Darrell Duffie and Kenneth J. Singleton. Credit Risk: Pricing, Measurement, and Management. Princeton University Press, 2003.
29) Principles for the management of credit risk from the Bank for International Settlements
30) Nils J. Nilsson, Introduction to Machine Learning.
31) Trevor Hastie, Robert Tibshirani and Jerome H. Friedman. The Elements of Statistical Learning. - Springer, 2001.
32) Pedro Domingos, The Master Algorithm, Basic Books. 2015.
33) Ian H. Witten, Eibe Frank. Data Mining: Practical machine learning tools and techniques. - Morgan Kaufmann, 2011. - 664 p.
34) Ethem Alpaydin. Introduction to Machine Learning. - MIT Press, 2004.
35) David J. C. MacKay. Information Theory, Inference, and Learning Algorithms Cambridge: Cambridge University Press, 2003.
36) Richard O. Duda, Peter E. Hart, David G. Stork. Pattern classification (2nd edition), Wiley, New York, 2001.
37) Christopher Bishop. Neural Networks for Pattern Recognition, Oxford University Press. 1995.
38) Stuart Russell & Peter Norvig. Artificial Intelligence - A Modern Approach. Pearson, 2009.
39) Ray Solomonoff, An Inductive Inference Machine, IRE Convention Record, Section on Information Theory, Part 2, 1957, pp., 56-62.
40) Голубев А. А. Финансы и кредит: Учеб. Пособие / А. А. Голубев, Н. П. Гаврилов, - СПб.: СПб ГУИТМО, 2006. - 95 с.
41) Ермаков С. Л. Работа коммерческого банка по кредитованию заёмщиков: Методические рекомендации / С. Л. Ермаков, - М.: Алес, 2005. - 145 с.
42) Митрофанова К. Б. Понятие кредитного риска и факторы, на него влияющие / К. Б. Митрофанова // Молодой ученый. - 2015. - № 2. - С. 284¬288.
43) Тен В. В. Проблемы анализа кредитоспособности заемщика / В. В. Тен //Банковское дело. - 2006. - № 3.
44) Черкашенко В. Н. Этот «загадочный» скоринг / В. Н. Черкашенко // Банковское дело- 2006. - № 3.
45) Кредитный скоринг, оценка заемщика, балы, рейтинги [Электронный ресурс] // - справ.-информ. портал. - Электрон. дан. - М., 2016. - URL: http://allcred.ru/articles/kreditnyj_skoring.html(Дата обращения: 18.05.2020)
46) Кредитный скоринг: реальные возможности [Электронный ресурс] / А.
Коптелов // - Статья: справ.-информ. портал. - Электрон. дан. - М., 2015. - URL: http://www.cnews.ru/articles/kreditnyy_skoring_realnye_vozmozhnosti
(Дата обращения: 18.05.2020)
47) Национальные особенности кредитного скоринга [Электронный ресурс] / В. А. Клапчук // Журнал - Электрон. дан. - М., 2014. - URL: http://www.factoringpro.ru/index.php/credit-scoringstatya/407-skoring-vibor(Дата обращения: 18.05.2020)
48) Скоринг как метод оценки кредитного риска [Электронный ресурс] // Статья - Электрон. дан. - М., 2002. - URL: http://www.cfin.ru/finanalysis/banks/ scoring.shtml (Дата обращения: 18.05.2020)
49) Управление кредитными рисками [Электронный ресурс] // Статья -
Электрон. дан. - М., 2005. - URL:
http://www.cfin.ru/finanalysis/banks/kreditrisks_mana gement.shtml (Дата обращения: 18.05.2020)
50) What is a Good Credit Score Rating? [Электронный ресурс] // - Электрон. дан. - М., 2016. - URL: http://www.moolanomy.com/1805/what-is-agood-credit- score/(Дата обращения: 18.05.2020)
51) Statistical and machine learning models in credit scoring: A systematic literature survey [Электронный ресурс] // - Электрон. дан. - М., 2020. - URL: https://www.sciencedirect.com/science/article/abs/pii/S1568494620302039(Дата обращения: 18.05.2020)
52) Методика оценки кредитоспособности заемщика, используемая Банками Франции Модель Г. Чонаевой [Электронный ресурс]. - Режим доступа: https://studfile.net/preview/1496252/page:2/
53) Банкротство предприятий [Электронный ресурс]. - Режим доступа: https://cyberleninka.rU/article/n/bankrotstvo-predpriyatiy-1
54) Кдин В.В. Использование методик многомерного рейтингового анализа в диагностике риска банкротства сельскохозяйственных организаций ошмянского района гродненской области. [Электронный ресурс]. - Режим доступа: https://elibrary.ru/item.asp?id=37136949
55) Модель прогнозирования финансового состояния предприятий агропромышленного комплекса. [Электронный ресурс]. - Режим доступа: http://masters.donntu.org/2013/fknt/vovk/library/art5.htm
56) И. Дежина, Б. Салтыков. Механизмы стимулирования коммерциализации исследований и разработок//Общество и экономика, № 7¬8, 2004.
57) Министерство образования и науки Российской Федерации. Основные методологические подходы по разработке дорожных карт по приоритетным направлениям научно-технологического и инновационного развития 2011, г. Москва, 86 с.
58) Дорожная карта: как реализовать стратегию интернет-маркетинга [Электронный ресурс]. - Режим доступа: https://www.uplab.ru/blog/ dorozhnaya-karta/
59) Симаранов С., Шох Х. Как создать совместную лабораторию по научно-техническому сотрудничеству: методические рекомендации - Проект EuropeAid «Наука и коммерциализация технологий», 2006.
60) Цуканова О.А., Шашкова Е.В. Разработка комплекса мер для повышения результативности инновационной системы спектральной оптической когерентной микроскопии // Фундаментальные исследования. - 2014. - Вып. 6. - Ч. 2. - С. 340-344.
61) Яновский А. Как финансировать проекты по коммерциализации технологий. - Проект EuropeAid «Наука и коммерциализация технологий», 2006.
62) Ляшин А. Стратегии коммерциализации инноваций - мост между инноватором и бизнесом // Экономика и жизнь. - 2011. - № 36(9402). - URL: http://www.eg-online.ru/(дата обращения: 27.01.2012).
63) Фёдорова Е.А., Фёдор Ю.Ф., Хрустова Л.Е. Прогнозирование банкротства предприятий на примере отраслей строительства, промышленности, транспорта, сельского хозяйства и торговли
64) Министерство образования и науки Российской Федерации. Основные методологические подходы по разработке дорожных карт по приоритетным направлениям научно-технологического и инновационного развития 2011, г. Москва, 86 с.
65) Дорожная карта: как реализовать стратегию интернет-маркетинга [Электронный ресурс]. - Режим доступа: https://www.uplab.ru/blog/ dorozhnaya-karta/
66) 4 Главных показателя для оценки вашего рынка [Электронный ресурс].
- Режим доступа: https://rb.ru/opinion/market-capacity/
67) Шамаева Д. Р. Деревья решения для задач построения рейтинга коммерческих банков [Текст] // Технические науки: проблемы и перспективы: материалы V Междунар. науч. конф. (г. Санкт-Петербург, июль 2017 г.). - СПб.: Свое издательство, 2017.
68) https://habr.com/ru/post/414613/
69) https://ru.wikipedia.org/wiki/Двоичная_классификация
70) https://vas3k.ru/blog/machine_learning/
71) https://cyberleninka.ru/article/n/evolyutsionnyy-algoritm-postroeniya- dereva-resheniy/
72) https://habr.com/ru/post/320726/
73) https://lambda-it.ru/post/busting-s-pomoshchiu-adaboost-i-gradient-boosting
74) https://docs.microsoft.com/ru-ru/azure/machine-learning/how-to-tune- hyperparameters
75) http://elibrary.ru/item.asp?id=35339610
76) https://scienceproblems.ru/images/PDF/Academy-2-2.pdf
77) http://elibrary.ru/item.asp?id=24413691
78) https://documents.tips/documents/credit-risk-prob-of-default.html
79) Зарубежный опыт коммерциализации инновационных технологий. [электронный ресурс].- Режим доступа: http://elibrary.ru/item.asp?id=29441985
80) Коммерциализация инноваций в регионах. [электронный ресурс].- Режим доступа: http://elibrary.ru/item.asp?id=24124516
81) Инвестиционная деятельность и инновации в Российской Федерации: публично-правовой аспект. [электронный ресурс].- Режим доступа: https://www.book.ru/book/920771


Работу высылаем на протяжении 30 минут после оплаты.




©2026 Cервис помощи студентам в выполнении работ