🔍 Поиск работ

Разработка программной системы для классификации заемщиков кредитным агрегатором

Работа №206345

Тип работы

Магистерская диссертация

Предмет

информатика

Объем работы44
Год сдачи2020
Стоимость4890 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
17
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 6
1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 8
1.1. Кредитный скоринг 8
1.2. Способы оценивания кредитоспособности 9
1.3. Типология задач классификации 11
1.4. Обзор существующих методов классификации 12
1.4.1. Нейронные сети 12
1.4.2. Логистическая регрессия 13
1.4.3. Метод опорных векторов 14
1.4.4. Градиентный бустинг 15
1.4.5. Деревья решений 16
1.5. Метрики качества модели 17
1.6. Анализ существующих решений 20
1.6.1. ZestFinance 20
1.6.2. Lenddo 21
1.6.3. Mail.ru 21
2. МЕТОДОЛОГИЯ ИССЛЕДОВАНИЯ 22
2.1. Сбор данных 22
2.2. Очистка данных 22
2.3. Сравнение методов 23
3. ПРОЕКТИРОВАНИЕ И РЕАЛИЗАЦИЯ СИСТЕМЫ 26
3.1. Архитектура системы 26
3.2. Анализ предиктивной способности признаков 28
3.3. Выбор модели 30
3.4. Подбор гиперпараметров 31
3.5. Подбор пороговых значений 32
4. ПРОВЕДЕНИЕ ЭКСПЕРИМЕНТОВ 35
4.1. Регистрирование модели 35
4.2. Тестирование 38
ЗАКЛЮЧЕНИЕ 41
ЛИТЕРАТУРА 42


Кредитный скоринг - это статистический анализ, осуществляемый кредиторами и финансовыми учреждениями для определения кредитоспособности человека. Чаще всего используется в потребительском кредитовании на небольшие суммы. Также возможно его использование в бизнесе сотовых операторов, страховых компаний и т.д. Сам скоринг осуществляется с помощью «скоринговой модели» - специальные веса, которые «взвешивают» математически выраженные характеристики заемщика, влияющие на его способность получить кредит.
Существует несколько видов скоринга [1], но в данном случае нас будет интересовать только один - application scoring - оценка кредитоспособности заемщиков при выдачи кредита. Основывается на обработке первичных данных заемщика .
Существуют несколько готовых решений программного обеспечения, но они подходят исключительно для банков. При этом стоит понимать, что не все клиенты кредитного агрегатора имеют возможности и/или средства для такого программного обеспечения. Поэтому при помощи собственного кредитного скоринга мы можем решить следующие задачи.
• Повысить качество клиентов для банков, отсекая явных дефолтников.
• Применять страховки для рискованных клиентов.
• Уменьшать размер выдаваемого кредита ненадежным клиентам.
Отсюда следует, что автоматизация классификации заемщиков для кредитного агрегатора является актуальной задачей.
Для достижения цели работы необходимо было решить следующие задачи.
• Произвести анализ предметной области, изучить существующие подходы кредитного скоринга.
• Произвести анализ требований к реализуемой системе .
• Спроектировать систему классификации в соответствии с требованиями.
• Реализовать спроектированную систему.
• Выполнить тестирование реализованной системы.
Структура и объем работы
Работа состоит из введения, четырех глав, заключения и списка используемой литературы. Объем работы составляет 44 страницы, объем библиографии 20 наименований.
Содержание работы
Первая глава, «Анализ предметной области» содержит описание кредитного скоринга, а также существующих методов классификации.
Вторая глава, «Методология исследования», описывает подход к работе над данными.
Третья глава, «Проектирование и реализация системы», описывает проект новой системы и ее реализацию.
Четвертая глава, «Тестирование», содержит описание и результаты написанных и проведенных тестов новой системы.
Заключение резюмирует результаты, полученные в рамках проведенной работы.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе проделанной работы были решены следующие задачи.
1) Проведен анализ предметной области и обзор существующих решений.
2) Выбрано несколько подходов к решению проблемы.
3) Проведен сбор и очистка данных.
4) Проведены эксперименты по обучению различных моделей машинного обучения.
5) Реализована система классификации заемщиков кредитным агрегатором.
Целью данной работы было создание системы, позволяющей классифицировать заемщиков банков на основе методов машинного обучения. Для достижения этой цели был проведен анализ исходного процесса, собраны и очищены данные, выбран алгоритм обучения, обучены модели и развернуты как веб-сервисы.
По итогу выполнения работ была реализована система, позволяющая классифицировать заемщиков банков на основе методов машинного обучения. Проведенные эксперименты показали, что набор моделей градиентного бустинга дает наилучшую точность классификации, поэтому его применение более эффективно .



1. Скоринг (scoring). [Электронный ресурс] URL: https://www.banki.ru/wikibank/skoring/(дата обращения: 26.04.2020).
2. Скоринг. [Электронный ресурс] URL: https://www.calltouch.ru/glossary/skoring(дата обращения: 26.04.2020).
3. Машинное обучение в микрофинансах: строим скоринговую модель для клиентов с пустой кредитной историей. [Электронный ресурс] URL: https://habr.com/ru/post/454574/(дата обращения: 26.04.2020).
4. Скоринг как метод оценки кредитного риска. [Электронный ресурс] URL: https://www.cfin.ru/finanalysis/banks/scoring.shtml(дата обращения: 26.04.2020).
5. Analysis from 50+ papers on the Application of ML in Credit Lending. [Электронный ресурс] URL: https://towardsdatascience.com/my-analysis- from-50-papers-on-the-application-of-ml-in-credit-lending-b9b810a3f38(дата обращения: 26.04.2020).
6. Метод опорных векторов (SVM) [Электронный ресурс] URL: https://neerc.ifmo.ru/wiki/index.php?title=%D0%9C%D0%B5%D1%82%D0% BE%D0%B4_%D0%BE%D0%BF%D0%BE%D1%80%D0%BD%D1%8B%D 1%85_%D0%B2%D0%B5%D0%BA%D1%82%D0%BE%D1%80%D0%BE% D0%B2_(SVM) (дата обращения: 26.04.2020).
7. Credit Scoring using Least Squares Support Vector Machine based on data of Thai Financial Institutions. [Электронный ресурс] URL: https://ieeexplore.ieee.org/document/4195581(дата обращения: 26.04.2020).
8. Credit Scoring: A Review on Support Vector Machines and Metaheuristic Approaches. [Электронный ресурс] URL: https://www.hindawi.com/journals/aor/2019/1974794/(дата обращения: 26.04.2020).
9. A comparison of Gradient Boosting with Logistic Regression in Practical Cases. [Электронный ресурс] URL:
https://www. sas. com/content/ dam/ SAS/support/en/ sas-global-forum- proceedings/2018/1857-2018.pdf/ (дата обращения: 26.04.2020).
10. Classification: ROC Curve and AUC. [Электронный ресурс] URL: https://developers. google. com/machine-learning/crash- course/classification/roc-and-auc.
11. Azure Microsoft. [Электронный ресурс] URL: https://azure.microsoft.com/ru-ru/(дата обращения: 26.04.2020).
12. Azure Machine Learning. [Электронный ресурс] URL: https://azure.microsoft.com/ru-ru/services/machine-learning/(дата обращения: 26.04.2020).
13. Математические методы обучения по прецедентам. [Электронный ресурс] URL: http://www.machinelearning.ru/wiki/images/6/6d/Voron-ML-1(дата обращения: 26.04.2020).
14. SHAP. [Электронный ресурс] URL: https://github.com/slundberg/shap(дата обращения: 26.04.2020).
15. AUC ROC. [Электронный ресурс] URL: https://dyakonov.org/2017/07/28/auc-roc- %D0%BF%D0%BB%D0%BE%D1%89%D0%B0%D0%B4%D1%8C- %D0%BF%D0%BE%D0%B4- %D0%BA%D1%80%D0%B8%D0%B2%D0%BE%D0%B9- %D0%BE%D1%88%D0%B8%D0%B1%D0%BE%D0%BA/(дата обращения: 26.04.2020).
16. SHAP. [Электронный ресурс] URL: https://github.com/slundberg/shap(дата обращения: 26.04.2020).
17. Случайный лес (Random Forest). [Электронный ресурс] URL: https://dyakonov.org/2016/11/14/%D1%81%D0%BB%D1%83%D1%87%D0% B0%D0%B9%D0%BD%D1%8B%D0%B9-%D0%BB%D0%B5%D1%81- random-forest/ (дата обращения: 26.04.2020).
18. Cross-validation: evaluating estimator performance. [Электронный ресурс] URL: https://scikit-learn.org/stable/modules/cross_validation.html.
19. Docker. [Электронный ресурс] URL: https://www.docker.com/.
20. Unit-testing. [Электронный ресурс] URL:
https://habr.com/ru/post/169.


Работу высылаем на протяжении 30 минут после оплаты.




©2026 Cервис помощи студентам в выполнении работ