Аннотация
Введение 5
1 Обзор цифрового следа 6
1.1. Определение цифрового следа 6
1.2. Цели сбора цифрового следа 7
1.3. Методы сбора цифрового следа клиентов банка 9
2 Практическое применение методов анализа 12
2.1. Обзор используемых методов анализа цифрового следа
клиентов банка 12
2.2. Разработка собственного метода анализа данных 19
3 Результаты исследования 23
3.1. Исходные данные 23
3.2. Создание анализа 24
3.3. Визуальное представление 35
3.4. Тестирование 40
Заключение 42
Список используемой литературы 43
Современный банковский сектор активно использует цифровые технологии для улучшения своей эффективности и предоставления качественных финансовых услуг. Вместе с этим, увеличивается объем цифровых данных, которые генерируются клиентами банков в процессе взаимодействия с различными банковскими продуктами и услугами. Эти данные, известные как цифровой след клиентов, представляют собой ценный источник информации о поведении, предпочтениях и потребностях клиентов.
Анализ цифрового следа клиентов банка является одним из актуальных направлений исследований в банковской сфере. Он позволяет банкам получить глубокое понимание своих клиентов, предсказать их поведение, определить кредитоспособность и принимать обоснованные решения о выдаче кредитов. Это открывает новые возможности для банков в области улучшения качества обслуживания клиентов, снижения рисков и повышения прибыльности.
Целью данной дипломной работы является исследование и анализ цифрового следа клиентов банка с использованием современных методов анализа данных и машинного обучения. В рамках работы будет проведен обзор методов сбора цифрового следа, а также рассмотрены примеры готовых решений для анализа и использования цифрового следа в банковской сфере.
Данная работа имеет практическую значимость для банков, поскольку представляет собой практическое исследование и разработку методов анализа цифрового следа, которые могут быть применены для принятия обоснованных решений о выдаче кредитов и улучшения финансовой деятельности банка. Данная выпускная квалификационная работа также поможет решить проблему загруженности банков в секторе решения выдачи кредитов, что даст больше времени на решения других важных задач для банка и уменьшит влияние человеческого фактора на решение кредитования.
В рамках данной работы был выполнен исследовательский анализ данных и разработана скоринговая модель для оценки кредитоспособности клиентов банка. Были проведены следующие этапы:
- Сбор и предобработка данных. Были получены исходные данные, которые включали информацию о клиентах банка, и проведена их предобработка. Были выполнены операции по очистке данных от пропущенных значений, кодированию категориальных признаков и масштабированию числовых признаков.
- Исследовательский анализ данных. Был проведён анализ данных, включающий исследование распределений признаков, анализ корреляций между признаками и выявление основных факторов, влияющих на кредитоспособность клиентов.
- Разработка скоринговой модели. Были выбраны и обучены различные алгоритмы включая Decision Tree Classifier и Support Vector Classifier (SVC). Была выбрана наилучшая модель на основе метрик оценки производительности.
Исходя из результатов работы, можно сделать вывод, что разработанная скоринговая модель демонстрирует хорошую
производительность с высокой точностью. Она может быть эффективно применена банком для автоматизации процесса принятия решений о выдаче кредита. Однако, необходимо отметить, что модель может потребовать дальнейшей настройки и оптимизации с учётом изменений в данных и новых требований банка.
В целом, данная работа демонстрирует применимость различных методов анализа данных цифрового следа и алгоритмов для решения задачи оценки кредитования.