Разработка математических моделей для оценки вероятности ключевого действия клиентами банка
|
ВВЕДЕНИЕ 7
ГЛАВА 1 МАРКЕТИНГ ОТНОШЕНИЙ: ПРОЦЕСС ОБЕСПЕЧЕНИЯ И
УЛУЧШЕНИЕ КАЧЕСТВА ОБСЛУЖИВАНИЯ КЛИЕНТОВ БАНКА 10
1.1 Сущность процесса маркетинг отношений 10
1.2 Сущность персонализации, и её место в маркетинге отношений 15
1.3 Анализ работ, посвященных прогнозированию оттока клиентов банка 19
1.4 Постановка задачи 27
Выводы по главе 29
ГЛАВА 2 МЕТОДЫ ГРАДИЕНТНОГО БУСТИНГА, КАК ИНСТРУМЕНТ ПРОГНОЗИРОВАНИЯ СОВЕРШЕНИЯ КЛЮЧЕВОГО ДЕЙСТВИЯ КЛИЕНТОМ БАНКА 30
2.1 Понятие градиентного бустинга 30
2.1.1 XGBoost 31
2.1.2 LightGBM 35
2.1.3 CATBoost 37
Выводы по главе 39
ГЛАВА 3 ПРОГНОЗИРОВАНИЕ СОВЕРШЕНИЯ КЛЮЧЕВОГО ДЕЙСТВИЯ
КЛИЕНТОМ БАНКА 40
3.1 Метрика качества модели 40
3.2 Разведочный анализ данных 40
3.3 Преобразование признаков 48
3.4 Кросс-валидация 49
3.4.1 Кросс-валидация по K блокам (K-fold cross-validation) 49
3.5 Построение базовых моделей 50
3.5.1 Модель XGBoost 50
3.5.2 Модель LightGBM 58
3.5.3 Модель CATBoost 66
3.6 Улучшение модели. Построение усредненной модели 72
3.7 Сравнение моделей и обсуждение результатов 74
Выводы по главе 75
ГЛАВА 4 ПРОЕКТ КОММЕРЦИАЛИЗАЦИИ 76
4.1 Дорожная карта коммерциализации 76
4.2 Бизнес-Модель 78
4.3 Команда проекта 79
4.4 Ценообразование 79
Выводы по главе 83
ЗАКЛЮЧЕНИЕ 84
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 85
ГЛАВА 1 МАРКЕТИНГ ОТНОШЕНИЙ: ПРОЦЕСС ОБЕСПЕЧЕНИЯ И
УЛУЧШЕНИЕ КАЧЕСТВА ОБСЛУЖИВАНИЯ КЛИЕНТОВ БАНКА 10
1.1 Сущность процесса маркетинг отношений 10
1.2 Сущность персонализации, и её место в маркетинге отношений 15
1.3 Анализ работ, посвященных прогнозированию оттока клиентов банка 19
1.4 Постановка задачи 27
Выводы по главе 29
ГЛАВА 2 МЕТОДЫ ГРАДИЕНТНОГО БУСТИНГА, КАК ИНСТРУМЕНТ ПРОГНОЗИРОВАНИЯ СОВЕРШЕНИЯ КЛЮЧЕВОГО ДЕЙСТВИЯ КЛИЕНТОМ БАНКА 30
2.1 Понятие градиентного бустинга 30
2.1.1 XGBoost 31
2.1.2 LightGBM 35
2.1.3 CATBoost 37
Выводы по главе 39
ГЛАВА 3 ПРОГНОЗИРОВАНИЕ СОВЕРШЕНИЯ КЛЮЧЕВОГО ДЕЙСТВИЯ
КЛИЕНТОМ БАНКА 40
3.1 Метрика качества модели 40
3.2 Разведочный анализ данных 40
3.3 Преобразование признаков 48
3.4 Кросс-валидация 49
3.4.1 Кросс-валидация по K блокам (K-fold cross-validation) 49
3.5 Построение базовых моделей 50
3.5.1 Модель XGBoost 50
3.5.2 Модель LightGBM 58
3.5.3 Модель CATBoost 66
3.6 Улучшение модели. Построение усредненной модели 72
3.7 Сравнение моделей и обсуждение результатов 74
Выводы по главе 75
ГЛАВА 4 ПРОЕКТ КОММЕРЦИАЛИЗАЦИИ 76
4.1 Дорожная карта коммерциализации 76
4.2 Бизнес-Модель 78
4.3 Команда проекта 79
4.4 Ценообразование 79
Выводы по главе 83
ЗАКЛЮЧЕНИЕ 84
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 85
Актуальность темы.
В настоящее время отток клиентов является одной из основных проблем для финансовых организаций. Непрерывная конкуренция на рынке и высокая стоимость привлечения новых клиентов заставили организации сосредоточиться на более эффективных стратегиях удержания клиентов. Хотя банковский и финансовый секторы показывают низкие показатели оттока клиентов по сравнению с другими, потеря клиентов гораздо сильнее влияет на прибыль нежели в иных секторах экономики. Исходя из этого, управление оттоком клиентов играет жизненно важную роль для повышения долгосрочной прибыльности организации.
По теме оттока было проведено много исследований для понимания поведения клиентов при уходе из организации и определения причин данного ухода. Анализируя работы, связанные с клиентооттоком, нельзя не отметить, что произошло значительное развитие методов для эффективного моделирования оттока клиентов в банковском и финансовом секторах.
После анализа текущей конъюнктуры в сфере анализа оттока клиентов, становится понятно, что в данной сфере существуют некоторые проблемы.
В частности, одной из основных остается недостаток точности прогнозирования; в результате чего, банку или кредитной организации порой бывает сложно предоставить конкретный вид услуг клиенту до того, как он уйдет к конкурентам.
Также недостатком является тот факт, что данная проблема слабо разработана в трудах российских ученых.
С проблемой оттока клиентов банка столкнулась компания Santander Group.
Банк Сантандер, Santander Group — крупнейшая финансово-кредитная группа в Испании. Помимо Испании Santander занимает одно из ведущих мест в Великобритании и в ряде стран Латинской Америки, также представлена в США.
Исходя из вышесказанного появляется необходимость поиска путей, направленных на решения проблемы связанной с прогнозированием совершения ключевого действия клиента.
Теоретической и методологической основой магистерской диссертации являются труды зарубежных и отечественных ученых в области машинного обучения. Так, например, в российской литературе известны такие авторы как:
Боднар А.Ю[1], Владыка М.В.[2], Пальмов С.В.[6], Романов В.В.[9], Сергеенкова А.А.[11], Хаустова М.Н.[13], Прохоренкова Л.А[46].
В зарубежной литературе известны следующие авторы:
Лабрам А.[15], Чан Ц.[17], Бакинкс В[18], Эстэр М.[22], Фаркуад М.[24], Феррера Дж.[25], Сегал Дж.[26], Гарланд Р.[27], Го-эн З.[29], Гулин К[30], Халкиди М.[31], Хуанг Б.[32], Хванг Х.[34], Жанг Дж.[36], Лей Дж.[37], Кевени С.[39], Керамати А.[40], Джафари-Маранди Р.[41], Аббаси Ю.[41], Брейман Л.[42], Лин С.[45], Мэйсон Л.[48,49], Бакстер Дж.[48,49], Литл М.[50], Сохраб Махмуд М.[51], Хуанг М.[52], Мозер М.[53], Ние Дж.[54], Сарадхи В.[57], Шарма А[58], Ши Н.[59], Мутанен Т.[61], Чен Т.[62], Ху Т.[63], Дуан Т[64], Юи З.[67], Жанг Т.[68].
Рассмотрев различные точки зрения в отечественной и зарубежной литературе, можно прийти к выводу, что существуют различные методы прогнозирования, каждый из которых имеет свои преимущества и недостатки.
Объект исследования процесс обеспечения и улучшение качества обслуживания клиентов.
Предмет исследования методы прогнозирования совершения ключевого действия клиентов банка.
Цель исследования - повышение эффективности процесса прогнозирования потенциальной ценности услуги для клиентов.
На основе результатов прогнозирования, банк в дальнейшем может сделать вывод о том какая услуга будет важна для клиента и своевременно её предоставить, тем самым предотвратив его уход из банка.
Для достижения цели были поставлены следующие задачи:
1) описание понятий оттока клиентов, персонализации.
2) провести исследование и анализ современных подходов к прогнозированию оттока клиентов.
3) анализ имеющихся прогнозных методов машинного обучения.
4) формулировка требований к прогнозной модели.
5) построение прогнозной модели.
6) сравнительный анализ результатов прогнозирования методами машинного обучения.
7) разработка плана коммерциализации.
Новизна работы заключается в том, что на основе комплексного анализа:
1) рассмотрены и проанализированы методы прогнозирования.
2) проведен сравнительный анализ методов.
3) разработаны модели прогнозирования потенциальной стоимости услуги для клиентов, результаты которых можно использовать для оценки вероятности совершения ключевого действия клиентами банка.
Практическая значимость работы обусловлена применением результатов исследования на практике, для анализа оттока клиентов в банке.
В настоящее время отток клиентов является одной из основных проблем для финансовых организаций. Непрерывная конкуренция на рынке и высокая стоимость привлечения новых клиентов заставили организации сосредоточиться на более эффективных стратегиях удержания клиентов. Хотя банковский и финансовый секторы показывают низкие показатели оттока клиентов по сравнению с другими, потеря клиентов гораздо сильнее влияет на прибыль нежели в иных секторах экономики. Исходя из этого, управление оттоком клиентов играет жизненно важную роль для повышения долгосрочной прибыльности организации.
По теме оттока было проведено много исследований для понимания поведения клиентов при уходе из организации и определения причин данного ухода. Анализируя работы, связанные с клиентооттоком, нельзя не отметить, что произошло значительное развитие методов для эффективного моделирования оттока клиентов в банковском и финансовом секторах.
После анализа текущей конъюнктуры в сфере анализа оттока клиентов, становится понятно, что в данной сфере существуют некоторые проблемы.
В частности, одной из основных остается недостаток точности прогнозирования; в результате чего, банку или кредитной организации порой бывает сложно предоставить конкретный вид услуг клиенту до того, как он уйдет к конкурентам.
Также недостатком является тот факт, что данная проблема слабо разработана в трудах российских ученых.
С проблемой оттока клиентов банка столкнулась компания Santander Group.
Банк Сантандер, Santander Group — крупнейшая финансово-кредитная группа в Испании. Помимо Испании Santander занимает одно из ведущих мест в Великобритании и в ряде стран Латинской Америки, также представлена в США.
Исходя из вышесказанного появляется необходимость поиска путей, направленных на решения проблемы связанной с прогнозированием совершения ключевого действия клиента.
Теоретической и методологической основой магистерской диссертации являются труды зарубежных и отечественных ученых в области машинного обучения. Так, например, в российской литературе известны такие авторы как:
Боднар А.Ю[1], Владыка М.В.[2], Пальмов С.В.[6], Романов В.В.[9], Сергеенкова А.А.[11], Хаустова М.Н.[13], Прохоренкова Л.А[46].
В зарубежной литературе известны следующие авторы:
Лабрам А.[15], Чан Ц.[17], Бакинкс В[18], Эстэр М.[22], Фаркуад М.[24], Феррера Дж.[25], Сегал Дж.[26], Гарланд Р.[27], Го-эн З.[29], Гулин К[30], Халкиди М.[31], Хуанг Б.[32], Хванг Х.[34], Жанг Дж.[36], Лей Дж.[37], Кевени С.[39], Керамати А.[40], Джафари-Маранди Р.[41], Аббаси Ю.[41], Брейман Л.[42], Лин С.[45], Мэйсон Л.[48,49], Бакстер Дж.[48,49], Литл М.[50], Сохраб Махмуд М.[51], Хуанг М.[52], Мозер М.[53], Ние Дж.[54], Сарадхи В.[57], Шарма А[58], Ши Н.[59], Мутанен Т.[61], Чен Т.[62], Ху Т.[63], Дуан Т[64], Юи З.[67], Жанг Т.[68].
Рассмотрев различные точки зрения в отечественной и зарубежной литературе, можно прийти к выводу, что существуют различные методы прогнозирования, каждый из которых имеет свои преимущества и недостатки.
Объект исследования процесс обеспечения и улучшение качества обслуживания клиентов.
Предмет исследования методы прогнозирования совершения ключевого действия клиентов банка.
Цель исследования - повышение эффективности процесса прогнозирования потенциальной ценности услуги для клиентов.
На основе результатов прогнозирования, банк в дальнейшем может сделать вывод о том какая услуга будет важна для клиента и своевременно её предоставить, тем самым предотвратив его уход из банка.
Для достижения цели были поставлены следующие задачи:
1) описание понятий оттока клиентов, персонализации.
2) провести исследование и анализ современных подходов к прогнозированию оттока клиентов.
3) анализ имеющихся прогнозных методов машинного обучения.
4) формулировка требований к прогнозной модели.
5) построение прогнозной модели.
6) сравнительный анализ результатов прогнозирования методами машинного обучения.
7) разработка плана коммерциализации.
Новизна работы заключается в том, что на основе комплексного анализа:
1) рассмотрены и проанализированы методы прогнозирования.
2) проведен сравнительный анализ методов.
3) разработаны модели прогнозирования потенциальной стоимости услуги для клиентов, результаты которых можно использовать для оценки вероятности совершения ключевого действия клиентами банка.
Практическая значимость работы обусловлена применением результатов исследования на практике, для анализа оттока клиентов в банке.
В ходе написания магистерской диссертационной работы, был рассмотрен процесс клиентооттока, рассмотрены факторы, влияющие на него, выявлена проблема, а также рассмотрена роль прогнозирования совершения ключевого действия ключевого действия клиента. Для оценки совершения ключевого действия клиентов, были использованы математические модели прогнозирования потенциальной ценности услуги для клиентов. В качестве инструментов прогнозирования рассматривались методы машинного обучения, а конкретно три вариации градиентного бустинга. Сравнительный анализ методов позволил выбрать необходимые инструменты для анализа, а именно вариации XGBoost, LightGBM и CATBoost.
В ходе работы были построены три модели на базе выше приведенных методов. В процессе работы, были построены три базовые модели, реализованные с помощью метода градиентного бустинга были выбраны три библиотеки, это:
- XGBoost, которая показала результат равный 1.3946;
- LightGBM, которая показала результат равный 1.4059;
- CatBoost, которая показала результат равный 1.4060.
Далее были построены две усредненные модели : XGBoost+LightGBM+CATBoost и XGBoost+LightGBM Данные модели разрабатывались с помощью библиотек Sklearn, xgboost, lightgbm и catboost и дали среднеквадратическую логарифмическую ошибку равную 1.37475 и 1.37876 соответственно.
В заключение работы был рассмотрен проект коммерциализации. Была построена дорожная карта проекта, включающая в себя этапы необходимые для вывода проекта на рынок. Были произведены плановые расчеты затрат на реализацию проекта, а также рассчитана цена на единицу продукции.
Таким образом была достигнута цель исследования и были выполнены поставленные задачи в начале исследования.
В ходе работы были построены три модели на базе выше приведенных методов. В процессе работы, были построены три базовые модели, реализованные с помощью метода градиентного бустинга были выбраны три библиотеки, это:
- XGBoost, которая показала результат равный 1.3946;
- LightGBM, которая показала результат равный 1.4059;
- CatBoost, которая показала результат равный 1.4060.
Далее были построены две усредненные модели : XGBoost+LightGBM+CATBoost и XGBoost+LightGBM Данные модели разрабатывались с помощью библиотек Sklearn, xgboost, lightgbm и catboost и дали среднеквадратическую логарифмическую ошибку равную 1.37475 и 1.37876 соответственно.
В заключение работы был рассмотрен проект коммерциализации. Была построена дорожная карта проекта, включающая в себя этапы необходимые для вывода проекта на рынок. Были произведены плановые расчеты затрат на реализацию проекта, а также рассчитана цена на единицу продукции.
Таким образом была достигнута цель исследования и были выполнены поставленные задачи в начале исследования.



