🔍 Поиск работ

Разработка математических моделей для оценки вероятности ключевого действия клиентами банка

Работа №207270

Тип работы

Дипломные работы, ВКР

Предмет

информационные системы

Объем работы90
Год сдачи2020
Стоимость4360 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
8
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 7
ГЛАВА 1 МАРКЕТИНГ ОТНОШЕНИЙ: ПРОЦЕСС ОБЕСПЕЧЕНИЯ И
УЛУЧШЕНИЕ КАЧЕСТВА ОБСЛУЖИВАНИЯ КЛИЕНТОВ БАНКА 10
1.1 Сущность процесса маркетинг отношений 10
1.2 Сущность персонализации, и её место в маркетинге отношений 15
1.3 Анализ работ, посвященных прогнозированию оттока клиентов банка 19
1.4 Постановка задачи 27
Выводы по главе 29
ГЛАВА 2 МЕТОДЫ ГРАДИЕНТНОГО БУСТИНГА, КАК ИНСТРУМЕНТ ПРОГНОЗИРОВАНИЯ СОВЕРШЕНИЯ КЛЮЧЕВОГО ДЕЙСТВИЯ КЛИЕНТОМ БАНКА 30
2.1 Понятие градиентного бустинга 30
2.1.1 XGBoost 31
2.1.2 LightGBM 35
2.1.3 CATBoost 37
Выводы по главе 39
ГЛАВА 3 ПРОГНОЗИРОВАНИЕ СОВЕРШЕНИЯ КЛЮЧЕВОГО ДЕЙСТВИЯ
КЛИЕНТОМ БАНКА 40
3.1 Метрика качества модели 40
3.2 Разведочный анализ данных 40
3.3 Преобразование признаков 48
3.4 Кросс-валидация 49
3.4.1 Кросс-валидация по K блокам (K-fold cross-validation) 49
3.5 Построение базовых моделей 50
3.5.1 Модель XGBoost 50
3.5.2 Модель LightGBM 58
3.5.3 Модель CATBoost 66
3.6 Улучшение модели. Построение усредненной модели 72
3.7 Сравнение моделей и обсуждение результатов 74
Выводы по главе 75
ГЛАВА 4 ПРОЕКТ КОММЕРЦИАЛИЗАЦИИ 76
4.1 Дорожная карта коммерциализации 76
4.2 Бизнес-Модель 78
4.3 Команда проекта 79
4.4 Ценообразование 79
Выводы по главе 83
ЗАКЛЮЧЕНИЕ 84
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 85


Актуальность темы.
В настоящее время отток клиентов является одной из основных проблем для финансовых организаций. Непрерывная конкуренция на рынке и высокая стоимость привлечения новых клиентов заставили организации сосредоточиться на более эффективных стратегиях удержания клиентов. Хотя банковский и финансовый секторы показывают низкие показатели оттока клиентов по сравнению с другими, потеря клиентов гораздо сильнее влияет на прибыль нежели в иных секторах экономики. Исходя из этого, управление оттоком клиентов играет жизненно важную роль для повышения долгосрочной прибыльности организации.
По теме оттока было проведено много исследований для понимания поведения клиентов при уходе из организации и определения причин данного ухода. Анализируя работы, связанные с клиентооттоком, нельзя не отметить, что произошло значительное развитие методов для эффективного моделирования оттока клиентов в банковском и финансовом секторах.
После анализа текущей конъюнктуры в сфере анализа оттока клиентов, становится понятно, что в данной сфере существуют некоторые проблемы.
В частности, одной из основных остается недостаток точности прогнозирования; в результате чего, банку или кредитной организации порой бывает сложно предоставить конкретный вид услуг клиенту до того, как он уйдет к конкурентам.
Также недостатком является тот факт, что данная проблема слабо разработана в трудах российских ученых.
С проблемой оттока клиентов банка столкнулась компания Santander Group.
Банк Сантандер, Santander Group — крупнейшая финансово-кредитная группа в Испании. Помимо Испании Santander занимает одно из ведущих мест в Великобритании и в ряде стран Латинской Америки, также представлена в США.
Исходя из вышесказанного появляется необходимость поиска путей, направленных на решения проблемы связанной с прогнозированием совершения ключевого действия клиента.
Теоретической и методологической основой магистерской диссертации являются труды зарубежных и отечественных ученых в области машинного обучения. Так, например, в российской литературе известны такие авторы как:
Боднар А.Ю[1], Владыка М.В.[2], Пальмов С.В.[6], Романов В.В.[9], Сергеенкова А.А.[11], Хаустова М.Н.[13], Прохоренкова Л.А[46].
В зарубежной литературе известны следующие авторы:
Лабрам А.[15], Чан Ц.[17], Бакинкс В[18], Эстэр М.[22], Фаркуад М.[24], Феррера Дж.[25], Сегал Дж.[26], Гарланд Р.[27], Го-эн З.[29], Гулин К[30], Халкиди М.[31], Хуанг Б.[32], Хванг Х.[34], Жанг Дж.[36], Лей Дж.[37], Кевени С.[39], Керамати А.[40], Джафари-Маранди Р.[41], Аббаси Ю.[41], Брейман Л.[42], Лин С.[45], Мэйсон Л.[48,49], Бакстер Дж.[48,49], Литл М.[50], Сохраб Махмуд М.[51], Хуанг М.[52], Мозер М.[53], Ние Дж.[54], Сарадхи В.[57], Шарма А[58], Ши Н.[59], Мутанен Т.[61], Чен Т.[62], Ху Т.[63], Дуан Т[64], Юи З.[67], Жанг Т.[68].
Рассмотрев различные точки зрения в отечественной и зарубежной литературе, можно прийти к выводу, что существуют различные методы прогнозирования, каждый из которых имеет свои преимущества и недостатки.
Объект исследования процесс обеспечения и улучшение качества обслуживания клиентов.
Предмет исследования методы прогнозирования совершения ключевого действия клиентов банка.
Цель исследования - повышение эффективности процесса прогнозирования потенциальной ценности услуги для клиентов.
На основе результатов прогнозирования, банк в дальнейшем может сделать вывод о том какая услуга будет важна для клиента и своевременно её предоставить, тем самым предотвратив его уход из банка.
Для достижения цели были поставлены следующие задачи:
1) описание понятий оттока клиентов, персонализации.
2) провести исследование и анализ современных подходов к прогнозированию оттока клиентов.
3) анализ имеющихся прогнозных методов машинного обучения.
4) формулировка требований к прогнозной модели.
5) построение прогнозной модели.
6) сравнительный анализ результатов прогнозирования методами машинного обучения.
7) разработка плана коммерциализации.
Новизна работы заключается в том, что на основе комплексного анализа:
1) рассмотрены и проанализированы методы прогнозирования.
2) проведен сравнительный анализ методов.
3) разработаны модели прогнозирования потенциальной стоимости услуги для клиентов, результаты которых можно использовать для оценки вероятности совершения ключевого действия клиентами банка.
Практическая значимость работы обусловлена применением результатов исследования на практике, для анализа оттока клиентов в банке.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе написания магистерской диссертационной работы, был рассмотрен процесс клиентооттока, рассмотрены факторы, влияющие на него, выявлена проблема, а также рассмотрена роль прогнозирования совершения ключевого действия ключевого действия клиента. Для оценки совершения ключевого действия клиентов, были использованы математические модели прогнозирования потенциальной ценности услуги для клиентов. В качестве инструментов прогнозирования рассматривались методы машинного обучения, а конкретно три вариации градиентного бустинга. Сравнительный анализ методов позволил выбрать необходимые инструменты для анализа, а именно вариации XGBoost, LightGBM и CATBoost.
В ходе работы были построены три модели на базе выше приведенных методов. В процессе работы, были построены три базовые модели, реализованные с помощью метода градиентного бустинга были выбраны три библиотеки, это:
- XGBoost, которая показала результат равный 1.3946;
- LightGBM, которая показала результат равный 1.4059;
- CatBoost, которая показала результат равный 1.4060.
Далее были построены две усредненные модели : XGBoost+LightGBM+CATBoost и XGBoost+LightGBM Данные модели разрабатывались с помощью библиотек Sklearn, xgboost, lightgbm и catboost и дали среднеквадратическую логарифмическую ошибку равную 1.37475 и 1.37876 соответственно.
В заключение работы был рассмотрен проект коммерциализации. Была построена дорожная карта проекта, включающая в себя этапы необходимые для вывода проекта на рынок. Были произведены плановые расчеты затрат на реализацию проекта, а также рассчитана цена на единицу продукции.
Таким образом была достигнута цель исследования и были выполнены поставленные задачи в начале исследования.



1 Боднар А. Ю. Информационно-сервисные инструменты обслуживания клиентов как основа обеспечения конкурентоустойчивости банков: дис. ... канд. экон. наук: 08.00.05. - Ростов-на-Дону, 2012. - 166 с.
2 Владыка М.В., Гончаренко Т.В. Повышение финансовой грамотности населения региона как фактор лояльности клиентов банка./М.В. Владыка, Т.В. Гончаренко // Банковское дело. - 2012. №3(11). - С. 20-25.
3 Гаврилов, Л.П. Основы электронной коммерции и бизнеса : учебное пособие
/ Л.П. Гаврилов. — Москва : СОЛОН-Пресс, 2009. - 592 с. - Текст : электронный // Электронно-библиотечная система «Лань» : [сайт]. - URL:
https://e.lanbook.com/book/13783(дата обращения: 25.11.2019). - Режим доступа: для авториз. пользователей.
4 Коэльо, Л.П. Построение систем машинного обучения на языке Python / Л.П. Коэльо, В. Ричарт ; перевод с английского А.А. Слинкин. - 2-е изд. — Москва : ДМК Пресс, 2016. — 302 с. - Текст : электронный // Электронно-библиотечная система «Лань» : [сайт]. - URL: https://e4anbook.com/book/82818(дата обращения: 28.11.2019). - Режим доступа: для авториз. пользователей.
5 Мухаметзянова, Е. С. Повышение качества обслуживания физических лиц в коммерческих банках: на примере ОАО "Сбербанк России": дис. ... канд. экон. наук: 08.00.10. - М., 2014. - 201 с.
6 Пальмов С. В. Анализ и прогнозирование оттока клиентов в телекоммуникационных компаниях на основе технологии Data Mining : дис. ... канд. техн. наук: 05.13.13. - Самара, 2005. - 172 с.
7 Путилов, А.В. Коммерциализация технологий и промышленные инновации : учебное пособие / А.В. Путилов, Ю.В. Черняховская. -Санкт-Петербург : Лань,
2018. -324 с. - Текст : электронный // Электронно-библиотечная система «Лань» : [сайт]. — URL: https://e.lanbook.com/book/110937(дата обращения: 28.11.2019). — Режим доступа: для авториз. пользователей. 
8 Рашка, С. Python и машинное обучение: крайне необходимое пособие по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения : руководство / С. Рашка ; перевод с английского А.В. Логунова. - Москва : ДМК Пресс, 2017. - 418 с. - Текст : электронный // Электронно-библиотечная система «Лань» : [сайт]. — URL: https://e.lanbook.com/book/100905(дата обращения: 26.11.2019). — Режим доступа: для авториз. пользователей.
9 Романов В. В. Система взаимоотношений российского коммерческого банка с клиентами: дис. ... канд. экон. наук: 08.00.10. - СПб., 2004. - 156 с.
10 Салмин А.А. Формирование оценки лояльности клиентов телекоммуникационной компании на основе байесовского подхода: дис. ... канд. техн. наук: 05.13.13. - Самара, 2008. - 181 с.
11 Сергеенкова А. А. Современные технологии обеспечения конкурентоспособности многофилиального коммерческого банка на рынке финансовых услуг: дис. ... канд. экон. наук: 08.00.10. - Ростов-на-Дону, 2007. - 151 с.
12 Сковиков, А.Г. Цифровая экономика. Электронный бизнес и электронная коммерция : учебное пособие / А.Г. Сковиков. - Санкт-Петербург : Лань, 2019. - 260 с. - Текст : электронный // Электронно-библиотечная система «Лань» : [сайт].
— URL: https://e.lanbook.com/book/119637(дата обращения: 28.11.2019). — Режим доступа: для авториз. пользователей.
13 Хаустова М. Н. Индивидуальное банковское обслуживание состоятельных клиентов как сегмент международных финансов: дис. ... канд. экон. наук: 08.00.14.
- СПб., 2012. - 139 с.
14 Шарден, Б. Крупномасштабное машинное обучение вместе с Python :
учебное пособие / Б. Шарден, Л. Массарон, А. Боскетти ; перевод с английского А. В. Логунова. — Москва : ДМК Пресс, 2018. - 358 с. - Текст : электронный // Электронно-библиотечная система «Лань» : [сайт]. - URL:
https://e.lanbook.com/book/105836(дата обращения: 25.11.2019). — Режим доступа: для авториз. пользователей.
15 Alex Labram: Fitting data with XGBoost // Institute and Facility of Actuaries,
2019. - P. 33-42.
16 Anil Kumar D, Ravi V: Predicting credit card customer churn in banks using data mining // International Journal of Data Analytics Technical Strategy, 2008. - P. 19-25.
17 Au W., Chan C.C., Yao X.: A Novel evolutionary data mining algorithm with applications to churn prediction. IEEE Trans. on evolutionary comp. 7, 2003. - P. 30-43.
18 Buckinx W., Van den Poel D.: Customer base analysis: partial detection of behaviorally loyal clients in a non-contractual FMCG retail setting. European Journal of Operational Research 164, 2005. - P. 7-15.
19 CATBoost documentation - 2020. - 63 p. [Электронный ресурс] - Режим доступа:https://catboost.ai/docs/concepts/parameter-tuning.html(дата обращения 23.02.2020)
20 Durkin Mark G, Howcroft Barry: Relationship Marketing in banking Sector: Impact of New Technologies//Marketing Intelligence Planning Vol. 21 No.1, 2008. - P. 61-71.
21 Ennew, C. T., Binks, M. R., &Chiplin, B: Customer Satisfaction and Customer Retention: An Examination of Small Businesses and Their Banks in the UK. In Proceedings of the 1994 Academy of Marketing Science (AMS) //Annual Conference. Springer International Publishing, 2015. - P. 182-196.
22 Ester, M.: A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise / M. Ester, H.-P. Kriegel, J. Sander, X. Xu // In Proc. ACM SIGMOD Int. Conf. on Management of Data, Portland, OR, 1996. -P. 226-231.
23 F. Pedregosa: Scikit-learn: machine learning in Python/G. Varoquaux, A. Gramfort, V. Michel, B. Thirion, O. Grisel, M. Blondel, P. Prettenhofer, R. Weiss, V. Dubourg, J. Vanderplas, A. Passos, D. Cournapeau, M. Perrot, E. Duchesnay // Journal of Machine Learning Research. 12, 2011. - P 2825-2830.
24 Farquad MAH, Ravi V, Raju SB Churn prediction using comprehensible support vector machine:An analytical CRM application // Applied Soft Computing, 2014. - P. 27-32.
25 Ferreira J., Vellasco M., Pachecco M., Barbosa C.: Data mining techniques on the evaluation of wireless churn. ESANN2004 proceedings - European Symposium on Artificial Neural Networks Bruges, 2004. - P. 76-89.
26 G. Sehgal: Comparison of various clustering algorithms/G. Sehgal, K. Garg // International Journal of Computer Science and Information Technologies, Vol. 5 (3), 2014. - P. 3074-3076.
27 Garland R.: Investigating indicators of customer profitability in personal retail banking. Proc. of the Third Annual Hawaii Int. Conf. on Business, 2003. - P. 153-166.
28 Gregory, Bryan: Predicting Customer Churn: Extreme Gradient Boosting with Temporal Data // ResearchGate, Berlin, 2019. - P. 85-98.
29 Guo-en X, Wei-dong J: Model of customer churn prediction on support vector machine// Systems Engineering Theory Pract 28, 2008. - P. 55-70.
30 Guolin Ke , Qi Meng: LightGBM: A Highly Efficient Gradient Boosting Decision Tree // Pekin University, People Republic of China, 2017. - P. 121-139.
31 Halkidi M On clustering validation techniques/ Halkidi M, Batistakis Y, Vazirgiannis M // J. Intell. Inf. Syst. 2001. - P. 107-145.
32 Huang B, Kechadi MT, Buckley B: Customer churn prediction in telecommunications // Expert Systems with Applications, 2012. - P. 143-167.
33 HussainIftikhar, HussainMazhar, HussainShahid and Sajid M.A.: Customer Relationship Management: Strategies And Practices In Selected Banks Of Pakistan, International Review of Business Research Papers Vol. 5 No. 6, 2009. - P.117-132.
34 Hwang H., Jung T., Suh E.: An LTV model and customer segmentation based on customer value: a case study on the wireless telecommunication industry. Expert Systems with Applications 26, 2004. - P. 87-106.
35 J. McCaffrey Clustering Non-Numeric Data Using Python [Электронный документ]https://visualstudiomagazine.com/articles/2018/04/01/..Проверено (дата обращения 25.11.2019)
36 Jin Zhang: LightGBM: An Effective and Scalable Algorithm for Prediction of Chemical Toxicity-Application to the Tox21 and Mutagenicity Data Sets // Karolinska Institutet, Sweden, 2019. - P. 254-276.
37 Jing Lei: Cross-Validation With Confidence // Journal of the American Statistical Association, Pittsburgh, 2019. - P. 165-183.
38 Karypis, G. CHAMELEON: A Hierarchical Clustering Algorithm Using Dynamic Modeling / G. Karypis, E.-H. Han, V. Kumar // Journal Computer Volume 32 Issue 8. IEEE Computer Society Press Los Alamitos, CA, 1999. - P 68-75.
39 Keaveney S., Parthasarathy M.: Customer Switching Behaviour in Online Services: An Exploratory Study of the Role of Selected Attitudinal, Behavioral, and Demographic Factors. Journal of the Academy of Marketing Science 29, New-York, 2001. - P. 5-20.
40 Keramati A, Ardabili SMS: Churn analysis for an Iranian mobile operator // Telecommunication Policy, 2011. - P. 75-93.
41 Keramati A, Jafari-Marandi R, Aliannejadi M, Ahmadian I, Mozzafari M, Abbasi U: Improved churn prediction in telecommunication industry using data mining techniques // Applied Soft Computing, 2014. - P. 91-111.
42 Leo Breiman: Technical Report 486 , Statistics Department University of
California, Berkeley, 1999. - P. 154-177.
43 Lester L.: Read the Signals//Target Marketing 28, Detroit, 2005. - P. 98-117.
44 LightGBM Documentation - 2020. - 103 p. [Электронный ресурс] - Режим доступа:https://lightgbm.readthedocs.io/en/latest/Parameters.html(дата обращения 23.02.2020)
45 Lin C-S, Tzeng G-H, Chin Y-C: Combined rough set theory and flow network graph to predict customer churn in credit card accounts // Expert Systems with Applications, 2011. - P. 23-37.
46 Liudmila Prokhorenkova, Gleb Gusev: CatBoost: unbiased boosting with categorical features // Cornell University, New York, 2017. - 30 p.
47 Machado, M: LightGBM: an Effective Decision Tree Gradient Boosting Method to Predict Customer Loyalty in the Finance Industry // ResearchGate, Berlin, 2019. - P. 65-78.
48 Mason, L.; Baxter, J.; Bartlett, P. L.; Frean, Marcus : Boosting Algorithms as Gradient Descent // Advances in Neural Information Processing Systems 12. MIT Press, 1999. - P. 76-89.
49 Mason, L.; Baxter, J.; Bartlett, P. L.; Frean, Marcus: Boosting Algorithms as Gradient Descent in Function Space // Research School of Information Sciences and Engineering Australian National University Canberra, 1999. - P. 43-68.
50 Max A Little: Using and understanding cross-validation strategies. Perspectives on Saeb et al // GigaScience, Volume 6, Issue 5, May 2017. - P. 77-91.
51 Md. Sohrab Mahmud: Improvement of K-means clustering algorithm with better initial centroids based on weighted average /Md. Sohrab Mahmud, Md. Mostafizer Rahman, Md. Nasim Akhtar// 7th International Conference on Electrical and Computer Engineering 2012. - P 647-650.
52 Min Huang: Improved K-means clustering center selecting algorithm/ Min Huang, Lei Yu, Ying Chen// Information Engineering and Applications 2012 pp 373-379 Madhu Yedla Enhancing, K-means Clustering Algorithm with Improved Initial Center/ Madhu Yedla, Srinivasa Rao Pathakota, T.M Srinivasa //International Journal of Computer Science and Information Technologies (IJCSIT), Vol. 1 (2) 2010. P. 121-125.
53 Mozer M. C., Wolniewicz R., Grimes D.B., Johnson E., Kaushansky H.: Predicting Subscriber Dissatisfaction and Improving Retention in the Wireless Telecommunication Industry. IEEE Transactions on Neural Networks, 2000. - P. 111-120.
54 Nie G, Rowe W, Zhang L, Tian Y, Shi Y: Credit card churn forecasting by logistic regression and decision tree // Expert Systems with Applications, 2011. - P. 99-121.
55 ParmarJitesh, Sadanand Vijay Kumar: Customer Relationship Management (CRM) Best Practices and Customer Loyalty: A Study of Indian Retail Banking Sector//European journal of social Sciences Vol. 11 No. 1, 2009. - P. 61-85.
56 Peevers, G., Douglas, G., Marshall, D., & Jack, M. A. :On the role of SMS for transaction confirmation with IVR telephone banking //International Journal of Bank Marketing, 29(3), 2011. - P. 206-223.
57 Saradhi VV, Palshikar GK: Employee churn prediction // Expert Systems with Applications, 2011. - P. 33-55.
58 Sharma A, Panigrahi PK: A neural network based approach for predicting customer churn in cellular network services // International Journal of Computer Applications, 2011. - P. 76-93. - Текст: электронный: [сайт].
59 Shi Na: Research on k-means clustering algorithm / Shi Na, Liu Xumin, Guan yong //2010 Third International Symposium on Intelligent Information Technology and Security Informatics 2010. - P. 55-67.
60 StanleyShirmila: New Perspectives in the banking sector -The CRM way// International Journal of Marketing, Financial Services & Management Research, Vol.1 Issue 11, November 2012. - P. 154-169.
61 Teemu Mutanen: Customer churn prediction - A case study in retail banking // Workshop on practical Data Mining // Berlin, Germany , 2006. - P. 5-19.
62 Tianqi Chen, Carlos Guestrin: XGBoost: A Scalable Tree Boosting System // University of Washington, 2016.
63 Ting Hu and Ting Song: Research on XGboost academic forecasting and analysis modelling // Journal of Physics: Conference Series, Volume 1324, United Kingdom, 2019. - P. 76-101.
64 Tony Duan, Anand Avati: NGBoost: Natural Gradient Boosting for Probabilistic Prediction // Cornell University, New York, 2019. - P. 167-191.
65 Uppal R.K.:Customer Service in Indian Commercial Banks: An Empirical Study//Asia Pacific Journal of Social Sciences, Vol. 1 No.1, 2010, - P. 127-141.
66 Xgboost Documentation - 2020. - 130 p. [Электронный ресурс] - Режим доступа:https://xgboost.readthedocs.io/en/latest/parameter.html (дата обращения 23.02.2020).
67 Yu X, Guo S, Guo J, Huang X: An extended support vector machine forecasting framework for customer churn in e-commerce // Expert Systems with Applications, 2011. - P. 57-79.
68 Zhang, T. BIRCH: An Efficient Data Clustering Method for Very Large Databases / T. Zhang, R. Ramakrishnan, M. Linvy // In Proc. ACM SIGMOD Int. Conf. on Management of Data. ACM Press, New York, 1996. - P. 103-114.


Работу высылаем на протяжении 30 минут после оплаты.




©2026 Cервис помощи студентам в выполнении работ