Компания при запуске нового продукта всегда стремится оценить эффект, который этот продукт приносит. Как эффект принято оценивать две важные метрики: чистая прибыль компании и лояльность клиентов.
А что если компания - банк, а продукт - новый тип карты? Расходы банка можно легко перечислить: реклама, печать карты, доставка карты, логистика, оплата труда сотрудников, которые непосредственно взаимодействовали клиентом. А в чем будет заключаться доход банка, если сам выпуск карты - бесплатная услуга, кроме платы за годовое обслуживание? Доход банка будет приходить от просрочек по кредитным счетам, от дополнительных платных услуг, на оформление которых повлияло получение нового продукта и других статей дохода, на которые мог повлиять новый продукт не напрямую, а косвенно повышением лояльности. Значит, лояльность нужно оценить какими-то измеримыми метриками. Рассматриваем банк, поэтому принято решение использовать транзакционную активность как метрику лояльности.
При известных измеримых метриках обычно проводят АБ тест и решение о масштабировании принимают по его итогам. Но в нашем случае провести честный АБ тест запуска нового продукта для оценки нужных метрик с помощью рандомизированного эксперимента невозможно из-за обширной маркетинговой компании. При этом продукт запустили без АБ-теста, основываясь на предварительных оценках эффекта, исходя из потребностей клиента, которые этот продукт удовлетворяет.
Поэтому принято решение оценить влияние получение нового продукта A на выбранные ключевые метрики по ретро данным, используя различные техники причинно-следственного анализа.
В работе были рассмотрены и применены к реальным данным два метода сопоставления: Coarsened Exact Matching и Propensity Score Matching.
Методом Coarsened Exact Matching удалось уменьшить общее L1 расстояние между выборками с 0.897 до 0.402, оставив 50.7% изначальной группы воздействия.
Метод Propensity Score Matching оставил 92.5% изначальной группы воздействия, но не показал баланса выборок по основным метрикам.
Результаты исследования, которые являются наиболее несмещенными - результаты применения метода Coarsened Exact Matching. Эти результаты статзначимы и подтверждают гипотезу о положительном влиянии получения продукта на транзакционную активность.
[1] Angrist J. D., Pischke J.-S. Mostly Harmless Econometrics: An Empiricist’s Companion. — 2008.
[2] Blackwell M., Iacus S., King G. cem: Coarsened exact matching in Stata. — 2010.
[3] Evaluating the Utility of Coarsened Exact Matching for Pharmacoepidemiology Using Real and Simulated Claims Data / Ripollone J. E., Huybrechts K. F., Rothman K. J., Ferguson R. E., and Franklin J. M. // American Journal of Epidemiology. — 2019.
[4] Evaluating uses of data mining techniques in propensity score estimation: a simulation study. / Setoguchi S., Schneeweiss S., Brookhart M. A., Glynn R. J., and Cook E. F. // Pharmacoepidemiology and Drug Safety. — 2008.
[5] Greifer N., Stuart E. A. Choosing the Causal Estimand for Propensity Score Analysis of Observational Studies // arXiv preprint arXiv:2106.10577. — 2021.
[6] https://habr.com/ru/articles/690414/. — 2022.
[7] https://platform.productland.ru/library/article/kakie-mogut-byt- alternativy-ab-testam. — 2023.
[8] https://statisticaloddsandends.wordpress.com/2021/10/31/standardized- mean-difference-smd-in-causal-inference/. — 2021.
[9] https://stats.stackexchange.com/questions/638728/how-to-obtain- the-weighted-or-unweighted-l1-imbalance-measure-for-raw-data. — 2024.
[10] The Influence of Left-Behind Experience on College Students’ Mental Health: A Cross-Sectional Comparative Study / Liu H., Zhou Z., Fan X., and Wang J. // International Journal of Environmental Research and Public Health (IJERPH). — 2020.
[11] Lee B. K., Lessler J., Stuart E. A. Improving propensity score weighting using machine learning. // Statistics in Medicine. — 2010.
[12] McCaffrey, Ridgeway, Morral. Propensity score estimation with boosted regression for evaluating causal effects in observational studies // Psychological Methods. — 2004.
[13] Stuart E. A. Matching Methods for Causal Inference: A Review and a Look Forward // Statistical Science. — 2010.