Введение 3
Обзор литературы 6
Содержательная постановка задачи 8
Математическая постановка задачи 9
Математическая модель 10
Извлечение социальных сетей из базы данных совместной фильтрации 13
Глава 1. Числовой эксперимент 16
1.1. Модель 17
1.2. Сетевое значение 20
1.3. Маркетинг 21
Выводы 22
Заключение 23
Список литературы 24
Приложение
За последние несколько лет рынок поменялся до неузнаваемости. Причиной тому стал технический прогресс. Сейчас мы не можем представить свою жизнь без онлайн-шоппинга, онлайн-кинотеатров и много другого, что подарил нам интернет. Естественно, и область маркетинга потерпела большие перемены: теперь мы не обращаем внимание на баннеры на улице или рекламу по телевизору, наш взор устремлен в телефон или ноутбук. Так как же обратить внимание владельца гаджета на нужный нам продукт, как не прогадать? За ответ на эти вопросы отвечает интеллектуальный анализ данный (Data mining). Одна из задач интеллектуального анализа данных - помочь компании определить потенциальных клиентов рынка.
Корпорации тратят баснословные суммы на маркетинг. Но как же понять оправдан он или нет? Если ожидаемая прибыль от клиента больше, чем стоимость маркетинга для нее, то маркетинг выполнил свою цель. Раньше работы в этой области в основном внутреннюю ценность клиента. Внутренняя ценность клиента - это ожидаемая прибыль от продаж ему. В своей работе я предлагаю также рассматривать сетевое значение клиента: ожидаемую прибыль от продаж других клиентов, которым он может предложить купить товар или повлиять на другого клиента.
Рассмотрим основные виды маркетинга: прямой и массовый. Прямой маркетинг - это вид продвижения, который предполагает передачу информации о продукте, услуге или компании непосредственно клиенту. К стратегиям прямого маркетинга относятся email рассылки, печатная и онлайн реклама, маркетинг на основе баз данных и прочее. В свою очередь массовый маркетинг предполагает сознательное игнорирование различий между покупателями, для продвижения товара используется единая стратегия коммуникации.
В отличие от массового маркетинга, в котором продукт предлагается всем потенциальным клиентам без разбора, в прямом маркетинге сначала пытаются выбрать клиентов, которые с большей вероятностью принесут прибыль и работают только с ними [1]. Сбор данных играет ключевую роль в этом процессе за счет создания моделей, которые предсказывают реакцию клиента, учитывая его поведение в прошлом и любую доступную демографическую информацию [2]. При успехе, этот подход может значительно увеличить прибыль компании [3]. Одним из основных ограничений является то, что этот подход предполагает, что каждый клиент принимает решение о покупке независимо от всех других покупателей. В действительности, решение человека купить продукт часто сильно зависит от его друзей, убеждения, партнеров и т. д.
Маркетинг, основанный на системе «из уст в уста» может быть гораздо более экономичным, чем более традиционный метод, поскольку он использует клиентов, чтобы выполнить большую часть продвижения [4]. Этот тип маркетинга получил название вирусного маркетинга из-за своего сходства с распространением эпидемии. Сейчас его используют большое количество компаний, особенно в интернет-секторе.
Игнорирование сетевых эффектов при принятии о том, какие клиенты будут покупать товар, могут привести к неоптимальным решениям. Клиент, чья внутренняя стоимость ниже, чем стоимость маркетинга, на самом деле может стоить маркетинга, когда учитывается ее сетевая ценность. Наоборот, маркетинг для прибыльного клиента может быть избыточным, если сетевые эффекты уже делают очень вероятной покупку товара.
Хоть определение сетевой ценности клиента на первый взгляд является чрезвычайно сложной задачей, эта величина зависит не только от самого клиента, но и от потенциала его в сети и состояния самой сети. В результате, маркетинг с сильными сетевыми эффектами является либо хитом, либо провалом. Многие компании инвестируют значительные средства, чтобы приобрести клиентов, которые будут основой сети, что иногда приводит к банкротству, когда желаемы сетевые эффекты не реализуются. С другой стороны, некоторые компании являются более успешными, чем ожидалось. Таким образом, основа действий на сетевых рынках может значительно снизить риск компаний на этом рынке.
Увеличение использования интернета привело к наличию большого количества данных, из которых может быть добыта необходимая сетевая информация. В своей работе я предлагаю общую схему для этого и для использования результатов оптимизации выбора клиентов на рынок. Решение основано на моделировании социальной сети в виде марковых случайных полей, где вероятность покупки каждого клиента зависит как от внутреннего желания приобрести продукт, так и от влияния других клиентов. Затем я фокусируюсь на базах данных, как источнике данных для интеллектуальных сетей влияния. Я применяю математическую модель к общедоступной базе данных Movie Lens [5] с рейтингом 9 тысяч фильмов и демонстрирую ее преимущества по сравнению с традиционным прямым маркетингом.
В представленной работе была построена модель, вычисляющая сетевое значение клиента онлайн-кинотеатра. Это помогло понять, что массовый маркетинг во времена социальных сетей и интернета избыточен, более того может привести к убыткам.
При построении стратегии маркетинга специалистам не стоит игнорировать сетевые эффекты. С их учетом прямой маркетинг дает положительное значение прибыли для компании.
1. A. M. Hughes The Complete Database Marketer: Second Generation Strategies and Techniques for Tapping the Power of Your Customer Database. Irwin, Chicago, IL: 1996.
2. C. X. Ling, C. Li Data Mining for Direct Marketing: Problems and Solutions // Proceeding of the Forth International Conference on Knowledge Discovery and Data Mining. New York, NY: AAAI Press, 1998. С. 73-79.
3. G. Piatetsky-Shapiro, B. Masand Estimating campaign benefits and modeling lift // Proceeding of Fifth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Can Diego, CA: ACM Press, 1999. С. 185-193.
4. S. Jurvetson What exactly is viral marketing? // Red Herring. 2000. №78. С. 110-112.
5. MovieLens Database // GroupLens
URL:https://grouplens.org/datasets/movielens/(дата обращения: 10.03.20).
6. D. R. Mani, J Drew, A Betz, P Datta Statistic and data mining techniques for lifetime value modeling // Proceedings of the Fifth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining . New York, NY: ACM Press, 1999. С. 94-103.
7. Д. А. Губанов, Д. А. Новиков, А. Г. Чхартишвили Социальные сети: модели информационного влияния, управления и противоборства. Москва: Физматлит, 2010.
8. J. S. Breese, D. Heckerman, C. Kadie Empirical analysis of predictive algorithms for collaborative filtering // Proceedings of Fourteenth
Conference on Uncertainty in Artificial Intelligence. Madison, WI: Morgan Kaufmann, 1998.
9. P. Domingos, M. Richardson Mining the Network Value of Customers // Proceedings of the Seventh International Conference on Knowledge Discovery and Data Mining. San-Francisco, CA: ACM Press, 2001. С. 57¬66.
10. L. Pelkowitz A continuous relaxation labeling algorithm for Markov random fields // IEEE Transactions on Systems, Man and Cybernetics. 1990. №20. С. 709-715.
11. J. Besag Spatial interaction and the statistical analysis of lattice systems // Journal of the Royal Statistical Society. 1947. №36. С. 192-236.
12. R. Kindermann, J.L. Snell Markov Random Fields and Their Applications. RI: Providence, 1980.
13. R. Chellappa, A. K. Jain Markov Random Fields: Theory and Applications. Boston, MA: Academic Press, 1993.
14. S. Geman, D. Geman Stochastic relaxation, Gibbs distributions, and the Bayesian restoration of images // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1984. №6. С. 721-741.
15. S. Chakrabarti, B. Dom, P. Indyk Enhanced hypertext categorization using hyperlinks // Proceedings of the 1998 ACM SIGMOD International Conference on Management of Data. Seattle, WA: ACM Press, 1998. С. 307-318.
16. P. Domingos, M. Pazzani On the optimality of the simple Bayesian classifier under zero-one loss // Machine Learning. 1997. №29. С. 103-130.
17. D. Heckerman, D. M. Chickering A dicision theorwtic approach to targeted advertisisng // Proceedings of Sixteenth Annual Conference on Uncertainty in Artificial Intelligence. Stanford, CA: Morgan Kaufmann, 2000.
18. P. Resnick, N. Iacovou, M. Suchak, P. Bergstrom, J. Riedl GroupLens: An open architecture for collaborative filtering of netnews // Proceedings of the ACM 1994 Conference on Computer Supported Cooperative Work. New York, NY: ACM Press, 1994. С. 175-186.