Тип работы:
Предмет:
Язык работы:


Сегментация пользователей мобильных операторов с помощью моделей Больших Данных

Работа №63203

Тип работы

Дипломные работы, ВКР

Предмет

информатика

Объем работы37
Год сдачи2018
Стоимость4270 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
200
Не подходит работа?

Узнай цену на написание


Введение 3
1. Обзор литературы 6
2. Обозреваемые задачи и методы их решения 12
2.1 Постановка задач об оттоке абонентов и смене аппарата у абонентов 12
2.2 Описание хода решения задачи 14
2.3 Анализ результатов 18
2.4 Постановка задач о маршрутах абонентов для размещения рекламных
носителей 20
2.5 Описание хода решения задачи 21
2.6 Выводы результатов решения 29
Заключение 31
Список используемой литературы

За последнее время словосочетание «большие данные» набирает все большую популярность. Это словосочетание используют по поводу и без повода в книгах и публикациях о потенциальных возможностях маркетинга, промышленности, сервисных и обслуживающих организациях, телекоммуникационных услуг, и в целом любой отрасли, где предприятия и игроки рынка каким-либо образом собирают и накапливают информацию о своей клиентской базе. Однако, используя этот термин, авторы не всегда достаточно полно представляют, что на самом деле кроется за этим словосочетанием. Обычно имеются ввиду неструктурированные массивы сырых данных, которыми обладают компании. Но как такие массивы обрабатывать, и как потом интерпретировать результаты этой обработки — представляют немногие. За границей подобная обработка, анализ и в целом использование компаниями и корпорациями данных о своей клиентской базе — дело совсем не новое, но развитие направление Big Data получило лишь в последние несколько лет, когда на рынке у компаний появились технические возможности для накопления, обмена и обработки больших объемов сырых данных и информации. Широкое применение «Big Data» получила в государственных структурах Соединенных Штатов, в медицине, финансовой сфере и телекоммуникационной сфере, история развития данного направления подробно рассматривается в исследовании компании McKinsey [1]. Аналитика, структурирование и последовавшее за этим целевое применение информации о гражданах страны и/или о клиентах компании позволяет корпорациям экономить миллионы долларов на логистике, затратах на персонал и рентабельности.
В России на рынке телекоммуникационных компаний в данное время все еще существует сильный разрыв между достаточно большим объёмом информации об абоненте, накопленной за многие годы, и между тем, как данная информация используется для внутренних целей компании. Для решения проблем, которые появляются в ходе планирования радиосети или которые появляются во время «развития» абонента используется лишь незначимый процент данных о своих абонентах.
Однако, имея данные о трафиковом потреблении, денежных тратах и платежах абонента, представляя его геосоциальные признаки, и имея информацию о том, в каких местах чаще бывает клиент, спектр задач, которые может решать Big Data можно рассматривать очень широко.
Как именно сотовые операторы могут использовать данные о своих абонентах, нам подсказывает зарубежный опыт. Первые пробы пера по работе с большими данными были использованы в Соединенных Штатах как раз для упомянутого выше планирования радиосети. Уже тогда на основе текущей загрузки базовых станций и ее динамики операторы стали делать выводы о том, как быстро растёт население в определенных районах городов, где ведётся активная застройка и заселение. Исходя из этих данных, операторы развивали радиочастотную сеть. В дальнейшем интерес сдвинулся из технологической и инфраструктурной области в коммерческую, а именно — в сторону развития абонента. Индивидуальный подход к работе с клиентом был поставлен во главу угла работы с большими данными. С появлением и ростом проникновения смартфонов, вовлечением людей в социальные сети персонализация и индивидуализация только усилились. Это позволяло и позволяет компаниям, в том числе и мобильным операторам, вести работу с каждым клиентом практически индивидуально, направляя ему целевые сегментированные предложения. Известен случай, который я описал и в своей работе «Варианты использования Больших Данных в телекоммуникационном бизнесе» [2], когда одна из торговых сетей в США направила SMS своему клиенту — молодой девушке с рекламой товаров для беременных [3]. Такой вывод система этой сети сделала, проанализировав покупки клиента за последние месяцы. Возмущённый отец девушки посчитал оскорблённым себя и свою, как ему казалось, невинную дочь и подал на сеть в суд. Однако вскоре дело было закрыто, поскольку девушка действительно оказалась беременной. Это один из многих примеров правильного (хотя и не очень удачного с эмоциональной точки зрения) таргетинга. Возможно, Вы и сами обращали внимание, что стоит Вам посетить сайт определённой тематики, и в следующую секунду Вы видите рекламу соответствующего товара или услуги в браузерах и, возможно, получаете SMS с тематикой сайта, который посещали еще вчера. Пока подобный опыт таргетированных предложений завязан в основном на трафик клиента в сети интернет и его использовании мобильных приложений в телефоне. С ростом интеграции компаний типа Yandex или Mail в сервисные организации на подобии мобильных операторов уровень персонализации работы с клиентов только вырастет.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Все выполненные в рамках исследования работы имели не только теоретическую ценность, но и практическую. Основанный на реальных выгрузках и данных анализ по маршрутам применили на практике, и результаты были представлены Оператору. Исследования были признаны успешными, и тестовая рекламная кампания была запущена, основываясь на результатах исследования популярных маршрутов.
Хотя не всё получилось идеальным образом в части оттока, в частности отсутствие интерфейса для загрузки данных оператору компании, полученные результаты удовлетворили заказчиков исследования и дали нам опыт практического применения нового интересного направления информатики — машинного обучения. Кроме того, алгоритмы применили к фактическим данным существующих клиентов и на основе полученных результатов с частью абонентов была проведена работа по удержанию. К минусам исследования вопроса по оттоку клиентов надо отнести то, что в итоге, всё-таки, не было получено пользовательского интерфейса, с помощью которого конечные пользователи могли бы загружать данные в необходимой детализации и получать прогнозные данные по клиентскому оттоку. Проработка интерфейса лежит в плоскости глобального проекта с Оператором и подразумевает заключение отдельного коммерческого контракта и проведения закупочной процедуры. Что касается маршрутов пользователей, то их построение и кластеризации путей абонентов — задача достаточно объемная и может представлять интерес не только для оператора, но и для государственных органов, для других коммерческих организаций. Результаты кластеризации маршрутов можно связать с задачами роста проникновения продуктов на основе технологий RFID и iBeacon, задачами разделения транспортных и пешеходных потоков, планирование городской инфраструктуры и др.
Следующими этапами планируется продолжение работ в части построения маршрутов и работы с оттоком. Дополнительно к этому прорабатывается задача по определению фродовых звонков на SIM-боксах. SIM-бокс представляет собой устройство-репозиторий SIM-карт и используется для незаконного подключения к телефонным сетям. Устройство конвертирует международные звонки в локальные звонки домашнего региона. Существует несколько видов мошенничества с использованием данного вида устройств:
• Мошенничество операторов связи. Оператор прогоняет телефонный трафик с использованием IP-телефонии. Чаще всего речь про присоединенных операторов связи. Присоединенный оператор перенаправляет междугородный и международный (МГ/МН) трафик через IP-шлюзы, минуя операторов зоновой связи, т.е. уводят трафик через IP-шлюзы. Схема, как это выглядит, представлена на • Мошенничество опять же оператора связи, когда последний организует пропуск трафика через сеть третьей стороны, т.е. оператор направляет вызовы другому присоединённому оператору, вызовы из сети которого тарифицируются (или не тарифицируются вообще) оператором зоновой связи по более низким тарифам. Схема представлена на Рисунке 10. Оба этих способа позволяют операторам обходить стандартные соединения по базовым станциям, присваивая прибыль традиционных операторов.
• Мошенничество без оператора. Группа физических лиц внутри себя договаривается о перенаправлении трафика через шлюз, минуя традиционное соединение через сотовых операторов. Та же схема, что представлена на Рисунке 9, только вместо переадресации трафика присоединенным оператором, абонент напрямую устанавливает соединение со шлюзом, который дальше совершает звонок по цене местного оператора. Таким образом традиционный оператор недополучает деньги на выручке от интерконнекта. Напомню, что интерконнектом называется связь между сетями операторов, а ставка интерконнекта — это стоимость терминации звонка при взаиморасчетах между операторами. Например, если абонент A оператора X звонит абоненту В оператора Y, то X заплатит Y сумму, равную количеству проговоренных минут * ставку интерконнекта
• Еще один вид мошенничества — случай, когда в SIM-бокс вставлена сим-карта оператора, оператор теоретически только выигрывает в выручке за счет выручки от интерконнекта, если звонок совершается с SIM-бокса на другого оператора связи. В этом случае другой оператор связи заплатит согласно установленной ставке интерконнекта. Но в данном случае это политическое джентельменское соглашение между операторами, и считается фродом. Сим-карта блокируется, чтобы не генерить фродовый трафик
• И, наконец, обратная ситуация. Если в SIM-бокс вставлена сим- карта оператора другого оператора и звонки идут на оператора, чьи интересы мы хотим защитить, то последний теряет в выручке за счет недополучения выручки от интерконнекта, который мог быть получен за счет звонка по стандартным каналам. Кроме того, идет потеря выручки за счет выплат от интерконнекта оператору, чья сим-карта вставлена в SIM-бокс. В этом случае надо определять такую сим-карту стороннего оператора и сообщать ему о проблеме. По соглашениям, упомянутым выше, оператор блокирует такую сим-карту
Задача, которую необходимо решить — научиться за счет машинного обучение определять сим-боксы и находить такие сим-карты, которые описаны выше в двух последних случаях в течение получаса. Сейчас есть два вида фродовых сим-боксов:
• Простые SIM-боксы, которые сразу генерируют много исходящего голосового трафика, у них нет передачи данных и смс. Звонки на разные номера по всей России в течение короткого промежутка. Такие сим-боксы находятся в течение часа. Достаточно данных из биллинга, чтобы такую сим-карту определить. Обычно они подключают большой пакет с небольшим авансовым платежом, который дает возможность в течение одного двух дней использовать весь объем включенного трафика.
• «Умные» сим-боксы. Они генерируют входящие вызовы в том числе, бывает смс трафик и трафик передачи данных. Такие сим- боксы находят в течение 4-5 часов. Данные из биллинга подгружаются в BI-системы, где скриптами без машинного обучения делается гипотеза, что это фродовый клиент. На сим- карту совершается тестовый звонок из страны, из которой генерируется трафик. Если не отвечает живой абонент в течение нескольких звонков, сим-карта блокируется.
Необходимо научиться за счет машинного обучение ловить сим-боксы первого и второго типов. У задачи вполне конкретное практическое применение с экономическим эффектом. Как было сказано выше, эта задача лежит в сфере интересов проработки и уже сейчас начинаются выгрузки данных для машинного обучения.



1. McKinsey Global Institute. Big data: The next frontier for innovation,
competition, and productivity, June 2011 //
http://www.slideshare.net/blueeyepathrec/mckinsey-global-institute-big-data-the-next-frontier-for-innovation-competition-and-productivity
2. Пономарёв А.А. Варианты использования больших данных в телекоммуникационном бизнесе // Компьютерные инструменты в образовании. - 2015 - №4: 3-8
3. Slon Magazine - онлайн-журнал об экономике и политике. URL: http://slon.ru/specials/data-economics/articles/target(Дата обращения: 22.05.2015)
4. Mozer, M. C., Wolniewicz, R., Grimes, D. B., Johnson, E., & Kaushansky, H. Churn reduction in the wireless industry. URL: http://www.cs.colorado.edu/~mozer/Research/Selected%20Publications/reprints/churn nips.pdf
5. Nabgha Hashmi, Naveed Anwer Butt and Dr.Muddesar Iqbal. Customer Churn Prediction in Telecommunication A Decade Review and Classification. URL: http://www.researchgate.net/profile/Nabgha Hashmi/publication/257920014 Customer Churn Prediction in Telecommunication A Decade Review and Classification/links/00b495261475ba6758000000.pdf
6. Bingquan Huang, Mohand Tahar Kechadi, BrianBuckley. Customer churn prediction in telecommunications.
URL:http://www.sciencedirect.com/science/article/pii/S0957417411011353
7. V Umayaparvathi and K lyakutti. Applications of data mining techniques in telecom churn prediction. International Journal of Computer Applications, 42(20):5-9, 2012 URL: https://pdfs.semanticscholar.org/4f96/e06db144823d16516af787e96d13073b4316.pdf
8. Michael C Mozer, RichardWolniewicz, David B Grimes, Eric Johnson, and Howard Kaushansky. Predicting subscriber dissatisfaction and improving retention in the wireless telecommunications industry. Neural Networks, IEEE Transactions on, 11(3):690-696, 2000 URL:
https://pdfs.semanticscholar.org/ef46/da76583559b112820255104d7b9dfbe25b60.pdf
9. Chih-Ping Wei and I-Tang Chiu. Turning telecommunications call details to churn prediction: a data mining approach. Expert systems with applications, 23(2):103- 112, 2002 URL:
http://isiarticles.com/bundles/Article/pre/pdf/21396.pdf
10. Yaya Xie, Xiu Li, EWT Ngai, and Weiyun Ying. Customer churn prediction using improved balanced random forests. Expert Systems with Applications, 36(3):5445-5449, 2009 URL: https://pdfs.semanticscholar.org/4359/d76d3b36944553eb1d08befaf219122fbefd.pdf
11.Shin-Yuan Hung, David C Yen, and Hsiu-Yu Wang. Applying data mining to telecom churn management. Expert Systems with Applications, 31(3):515-524, 2006 URL:
https://pdfs.semanticscholar.org/9e39/a8fa0c10314199d4f99aeaafdb124ea435de.pdf
12. Kristof Coussement and Dirk Van den Poel. Churn prediction in subscription services: An application of support vector machines while comparing two parameter-selection techniques. Expert systems with applications, 34(1):313-327, 2008 URL:
https://pdfs.semanticscholar.org/9223/0fcb6e68a86db7757267813db75f99f4ccc0.pdf
13. Laasonen Kari. Clustering and Prediction of Mobile User Routes from Cellular Data // Knowledge Discovery in Databases: PKDD 2005. -2005 URL: https://www.cs.helsinki.fi/group/context/pubs/pkdd05.pdf
14.Saravanan M Pravinth Samuel V Pavan Holla. Route Detection and Mobility Based Clustering // Internet Multimedia Systems Architecture and Application (IMSAA), 2011 IEEE 5th International Conference on. - 2011 URL: http://ieeexplore.ieee.org/iel5/6151916/6156331/06156372.pdf


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ