В сфере микрокредитования решение о выдаче займа принимается на основании анкеты клиента и кредитной истории гражданина. Процессы ручного рассмотрения каждой заявки уже сейчас начинают уходить на второй план. До появления систем авто-скоринга андеррайтеры занимались обработкой всего трафика заявок и принимали свое субъективное решение. Большие компании стремятся заменить своих сотрудников алгоритмическими системами [1]. Уже сейчас большой процент заявок на кредит (если быть точнее, то 90%) в микро- финансовой организации, для которой компания Devim разрабатывает и внедряет алгоритмы оценки, обрабатываются автоматически, а остальные уходят на ручное рассмотрение андеррайтерам соответствующей мфо (микрофинансовая организация). И многие заявки возвращаются клиентам в статусе «Отказано», что негативно сказывается и на жизни гражданина, и на прибыли микрофинансовой организации. Предугадать кредитную историю можно попробовать из общедоступных данных о клиенте из социальных сетей. В социальных сетях пользователи легко делятся своей приватной и публичной информацией, которую можно добавлять к данным анкеты, не указанным клиентом. Так как при подаче заявки в микрофинансовую организацию клиент обязуется указывать свои паспортные данные, о чем сказано в договоре, то несовпадение этих данных с информацией из социальной сети может трактоваться как попытка мошенничества.
Пока что сервисы скоринга не обучены звонить клиентам, оценивать их эмоциональное и физическое состояние, задавать косвенные вопросы и нечетко анализировать данные и поведение пользователя в социальных сетях. Google показала на своем фестивале разработчиков Google I/O 2018 [2], что их Ассистент движется в этом направлении - понимании общего смысла устной речи [3]. Внедрение таких алгоритмов общения с клиентами вместо андеррайтеров очень рискованная и трудозатратная задача. В такой ситуации человек обладает преимуществом - он может позвонить и лично пообщаться с клиентом, подробнее спросить его про заявку. А для получения каких-то дополнительных данных они просматривают профили клиентов из социальных сетей, а также профили друзей и родственников. Автоматизация обхода профилей и их анализ облегчит монотонную работу андеррайтера и ускорит принятие решение, время на вынесение которого может быть ограничено политикой компании.
Бывают ситуации, когда в займе было отказано, так как клиент не имеет кредитной истории. Клиентами без кредитной истории могут быть молодые люди, которые в силу своего возраста не могли брать займы, и мигранты, кредитную историю которых затруднительно получить в силу языковых, географических и технологических барьеров. Например, пока что сложно интегрироваться с бюро кредитных историй каждого государства, даже если оно имеет собственное API для таких целей. В таких случаях предсказывающие модели могут давать некорректные решения. Оценка кредитоспособности для таких клиентов зависит от конкретной системы, её архитектуры и встроенных алгоритмов. Так, заявки без кредитной истории могут отклоняться в 100% случаев или перенаправляться андеррайтерам. Анализ профиля социальной сети в некоторых случаях может помочь заполнить пробелы в анкете клиента для корректировки входящих данных в модель.
В данной работе была поставлена задача использования публичных данных пользователей социальных сетей в задаче оценки надежности клиентов микрофинансовой организации. Был разработан production-ready микросервис, готовый к внедрению в текущую систему, а также прототип изменений дизайна веб интерфейса информационной подсистемы андеррайтинга. В свою очередь, сервис реализует алгоритмические проверки пользователя и сообщает сотруднику о потенциальном случае мошенничества.
Разработанные методы анализа и проверки клиента в основном направлены на ускорение взаимодействия андеррайтеров с указанными в заявке данными пользователя и определение случаев мошенничества, что ускоряет принятие решений.
Предварительный анализ числовых данных, собранных из социальной сети ВКонтакте по базе данных микрофинансовой организации не оправдал ожидаемых и приемлемых результатов точности предсказания целевых переменных и требует дальнейших исследований взаимосвязей поведения пользователя в интернете и его кредитного рейтинга. Под поведением подразумеваются оставляемые комментарии, их эмоциональная окраска, частота и тематичность.
Алгоритмические проверки тоже могут быть улучшены и дополнены в различных направлениях, таких как автоматическое определение ложных (фейковых) страниц, анализ интересов пользователя через подписки, лайки и группы или предложение пройти опрос через мессенджеры или на точке продаж для оценки психологического состояния клиента на момент рассмотрения заявки. Анализ друзей и социальных графов пользователя также может дать положительные результаты в предсказании финансового положения клиента.
Использование данных из большого количества различных социальных сетей является дополнительным неисследованным информационным полем, что поможет построить финансовый профиль каждого человека.
Ни для кого не секрет, что описанные выше направления исследований и разработки требуют колоссальных трудозатрат от специалистов совершенно различных направлений деятельности. Для анализа поведения человека в интернете и его закономерностей требуется большое количество исследований в этом направлении, для проведения которых требуются большие объемы данных. А для подготовки и анализа такого объема данных требуются вычислительные мощности.
[1] Роботы вместо лучших сотрудников: машинное обучение по ответам экспертов / Блог компании Devim / Хабр [Электронный ресурс] // habr. URL:https://habr.com/company/devimteam/blog/348092/ (дата обращения: 17.05.18).
[2] Google I/O 2018 [Электронный ресурс] URL:https://events .google .сот/ io/ (дата обращения: 17.05.18).
[3] Google IO 2018: all of the highlights and news from the keynote [Электронный ресурс] // techradar. URL:https://www.techradar.com/news/ google-io-2018 (дата обращения: 17.05.18).
[4] How Trump Consultants Exploited the Facebook Data of Millions [Электронный ресурс] // The New York Times. URL:https ://www.nytimes .com/2018/ 03/17/us/politics/cambridge-analytica-trump-campaign.html (дата обращения: 17.05.18).
[5] Как «ВКонтакте» разрешила анализировать данные пользователей [Электронный ресурс] // РБК. URL: https: //www .rbc .ru/technology_and_ media/02/04/2018/5abe534d9a7947350e3a7dfa (дата обращения: 17.05.18).
[6] «ВКонтакте» не будет сотрудничать с Национальным бюро кредитных историй [Электронный ресурс] // Коммерсант.ru. URL:https://www. kommersant.ru/doc/3630050 (дата обращения: 17.05.18).
[7] Twitch.TV [Электронный ресурс] URL:https: //www. twitch. tv/ (дата обращения: 17.05.18).
[8] Стримеры — о том, как заработать на трансляциях компьютерных игр [Электронный ресурс] // The Village. URL:http://www.the-village.ru/ village/people/people/233345-go-stream (дата обращения: 17.05.18).
[9] Devim URL:https://devim.com/ (дата обращения: 17.05.18).
[10] VK API на Python: часть 1, выгружаем все фото из альбома [Электронный ресурс] // proglib.io URL:https ://proglib. io/p/python-vk-api/ (дата обращения: 17.05.18).
[11] VK API на Python: часть 2, узнаем, что лайкал пользователь [Электронный ресурс] // proglib.io URL:https: //proglib. io/p/python-vk-api-2/ (дата обращения: 17.05.18).
[12] Sam Newman Building Microservices // O’REILLY.
[13] bottleneck Определение в кембриджском словаре английского языка [Электронный ресурс] URL:https://dictionary.Cambridge.org/ru/T2A cyrsT2AcyrlT2AcyroT2AcyrvT2AcyraT2AcyrrT2Acyrsftsn/ T2AcyraT2AcyrnT2AcyrgT2AcyrlT2AcyriT2AcyrishrtT2A cyrsT2AcyrkT2AcyriT2Acyrishrt/bottleneck (дата обращения: 17.05.18).
[14] What is domain logic? [Электронный ресурс] // Enterprise Craftsmanship. URL: https: / / enterprise craftsmanship. com/2016/08/ 25/what-is-domain-logic/ (дата обращения: 17.05.18).
[15] Susan J. Fowler Production-Ready Microservices: Building Standardized Systems Across an Engineering Organization // O’REILLY URL:https: //www. goodreads.com/book/show/33252815-production-ready-microservices
...