Разработка математических моделей для прогнозирования категории претензий клиентов страховой фирмы
|
ВВЕДЕНИЕ 7
ГЛАВА 1 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ФУНКЦИОНИРОВАНИЯ
ПРОЦЕЕССА УПРАВЛЕНИЯ ПРЕТЕНЗИЯМИ 10
1.1 Процесс управления претензиям 10
1.2 Анализ степени изученности темы 11
1.3 Постановка задачи 14
Выводы по главе 1 16
ГЛАВА 2 МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ КАК ЭФФЕКТИВНОЕ
СРЕДСТВО РЕШЕНИЯ ЗАДАЧ ПРОГНОЗИРОВАНИЯ 17
2.1 Логистическая регрессия 17
2.2 Градиентный бустинг (XGBoost) 20
2.3 Случайный лес (Random Forest) 23
2.4 Метод k-ближайших соседей 24
2.5 Extratreesclassifier 26
Выводы по главе 2 26
ГЛАВА 3 ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ МАТЕМАТИЧЕСКИХ
МОДЕЛЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ КАТЕГОРИИ ПРЕТЕНЗИИ
КЛИЕНТА СТРАХОВОЙ ФИРМЫ 29
3.1 Описание набора данных 29
3.2 Подготовка данных для исследования 30
3.3 Метрика для оценки качества обучения моделей 37
3.4 Процедура обучения 37
3.5 Построение базовых моделей 38
3.5.1 Применение метода логистической регрессии 38
3.5.2 Применение метода k-ближайших соседей 39
3.5.3 Применение метода Random Forest 41
3.5.4 Применение метода градиентного бустинга (XGBoost) 43
3.5.5 Применение метода Extratreesclassifier 48
3.6 Сравнение моделей и обсуждение результатов 50
Выводы по главе 3 52
ГЛАВА 4 КОММЕРЦИАЛИЗАЦИЯ ПРОЕКТА 53
4.1 Дорожная карта 55
4.2 Бизнес-модель 57
4.3 Команда проекта 58
4.4 Ценообразование 59
Выводы по главе 4 64
ЗАКЛЮЧЕНИЕ 65
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
ГЛАВА 1 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ФУНКЦИОНИРОВАНИЯ
ПРОЦЕЕССА УПРАВЛЕНИЯ ПРЕТЕНЗИЯМИ 10
1.1 Процесс управления претензиям 10
1.2 Анализ степени изученности темы 11
1.3 Постановка задачи 14
Выводы по главе 1 16
ГЛАВА 2 МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ КАК ЭФФЕКТИВНОЕ
СРЕДСТВО РЕШЕНИЯ ЗАДАЧ ПРОГНОЗИРОВАНИЯ 17
2.1 Логистическая регрессия 17
2.2 Градиентный бустинг (XGBoost) 20
2.3 Случайный лес (Random Forest) 23
2.4 Метод k-ближайших соседей 24
2.5 Extratreesclassifier 26
Выводы по главе 2 26
ГЛАВА 3 ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ МАТЕМАТИЧЕСКИХ
МОДЕЛЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ КАТЕГОРИИ ПРЕТЕНЗИИ
КЛИЕНТА СТРАХОВОЙ ФИРМЫ 29
3.1 Описание набора данных 29
3.2 Подготовка данных для исследования 30
3.3 Метрика для оценки качества обучения моделей 37
3.4 Процедура обучения 37
3.5 Построение базовых моделей 38
3.5.1 Применение метода логистической регрессии 38
3.5.2 Применение метода k-ближайших соседей 39
3.5.3 Применение метода Random Forest 41
3.5.4 Применение метода градиентного бустинга (XGBoost) 43
3.5.5 Применение метода Extratreesclassifier 48
3.6 Сравнение моделей и обсуждение результатов 50
Выводы по главе 3 52
ГЛАВА 4 КОММЕРЦИАЛИЗАЦИЯ ПРОЕКТА 53
4.1 Дорожная карта 55
4.2 Бизнес-модель 57
4.3 Команда проекта 58
4.4 Ценообразование 59
Выводы по главе 4 64
ЗАКЛЮЧЕНИЕ 65
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
В настоящее время страхование является важным сектором, как мировой, так и национальной финансовой системы.
Экономическая сущность страхования состоит в создании денежных фондов за счёт взносов заинтересованных в страховании сторон и предназначенных для возмещения ущерба у лиц, участвующих в формировании этих фондов. Поскольку возможный ущерб (или страховой риск) носит вероятностный характер, то происходит перераспределение страхового фонда, как в пространстве, так и во времени. Можно сказать, что возмещение ущерба у пострадавших лиц происходит за счёт взносов всех, кто участвовал в формировании этих страховых фондов.
Сам процесс обращений клиентов, рассмотрения их заявок, установления виновной стороны и выплаты денег, в некоторых случаях, может занимать довольно долгое время. А с учетом, расширения клиентской базы в страховых компаниях, увеличивается и количество заявок.
Ускорение процесса обработки и рассмотрения обращения клиента является одной из перспективных задач, решение которой благоприятно отразится, как на функционировании компании, так и на времени клиента.
Однако не все страховые компании согласны и могут вести активное развитие в данном вопросе. На сегодняшний момент, приблизительно 67 % страховых компаний считают, что они имеют не полный доступ к данным своих клиентов. По мнению респондентов, таких данных достаточно для успешного взаимодействия с клиентом, но недостаточно для того, чтобы делать прогноз их поведения.
Но, несмотря на это, уже около 30 % страховых компаний, уже на сегодняшний день начинают внедрять новые информационные технологии и аналитику для того, чтобы предсказывать запросы своих клиентов и создавать персонализированные сообщения. Главной проблемой для тех компаний, которые пока не делают этого, становится отсутствие необходимых систем. Большинство страховых компаний, так или иначе, заинтересованы в модернизации своих ИТ- систем в ближайшие пять лет, так что разработка новых методов прогнозирования и оптимизации для сферы страхования является ведущим звеном по усовершенствованию деятельности страховых компаний.
В связи с вышесказанным появляется необходимость поиска путей, направленных на решения проблемы с ускоренным рассмотрением претензий клиентов.
Теоретической и методологической основой дипломного проекта являются труды зарубежных и отечественных ученых в области машинного обучения. Так, например, в российской литературе известны такие авторы как: Барский А.Б., Николенко. С., Кадурин А., Архангельская Е., В. Н. Ручкин, В. А. Фулин., Вьюгин В.В. В зарубежной литературе: Оливье Кален, Джанлука Бонтемпи, Андреа Даль Поццоло, Ян-Ал Ле Боргн, Фабрицио_Карсильо, Константин_Циглер.
Рассмотрев различные точки зрения, можно прийти к выводу, что существуют различные методы прогнозирования, каждый из которых имеет свои достоинства и недостатки.
Объектом исследовательской работы является процесс управления претензиями страховой компании.
Предметом исследования является процесс обнаружения категории претензий, подходящих для ускоренного утверждения.
Целью исследования является разработка математических моделей для прогнозирования категории претензий клиента страховой фирмы, с использованием методов машинного обучения.
Для достижения цели были поставлены следующие задачи:
1) описание процесса обработки заявок клиентов;
2) теоретическое описание машинного обучения, его виды и алгоритмы;
3) анализ и сравнение имеющихся прогнозных методов машинного обучения;
4) формулировка требований к прогнозной модели;
5) построение прогнозной модели;
6) сравнительный анализ результатов прогнозирования;
7) формирование плана коммерциализации.
Научная новизна работы заключается в том, что на основе комплексного анализа:
1. Рассмотрены и проанализированы методы прогнозирования.
2. Проведен сравнительный анализ методов.
3. Разработана модель прогнозирования вероятности категорий претензий клиента страховой фирмы методами XGBoost, Random Forest, Logistic regression, K-nearest neighbors, ExtraTreesClassifier.
4. Проведен сравнительный анализ результатов исследования, сделаны выводы, даны рекомендации.
Практическая значимость работы обусловлена применением результатов исследования на практике, для повышения качества работы страховой фирмы
Экономическая сущность страхования состоит в создании денежных фондов за счёт взносов заинтересованных в страховании сторон и предназначенных для возмещения ущерба у лиц, участвующих в формировании этих фондов. Поскольку возможный ущерб (или страховой риск) носит вероятностный характер, то происходит перераспределение страхового фонда, как в пространстве, так и во времени. Можно сказать, что возмещение ущерба у пострадавших лиц происходит за счёт взносов всех, кто участвовал в формировании этих страховых фондов.
Сам процесс обращений клиентов, рассмотрения их заявок, установления виновной стороны и выплаты денег, в некоторых случаях, может занимать довольно долгое время. А с учетом, расширения клиентской базы в страховых компаниях, увеличивается и количество заявок.
Ускорение процесса обработки и рассмотрения обращения клиента является одной из перспективных задач, решение которой благоприятно отразится, как на функционировании компании, так и на времени клиента.
Однако не все страховые компании согласны и могут вести активное развитие в данном вопросе. На сегодняшний момент, приблизительно 67 % страховых компаний считают, что они имеют не полный доступ к данным своих клиентов. По мнению респондентов, таких данных достаточно для успешного взаимодействия с клиентом, но недостаточно для того, чтобы делать прогноз их поведения.
Но, несмотря на это, уже около 30 % страховых компаний, уже на сегодняшний день начинают внедрять новые информационные технологии и аналитику для того, чтобы предсказывать запросы своих клиентов и создавать персонализированные сообщения. Главной проблемой для тех компаний, которые пока не делают этого, становится отсутствие необходимых систем. Большинство страховых компаний, так или иначе, заинтересованы в модернизации своих ИТ- систем в ближайшие пять лет, так что разработка новых методов прогнозирования и оптимизации для сферы страхования является ведущим звеном по усовершенствованию деятельности страховых компаний.
В связи с вышесказанным появляется необходимость поиска путей, направленных на решения проблемы с ускоренным рассмотрением претензий клиентов.
Теоретической и методологической основой дипломного проекта являются труды зарубежных и отечественных ученых в области машинного обучения. Так, например, в российской литературе известны такие авторы как: Барский А.Б., Николенко. С., Кадурин А., Архангельская Е., В. Н. Ручкин, В. А. Фулин., Вьюгин В.В. В зарубежной литературе: Оливье Кален, Джанлука Бонтемпи, Андреа Даль Поццоло, Ян-Ал Ле Боргн, Фабрицио_Карсильо, Константин_Циглер.
Рассмотрев различные точки зрения, можно прийти к выводу, что существуют различные методы прогнозирования, каждый из которых имеет свои достоинства и недостатки.
Объектом исследовательской работы является процесс управления претензиями страховой компании.
Предметом исследования является процесс обнаружения категории претензий, подходящих для ускоренного утверждения.
Целью исследования является разработка математических моделей для прогнозирования категории претензий клиента страховой фирмы, с использованием методов машинного обучения.
Для достижения цели были поставлены следующие задачи:
1) описание процесса обработки заявок клиентов;
2) теоретическое описание машинного обучения, его виды и алгоритмы;
3) анализ и сравнение имеющихся прогнозных методов машинного обучения;
4) формулировка требований к прогнозной модели;
5) построение прогнозной модели;
6) сравнительный анализ результатов прогнозирования;
7) формирование плана коммерциализации.
Научная новизна работы заключается в том, что на основе комплексного анализа:
1. Рассмотрены и проанализированы методы прогнозирования.
2. Проведен сравнительный анализ методов.
3. Разработана модель прогнозирования вероятности категорий претензий клиента страховой фирмы методами XGBoost, Random Forest, Logistic regression, K-nearest neighbors, ExtraTreesClassifier.
4. Проведен сравнительный анализ результатов исследования, сделаны выводы, даны рекомендации.
Практическая значимость работы обусловлена применением результатов исследования на практике, для повышения качества работы страховой фирмы
В ходе написания магистерской диссертационной работы, был рассмотрен процесс обработки претензий клиентов страховой фирмы. В качестве инструментов прогнозирования рассматривались методы машинного обучения, начиная от простых методов, таких как логистическая регрессия, заканчивая градиентным бустингом.
Для построения модели прогнозирования методами машинного обучения по средствам языка программирования python, были использованы методы машинного обучения.
Из сравнения моделей мы увидели, что категорию претензии лучше всего предсказывает метод Extratreesclassifier.
В заключение работы был рассмотрен проект коммерциализации. В нем была построена дорожная карата проекта, включающая в себя этапы необходимые для вывода проекта на рынок. Были произведены плановые расчеты затрат на реализацию проекта, а также рассчитана цена на единицу продукции.
Таким образом, была достигнута цель исследования и были выполнены поставленные задачи в начале исследования.
Для построения модели прогнозирования методами машинного обучения по средствам языка программирования python, были использованы методы машинного обучения.
Из сравнения моделей мы увидели, что категорию претензии лучше всего предсказывает метод Extratreesclassifier.
В заключение работы был рассмотрен проект коммерциализации. В нем была построена дорожная карата проекта, включающая в себя этапы необходимые для вывода проекта на рынок. Были произведены плановые расчеты затрат на реализацию проекта, а также рассчитана цена на единицу продукции.
Таким образом, была достигнута цель исследования и были выполнены поставленные задачи в начале исследования.



