🔍 Поиск работ

Разработка математических моделей для прогнозирования категории претензий клиентов страховой фирмы

Работа №207263

Тип работы

Дипломные работы, ВКР

Предмет

информационные системы

Объем работы67
Год сдачи2020
Стоимость4245 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
8
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 7
ГЛАВА 1 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ФУНКЦИОНИРОВАНИЯ
ПРОЦЕЕССА УПРАВЛЕНИЯ ПРЕТЕНЗИЯМИ 10
1.1 Процесс управления претензиям 10
1.2 Анализ степени изученности темы 11
1.3 Постановка задачи 14
Выводы по главе 1 16
ГЛАВА 2 МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ КАК ЭФФЕКТИВНОЕ
СРЕДСТВО РЕШЕНИЯ ЗАДАЧ ПРОГНОЗИРОВАНИЯ 17
2.1 Логистическая регрессия 17
2.2 Градиентный бустинг (XGBoost) 20
2.3 Случайный лес (Random Forest) 23
2.4 Метод k-ближайших соседей 24
2.5 Extratreesclassifier 26
Выводы по главе 2 26
ГЛАВА 3 ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ МАТЕМАТИЧЕСКИХ
МОДЕЛЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ КАТЕГОРИИ ПРЕТЕНЗИИ
КЛИЕНТА СТРАХОВОЙ ФИРМЫ 29
3.1 Описание набора данных 29
3.2 Подготовка данных для исследования 30
3.3 Метрика для оценки качества обучения моделей 37
3.4 Процедура обучения 37
3.5 Построение базовых моделей 38
3.5.1 Применение метода логистической регрессии 38
3.5.2 Применение метода k-ближайших соседей 39
3.5.3 Применение метода Random Forest 41
3.5.4 Применение метода градиентного бустинга (XGBoost) 43
3.5.5 Применение метода Extratreesclassifier 48
3.6 Сравнение моделей и обсуждение результатов 50
Выводы по главе 3 52
ГЛАВА 4 КОММЕРЦИАЛИЗАЦИЯ ПРОЕКТА 53
4.1 Дорожная карта 55
4.2 Бизнес-модель 57
4.3 Команда проекта 58
4.4 Ценообразование 59
Выводы по главе 4 64
ЗАКЛЮЧЕНИЕ 65
БИБЛИОГРАФИЧЕСКИЙ СПИСОК

В настоящее время страхование является важным сектором, как мировой, так и национальной финансовой системы.
Экономическая сущность страхования состоит в создании денежных фондов за счёт взносов заинтересованных в страховании сторон и предназначенных для возмещения ущерба у лиц, участвующих в формировании этих фондов. Поскольку возможный ущерб (или страховой риск) носит вероятностный характер, то происходит перераспределение страхового фонда, как в пространстве, так и во времени. Можно сказать, что возмещение ущерба у пострадавших лиц происходит за счёт взносов всех, кто участвовал в формировании этих страховых фондов.
Сам процесс обращений клиентов, рассмотрения их заявок, установления виновной стороны и выплаты денег, в некоторых случаях, может занимать довольно долгое время. А с учетом, расширения клиентской базы в страховых компаниях, увеличивается и количество заявок.
Ускорение процесса обработки и рассмотрения обращения клиента является одной из перспективных задач, решение которой благоприятно отразится, как на функционировании компании, так и на времени клиента.
Однако не все страховые компании согласны и могут вести активное развитие в данном вопросе. На сегодняшний момент, приблизительно 67 % страховых компаний считают, что они имеют не полный доступ к данным своих клиентов. По мнению респондентов, таких данных достаточно для успешного взаимодействия с клиентом, но недостаточно для того, чтобы делать прогноз их поведения.
Но, несмотря на это, уже около 30 % страховых компаний, уже на сегодняшний день начинают внедрять новые информационные технологии и аналитику для того, чтобы предсказывать запросы своих клиентов и создавать персонализированные сообщения. Главной проблемой для тех компаний, которые пока не делают этого, становится отсутствие необходимых систем. Большинство страховых компаний, так или иначе, заинтересованы в модернизации своих ИТ- систем в ближайшие пять лет, так что разработка новых методов прогнозирования и оптимизации для сферы страхования является ведущим звеном по усовершенствованию деятельности страховых компаний.
В связи с вышесказанным появляется необходимость поиска путей, направленных на решения проблемы с ускоренным рассмотрением претензий клиентов.
Теоретической и методологической основой дипломного проекта являются труды зарубежных и отечественных ученых в области машинного обучения. Так, например, в российской литературе известны такие авторы как: Барский А.Б., Николенко. С., Кадурин А., Архангельская Е., В. Н. Ручкин, В. А. Фулин., Вьюгин В.В. В зарубежной литературе: Оливье Кален, Джанлука Бонтемпи, Андреа Даль Поццоло, Ян-Ал Ле Боргн, Фабрицио_Карсильо, Константин_Циглер.
Рассмотрев различные точки зрения, можно прийти к выводу, что существуют различные методы прогнозирования, каждый из которых имеет свои достоинства и недостатки.
Объектом исследовательской работы является процесс управления претензиями страховой компании.
Предметом исследования является процесс обнаружения категории претензий, подходящих для ускоренного утверждения.
Целью исследования является разработка математических моделей для прогнозирования категории претензий клиента страховой фирмы, с использованием методов машинного обучения.
Для достижения цели были поставлены следующие задачи:
1) описание процесса обработки заявок клиентов;
2) теоретическое описание машинного обучения, его виды и алгоритмы;
3) анализ и сравнение имеющихся прогнозных методов машинного обучения;
4) формулировка требований к прогнозной модели;
5) построение прогнозной модели;
6) сравнительный анализ результатов прогнозирования;
7) формирование плана коммерциализации.
Научная новизна работы заключается в том, что на основе комплексного анализа:
1. Рассмотрены и проанализированы методы прогнозирования.
2. Проведен сравнительный анализ методов.
3. Разработана модель прогнозирования вероятности категорий претензий клиента страховой фирмы методами XGBoost, Random Forest, Logistic regression, K-nearest neighbors, ExtraTreesClassifier.
4. Проведен сравнительный анализ результатов исследования, сделаны выводы, даны рекомендации.
Практическая значимость работы обусловлена применением результатов исследования на практике, для повышения качества работы страховой фирмы

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе написания магистерской диссертационной работы, был рассмотрен процесс обработки претензий клиентов страховой фирмы. В качестве инструментов прогнозирования рассматривались методы машинного обучения, начиная от простых методов, таких как логистическая регрессия, заканчивая градиентным бустингом.
Для построения модели прогнозирования методами машинного обучения по средствам языка программирования python, были использованы методы машинного обучения.
Из сравнения моделей мы увидели, что категорию претензии лучше всего предсказывает метод Extratreesclassifier.
В заключение работы был рассмотрен проект коммерциализации. В нем была построена дорожная карата проекта, включающая в себя этапы необходимые для вывода проекта на рынок. Были произведены плановые расчеты затрат на реализацию проекта, а также рассчитана цена на единицу продукции.
Таким образом, была достигнута цель исследования и были выполнены поставленные задачи в начале исследования.



1. MachineLearning.ru[Электронный ресурс] - Режим доступа:
http://www.machinelearning.rU/wiki/images/1/1c/Sem06_metrics.pdf - статья
«Семинары по выбору моделей» (дата задействования 13.02.2020).
2. Николенко С., Кадурин А., Архангельская Е. «Глубокое обучение» Питер, 2018 год, 480 стр., ISBN: 978-5-496-02536-2.
3. Универсальный искусственный интеллект и экспертные системы/ В.Н. Ручкин, В.А. Фулин. - СПб.: БХВ - Петербург, 2009. - 240 с.
4. Математические основы теории машинного обучения и прогнозирования / Вьюгин В.В. - М.: 2013. - 387 с.
5. Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: основы моделирования и первичная обработка данных. - М.: Финансы и статистика, 1983.
6. Jin Zhang: LightGBM: An Effective and Scalable Algorithm for Prediction of Chemical Toxicity-Application to the Tox21 and Mutagenicity Data Sets // Karolinska Institutet, Sweden, 2019.
7. D.J. Hand. Измерение эффективности классификатора: последовательная альтернатива области под кривой roc. Машинное обучение, 77 (1): 103-123, 2009.
8. С. Элкан. Основы обучения с учетом затрат. В Международной совместной конференции по искусственному интеллекту, том 17, страницы 973¬978, 2001.
9. Alejandro Correa Bahnsen, Aleksandar Stojanovic, Djamila Aouada, and Bjorn Ottersten. Стоимость обнаружения мошенничества с использованием кредитных карт с минимальным риском. В Машинном обучении и приложении (ICMLA), 2013 12-я Международная конференция том 1, стр. 333-338. IEEE, 2013.
10. G. Batista, A. Carvalho, and M. Monard. Применение односторонней выборки к несбалансированным наборам данных. MICAI 2000: достижения в области искусственного интеллекта, страницы 315-325, 2000 год.
11. Jin Zhang: LightGBM: An Effective and Scalable Algorithm for Prediction of Chemical Toxicity-Application to the Tox21 and Mutagenicity Data Sets // Karolinska Institutet, Sweden, 2019.
12. Haibo He and Edwardo A Garcia. Учиться на несбалансированных данных. Знание и инженерия данных, IEEE Transactions on, 21(9):1263-1284, 2009.
13. Вьюгин В.В. «Математические основы теории машинного обучения прогнозирования» М.: 2013. - 387 с.
14. Назарова, В.В., Матвеева, Е.А. Концепция риск-менеджмента в страховых организациях /В.В. Назарова, Е.А. Матвеева// [Электронный ресурс]. Научный журнал НИУ ИТМО. Серия «Экономика и экологический менеджмент». - 2014 - №4. - С. 258-275 http://economics.ihbt.ifmo.ru/file/article/11055.pdf.
15. Комлева, Н.В., Янин, А.С., Самиев, П.В. Страхование в системе риск
менеджмента /Н.В. Комлева и др.// [Электронный ресурс]. Бюллетень рейтингового агентства «Эксперт РА». - 2008
http://raexpert.ru/researches/insurance/risk-insurance/.
16. Швецова, И.Н., Шешукова, Е.С. Big Data в страховании: опыт США и использование успешных практик в России /И.Н. Швецова, Е.С. Шешукова// International Scientific Journal. - 2016 - № 10 (20). - С. 125-132.
17. С. Чен, А. Лиу, Л. Брейман. Использование случайного леса для несбалансированных данных. Университет Калифорнии, Беркли 110.
18. Смирнов, Е.А. Страховые компании встают на путь Big Data// Издание о
высоких технологиях «Cnews» [Электронный ресурс -
http: //www. cnews. ru/news/top/strahovye_kompanii_vstayut_na_put_big_data.
19. Claim Management System// [Электронный ресурс]. -
https: //www.researchgate.net/publication/318965364_CLAIM_MANAGEMENT_SY S TEM.
20. Causes and Problem Identification in Construction Claim Management//
[Электронный ресурс]. -https: //www.researchgate.net/publication/330423609_Causes_and_Problem_Identificati on in Construction Claim Management.
21. Tadviser.ru[Электронный ресурс] - Режим доступа:
http://www.tadviser.ru/index.php/ Big_Data_%D0%B8_BI_Day_2019 - статья «BIG DATA И BI DAY 2019» (дата задействования 05.01.2020).
22. Public Liability Claims Management// [Электронный ресурс]. - https://www.researchgate.net/publication/23749078_Public_Liability_Claims_Manage ment. Фостер Проректор. Машинное обучение на основе несбалансированных наборов, данных 101. В материалах семинара AAAI’2000 по несбалансированным наборам данных, 2000 год.
23. Величко, Н.В., Осадчая, Н.Н. К вопросу об управлении рисками в страховании /Н.В. Величко, Н.Н. Осадчая// [Электронный ресурс]. Science Time. - 2015 - №4 (16) - С. 102-109 - http://cyberleninka.ru/article/n/k-voprosu-ob- upravlenii-riskami-v-strahovanii.
24. Аналитический обзор рынка Big Data/ Блог компании ПАО «Московская
Биржа»// [Электронный ресурс]. -
https://habrahabr.ru/company/moex/blog/256747/.Эндрю Эстабрукс, Тэхо Джо и Натали Япкович. Метод множественной повторной выборки для обучения на основе несбалансированных наборов данных. Вычислительный Интеллект, 20(1): стр. 18-36, 2004.
25. Ting Hu and Ting Song: Research on XGboost academic forecasting and analysis modelling // Journal of Physics: Conference Series, Volume 1324, United Kingdom, 2019Алехандро Корреа Бансен, Джамила Аояма и Бьерн Оттерстен. Пример зависимых деревьев принятия решений от затрат. Экспертные системы с приложениями, 2015.
26. Tony Duan, Anand Avati: NGBoost: Natural Gradient Boosting for Probabilistic Prediction// Cornell University, New York, 2019.
21. Монастырный, Е.А. Ресурсный подход к построению бизнес-процессов и коммерциализации разработок / Е.А. Монастырный, Я.Н. Грик // Инновации. - 2004. - № 7. - С. 85-81.
28. Дж. Козметский. Вызов технологических инноваций на пороге новой эры общемировой конкуренции, 1999, 296 с.
29. Ляшин А. Стратегии коммерциализации инноваций — мост между инноватором и бизнесом [Электронный ресурс] // Экономика и жизнь. - 2011, № 36 (9402).
30. Python для сложных задач: наука о данных и машинное обучение. - СПб.: Питер, 2018. - 576 с.


Работу высылаем на протяжении 30 минут после оплаты.




©2026 Cервис помощи студентам в выполнении работ