📄Работа №207263

Тема: Разработка математических моделей для прогнозирования категории претензий клиентов страховой фирмы

📝

Тип работы Дипломные работы, ВКР

📚

Предмет Информационные системы

📄

Объем: 67 листов

📅

Год: 2020

👁️

4245 руб.

🛒 Купить работу

Не подходит эта работа?
Закажите новую по вашим требованиям

Узнать цену на написание

ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание 📖 Введение ✅ Заключение 📕 Литература 🔍 Похожие 🛒 Купить

📋 Содержание

ВВЕДЕНИЕ 7
ГЛАВА 1 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ФУНКЦИОНИРОВАНИЯ
ПРОЦЕЕССА УПРАВЛЕНИЯ ПРЕТЕНЗИЯМИ 10
1.1 Процесс управления претензиям 10
1.2 Анализ степени изученности темы 11
1.3 Постановка задачи 14
Выводы по главе 1 16
ГЛАВА 2 МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ КАК ЭФФЕКТИВНОЕ
СРЕДСТВО РЕШЕНИЯ ЗАДАЧ ПРОГНОЗИРОВАНИЯ 17
2.1 Логистическая регрессия 17
2.2 Градиентный бустинг (XGBoost) 20
2.3 Случайный лес (Random Forest) 23
2.4 Метод k-ближайших соседей 24
2.5 Extratreesclassifier 26
Выводы по главе 2 26
ГЛАВА 3 ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ МАТЕМАТИЧЕСКИХ
МОДЕЛЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ КАТЕГОРИИ ПРЕТЕНЗИИ
КЛИЕНТА СТРАХОВОЙ ФИРМЫ 29
3.1 Описание набора данных 29
3.2 Подготовка данных для исследования 30
3.3 Метрика для оценки качества обучения моделей 37
3.4 Процедура обучения 37
3.5 Построение базовых моделей 38
3.5.1 Применение метода логистической регрессии 38
3.5.2 Применение метода k-ближайших соседей 39
3.5.3 Применение метода Random Forest 41
3.5.4 Применение метода градиентного бустинга (XGBoost) 43
3.5.5 Применение метода Extratreesclassifier 48
3.6 Сравнение моделей и обсуждение результатов 50
Выводы по главе 3 52
ГЛАВА 4 КОММЕРЦИАЛИЗАЦИЯ ПРОЕКТА 53
4.1 Дорожная карта 55
4.2 Бизнес-модель 57
4.3 Команда проекта 58
4.4 Ценообразование 59
Выводы по главе 4 64
ЗАКЛЮЧЕНИЕ 65
БИБЛИОГРАФИЧЕСКИЙ СПИСОК

📖 Введение

В настоящее время страхование является важным сектором, как мировой, так и национальной финансовой системы.
Экономическая сущность страхования состоит в создании денежных фондов за счёт взносов заинтересованных в страховании сторон и предназначенных для возмещения ущерба у лиц, участвующих в формировании этих фондов. Поскольку возможный ущерб (или страховой риск) носит вероятностный характер, то происходит перераспределение страхового фонда, как в пространстве, так и во времени. Можно сказать, что возмещение ущерба у пострадавших лиц происходит за счёт взносов всех, кто участвовал в формировании этих страховых фондов.
Сам процесс обращений клиентов, рассмотрения их заявок, установления виновной стороны и выплаты денег, в некоторых случаях, может занимать довольно долгое время. А с учетом, расширения клиентской базы в страховых компаниях, увеличивается и количество заявок.
Ускорение процесса обработки и рассмотрения обращения клиента является одной из перспективных задач, решение которой благоприятно отразится, как на функционировании компании, так и на времени клиента.
Однако не все страховые компании согласны и могут вести активное развитие в данном вопросе. На сегодняшний момент, приблизительно 67 % страховых компаний считают, что они имеют не полный доступ к данным своих клиентов. По мнению респондентов, таких данных достаточно для успешного взаимодействия с клиентом, но недостаточно для того, чтобы делать прогноз их поведения.
Но, несмотря на это, уже около 30 % страховых компаний, уже на сегодняшний день начинают внедрять новые информационные технологии и аналитику для того, чтобы предсказывать запросы своих клиентов и создавать персонализированные сообщения. Главной проблемой для тех компаний, которые пока не делают этого, становится отсутствие необходимых систем. Большинство страховых компаний, так или иначе, заинтересованы в модернизации своих ИТ- систем в ближайшие пять лет, так что разработка новых методов прогнозирования и оптимизации для сферы страхования является ведущим звеном по усовершенствованию деятельности страховых компаний.
В связи с вышесказанным появляется необходимость поиска путей, направленных на решения проблемы с ускоренным рассмотрением претензий клиентов.
Теоретической и методологической основой дипломного проекта являются труды зарубежных и отечественных ученых в области машинного обучения. Так, например, в российской литературе известны такие авторы как: Барский А.Б., Николенко. С., Кадурин А., Архангельская Е., В. Н. Ручкин, В. А. Фулин., Вьюгин В.В. В зарубежной литературе: Оливье Кален, Джанлука Бонтемпи, Андреа Даль Поццоло, Ян-Ал Ле Боргн, Фабрицио_Карсильо, Константин_Циглер.
Рассмотрев различные точки зрения, можно прийти к выводу, что существуют различные методы прогнозирования, каждый из которых имеет свои достоинства и недостатки.
Объектом исследовательской работы является процесс управления претензиями страховой компании.
Предметом исследования является процесс обнаружения категории претензий, подходящих для ускоренного утверждения.
Целью исследования является разработка математических моделей для прогнозирования категории претензий клиента страховой фирмы, с использованием методов машинного обучения.
Для достижения цели были поставлены следующие задачи:
1) описание процесса обработки заявок клиентов;
2) теоретическое описание машинного обучения, его виды и алгоритмы;
3) анализ и сравнение имеющихся прогнозных методов машинного обучения;
4) формулировка требований к прогнозной модели;
5) построение прогнозной модели;
6) сравнительный анализ результатов прогнозирования;
7) формирование плана коммерциализации.
Научная новизна работы заключается в том, что на основе комплексного анализа:
1. Рассмотрены и проанализированы методы прогнозирования.
2. Проведен сравнительный анализ методов.
3. Разработана модель прогнозирования вероятности категорий претензий клиента страховой фирмы методами XGBoost, Random Forest, Logistic regression, K-nearest neighbors, ExtraTreesClassifier.
4. Проведен сравнительный анализ результатов исследования, сделаны выводы, даны рекомендации.
Практическая значимость работы обусловлена применением результатов исследования на практике, для повышения качества работы страховой фирмы

✅ Заключение

В ходе написания магистерской диссертационной работы, был рассмотрен процесс обработки претензий клиентов страховой фирмы. В качестве инструментов прогнозирования рассматривались методы машинного обучения, начиная от простых методов, таких как логистическая регрессия, заканчивая градиентным бустингом.
Для построения модели прогнозирования методами машинного обучения по средствам языка программирования python, были использованы методы машинного обучения.
Из сравнения моделей мы увидели, что категорию претензии лучше всего предсказывает метод Extratreesclassifier.
В заключение работы был рассмотрен проект коммерциализации. В нем была построена дорожная карата проекта, включающая в себя этапы необходимые для вывода проекта на рынок. Были произведены плановые расчеты затрат на реализацию проекта, а также рассчитана цена на единицу продукции.
Таким образом, была достигнута цель исследования и были выполнены поставленные задачи в начале исследования.

Нужна своя уникальная работа?

Срочная разработка под ваши требования

Рассчитать стоимость

ИЛИ

Поиск аналога

📕 Список литературы

1. MachineLearning.ru[Электронный ресурс] - Режим доступа:
http://www.machinelearning.rU/wiki/images/1/1c/Sem06_metrics.pdf - статья
«Семинары по выбору моделей» (дата задействования 13.02.2020).
2. Николенко С., Кадурин А., Архангельская Е. «Глубокое обучение» Питер, 2018 год, 480 стр., ISBN: 978-5-496-02536-2.
3. Универсальный искусственный интеллект и экспертные системы/ В.Н. Ручкин, В.А. Фулин. - СПб.: БХВ - Петербург, 2009. - 240 с.
4. Математические основы теории машинного обучения и прогнозирования / Вьюгин В.В. - М.: 2013. - 387 с.
5. Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: основы моделирования и первичная обработка данных. - М.: Финансы и статистика, 1983.
6. Jin Zhang: LightGBM: An Effective and Scalable Algorithm for Prediction of Chemical Toxicity-Application to the Tox21 and Mutagenicity Data Sets // Karolinska Institutet, Sweden, 2019.
7. D.J. Hand. Измерение эффективности классификатора: последовательная альтернатива области под кривой roc. Машинное обучение, 77 (1): 103-123, 2009.
8. С. Элкан. Основы обучения с учетом затрат. В Международной совместной конференции по искусственному интеллекту, том 17, страницы 973¬978, 2001.
9. Alejandro Correa Bahnsen, Aleksandar Stojanovic, Djamila Aouada, and Bjorn Ottersten. Стоимость обнаружения мошенничества с использованием кредитных карт с минимальным риском. В Машинном обучении и приложении (ICMLA), 2013 12-я Международная конференция том 1, стр. 333-338. IEEE, 2013.
10. G. Batista, A. Carvalho, and M. Monard. Применение односторонней выборки к несбалансированным наборам данных. MICAI 2000: достижения в области искусственного интеллекта, страницы 315-325, 2000 год.
11. Jin Zhang: LightGBM: An Effective and Scalable Algorithm for Prediction of Chemical Toxicity-Application to the Tox21 and Mutagenicity Data Sets // Karolinska Institutet, Sweden, 2019.
12. Haibo He and Edwardo A Garcia. Учиться на несбалансированных данных. Знание и инженерия данных, IEEE Transactions on, 21(9):1263-1284, 2009.
13. Вьюгин В.В. «Математические основы теории машинного обучения прогнозирования» М.: 2013. - 387 с.
14. Назарова, В.В., Матвеева, Е.А. Концепция риск-менеджмента в страховых организациях /В.В. Назарова, Е.А. Матвеева// [Электронный ресурс]. Научный журнал НИУ ИТМО. Серия «Экономика и экологический менеджмент». - 2014 - №4. - С. 258-275 http://economics.ihbt.ifmo.ru/file/article/11055.pdf.
15. Комлева, Н.В., Янин, А.С., Самиев, П.В. Страхование в системе риск
менеджмента /Н.В. Комлева и др.// [Электронный ресурс]. Бюллетень рейтингового агентства «Эксперт РА». - 2008
http://raexpert.ru/researches/insurance/risk-insurance/.
16. Швецова, И.Н., Шешукова, Е.С. Big Data в страховании: опыт США и использование успешных практик в России /И.Н. Швецова, Е.С. Шешукова// International Scientific Journal. - 2016 - № 10 (20). - С. 125-132.
17. С. Чен, А. Лиу, Л. Брейман. Использование случайного леса для несбалансированных данных. Университет Калифорнии, Беркли 110.
18. Смирнов, Е.А. Страховые компании встают на путь Big Data// Издание о
высоких технологиях «Cnews» [Электронный ресурс -
http: //www. cnews. ru/news/top/strahovye_kompanii_vstayut_na_put_big_data.
19. Claim Management System// [Электронный ресурс]. -
https: //www.researchgate.net/publication/318965364_CLAIM_MANAGEMENT_SY S TEM.
20. Causes and Problem Identification in Construction Claim Management//
[Электронный ресурс]. -https: //www.researchgate.net/publication/330423609_Causes_and_Problem_Identificati on in Construction Claim Management.
21. Tadviser.ru[Электронный ресурс] - Режим доступа:
http://www.tadviser.ru/index.php/ Big_Data_%D0%B8_BI_Day_2019 - статья «BIG DATA И BI DAY 2019» (дата задействования 05.01.2020).
22. Public Liability Claims Management// [Электронный ресурс]. - https://www.researchgate.net/publication/23749078_Public_Liability_Claims_Manage ment. Фостер Проректор. Машинное обучение на основе несбалансированных наборов, данных 101. В материалах семинара AAAI’2000 по несбалансированным наборам данных, 2000 год.
23. Величко, Н.В., Осадчая, Н.Н. К вопросу об управлении рисками в страховании /Н.В. Величко, Н.Н. Осадчая// [Электронный ресурс]. Science Time. - 2015 - №4 (16) - С. 102-109 - http://cyberleninka.ru/article/n/k-voprosu-ob- upravlenii-riskami-v-strahovanii.
24. Аналитический обзор рынка Big Data/ Блог компании ПАО «Московская
Биржа»// [Электронный ресурс]. -
https://habrahabr.ru/company/moex/blog/256747/.Эндрю Эстабрукс, Тэхо Джо и Натали Япкович. Метод множественной повторной выборки для обучения на основе несбалансированных наборов данных. Вычислительный Интеллект, 20(1): стр. 18-36, 2004.
25. Ting Hu and Ting Song: Research on XGboost academic forecasting and analysis modelling // Journal of Physics: Conference Series, Volume 1324, United Kingdom, 2019Алехандро Корреа Бансен, Джамила Аояма и Бьерн Оттерстен. Пример зависимых деревьев принятия решений от затрат. Экспертные системы с приложениями, 2015.
26. Tony Duan, Anand Avati: NGBoost: Natural Gradient Boosting for Probabilistic Prediction// Cornell University, New York, 2019.
21. Монастырный, Е.А. Ресурсный подход к построению бизнес-процессов и коммерциализации разработок / Е.А. Монастырный, Я.Н. Грик // Инновации. - 2004. - № 7. - С. 85-81.
28. Дж. Козметский. Вызов технологических инноваций на пороге новой эры общемировой конкуренции, 1999, 296 с.
29. Ляшин А. Стратегии коммерциализации инноваций — мост между инноватором и бизнесом [Электронный ресурс] // Экономика и жизнь. - 2011, № 36 (9402).
30. Python для сложных задач: наука о данных и машинное обучение. - СПб.: Питер, 2018. - 576 с.

🛒 Оформить заказ

⚡ Работу высылаем в течении 5 минут после оплаты.

Имя

E-mail

Телефон

Дополнительная информация

С условиями приобретения работы согласен

📋 Содержание 📖 Введение ✅ Заключение 📕 Литература 🔍 Похожие 🛒 Купить ⬆️

Оценка стоимости

Предмет *

Гуманитарные дисциплины

Педагогика и образование

Правовые дисциплины

Экономические дисциплины

Технические дисциплины

Биология и медицина

Другое

Естественные науки и экология

Иностранные языки

Математические дисциплины

Программирование и IT

Физика и астрофизика

Химия

Тип работы *

Написание учебных работ

Написание научных работ

Тесты, задачи и экзаменационные материалы

Отчеты по практике

Научные публикации

Эссе и творческие работы

Презентации и защита

Чертежи и графика

Переводы

Программирование и IT

Бизнес и маркетинг

Копирайтинг и работа с текстом

Анализ и исследования

Рецензии и отзывы

Оформление и доработка

Подготовка документов

Методические разработки

Консультации и онлайн-помощь

Прочее

Написание работ

Объем работы *

Срок выполнения *

Это краткая форма заказа. После ее заполнения вы перейдете на полную форму заказа работы

Каталог работ (210005)

Статьи

»» Все статьи

Вход в личный кабинет