Тема: ОБНАРУЖЕНИЕ МОШЕННИЧЕСТВА В АВТОСТРАХОВАНИИ
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Введение 3
1 Общая характеристика и сущность мошенничества 5
1.1 Мошенничество в страховании и автостраховании: понятия, сущность и виды 5
1.2 Основные способы (схемы) мошеннических действий в сфере автострахования ..11
1.3 Методы обнаружения мошенничества в автостраховании 16
2 Теоретические основы интеллектуального анализа данных и машинного обучения 20
2.1 Основные понятия интеллектуального анализа данных и машинного обучения ...20
2.2 Существующие виды и методы машинного обучения 25
3 Практическое применение интеллектуального анализа данных и методов машинного
обучения 40
3.1 Подготовка данных 40
3.2 Результаты применения нескольких методов машинного обучения для
обнаружения мошенничества в автостраховании и основные выводы 45
Заключение 56
Список использованных источников и литературы 58
Приложение А Тепловая карта, построенная с целью обнаружения мультиколлинеарности
признаков в исходном наборе данных
📖 Введение
Проблема мошенничества в страховании с каждым годом становится более острой. За последние несколько лет количество мошенников увеличивается. Создаются целые цепочки, в которые могут быть включены криминальные люди, сотрудники подразделений страховщиков, правоохранители и судьи.
Методы по присвоению денег страховых компаний становятся все более сложными и продуманными, суммы увеличиваются. Автострахование - самый массовый вид страхования, так как является обязательным в большинстве стран мира. Рост международного рынка страхования автотранспортных средств сопровождается криминализацией данной сферы, поскольку постоянное увеличение финансовых средств, находящихся в обороте страховых компаний, привлекает все больше криминальных структур и отдельных лиц, желающих получить материальную выгоду незаконным путем [6].
В связи с усложнением схем реализации мошеннических действий в автостраховании возникает трудность в обнаружении конкретных признаков преступления, поскольку с изменением схем мошенничества связано и изменение признаков, на которые стоит обращать более пристальное внимание, т. е. тех признаков, которые могли бы с большой вероятностью указать на попытку мошенничества. Отсюда следует и сложность в сборе доказательной базы.
Цель работы - построение моделей для определения мошеннических действий в сфере автомобильного страхования путем применения интеллектуального анализа данных, машинного обучения.
Для достижения поставленной цели были сформулированы следующие задачи:
1. Рассмотреть понятие и сущность мошенничества в автостраховании.
2. Изучить существующие методы мошенничества в сфере автострахования.
3. Изучить традиционные и наиболее применяемые методы обнаружения мошеннических действий в сфере страхования автомобилей.
4. Изучить теоретические основы интеллектуального анализа данных и машинного обучения.
5. Рассмотреть существующие методы интеллектуального анализа данных, в частности машинного обучения, и меры их оценки.
6. Произвести подготовку набора данных (dataset) для дальнейшего построения моделей.
7. Провести обучение моделей логистической регрессии, деревьев решений, случайного леса и метода опорных векторов на обучающей выборке и тестирование на тестовой выборке с целью выявления мошеннических действий со стороны лиц - участников страховых отношений.
8. Выявить модель с наиболее точным прогнозом и основные недостатки данного метода в обнаружении такого рода преступлений.
Объектом исследования является рынок автострахования.
В качестве предмета исследования выделены случаи мошеннических действий со стороны участников страховых отношений в области автострахования.
В процессе работы использовались как абстрактные методы (системный анализ и синтез, абстрагирование, обобщение, изучение и анализ литературы), так и практические (наблюдение, расчеты, измерения, моделирование). Обучение и тестирование моделей реализовано с помощью jupyter-notebook.
✅ Заключение
В ряде стран мошенничество в автостраховании с каждым годом приобретает все большую популярность, поскольку в большинстве стран является обязательным для каждого водителя.
Согласно цели данной работы были построены модели для определения мошеннических действий в автостраховании путем применения популярного направления искусственного интеллекта - машинного обучения. Каждая из поставленных задач выпускной квалификационной работы была реализована.
В первой главе были раскрыты теоретические основы мошенничества в автостраховании, были определены понятие мошенничества в автостраховании и его виды. Кроме этого, были описаны и основные, наиболее популярные схемы мошеннических действий в этой области на настоящий момент и описаны возможные методы их обнаружения.
Во второй главе акцент был сделан на теорию интеллектуального анализа данных, Data Science (науку о данных), Data Mining (анализ данных) и Machine Learning (машинное обучение), рассмотрены их основные понятия, которые являются важными для понимания с целью дальнейшего построения моделей.
Более подробно во второй главе были рассмотрены существующие виды машинного обучения и соответствующие им методы, в т.ч. в главе были раскрыты способы оценки получившихся результатов моделей.
В рамках третьей главы была проведена подготовка исходного анализа данных: заменены и очищены пропущенные значения, снижено влияние выбросов на весь набор данных (dataset) в целом, проведено исследование данных на мультиколлинеарность признаков, выявлена зависимость между несколькими характеристиками данных, часть признаков была удалена в связи с отсутствием в них необходимости.
Из набора данных была сформирована обучающая выборка, состоящая из 75% случайно выбранных строк для построения нескольких моделей машинного обучения: логистическая регрессия, метод опорных векторов, деревья решений и случайный лес. Тестовая выборка, в свою очередь, состояла из 25% данных, соответственно. Получилось добиться точности предсказания результатов модели на уровне 81% на данных тестовой выборки с помощью модели классификации логистической регрессии, которая продемонстрировала наилучший результат из всех рассмотренных методов.
У помянутые в работе методы машинного обучения продемонстрировали достаточно хорошие результаты на тестовой выборке, однако стоит отметить, что сам набор данных был недостаточно большим, что могло сказаться и на полученных результатах. Недостаточное количество случаев мошенничества могло привести к тому, что модель неверно классифицировала мошенничество и наоборот, для улучшения качества прогноза моделей может быть рекомендовано использование более объемного набор данных. В целом полученные результаты подтверждают возможность практического применения модели на реальных данных.
Машинное обучение, как и искусственный интеллект, открывает новые горизонты развития сферы интеллектуального анализа данных в целом, что в будущем позволит еще более эффективно бороться с преступлениями в области мошенничества в автостраховании.
Таким образом, задачи работы выполнены в полном объеме, цель достигнута.





