Тип работы:
Предмет:
Язык работы:


СКОРИНГОВЫЕ МЕТОДЫ В ЗАДАЧАХ ОБ ЭФФЕКТИВНОСТИ ЭКО

Работа №46957

Тип работы

Магистерская диссертация

Предмет

информатика

Объем работы52
Год сдачи2018
Стоимость4960 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
59
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 3
2. ПОСТАНОВКА ЗАДАЧИ 6
3. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ И ПОНЯТИЯ 7
4. ОПИСАНИЕ МЕТОДОВ 10
a) Логистическая регрессия 11
b) Метод k - ближайших соседей 14
5. ВХОДНЫЕ ДАННЫЕ 16
6. ЧИСЛЕННЫЕ ЭКСПЕРИМЕНТЫ 28
a) Логистическая регрессия 28
b) Метод k - ближайших соседей 31
7. ROC - АНАЛИЗ 33
a) Логистическая регрессия 34
b) Метод k - ближайших соседей 36
8. ЗАКЛЮЧЕНИЕ 43
9. СПИСОК ЛИТЕРАТУРЫ 46
10. ПРИЛОЖЕНИЕ 1 (ЛИСТИНГ ПРОГРАММНОГО КОДА)

Из-за роста количества банковских учреждений, а также рынка кредитования физических лиц неизбежно влечет за собой принятие дополнительных кредитных рисков.
Так как происходит развитие розничного кредитования, вследствие чего банки должны придумывать механизмы для быстрой оценки гражданина на одобрение или отказ от кредита по соответствующим причинам. С каждым годом техника развивается, и соответственно развиваются и механизмы оценка кредитоспособности заемщика.
Механизм должен четко определять кредитоспособность населения, для этого необходим качественный анализ расширяющегося рынка. Под «кредитоспособностью» понимается возможность погашения кредита в срок, но и возможность по уровню заработной платы.
Благодаря конкурентной борьбе между банками, увеличиваются и шансы для одобрения кредитоспособности человека, в связи с этим кредитный рынок разбивается на «высококачественные» доли рынка, а также «не добросовестные», например выдача кредита любому желающему без оценки кредитоспособности заемщика с минимальными временными затратами.
Следовательно из сложившейся ситуации Банк России проводит проверку всех кредитных организаций по реальным затратам потенциальных заемщиков по потребительским кредитам. А также они проверяют на сколько целесообразно выдача кредита заемщику, на сколько велика доля уверенности в нем, так как если заемщик не возвращает кредит, то кредитное учреждение теряет огромные деньги в виде затрат на обработку кредита.
Для этого и были разработаны скоринговые системы, так как называемые механизмы оценки кредитоспособности заемщика. Они были разработаны Дэвидом Дюрана, который, уходя в 40-х г. в армию, оставил своим партнерам по кредитному бизнесу краткий перечень правил по отбору кредитоспособных заемщиков. На тот момент в той или иной форме уже существовал скоринг. Далее скоринговые системы начали лучше анализировать рынок; его потребности, возможности населения, возможности кредитного учреждения. [1]
Формулировка «Скоринговые системы» произошло от английского слова «score» - то есть подсчитывать очки или количество набранных очков. Соответственно скоринговая система - это механизм подсчета очков потенциального заемщика на основе данных о нем, то есть оценка кредитоспособности заемщика. По сути, для кредитной организации скориновая модель позволяет дать четкие ответы на важные вопросы: стоит ли давать кредит этому человеку? Отдаст ли человек в срок кредит? Есть ли у него желание вернуть кредит ранее поставленного срока? и другие вопросы, которые важны для оценки кредитоспособности потенциального заемщика. Чаще всего на практике ответ сводится к двум решениям: выдать кредит или отказать в выдаче кредита, то есть бинарный вывод информации.
Основанием для работы механизма служит анкета или иной другой документ, в котором отображены наиболее значимые характеристики заемщика, по которым можно определить дальнейший ответ по выдаче кредита.
Как правило, перечень характеристик почти везде одинаковый:
— уровень доходов семьи;
— стаж работы на последнем месте работы;
— возраст;
— семейное положение;
— наличие детей;
— количество лиц, проживающих совместно;
— образование;
— должность на работе;
— наличие в собственности недвижимости;
— наличие в собственности автотранспорта;
— стаж вождения автотранспортом;
— количество нарушений правил дорожного движения;
— количество нарушений ПДД с тяжким исходом;
— другие.
Каждую характеристику в скоринге называют фактором. Некоторые факторы имеют числовой вид, а некоторые категоризированные, то есть не числовой вид. Очевидно, что при работе механизма должен делаться упор на наиболее значимые факторы из всех факторов, предоставленных потенциальным заемщиком. Для этого необходим постоянный анализ рынка с точки зрения потенциальных заемщиков, а также с точки зрения кредитных учреждений. [3] Чтобы использовать в скоринге наиболее существенные характеристики для правильного принятия решения. Определением конечного списка характеристик, по которым будет далее работать скоринговая система, может быть сделано на основе экспертных оценок работников кредитного учреждения, а также аналитиками в банковской сфере, и, конечно же, с использованием статических методов. Единственное ограничение на использование статических методов это достаточный по объему массив данных с результатами по кредитам. Поэтому наилучший вариант это экспертная оценка аналитиков или работников в банковской сфере.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В данной работе были проанализированы входные данные, которые описывают процесс ЭКО, а также была произведена нормализация данных, с помощью Min-max нормализации. Далее были построены два скоринговых метода, а именно: метод k- ближайших соседей и логистическая регрессия. Для каждого метода были произведены численные эксперименты и произведен ROC - анализ, в том числе построение roc - кривых на медицинских параметрах. Далее представлена таблица со значениями ROC- анализа (Таблица 13).
Исходя из данной таблицы, можно сделать вывод, что значению площади под кривой AUC лучше прогнозирует событие это логистическая регрессия, при этом оба метода находятся в одном положении по качеству модели «Очень хорошее». Далее если судить по ошибке первого рода, то почти в 6% случаев метод дает отрицательный ответ, когда на самом деле у женщины есть беременность, но если посмотреть по ошибке второго рода, то тут лучший результат дает метод ближайших соседей. Примерно у 8% пациенток метод выдает положительный результат, когда на самом деле беременности нет. Соответственно, основываясь на экспертном мнении врачей - эмбриологов, женщина находясь на протоколе ЭКО, то есть готовясь стать мамой при помощи медицинского вмешательства, находится очень в не размеренном психологическом состоянии, поэтому лучше, чтобы ошибка второго рода была минимальна, так как для женщины в первую очередь, это огромный стресс и если врач дает надежду - определенные гарантии на развитие беременности, то как минимум у женщины это должно произойти.
Далее рассмотрим преимущества и недостатки, выявленные в ходе разработки программного кода скоринговых методов ().
Подводя итог результатов методов, лучше на исходных данных работает логистическая регрессия, но для ее реализации необходима нормализация данных, при этом по некоторым характеристикам лучше работает метод ближайших соседей.
Также в ходе работы были выделены значимые характеристики процесса ЭКО: год проведения процедуры, качество клеток, процент оплодотворения и процент доростания клеток. Иными словами, исход зависит от механизмов и методов, используемых в клинике в определенный год, когда делалась процедура. А также от качества переносимых клеток, которые получились в ходе слияния двух клеток (сперматозоид, яйцеклетка), у которых был определенное качество клеток (подвижность клеток, количество клеток, быстрота деления и тд.). Процент оплодотворения и процент доростания до бластоцисты характеризуют, на сколько способны эти клетки выжить в определенных условиях, так как не все клетки выживают, выживают только сильнейшие.



[1] «Statistics for Biology and Health» авторов: M. Gail, K. Krickeberg, J. Samet, A. Tsiatis, W. Wong.
[2] «Введение в R» авторы: У.Н. Венэбльз, Д. М. Смит и Рабочая группа разработки R
[3] Brett Lantz. Machine Learning with R. Pack Publishing. Birmongham- Mumbai, 2013.
[4] Anderson R. The credit scoring toolkit: theory and practice for retail credit risk management and decision automation. [Text] - New York: Oxford University press, 2007. - 790 p.
[5] Jaccard, J. Interaction effects in logistic regression. [Text] - Thousand Oaks: Sage Publications, 2001. - 70 p.
[6] К. В. Воронцов «Математические методы обучения по прецедентам (теория обучения машин)»
[7] Кузьмичев, Штыря: «Экстракорпоральное оплодотворение. Только факты. Информация к размышлению», 2012
[8] Экстракорпоральное оплодотворение / Кэй Элдер, Брайан Дэйл ; Пер. с англ. - М. : МЕДпресс!информ, 2008.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ