БАЙЕСОВСКИЙ ПОДХОД В КРЕДИТНОМ СКОРИНГЕ
|
Введение 3
1 Предварительные сведения 6
1.1 Байесовские сети 6
1.2 Методы построения БС 10
1.3 Задачи обучения по прецедентам 17
1.4 Задача кредитного скоринга 20
2 Общая задача классификации 22
2.1 Вероятностная постановка задачи классификации 22
2.2 Вероятностная постановка задачи кредитного скоринга 23
3 Решение задачи кредитного скоринга 24
3.1 Построение минимизирующего алгоритма 26
3.2 Принцип максимума апостериорной вероятности 27
3.3 Наивный байесовский классификатор 28
3.4 Нахождение эмпирических оценок 29
3.4.1 Непараметрическая оценка 29
3.4.2 Метод Парзеновского окна 31
3.4.3 Параметрическая оценка 32
3.5 Логистическая регрессия 35
3.6 Построение байесовской сети для задачи кредитного скоринга ... 37
3.7 Решение скоринговой задачи методом Байеса 38
4 Комплекс программ 42
Заключение 52
Список сокращений 53
Список использованных источников 54
Приложение A-Б 57-63
1 Предварительные сведения 6
1.1 Байесовские сети 6
1.2 Методы построения БС 10
1.3 Задачи обучения по прецедентам 17
1.4 Задача кредитного скоринга 20
2 Общая задача классификации 22
2.1 Вероятностная постановка задачи классификации 22
2.2 Вероятностная постановка задачи кредитного скоринга 23
3 Решение задачи кредитного скоринга 24
3.1 Построение минимизирующего алгоритма 26
3.2 Принцип максимума апостериорной вероятности 27
3.3 Наивный байесовский классификатор 28
3.4 Нахождение эмпирических оценок 29
3.4.1 Непараметрическая оценка 29
3.4.2 Метод Парзеновского окна 31
3.4.3 Параметрическая оценка 32
3.5 Логистическая регрессия 35
3.6 Построение байесовской сети для задачи кредитного скоринга ... 37
3.7 Решение скоринговой задачи методом Байеса 38
4 Комплекс программ 42
Заключение 52
Список сокращений 53
Список использованных источников 54
Приложение A-Б 57-63
Вероятностный подход к представлению знаний состоит в том, что область знаний представляется совокупностью переменных и совместным распределением их вероятностей или его приближением. Это позволяет вычислить или оценить условное распределение вероятностей части переменных (гипотезы), когда некоторые из остальных (наблюдение) приняли определенное значение.
На основании сведений о распределении вероятностей можно:
- определить ожидаемые значения ненаблюдаемых переменных и их совокупностей;
- подтвердить или отвергнуть гипотезы о событиях (о том, что переменные приняли совокупность значений);
- верифицировать (обнаружить противоречия или убедиться в их отсутствии) значения переменных, составивших наблюдение.
Вероятностный подход также носит практическую ценность, поскольку позволяет использовать графическое представление для решения теоретических задач. Вероятностные сети широко применены в прикладных отраслях жизнедеятельности, в особенности в экономике и статистике. Одной из областей применения вероятностного подхода является скоринговые задачи, поскольку они основываются на условном распределении вероятностей. В работе рассматривается вероятностный подход к описанию скоринговых задач с помощью дискретных байесовских сетей.
Выбор темы данной магистерской диссертации связан с тем, что одной из важнейших задач остается разработка методов определения, изучения и применения вероятностных сетей в таких сферах как экономика, статистики и наука в целом.
Объектом исследования в представленной диссертации выступает теория вероятностных сетей. Предмет исследования: применение дискретных байесовских сетей к решению скоринговых задач.
Основной целью работы является описание и изучение методов решения задач скоринга с помощью аппарата дискретных байесовских сетей.
Данная цель достигается путем решения следующих задач:
1. Провести обзор и анализ литературы по вероятностным сетям.
2. Изучить определение и характеристики дискретных байесовских сетей и методы их построения.
3. Рассмотреть определение скоринга и его характеристики. Изучить постановку задачи скоринга. Получить алгоритмы её решения с помощью дискретных байесовских сетей.
4. Разработать комплекс программ, реализующий решение задачи кредитного скоринга по имеющейся выборке.
Методы исследования основаны на использовании теории вероятностей, теории вероятностных сетей, теории машинного обучения и задач обучения по прецедентам.
В основе байесовского подхода к решению скоринговых задач лежит аппарат дискретных байесовких сетей, подробное описание которого можно найти в работах [14, 27, 20]. Для построения и обучения дискретных байесовских сетей удобно использовать методы машинного обучения, описанные в работах [4, 13]. Методы построения эмпирических оценок плотностей вероятностей для компонентов дискретных байесовских сетей, а также нахождение алгоритмов решения для задач классификации рассмотрены в курсе лекций [9]. Понятие кредитного скоринга, а также оценки рисков для решения задач кредитного скоринга были рассмотрены в работе [26].
Теоретическая значимость работы заключается в применении аппарата дискретных байесовских сетей в решении общих задач классификации.
Результаты, полученные в работе, могут быть применены для анализа и решения скоринговых задач. Разработан комплекс программ, позволяющий решать задачи классификации по эмпирически полученным данным.
Основные результаты диссертации докладывались и обсуждались на международной конференции студентов, аспирантов и молодых ученых «Проспект Свободный-2016». По теме магистерской диссертации опубликована статья в трудах конференции в трудах указанной конференции.
Постановка изложенных в диссертации задач была сделана научным руководителем магистранта, кандидатом физико-математических наук, доцентом Семеновой Д.В. Формализация и обоснование полученных в диссертации результатов, математические выкладки, численные расчеты выполнены лично автором.
Представленная работа состоит из четырех глав.
В первой главе большое внимание уделено теории вероятностных сетей, задачам обучения по прецендентам и теории скоринга. Здесь приведены основные определения необходимые для дальнейшего исследования, в частности, определения дискретных байесовских сетей и скоринга.
Во второй главе сформулированы общие вероятностные постановки задачи классификации и задачи кредитного скоринга.
В третьей главе описана постановка задачи кредитного скоринга по имеющейся выборке и алгоритмы её решения с помощью дискретных байесовских сетей.
Четвертая глава содержит описание комплекса программ и вычислительных алгоритмов решения задачи, описанной в главе 3.
Резюме. Во введении кратко описан объект исследования, сформулирована цель магистерской диссертационной работы, а также выделены её задачи. Перечислены основные публикации по теме работы и дана общая характеристика магистерской диссертации.
На основании сведений о распределении вероятностей можно:
- определить ожидаемые значения ненаблюдаемых переменных и их совокупностей;
- подтвердить или отвергнуть гипотезы о событиях (о том, что переменные приняли совокупность значений);
- верифицировать (обнаружить противоречия или убедиться в их отсутствии) значения переменных, составивших наблюдение.
Вероятностный подход также носит практическую ценность, поскольку позволяет использовать графическое представление для решения теоретических задач. Вероятностные сети широко применены в прикладных отраслях жизнедеятельности, в особенности в экономике и статистике. Одной из областей применения вероятностного подхода является скоринговые задачи, поскольку они основываются на условном распределении вероятностей. В работе рассматривается вероятностный подход к описанию скоринговых задач с помощью дискретных байесовских сетей.
Выбор темы данной магистерской диссертации связан с тем, что одной из важнейших задач остается разработка методов определения, изучения и применения вероятностных сетей в таких сферах как экономика, статистики и наука в целом.
Объектом исследования в представленной диссертации выступает теория вероятностных сетей. Предмет исследования: применение дискретных байесовских сетей к решению скоринговых задач.
Основной целью работы является описание и изучение методов решения задач скоринга с помощью аппарата дискретных байесовских сетей.
Данная цель достигается путем решения следующих задач:
1. Провести обзор и анализ литературы по вероятностным сетям.
2. Изучить определение и характеристики дискретных байесовских сетей и методы их построения.
3. Рассмотреть определение скоринга и его характеристики. Изучить постановку задачи скоринга. Получить алгоритмы её решения с помощью дискретных байесовских сетей.
4. Разработать комплекс программ, реализующий решение задачи кредитного скоринга по имеющейся выборке.
Методы исследования основаны на использовании теории вероятностей, теории вероятностных сетей, теории машинного обучения и задач обучения по прецедентам.
В основе байесовского подхода к решению скоринговых задач лежит аппарат дискретных байесовких сетей, подробное описание которого можно найти в работах [14, 27, 20]. Для построения и обучения дискретных байесовских сетей удобно использовать методы машинного обучения, описанные в работах [4, 13]. Методы построения эмпирических оценок плотностей вероятностей для компонентов дискретных байесовских сетей, а также нахождение алгоритмов решения для задач классификации рассмотрены в курсе лекций [9]. Понятие кредитного скоринга, а также оценки рисков для решения задач кредитного скоринга были рассмотрены в работе [26].
Теоретическая значимость работы заключается в применении аппарата дискретных байесовских сетей в решении общих задач классификации.
Результаты, полученные в работе, могут быть применены для анализа и решения скоринговых задач. Разработан комплекс программ, позволяющий решать задачи классификации по эмпирически полученным данным.
Основные результаты диссертации докладывались и обсуждались на международной конференции студентов, аспирантов и молодых ученых «Проспект Свободный-2016». По теме магистерской диссертации опубликована статья в трудах конференции в трудах указанной конференции.
Постановка изложенных в диссертации задач была сделана научным руководителем магистранта, кандидатом физико-математических наук, доцентом Семеновой Д.В. Формализация и обоснование полученных в диссертации результатов, математические выкладки, численные расчеты выполнены лично автором.
Представленная работа состоит из четырех глав.
В первой главе большое внимание уделено теории вероятностных сетей, задачам обучения по прецендентам и теории скоринга. Здесь приведены основные определения необходимые для дальнейшего исследования, в частности, определения дискретных байесовских сетей и скоринга.
Во второй главе сформулированы общие вероятностные постановки задачи классификации и задачи кредитного скоринга.
В третьей главе описана постановка задачи кредитного скоринга по имеющейся выборке и алгоритмы её решения с помощью дискретных байесовских сетей.
Четвертая глава содержит описание комплекса программ и вычислительных алгоритмов решения задачи, описанной в главе 3.
Резюме. Во введении кратко описан объект исследования, сформулирована цель магистерской диссертационной работы, а также выделены её задачи. Перечислены основные публикации по теме работы и дана общая характеристика магистерской диссертации.
В данной работе на базе кредитных историй имеющихся клиентов банка решается задача нахождения вероятности того, что произвольный клиент погасит просроченную задолженность. В ходе работы были решены следующие задачи.
- Проведен обзор англоязычной и русскоязычной литературы по теории вероятностных сетей, изучены свойства байесовских сетей и методы их обучения, а также, рассмотрена задача классификации и методы её решения.
- Разработан алгоритм решения скоринговых задач с помощью дискретных байесовских сетей.
- С помощью метода ОМД найдена оптимальная структура для поставленной скоринговой задачи.
- Разработан комплекс программ, реализующий решение задачи кредитного скоринга по данным известной выборки
- Решена задача скоринга по данным известной выборки.
Таким образом, в работе было исследовано применение аппарата дискретных байесовских сетей к задачам обучения по прецендентам, в частности, к задаче классификации клиентов банка по имеющейся кредитной истории.
Данная работа докладывалась на международной конференции студентов, аспирантов и молодых ученых «Проспект Свободный-2016» и была принята к публикации в сборнике по материалам конференции.
- Проведен обзор англоязычной и русскоязычной литературы по теории вероятностных сетей, изучены свойства байесовских сетей и методы их обучения, а также, рассмотрена задача классификации и методы её решения.
- Разработан алгоритм решения скоринговых задач с помощью дискретных байесовских сетей.
- С помощью метода ОМД найдена оптимальная структура для поставленной скоринговой задачи.
- Разработан комплекс программ, реализующий решение задачи кредитного скоринга по данным известной выборки
- Решена задача скоринга по данным известной выборки.
Таким образом, в работе было исследовано применение аппарата дискретных байесовских сетей к задачам обучения по прецендентам, в частности, к задаче классификации клиентов банка по имеющейся кредитной истории.
Данная работа докладывалась на международной конференции студентов, аспирантов и молодых ученых «Проспект Свободный-2016» и была принята к публикации в сборнике по материалам конференции.



