1. Необходимые сведения из теории вероятности 8
1.1. Вероятностное пространство 8
1.2. Условная вероятность 10
1.3. Формула полной вероятности и формула Байеса 11
2. Теоретические основы байесовских сетей доверия 12
2.1. Понятие байесовских сетей, его сущность и характеристики 12
2.1.1. Типы байесовских сетей 13
2.1.2. Обучение сети 15
2.1.3. Процесс рассуждения в байесовских сетях доверия 19
2.1.4. Представление знаний с использованием БСД 20
2.2. Прикладные программы 24
3. Оценка социально-экономических параметров смертности населения
в РФ на основе байесовских сетей доверия 27
3.1. Постановка задачи 27
3.2. Обучение сети 29
3.3. Анализ чувствительности факторов смертности населения 35
Заключение 38
Приложение 41
Реферат
Тема магистерской работы: «Анализ социально-экономических детерминант смертности населения в РФ с использованием байесовских сетей доверия».
Цель исследования - проанализировать социально - экономические показатели смертности населения в РФ с применением байесовских сетей доверия и выявить наиболее значимые факторы смертности.
Предмет исследования - анализ причин смертности на основе байесовских сетей доверия.
Объект исследования - система социально - экономических детерминант смертности.
В результате магистерского исследования решены следующие задачи: раскрыто понятие байесовской сети доверия, проведен анализ методов и моделей оценки факторов смертности на основе изученной литературы; построена байесовская сеть доверия; разработана методика выявления причин и факторов, влияющих на смертность; выделены наиболее значимые социально-экономические детерминанты смертности населения.
Объем работы 40 страниц. Магистерская работа содержит введение, основную часть, состоящую из трех глав, заключения, 11 рисунков, 5 таблиц, 2 приложений и 25 источников библиографического списка литературы.
Работа посвящена анализу факторов смертности населения в РФ.
Во введении обоснована актуальность темы, сформулированы проблемы, поставлены цели и задачи исследования, раскрыта структура работы.
Первая глава посвящена теоретическим основам теории вероятности. В ней даются определения основным понятиям, которые связаны с теорией вероятности. Также приводится формула Байеса.
Вторая глава содержит основные теоретические раскрывающие сущность понятия « байесовские сети доверия».
Третья глава посвящена изучению вопроса о применении байесовской сети доверия. В ней произведен анализ социально-экономических детерминант смертности населения в РФ.
В завершение третьей главы приводятся результаты опытно-экспериментальной работы по анализу факторов смертности населения в РФ. Приведен графический материал, который наглядно показывает влияние факторов на смертность населения.
В заключении приведены основные результаты работы, отражающие поставленные задачи исследования.
Ключевые слова: байесовская сеть доверия, методы анализа факторов, чувствительность модели.
Понятие информационной зависимости между теми или иными объектами любой предметной области является естественным для человеческого мышления. Люди склоны рассуждать в терминах трехуровневых связей между факторами: фактор x влияет на y посредством z. Поэтому попытки сконструировать интуитивно-понятную математическую модель такой предметной области приводят к необходимости использовать язык, который способен ясно выявлять и формулировать непрямые зависимости между факторами [5].
В теории вероятности понятие информационной зависимости между факторами можно сконструировать с применением условной зависимости, которая описывает, как уверенность в исходе некоего события меняется при получении нового знания о фактах, при условии, что уже был известен некоторый набор других фактов.
Удобно и интуитивно понятно представлять зависимости между зависимыми факторами посредством направленного пути, соединяющего эти элементы в графе. Если зависимость между элементами x и y не является непосредственной и осуществляется посредством третьего элемента z, то логично ожидать, что на пути между x и y будет находиться элемент z. Такие узлы-посредники будут «отсекать» исходную зависимость между x и y, то есть моделировать ситуацию условной независимости между ними при известном значении непосредственных факторов влияния [1].
В настоящее время байесовские сети доверия (БСД) являются инструментом, крайне привлекательным при разработке различных экспертных систем и систем искусственного интеллекта. Подобный интерес напрямую связан с накоплением огромного объема информации в естественнонаучных областях и с необходимостью ее анализа при учете постоянного поступления новых данных. Модели на основе БСД способны к самообучению и самосовершенствованию по мере накопления экспериментальной информации. С этим свойством связана относительная нечувствительность таких моделей к возможным ошибочным или неполным данным. Преимуществом моделей БСД является также возможность интеграции разнородных данных - это происходит потому, что БСД моделируют самые общие причинно-следственные зависимости между интересующими исследователя параметрами. Эти зависимости выражены в виде некоторой вероятностной модели, достаточно гибкой для возможного описания причинно-следственных отношений самого общего вида. Алгоритмы обучения байесовских сетей доверия допускают распараллеливание вычислений и могут быть реализованы в виде программ, выполняющихся на суперкомпьютерах.
БСД представляют собой конструкции, обычно представленные графически в виде направленного ациклического графа и таблиц условных вероятностей для каждого узла графа, соответствующих определенным переменным. Процесс работы с ними заключается в выполнении двух основных действий: обучения (формирования таблиц условных вероятностей для каждой переменной графа) БСД на основе имеющихся данных о переменных сети и непосредственного использования БСД для вычисления различных вероятностей, связанных с переменными изучаемой сети [2].
Необходимость анализа факторов смертности обуславливает актуальность данного исследования и определяет его проблему: оценить влияние социально-экономических показателей на смертность в РФ. В рамках решения данной проблемы была определена тема исследования «Анализ социально-экономических детерминант смертности населения в РФ на основе байесовских сетей доверия».
Цель данной работы - проанализировать социально- экономические показатели смертности населения в РФ с применением байесовских сетей доверия и выявить наиболее значимые факторы смертности.
В связи с этим ставятся и решаются следующие задачи:
1. анализ методов и моделей оценки факторов смертности;
2. построение байесовской сети доверия;
3. обучение байесовской сети;
4. разработка методик выявления причин и факторов, влияющих на показатель смертность населения.
Объект исследования - система социально - экономических детерминант смертности населения.
Предмет исследования - анализ причин смертности на основе байесовских сетей доверия.
В ходе научной работы использовались следующие теоретические и математические методы исследования:
1. изучение и анализ литературы по проблеме исследования;
2. сбор данных;
3. анализ полученных показателей.
Новизна исследования заключается в том, что при помощи байесовских сетей доверия выделены наиболее значимые факторы смертности населения, которые можно использовать для повышения уровня жизни населения.
Практическая значимость исследования определяется тем, что выделенные в ней социально-экономические детерминанты смертности могут найти применение в решении государственных задач.
Представление непрямых зависимостей между факторами с помощью байесовских сетей доверия является наглядным и удобным в использовании инструментом.
Целью настоящего исследования являлся анализ социально-экономические показатели смертности населения в РФ с применением байесовских сетей доверия. Практически значимым было выявить наиболее значимые показатели смертности населения.
В основу работы положены данные о 15 социально-экономических детерминант смертности. Структура и все показатели модели взяты из литературной информации по данной проблеме.
В настоящем исследовании разработана байесовская сеть, для анализа социально-экономических детерминант смертности населения в РФ. Поставлена задача - нахождения наиболее значимых показателей смертности населения. Сформулирован метод решения таких задач. Этот метод применен к практическим данным.
Разработка компьютерного теста реализована с помощью пакета программ NETICA и HUGIN. На основании программного комплекса сделан вывод о чувствительности модели.
Математическая часть работы заключалась в обосновании значимости предложенных социально-экономических детерминант смертности. Для расчетов применялась формула Байеса, в результате которых были выделены наиболее значимые показатели смертности:
1. уровень безработицы;
2. соотношение среднедушевых денежных доходов с величиной прожиточного минимума;
3. заболеваемость с установленным диагнозом алкоголизма и алкогольного психоза;
4. возрастной состав населения моложе трудоспособного возраста.
Улучшение качества вероятностных оценок модели может быть достигнуто добавлением дополнительных входных узлов и обучением сети с помощью статистических данных.
Вывод: поставленные задачи в основном решены, цель, сформулированная во введении достигнута.
Основные результаты магистерского исследования были представлены на III Региональная конференция «Мой выбор - НАУКА!».