Алгебраические байесовские сети: представление данных, алгоритмы обработки и реинжиниринг комплекса программ (проектная работа)
|
Введение 4
1. Алгебраические байесовские сети: структура и оценки
вероятности истинности 9
1.1. Введение
1.2. Структура АБС
1.3. Локальный априорный и апостериорный вывод . . . . . . 13
1.4. Выводы по главе
2. Алгебраические байесовские сети: база данных 20
2.1. Введение
2.2. Выбор технологий
2.4. Существующие проблемы и их решение
2.5. Выводы по главе
3. Расширенная документация:
материалы для методического пособия 31
3.1. Введение
3.2. Структура
3.3. Аналитическая проверка: численные эксперименты
3.4. Программная проверка
3.5. Выводы по главе
Заключение 40
Список литературы
1. Алгебраические байесовские сети: структура и оценки
вероятности истинности 9
1.1. Введение
1.2. Структура АБС
1.3. Локальный априорный и апостериорный вывод . . . . . . 13
1.4. Выводы по главе
2. Алгебраические байесовские сети: база данных 20
2.1. Введение
2.2. Выбор технологий
2.4. Существующие проблемы и их решение
2.5. Выводы по главе
3. Расширенная документация:
материалы для методического пособия 31
3.1. Введение
3.2. Структура
3.3. Аналитическая проверка: численные эксперименты
3.4. Программная проверка
3.5. Выводы по главе
Заключение 40
Список литературы
Актуальность темы исследования. Теория вероятностных графических моделей (ВГМ) [36] является одной из областей искуственного интеллекта, дающей возможность связать понятия данных, вероятностной логики и теории графов. Соединяя эти понятия, исследователь получает возможность анализировать данные, принимая во
внимание их связанность между собой (например, последовательность
состояний или причинно-следственные связи). К ВГМ относятся такие
модели как марковские цепи и байесовские сети доверия, имеющие широкое применение и родственные алгебраическим байесовским сетям,
рассматриваемым в данной работе. Вероятностные графические модели имеют широкое применение в ряде областей и давно подтвердили
свою состоятельность [5, 9, 10, 14]. Они в настоящее время активно
применяются в системах распознавания образов [22, 25], интеллектуальных системах поддержки принятия решений и рекомендательных
системах [3, 4, 6, 13], системах моделирования рисков и обнаружения
отказов [7, 15, 18, 31], оценивания повреждений и мониторинга состояния здоровья [1, 2, 8] и системах моделирования отклика экологических
систем на различные изменения и воздействия [11, 17].
Одним из видов ВГМ является структура алгебраических байесовских сетей (АБС) [26, 27], предполагающая декомпозицию базы знаний
на небольшие объемы данных, тесно связанных между собой, что позволяет ускорить алгоритмы обработки за счет возможности работать
с ограниченным набором элементов. Иным фактором, влияющим на
качество и скорость работы алгоритмов модели, является постановка
решаемых задач. Кроме того, АБС предполагают наличие интервальных вероятностных оценок, что дает возможность расширить оценки
на узлах фрагментов знаний.
В настоящее время ведется работа над проектом web-платформы
«AlgBN Web App» по работе и обучению АБС [28]. В рамках данного
проекта используется математическая библиотека, основанния на комплексе программ «AlgBN Math Library» [19, 30], который не имеет достаточно подробной обучающей документации для быстрого освоения.
Так как на данном комплексе программ основана большая часть существующих ныне исследований, то был необходим способ быстрого ознакомления с комплексом для его освоения. В связи с этим в данной
работе были созданы кейсы тестов, охватывающие всю функциональность комплекса программ, которые были оформлены в расширенную документацию по комплексу программ, что является основой для создания методического пособия по основам теории АБС и комплексу программ для их обработки.
Также разработанный комплекс программ не включает в себя базу
данных, позволяющую удаленно хранить данные для работы с ними.
Существующее решение [33] (разработанная схема базы данных) является устаревшим, не учитывающим новейшие теоретические результаты. Кроме того, разрабатываемая web-платформа также нуждается в
базе данных для хранения АБС и работы с ними. Поэтому в рамках
данной работы была разработана и реализована база данных для хранения АБС и работы с АБС.
Целью данной выпускной квалификационной работы является создание базы данных для хранения АБС и работы с ними с сопутствующей подготовкой материалов для методического пособия в рамках web-платформы «AlgBN Web App» по обучению теории АБС. Для
достижения данной цели были поставлены следующие задачи:
1. Проектирование схемы базы данных;
2. Реализация базы данных средствами СУБД MS SQL Server;
3. Создание уровня доступа к данным (DAL);
4. Разработка кейсов тестов к комплексу программ «AlgBN Math
Library» и их реализация на языке С#;
5. Создание расширенной документации к комплексу программ «AlgBN Math Library».
5Методы исследования. Для решения поставленных задач в данной области понадобилось изучить методические материалы, поставить
проблему, проанализировать ее, спроектировать несколько вариантов
решения. Затем были выбраны подходящие средства и технологии программирования, связанные с языком реализации (C#, SQL), средой
разработки (Visual Studio, MS SQL Sever).После чего были проведены численные и программные эксперименты, позволяющие написать
методическое пособие. А также были проведены тестовые случаи для
обоснования корректности полученной базы данных. В качестве методов решения используются теоретические методы (анализ предыдущих результатов), методы объектно-ориентированного программирования (ООП), методы проектирования баз данных.
Публикации. По теме дипломного проекта было подготовлено научных публикаций:
• А.И. Бирилло Локальный синтез согласованных оценок истинности в алгебраических байесовских сетях: вычислительные эксперименты // Материалы 6-й всероссийской научной конференции
по проблемам информатики СПИСОК-2016. (26–29 апреля 2016 г.
Санкт-Петербург). СПб.: ВВМ, 2016. С. 453–459.
• А.И. Бирилло, Анализ согласованности оценок истинности в локальном априорном и апостериорном выводе в алгебраических
байесовских сетях: вычислительные эксперименты // Региональная информатика (РИ-2016). XV Санкт-Петербургская международная конференция «Региональная информатика (РИ-2016)»
(Санкт-Петербург, 26-28 октября 2016 г.): Материалы конференции. СПб.: СПОИСУ, 2016, С. 515
• А.А. Золотин, Е.А. Мальчевская, А.И. Бирилло, А.Л. Тулупьев,
Управление согласованностью оценок вероятностей в локальном
апостериорном выводе в алгебраических байесовских сетях // 9-я
Российская мультиконференция по проблемам управления, материалы 9-й конференции ”Информационные технологии в управлении” (ИТУ-2016) - СПб: АО ”Концерн ”ЦНИИ ”Электроприбор”,
2016, С. 52 – 61.
• А. А. Золотин, Д. Г Левенец., М. А. Зотов, А. И. Бирилло, А. И.
Березин, А. В. Иванова, А. Л. Тулупьев, Алгоритмы обработки
и визуализации алгебраических байесовских сетей. // Образовательные технологии и общество, 2017.
• E. Malchevskaya, N. Kharitonov, A. Zolotin, A. Birillo, Algebraic
Bayesian Networks: Probabilistic-Logic Inference Algorithms and
Storage Structures //Finnish-Russian University Cooperation in
Telecommunications, 3 - 7 april 2017 (в печати)
• E. Malchevskaya, A. Birillo, A. Zolotin, A. Tulupyev, Local Propagation
Algorithms in Algebraic Bayesian Networks and Related Models: Final
Rendering to Matrix-Vector Equations // Intelligent Information
Technologies for Industry, 14 - 16 september 2017 (на рецензировании)
Кроме того была отправлена заявка на регистрацию в Роспатент. Данная выпускная квалификационная работа бакалавра содержит материалы исследований, частично поддержанных грантом РФФИ
15-01-09001 — «Комбинированный логико-вероятностный графический
подход к представлению и обработке систем знаний с неопределенностью: алгебраические байесовские сети и родственные модели».
Структура и объем работы. Работа состоит из введения, трех глав, заключения и используемой литературы.
Первая глава носит обзорный характер и состоит из 4 разделов. В
первом разделе содержатся общие сведения об АБС. Во втором разделе подробно описана структура АБС, а также даны все необходимые
определения и понятия по данной тематике. В третьем разделе изложены основные теоретические сведения по локальному априорному и
апостериорному выводу в АБС. Четвертый раздел содержит основные выводы по данной главе.
Вторая глава описывает разработанную базу данных и состоит из
5 разделов. Первый раздел описывает существующее решение и структуру данной главы. Второй раздел содержит обзор на существующие
технологии и обоснование выбранной СУБД. Третий раздел содержит
подробное описание разработанной базы данных с соответствующими
схемами. Четвертый раздел описывает существующие при проектировании и реализации проблемы, а также их решение. Пятый раздел содержит выводы по текущей главе.
Третья глава содержит описание созданных материалов к методическому пособию к комплексу программ «AlgBN Math Library» и состоит также из 5 разделов. Первый раздел описывает необходимость создания данного пособия, а также используемые при создании технологии.
Второй раздел содержит подробное описание структуры разработанных материалов (основные разделы, их описание). Третий раздел описывает аналитическую проверку разработанных кейсов тестов. Четвертый раздел содержит подробное описание программной проверки для кейсов тестов. Пятый раздел содержит выводы по данной главе.
внимание их связанность между собой (например, последовательность
состояний или причинно-следственные связи). К ВГМ относятся такие
модели как марковские цепи и байесовские сети доверия, имеющие широкое применение и родственные алгебраическим байесовским сетям,
рассматриваемым в данной работе. Вероятностные графические модели имеют широкое применение в ряде областей и давно подтвердили
свою состоятельность [5, 9, 10, 14]. Они в настоящее время активно
применяются в системах распознавания образов [22, 25], интеллектуальных системах поддержки принятия решений и рекомендательных
системах [3, 4, 6, 13], системах моделирования рисков и обнаружения
отказов [7, 15, 18, 31], оценивания повреждений и мониторинга состояния здоровья [1, 2, 8] и системах моделирования отклика экологических
систем на различные изменения и воздействия [11, 17].
Одним из видов ВГМ является структура алгебраических байесовских сетей (АБС) [26, 27], предполагающая декомпозицию базы знаний
на небольшие объемы данных, тесно связанных между собой, что позволяет ускорить алгоритмы обработки за счет возможности работать
с ограниченным набором элементов. Иным фактором, влияющим на
качество и скорость работы алгоритмов модели, является постановка
решаемых задач. Кроме того, АБС предполагают наличие интервальных вероятностных оценок, что дает возможность расширить оценки
на узлах фрагментов знаний.
В настоящее время ведется работа над проектом web-платформы
«AlgBN Web App» по работе и обучению АБС [28]. В рамках данного
проекта используется математическая библиотека, основанния на комплексе программ «AlgBN Math Library» [19, 30], который не имеет достаточно подробной обучающей документации для быстрого освоения.
Так как на данном комплексе программ основана большая часть существующих ныне исследований, то был необходим способ быстрого ознакомления с комплексом для его освоения. В связи с этим в данной
работе были созданы кейсы тестов, охватывающие всю функциональность комплекса программ, которые были оформлены в расширенную документацию по комплексу программ, что является основой для создания методического пособия по основам теории АБС и комплексу программ для их обработки.
Также разработанный комплекс программ не включает в себя базу
данных, позволяющую удаленно хранить данные для работы с ними.
Существующее решение [33] (разработанная схема базы данных) является устаревшим, не учитывающим новейшие теоретические результаты. Кроме того, разрабатываемая web-платформа также нуждается в
базе данных для хранения АБС и работы с ними. Поэтому в рамках
данной работы была разработана и реализована база данных для хранения АБС и работы с АБС.
Целью данной выпускной квалификационной работы является создание базы данных для хранения АБС и работы с ними с сопутствующей подготовкой материалов для методического пособия в рамках web-платформы «AlgBN Web App» по обучению теории АБС. Для
достижения данной цели были поставлены следующие задачи:
1. Проектирование схемы базы данных;
2. Реализация базы данных средствами СУБД MS SQL Server;
3. Создание уровня доступа к данным (DAL);
4. Разработка кейсов тестов к комплексу программ «AlgBN Math
Library» и их реализация на языке С#;
5. Создание расширенной документации к комплексу программ «AlgBN Math Library».
5Методы исследования. Для решения поставленных задач в данной области понадобилось изучить методические материалы, поставить
проблему, проанализировать ее, спроектировать несколько вариантов
решения. Затем были выбраны подходящие средства и технологии программирования, связанные с языком реализации (C#, SQL), средой
разработки (Visual Studio, MS SQL Sever).После чего были проведены численные и программные эксперименты, позволяющие написать
методическое пособие. А также были проведены тестовые случаи для
обоснования корректности полученной базы данных. В качестве методов решения используются теоретические методы (анализ предыдущих результатов), методы объектно-ориентированного программирования (ООП), методы проектирования баз данных.
Публикации. По теме дипломного проекта было подготовлено научных публикаций:
• А.И. Бирилло Локальный синтез согласованных оценок истинности в алгебраических байесовских сетях: вычислительные эксперименты // Материалы 6-й всероссийской научной конференции
по проблемам информатики СПИСОК-2016. (26–29 апреля 2016 г.
Санкт-Петербург). СПб.: ВВМ, 2016. С. 453–459.
• А.И. Бирилло, Анализ согласованности оценок истинности в локальном априорном и апостериорном выводе в алгебраических
байесовских сетях: вычислительные эксперименты // Региональная информатика (РИ-2016). XV Санкт-Петербургская международная конференция «Региональная информатика (РИ-2016)»
(Санкт-Петербург, 26-28 октября 2016 г.): Материалы конференции. СПб.: СПОИСУ, 2016, С. 515
• А.А. Золотин, Е.А. Мальчевская, А.И. Бирилло, А.Л. Тулупьев,
Управление согласованностью оценок вероятностей в локальном
апостериорном выводе в алгебраических байесовских сетях // 9-я
Российская мультиконференция по проблемам управления, материалы 9-й конференции ”Информационные технологии в управлении” (ИТУ-2016) - СПб: АО ”Концерн ”ЦНИИ ”Электроприбор”,
2016, С. 52 – 61.
• А. А. Золотин, Д. Г Левенец., М. А. Зотов, А. И. Бирилло, А. И.
Березин, А. В. Иванова, А. Л. Тулупьев, Алгоритмы обработки
и визуализации алгебраических байесовских сетей. // Образовательные технологии и общество, 2017.
• E. Malchevskaya, N. Kharitonov, A. Zolotin, A. Birillo, Algebraic
Bayesian Networks: Probabilistic-Logic Inference Algorithms and
Storage Structures //Finnish-Russian University Cooperation in
Telecommunications, 3 - 7 april 2017 (в печати)
• E. Malchevskaya, A. Birillo, A. Zolotin, A. Tulupyev, Local Propagation
Algorithms in Algebraic Bayesian Networks and Related Models: Final
Rendering to Matrix-Vector Equations // Intelligent Information
Technologies for Industry, 14 - 16 september 2017 (на рецензировании)
Кроме того была отправлена заявка на регистрацию в Роспатент. Данная выпускная квалификационная работа бакалавра содержит материалы исследований, частично поддержанных грантом РФФИ
15-01-09001 — «Комбинированный логико-вероятностный графический
подход к представлению и обработке систем знаний с неопределенностью: алгебраические байесовские сети и родственные модели».
Структура и объем работы. Работа состоит из введения, трех глав, заключения и используемой литературы.
Первая глава носит обзорный характер и состоит из 4 разделов. В
первом разделе содержатся общие сведения об АБС. Во втором разделе подробно описана структура АБС, а также даны все необходимые
определения и понятия по данной тематике. В третьем разделе изложены основные теоретические сведения по локальному априорному и
апостериорному выводу в АБС. Четвертый раздел содержит основные выводы по данной главе.
Вторая глава описывает разработанную базу данных и состоит из
5 разделов. Первый раздел описывает существующее решение и структуру данной главы. Второй раздел содержит обзор на существующие
технологии и обоснование выбранной СУБД. Третий раздел содержит
подробное описание разработанной базы данных с соответствующими
схемами. Четвертый раздел описывает существующие при проектировании и реализации проблемы, а также их решение. Пятый раздел содержит выводы по текущей главе.
Третья глава содержит описание созданных материалов к методическому пособию к комплексу программ «AlgBN Math Library» и состоит также из 5 разделов. Первый раздел описывает необходимость создания данного пособия, а также используемые при создании технологии.
Второй раздел содержит подробное описание структуры разработанных материалов (основные разделы, их описание). Третий раздел описывает аналитическую проверку разработанных кейсов тестов. Четвертый раздел содержит подробное описание программной проверки для кейсов тестов. Пятый раздел содержит выводы по данной главе.
В настоящей работе были представлены базовые определения, связанные с алгебраическими байесовскими сетями, приведены ссылки на аналоги разработанных схем баз данных с указанными недостатками,
описан выбор соответствующих технологий для реализации базы данных. Кроме того была приведена подробна схема разработанной базы данных и проанализированы и описаны все возникшие проблемы при
разработке, а также указано их решение. Также приведены разработанные материалы, сопутствующие созданию методического пособия для работы с комплексом программ «AlgBN Math Library».
В результате проделанной работы была разработана и реализована
база данных для хранения АБС и работы с ними, что позволило интегрировать ее в web-платформу «AlgBN Web App» по обучению теории АБС. Также разработанная база данных учитывает все недостатки
прошлых аналогов и новейшие теоретические результаты в данной области. Кроме того были разработаны материалы для методического пособия к комплексу программ «AlgBN Math Library», которые содержат
не только подробное руководство использования данного комплекса,
а также краткие теоретические аспекты для лучшего понимая темы.
Данные материалы позволят выпустить методическое пособие, которое необходимо при знакомстве с данной тематикой.
описан выбор соответствующих технологий для реализации базы данных. Кроме того была приведена подробна схема разработанной базы данных и проанализированы и описаны все возникшие проблемы при
разработке, а также указано их решение. Также приведены разработанные материалы, сопутствующие созданию методического пособия для работы с комплексом программ «AlgBN Math Library».
В результате проделанной работы была разработана и реализована
база данных для хранения АБС и работы с ними, что позволило интегрировать ее в web-платформу «AlgBN Web App» по обучению теории АБС. Также разработанная база данных учитывает все недостатки
прошлых аналогов и новейшие теоретические результаты в данной области. Кроме того были разработаны материалы для методического пособия к комплексу программ «AlgBN Math Library», которые содержат
не только подробное руководство использования данного комплекса,
а также краткие теоретические аспекты для лучшего понимая темы.
Данные материалы позволят выпустить методическое пособие, которое необходимо при знакомстве с данной тематикой.



