Введение 4
1. Алгебраические байесовские сети: структура и оценки
вероятности истинности 9
1.1. Введение
1.2. Структура АБС
1.3. Локальный априорный и апостериорный вывод . . . . . . 13
1.4. Выводы по главе
2. Алгебраические байесовские сети: база данных 20
2.1. Введение
2.2. Выбор технологий
2.4. Существующие проблемы и их решение
2.5. Выводы по главе
3. Расширенная документация:
материалы для методического пособия 31
3.1. Введение
3.2. Структура
3.3. Аналитическая проверка: численные эксперименты
3.4. Программная проверка
3.5. Выводы по главе
Заключение 40
Список литературы
Актуальность темы исследования. Теория вероятностных графических моделей (ВГМ) [36] является одной из областей искуственного интеллекта, дающей возможность связать понятия данных, вероятностной логики и теории графов. Соединяя эти понятия, исследователь получает возможность анализировать данные, принимая во
внимание их связанность между собой (например, последовательность
состояний или причинно-следственные связи). К ВГМ относятся такие
модели как марковские цепи и байесовские сети доверия, имеющие широкое применение и родственные алгебраическим байесовским сетям,
рассматриваемым в данной работе. Вероятностные графические модели имеют широкое применение в ряде областей и давно подтвердили
свою состоятельность [5, 9, 10, 14]. Они в настоящее время активно
применяются в системах распознавания образов [22, 25], интеллектуальных системах поддержки принятия решений и рекомендательных
системах [3, 4, 6, 13], системах моделирования рисков и обнаружения
отказов [7, 15, 18, 31], оценивания повреждений и мониторинга состояния здоровья [1, 2, 8] и системах моделирования отклика экологических
систем на различные изменения и воздействия [11, 17].
Одним из видов ВГМ является структура алгебраических байесовских сетей (АБС) [26, 27], предполагающая декомпозицию базы знаний
на небольшие объемы данных, тесно связанных между собой, что позволяет ускорить алгоритмы обработки за счет возможности работать
с ограниченным набором элементов. Иным фактором, влияющим на
качество и скорость работы алгоритмов модели, является постановка
решаемых задач. Кроме того, АБС предполагают наличие интервальных вероятностных оценок, что дает возможность расширить оценки
на узлах фрагментов знаний.
В настоящее время ведется работа над проектом web-платформы
«AlgBN Web App» по работе и обучению АБС [28]. В рамках данного
проекта используется математическая библиотека, основанния на комплексе программ «AlgBN Math Library» [19, 30], который не имеет достаточно подробной обучающей документации для быстрого освоения.
Так как на данном комплексе программ основана большая часть существующих ныне исследований, то был необходим способ быстрого ознакомления с комплексом для его освоения. В связи с этим в данной
работе были созданы кейсы тестов, охватывающие всю функциональность комплекса программ, которые были оформлены в расширенную документацию по комплексу программ, что является основой для создания методического пособия по основам теории АБС и комплексу программ для их обработки.
Также разработанный комплекс программ не включает в себя базу
данных, позволяющую удаленно хранить данные для работы с ними.
Существующее решение [33] (разработанная схема базы данных) является устаревшим, не учитывающим новейшие теоретические результаты. Кроме того, разрабатываемая web-платформа также нуждается в
базе данных для хранения АБС и работы с ними. Поэтому в рамках
данной работы была разработана и реализована база данных для хранения АБС и работы с АБС.
Целью данной выпускной квалификационной работы является создание базы данных для хранения АБС и работы с ними с сопутствующей подготовкой материалов для методического пособия в рамках web-платформы «AlgBN Web App» по обучению теории АБС. Для
достижения данной цели были поставлены следующие задачи:
1. Проектирование схемы базы данных;
2. Реализация базы данных средствами СУБД MS SQL Server;
3. Создание уровня доступа к данным (DAL);
4. Разработка кейсов тестов к комплексу программ «AlgBN Math
Library» и их реализация на языке С#;
5. Создание расширенной документации к комплексу программ «AlgBN Math Library».
5Методы исследования. Для решения поставленных задач в данной области понадобилось изучить методические материалы, поставить
проблему, проанализировать ее, спроектировать несколько вариантов
решения. Затем были выбраны подходящие средства и технологии программирования, связанные с языком реализации (C#, SQL), средой
разработки (Visual Studio, MS SQL Sever).После чего были проведены численные и программные эксперименты, позволяющие написать
методическое пособие. А также были проведены тестовые случаи для
обоснования корректности полученной базы данных. В качестве методов решения используются теоретические методы (анализ предыдущих результатов), методы объектно-ориентированного программирования (ООП), методы проектирования баз данных.
Публикации. По теме дипломного проекта было подготовлено научных публикаций:
• А.И. Бирилло Локальный синтез согласованных оценок истинности в алгебраических байесовских сетях: вычислительные эксперименты // Материалы 6-й всероссийской научной конференции
по проблемам информатики СПИСОК-2016. (26–29 апреля 2016 г.
Санкт-Петербург). СПб.: ВВМ, 2016. С. 453–459.
• А.И. Бирилло, Анализ согласованности оценок истинности в локальном априорном и апостериорном выводе в алгебраических
байесовских сетях: вычислительные эксперименты // Региональная информатика (РИ-2016). XV Санкт-Петербургская международная конференция «Региональная информатика (РИ-2016)»
(Санкт-Петербург, 26-28 октября 2016 г.): Материалы конференции. СПб.: СПОИСУ, 2016, С. 515
• А.А. Золотин, Е.А. Мальчевская, А.И. Бирилло, А.Л. Тулупьев,
Управление согласованностью оценок вероятностей в локальном
апостериорном выводе в алгебраических байесовских сетях // 9-я
Российская мультиконференция по проблемам управления, материалы 9-й конференции ”Информационные технологии в управлении” (ИТУ-2016) - СПб: АО ”Концерн ”ЦНИИ ”Электроприбор”,
2016, С. 52 – 61.
• А. А. Золотин, Д. Г Левенец., М. А. Зотов, А. И. Бирилло, А. И.
Березин, А. В. Иванова, А. Л. Тулупьев, Алгоритмы обработки
и визуализации алгебраических байесовских сетей. // Образовательные технологии и общество, 2017.
• E. Malchevskaya, N. Kharitonov, A. Zolotin, A. Birillo, Algebraic
Bayesian Networks: Probabilistic-Logic Inference Algorithms and
Storage Structures //Finnish-Russian University Cooperation in
Telecommunications, 3 - 7 april 2017 (в печати)
• E. Malchevskaya, A. Birillo, A. Zolotin, A. Tulupyev, Local Propagation
Algorithms in Algebraic Bayesian Networks and Related Models: Final
Rendering to Matrix-Vector Equations // Intelligent Information
Technologies for Industry, 14 - 16 september 2017 (на рецензировании)
Кроме того была отправлена заявка на регистрацию в Роспатент. Данная выпускная квалификационная работа бакалавра содержит материалы исследований, частично поддержанных грантом РФФИ
15-01-09001 — «Комбинированный логико-вероятностный графический
подход к представлению и обработке систем знаний с неопределенностью: алгебраические байесовские сети и родственные модели».
Структура и объем работы. Работа состоит из введения, трех глав, заключения и используемой литературы.
Первая глава носит обзорный характер и состоит из 4 разделов. В
первом разделе содержатся общие сведения об АБС. Во втором разделе подробно описана структура АБС, а также даны все необходимые
определения и понятия по данной тематике. В третьем разделе изложены основные теоретические сведения по локальному априорному и
апостериорному выводу в АБС. Четвертый раздел содержит основные выводы по данной главе.
Вторая глава описывает разработанную базу данных и состоит из
5 разделов. Первый раздел описывает существующее решение и структуру данной главы. Второй раздел содержит обзор на существующие
технологии и обоснование выбранной СУБД. Третий раздел содержит
подробное описание разработанной базы данных с соответствующими
схемами. Четвертый раздел описывает существующие при проектировании и реализации проблемы, а также их решение. Пятый раздел содержит выводы по текущей главе.
Третья глава содержит описание созданных материалов к методическому пособию к комплексу программ «AlgBN Math Library» и состоит также из 5 разделов. Первый раздел описывает необходимость создания данного пособия, а также используемые при создании технологии.
Второй раздел содержит подробное описание структуры разработанных материалов (основные разделы, их описание). Третий раздел описывает аналитическую проверку разработанных кейсов тестов. Четвертый раздел содержит подробное описание программной проверки для кейсов тестов. Пятый раздел содержит выводы по данной главе.
В настоящей работе были представлены базовые определения, связанные с алгебраическими байесовскими сетями, приведены ссылки на аналоги разработанных схем баз данных с указанными недостатками,
описан выбор соответствующих технологий для реализации базы данных. Кроме того была приведена подробна схема разработанной базы данных и проанализированы и описаны все возникшие проблемы при
разработке, а также указано их решение. Также приведены разработанные материалы, сопутствующие созданию методического пособия для работы с комплексом программ «AlgBN Math Library».
В результате проделанной работы была разработана и реализована
база данных для хранения АБС и работы с ними, что позволило интегрировать ее в web-платформу «AlgBN Web App» по обучению теории АБС. Также разработанная база данных учитывает все недостатки
прошлых аналогов и новейшие теоретические результаты в данной области. Кроме того были разработаны материалы для методического пособия к комплексу программ «AlgBN Math Library», которые содержат
не только подробное руководство использования данного комплекса,
а также краткие теоретические аспекты для лучшего понимая темы.
Данные материалы позволят выпустить методическое пособие, которое необходимо при знакомстве с данной тематикой.
[1] S. Arangio and F. Bontempi. Structural health monitoring of a
cable-stayed bridge with bayesian neural networks. Structure and
Infrastructure Engineering, 11(4):575–587, 2015.
[2] O. Arsene, I. Dumitrache, and I. Mihu. Expert system for medicine
diagnosis using software agents. Expert Systems with Applications,
42(4):1825–1834, 2015.
[3] J. Bobadilla, F. Ortega, A. Hernando, and A. Gutiérrez. Recommender
systems survey. Knowledge-based systems, 46:109–132, 2013.
[4] J. Borras, A. Moreno, and A. Valls. Intelligent tourism recommender
systems: A survey. Expert Systems with Applications, 41(16):7370–
7389, 2014.
[5] Z. Cai, P. Guo, S. Si, Z. Geng, C. Chen, and L. Cong. Analysis of
prognostic factors for survival after surgery for gallbladder cancer based
on a bayesian network. Scientific Reports, 7(1):293, 2017.
[6] A. Constantinou, N. Fenton, and M. Neil. pi-football: A bayesian
network model for forecasting association football match outcomes.
Knowledge-Based Systems, 36:322–339, 2012.
[7] J. Dabrowski and J. de Villiers. Maritime piracy situation modelling
with dynamic bayesian networks. Information fusion, 23:116–130, 2015.
[8] P. Dawson, R. Gailis, and A. Meehan. Detecting disease outbreaks
using a combined bayesian network and particle filter approach.
Journal of theoretical biology, 370:171–183, 2015.
[9] X. Desforges, M. Diévart, and B. Archimède. A prognostic function for
complex systems to support production and maintenance co-operative
planning based on an extension of object oriented bayesian networks.
Computers in Industry, 86:34–51, 2017.
41[10] S. Dragicevic, S. Celar, and M. Turic. Bayesian network model for task
effort estimation in agile software development. Journal of Systems and
Software, 127:109–119, 2017.
[11] S. Hamilton, C. Pollino, and A. Jakeman. Habitat suitability modelling
of rare species using bayesian networks: Model evaluation under limited
data. Ecological Modelling, 299:64–78, 2015.
[12] J. Han, E. Haihong, G. Le, and J. Du. Survey on nosql database. In
Pervasive computing and applications (ICPCA), 2011 6th international
conference on, pages 363–366. IEEE, 2011.
[13] J-S. Kim and C-H. Jun. Ranking evaluation of institutions based on a
bayesian network having a latent variable. Knowledge-Based Systems,
50:87–99, 2013.
[14] YG. Kim, SM. Lee, and PH. Seong. A methodology for a quantitative
assessment of safety culture in npps based on bayesian networks.
Annals of Nuclear Energy, 102:23–36, 2017.
[15] S-S. Leu and C-M. Chang. Bayesian-network-based fall risk evaluation
of steel construction projects by fault tree transformation. Journal of
Civil Engineering and Management, 21(3):334–342, 2015.
[16] Y. Li and S. Manoharan. A performance comparison of sql and nosql
databases. In Communications, Computers and Signal Processing
(PACRIM), 2013 IEEE Pacific Rim Conference on, pages 15–19.
IEEE, 2013.
[17] KF-R. Liu, J-Y. Kuo, Ken. Yeh, C-W. Chen, H-H. Liang, and Y-H.
Sun. Using fuzzy logic to generate conditional probabilities in bayesian
belief networks: a case study of ecological assessment. International
Journal of Environmental Science and Technology, 12(3):871–884,
2015.
[18] Q. Mahboob, E. Schöne, U. Maschek, and J. Trinckauf. Investment
into human risks in railways and decision optimization. Human and
42Ecological Risk Assessment: An International Journal, 21(5):1299–
1313, 2015.
[19] E. Mal’chevskaya, A. Berezin, A. Zolotin, and A. Tulupyev.
Algebraic bayesian networks: Local probabilistic-logic inference
machine architecture and set of minimal joint graphs. In Proceedings of
the First International Scientific Conference “Intelligent Information
Technologies for Industry”(IITI’16), pages 69–79. Springer, 2016.
[20] Microsoft. Sql server technical documentation. URL:
https://docs.microsoft.com/en-us/sql/sql-server/
sql-server-technical-documentation.
[21] MySQL. Mysql documentation. URL: https://dev.mysql.com/doc/.
[22] P. Peng, Y. Tian, Y. Wang, J. Li, and T. Huang. Robust multiple
cameras pedestrian detection with multi-view bayesian network.
Pattern Recognition, 48(5):1760–1772, 2015.
[23] J. Pokorny. Nosql databases: a step to database scalability in web
environment. International Journal of Web Information Systems,
9(1):69–82, 2013.
[24] PostgreSQL. Postgresql documentation. URL: https://www.
postgresql.org/docs/.
[25] J. Shang, Z. Wang, and Q. Huang. A robust algorithm for joint sparse
recovery in presence of impulsive noise. IEEE Signal Processing Letters,
22(8):1166–1170, 2015.
[26] В.И. Городецкий. Алгебраические байесовские сети—новая парадигма экспертных систем. Юбилейный сборник трудов институтов Отделения информатики, вычислительной техники и автоматизации РАН, 2:120–141, 1993.
[27] В.И. Городецкий and А.Л. Тулупьев. Формирование непротиворечивых баз знаний с неопределенностью. Известия РАН. Сер.
Теория и системы управления, (5):33–42, 1997.
43[28] А.А. Золотин, Д.Г. Левенец, М.А. Зотов, А.И. Бирилло, А.И. Березин, А.В. Иванова, and А.Л. Тулупьев. Алгоритмы обработки
и визуализации алгебраических байесовских сетей. Образовательные технологии и общество, 20(1), 2017.
[29] А.А. Золотин, А.Л. Тулупьев, and А.В. Сироткин. Матричновекторные алгоритмы локального апостериорного вывода в алгебраических байесовских сетях над пропозициями-квантами.
Научно-технический вестник информационных технологий, механики и оптики, 15(4), 2015.
[30] Е.А. Мальчевская and А.А. Золотин. Логико-вероятностный вывод в АБС: архитектура и примеры использования программного
комплекса на языке c#. In Гибридные и синергетические интеллектуальные системы, pages 181–187, 2016.
[31] А.В. Суворова, А.Л. Тулупьев, and А.В. Сироткин. Байесовские сети доверия в задачах оценивания интенсивности рискованного поведения. Нечеткие системы и мягкие вычисления, 9(2):115, 2014.
[32] А.Л. Тулупьев. Ациклические алгебраические байесовские сети:
логико-вероятностный вывод. Нечеткие системы и мягкие вычисления: Научный журнал Российской ассоциации нечетких систем
и мягких вычислений, 1(1):57–93, 2006.
[33] А.Л. Тулупьев. Алгебраические байесовские сети: логиковероятностная графическая модель баз фрагментов знаний с
неопределенностью. Учреждение Российской академии наук
Санкт-Петербургский институт информатики и автоматизации
РАН, 2009.
[34] А.Л. Тулупьев, С.И. Николенко, and А.В. Сироткин. Байесовские
сети: логико-вероятностный подход, 2006.
[35] А.Л. Тулупьев, А.В. Сироткин, and А.А. Золотин. Матричные
уравнения нормирующих множителей в локальном апостериорном
44выводе оценок истинности в алгебраических байесовских сетях.
Вестник Санкт-Петербургского университета. Серия 1. Математика. Механика. Астрономия, 2(3), 2015.
[36] А.Л. Тулупьев, А.В. Сироткин, and С.И. Николенко. Байесовские сети доверия: логико-вероятностный вывод в ациклических
направленных графах. СПб.: Изд-во Санкт-Петербургского унта, 2009.