Введение 4
1. Основные объекты и результаты теории алгебраических
байесовских сетей 8
1.1. Элементы глобальных структур 8
1.2. Классификация сепараторов 13
1.3. Схема алгоритмов синтеза подмножеств МГС 13
1.4. Обозначения, используемые в листингах алгоритмов . . 16
2. Описание ранее разработанных алгоритмов 18
2.1. МК-алгоритмы 18
2.2. Алгоритм сборки 23
3. Описание инкрементальных и декрементальных алгоритмов 25
3.1. Инкрементальные алгоритмы 26
3.2. Декрементальные алгоритмы 28
4. Статистическая оценка сложности алгоритмов 33
4.1. Схема проведения экспериментов 33
4.2. Результаты 33
5. Система анализа и синтеза 37
5.1. Архитектура 37
5.2. Визуализация 39
Заключение 41
Список литературы
Актуальность темы исследования. В 1993 году В.И. Городецкий ввел понятие теории алгебраических байесовских сетей (АБС), которая является экземпляром класса вероятностных графических моделей (ВГМ) [9,22,23,30–32].
АБС представлена в виде ненаправленного графа, вершины которого являются фрагментами знаний [8]. Существуют две основные задачи
в рамках АБС: проведение логико-вероятностного вывода [7, 10, 21, 24,
25,28,29] и генерация глобальных структур.
Структурный анализ изучает алгоритмы генерации глобальных
структур: первичной, вторичной, третичной и четвертичной [10]. Результаты предыдущих исследований, посвященных первичной структуре, предложены в [14,17,18]. Синтез вторичной структуры осуществляется и в настоящее время. Проделанную работу по вторичной структуре можно изучить в [6,20]. Генерация множества вторичной структуры, или множества минимальных графов смежности (ММГС), образует класс независимых алгоритмов [16, 19, 28]. Выделение единственной
структуры из такого множества может производиться на основе численных характеристик логико-вероятностного вывода. Также исследования в данный момент ведутся и над третичной [13] и четвертичной
структурами [17,20]. Представление по данным структурам можно получить в [27].
Объектом исследования выступает алгебраическая байесовская
сеть, а предметом исследования — генерация множества минимальных графов смежности в данной теории.
Целью данной выпускной квалификационной работы является ускорение автоматизации синтеза множества вторичной структуры. Для достижения данной цели необходимо решить следующие
задачи:
1. Перенос программных достижений на язык C#, касающихся алгоритмов синтеза ММГС.
42. Разработка инкрементальных алгоритмов генерации ММГС, доказательство их корректности и эффективности, а также предоставление реализации алгоритмов на языке C#.
3. Осуществление визуализации полученного множества.
В настоящей работе были представлены базовые определения глобальных вторичных структур и ММГС, приведены существующие алгоритмы генерации необходимого множества, описана архитектура полученного программного комплекса с диаграммами написанных классов,
а также приведены примеры работы вышеописанных алгоритмов.
В результате проделанной работы реализована библиотека на C#,
состоящая из различных компонент и имеющая разнообразную функциональность. Функциональность данной программного комплекса покрывает большую часть операций, существующих на данных момент
для синтеза ММГС. Данная генерация представляет научный интерес
и даст отличную возможность при реализации глобального вывода.
Кроме того, вышеприведенные результаты позволят интегрировать
воедино реализации алгоритмов представления и обработки знаний с
неопределенностью на основе байесовских сетей доверия.
Перспективными направлениями дальнейших исследований являются направления, связанные с дальнейшей оптимизацией генерации
множества минимальных графов смежности, а также поиска минимальных графов смежности, обладающих оптимальными численными характеристиками для проведения глобального логико-вероятностного вывода.
[1] Березин А. И. Множество минимальных графов смежности: при¬меры использования программного комплекса на языке С#. // Гибридные и синергетические интеллектуальные системы. 2016 [в пе¬чати].
[2] Березин А. И., Зотов М. А., Иванова А. В. Синтез множества минимальных графов смежности: статистическая оценка сложности декрементального алгоритма. // Нечеткие системы и мягкие вы¬числения. 2016 [в печати].
[3] Березин А. И., Романов А. В., Зотов М. А. Синтез вторичной струк¬туры алгебраических байесовских сетей: оценка мощности множе¬ства минимальных графов смежности. // Нечеткие системы и мяг¬кие вычисления. 2016 [в печати].
[4] Зотов М. А., Левенец Д. Г., Тулупьев А. Л., Золотин А. А. Син¬тез вторичной структуры алгебраических байесовских сетей: ин¬крементальный алгоритм и статистическая оценка его сложности. // Научно-технический вестник информационных технологий, ме¬ханики и оптики. 2016. Т. 16. № 1. С. 122-132.
[5] Зотов, М. А., Тулупьев, А. Л. Синтез вторичной структуры ал¬гебраических байесовских сетей: методика статистической оценки сложности и компаративный анализ прямого и жадного алгорит¬мов. // Компьютерные инструменты в образовании. 2015. № 1. С. 3-16.
[6] Зотов М. А., Тулупьев А. Л., Сироткин А. В. Статистические оцен¬ки сложности прямого и жадного алгоритмов синтеза вторичной структуры алгебраических байесовских сетей. // Нечеткие систе¬мы и мягкие вычисления. 2015. Т. 10. № 1. С. 75-91.
[7] Тулупьев А. Л. Алгебраические байесовские сети: реализация логико-вероятностного вывода в комплексе Java-программ. // Тру¬ды СПИИРАН. 2009. Вып. 8. С. 191-232.
[8] Тулупьев А. Л., Николенко С. И., Сироткин А. В. Байесовские сети: логико-вероятностный подход. // СПб.: Наука. 2006. С. 607.
[9] Тулупьев А. Л., Сироткин А. В., Николенко С. И. Байесовские сети доверия. // СПб.: Изд-во СПбГУ. 2009. С. 400.
[10] Тулупьев А. Л., Столяров Д. М., Ментюков М. В. Представление локальной и глобальной структуры алгебраической байесовской се¬ти в Java-приложениях. // Труды СПИИРАН. 2007. Вып. 5. С. 71¬99. Доступна онлайн: http://mi.mathnet.ru/trspy301.
[11] Тулупьев А. Л., Фильченков A. A., Сироткин А. В. Система для построения и визуализации семейства минимальных вторич¬ных структур алгебраической байесовской сети, соответствующих ее первичной структуре Algebraic Bayesian Networks Secondary Structures Generator, Version 1 for Java (AlgBNSSGj.v.01). // Свид. о гос. рег. эл. ресурса (ОФЭРНиО ИИО ГАН РАО) № 15769 от 20.05.2010. Бюлл. ’’Хроники объед. фонда эл. ресурсов ’’Наука и образование”. 2010. № 5. С. 27.
[12] Тулупьев А. Л., Фильченков A. A., Сироткин А. В. Программа для синтеза семейства минимальных графов смежности Algebraic Bayesian Networks Secondary Structures Generator, Version 1 for Java (AlgBNSSGj.v.01) // Свид. о гос. рег. прогр. для ЭВМ. Рег. № 2010614269 (30.06.2010). РОСПАТЕНТ. Бюлл. ”Прогр. для ЭВМ, БД, тол. инт. микросх.’. 2010. № 3. С. 455-456.
[13] Фильченков А. А. Алгоритмы построения третичной структуры ал¬гебраической байесовской сети. // Труды СПИИРАН. 2011. Вып. 17. С. 197-218.
[14] Фильченков А. А. Преобразование первичной структуры алгебраи¬ческой байесовской сети к ациклической с сохранением вероятност¬ной семантики. // Труды СПИИРАН. 2013. Вып. 30. С. 156-168.
[15] Фильченков А. А. Синтез графов смежности в машинном обучении глобальных структур алгебраических байесовских сетей. // СПб¬ГУ. 2013.
[16] Фильченков А. А., Тулупьев А. Л. Структурный анализ систем минимальных графов смежности. // Труды СПИИРАН. 2009. Вып. 11. С. 104-129. Доступна онлайн: http://mi.mathnet.ru/trspy50.
[17] Фильченков А. А., Тулупьев А. Л. Алгоритм выявления ациклич¬ности первичной структуры алгебраической байесовской сети по ее четвертичной структуре. // Труды СПИИРАН. 2011. Вып. 19. С. 128-145.
[18] Фильченков А. А., Тулупьев А. Л. Связность и ацикличность пер¬вичной структуры алгебраической байесовской сети. // Вестник СПбГУ. 2013. Серия 1: Математика, Механика, Астрономия. № 1. С. 110-118.
[19] Фильченков А. А., Фроленков К. В., Сироткин А. В., Тулупьев А. Л. Система алгоритмов синтеза пожмножеств минимальных гра¬фов смежности. // Труды СПИИРАН. 2013. Вып. 4. № 27.
[20] Фильченков А. А., Фроленков К. В., Тулупьев А. Л. Устранение циклов во вторичной структуре алгебраической байесовской сети на основе анализа ее четвертичной структуры. // Труды СПИИ- РАН. 2012. Вып. 21. С. 143-156.
[21] Фроленков К. В., Фильченков A. A., Тулупьев А. Л. Апостериор¬ный вывод в третичной полиструктуре алгебраической байесовской сети. // Труды СПИИРАН. 2012. Вып. 23. С. 343-356.
[22] Dlamini W. M. A Bayesian belief network analysis of factors influencing wildfire occurrence in Swaziland. // Environmental modelling & software. 2010. Vol. 25. pp. 199-208.
[23] Farasat A., Nikolaev A., Srihari S. N., Blair R. H. Probabilistic graphical models in modern social network analysis. // Plos Computational Biology. 2015. Vol. 5. no. 1.
[24] Farine D. R., Strandburg-Peshkin A. Estimating uncertainty and reliability of social network data using Bayesian inference. // Royal Society Open Science. 2015. Vol. 2. no. 9. pp. 150-367.
[25] Kappel D., Habenschuss S., Legenstein R., Maass W. Network Plasticity as Bayesian Inference. // Plos Computational Biology. 2015. Vol. 11. no. 11.
[26] Lennon Craig. On the Locality of the Prufer Code. // Electronic Journal of Combinatorics. 2009. Vol. 16. no. R10. pp. 197-218.
[27] Levenets D. G., Zotov M. A., Romanov A. V., Tulupyev A. L., Zolotin A. A., Filchenkov A. A. Decremental and Incremental Reshaping of Algebraic Bayesian Networks Global Structures. // Proceedings of IITI’16. May 16—21, 2016, Sochi, Russia [in print].
[28] Mal’chevskaya E. A., Berezin A. I., Zolotin A. A., Tulupyev A. L. Algebraic Bayesian Networks: Local Probabilistic-Logic Inference Machine Architecture and Set of Minimal Joint Graphs. // Proceedings of IITI’16. May 16—21, 2016, Sochi, Russia [in print].
[29] Nelson A. W., Malik A. S., Wendel J. C., Zipf M. E. Probabilistic Force Prediction in Cold Sheet Rolling by Bayesian Inference. // Journal of Manufacturing Science and Engineering-Transactions of the Asme. 2014. Vol. 136. no. 4.
[30] Razib R. H., Nikolaev A. Probabilistic Graphical Modeling method for inferring hydraulic conductivity maps from hydraulic head maps. // Journal of Hydrologic Engineering. 2016. Vol. 21. no. 2.
[31] Richards R. G., Sano M., Sahin O. Exploring climate change adaptive capacity of surf life saving in Australia using Bayesian belief networks. // Ocean & Coastal Management. 2016. Vol. 120. pp. 148-159.
[32] Yodo N., Wang P. Resilience Modeling and Quantification for Engineered Systems Using Bayesian Networks. // Journal of Mechanical Design. 2016. Vol. 138. no. 3.
[33] Seo Seunghyun, Shin Heesung A generalized enumeration of labeled trees and reverse Prufer algorithm. // Journal of Combinatorics Theory Series A. 2007. Vol. 114. no 7. pp. 1357-1361.