Введение 3
Постановка задачи 5
Обзор литературы 6
Глава 1. Основные понятия 8
1.1 Многошаговая игра с полной информацией 8
1.2 Алгоритм Дейкстры 10
Глава 2. Постановка игры управления агентами в сети 12
2.1 Общая сетевая структура 12
2.2 Подвижный агент: дрон 13
2.3 Альтернативы и выигрыши 14
2.4 Пример игры 15
2.5 Условие существования равновесия по Нэшу 18
Глава 3. Описание программного обеспечения 21
3.1 Постановка задачи для программного обеспечения 21
3.2 Обоснование подхода к решению задачи 21
3.3 Описание архитектуры программы 22
Глава 4. Тестирование программы на примере игры двух лиц .... 23
4.1 Постановка игры 23
4.2 Результат при условии, что первым «ходит» первый игрок . 23
4.3 Результат при условии, что первым «ходит» второй игрок . . 25
4.4 Вывод 25
Заключение 27
Список литературы 28
Приложение 29
В работе введена новая постановка некооперативной многошаговой игры управления агентами в сети. Сетевая структура описывается графом, где вершинами являются агенты, а ребра определены как устойчивые связи между агентами [1]. Выигрыш каждого игрока зависит от диаметра подграфа, определенного на вершинах, принадлежащих игроку. Диаметром графа является длина кратчайшего пути между двумя наиболее удаленными друг от друга вершинами. Диаметр графа используется для оценки максимального времени, требующегося для доставки пакета информации от одного агента к другому.
В данной работе будем предполагать, что каждый каждый игрок имеет в своем распоряжении одного подвижного агента, который может быть расположен в любой допустимой позиции для образования нового подграфа. Целью каждого игрока является уменьшение диаметра результирующего расширенного подграфа.
Актуальность данного подхода определяется практической значимостью рассмотренной задачи в приложениях, связанных с самоорганизующимися одноранговыми мобильными сетями (MANET) [2]. MANET - сеть, без заранее определенной структуры, которая состоит из набора беспроводных мобильных узлов или хостов (роль которых, в данной работе, берут на себя агенты игроков). Правильная организация сети MANET играет ключевую роль в таких задачах как восстановление связи в местах природных катастроф (землетрясений, наводнений и т. п.), координирование действий спасательных отрядов и т. д. Одной из самых важных проблем, связанных с построением данной сети, является разумное использование ограниченных ресурсов, таких как электромагнитный спектр частот радиоволн, время работы аккумуляторов и т. п. Неразумное использование этих ресурсов может привести к ухудшению производительности всей сети в целом. Большая часть исследований, проведенных с применением теории игр в области мобильных сетей, связано с обнаружения вредоносных или не приносящих пользу узлов. В данном же исследовании используется другой подход: рассматривается совместный сценарий поведения узлов для достижения максимальной выгоды.
Основной особенностью данного типа сетей является возможность реорганизовывать структуру сети (топологию, пути передачи данных, распределение спектра и т. д.), основываясь на знаниях предыдущих этапов построения. Таким образом, с течением времени общая производительность сети (скорость доставки пакетов информации, расходы на доставку пакета и т. п.) будет расти.
Все узлы сети имеют некоторую область взаимодействия с другими узлами. Таким образом, последовательность узлов может образовывать канал (путь) для передачи данных. Большое количество промежуточных узлов в таком пути может отрицательно сказаться на скорости передачи данных. Или, в некоторых случаях, препятствия на пути (озера, обломки и т. п.) могут вызвать его разрыв. Одним из эффективных способов уменьшения нагрузки на канал или его восстановления является использование беспилотных летательных аппаратов - дронов.
Предметом данного исследования является поиск наилучшего места для внедренных мобильных агентов (дронов). Под наилучшим местом понимается такое место, что помещение туда дрона приводит к увеличению производительности сети, а именно уменьшение длины канала передачи данных [3]. В данной задаче жестко ограничено число доступных беспилотных летательных аппаратов. В процессе самоорганизации сеть самостоятельно определяет оптимальное место для помещения в него подвижного узла. В итоге, две части одного маршрута, состоящие из промежуточных неподвижных узлов, будут соединены между собой беспилотником.
Так как сеть MANET предполагает динамическую топологию: в каждый момент времени сеть самостоятельно определят как использовать беспилотник наилучшим образом, было принято решение, в качестве инструмента исследования, применять теорию позиционных игр [4], [5]. Особенностью данного класса игр является учет динамики конфликтно - управляемого процесса. Класс конечношаговых игр с полной информацией является одним из классов позиционных игр. Данный класс игр теоретически позволяет построить граф игры, наглядно демонстрирующий поведение игроков в конкретных ситуациях. Для класса конечношаговых игр вводится понятие абсолютного равновесия по Нэшу, что является усилением понятия равновесия по Нэшу для игр в нормальной форме.
Анализ проблемы оперативного восстановления связи в местах природных катастроф показал, что ключевую роль здесь играет разумное использование ограниченных ресурсов, в частности, беспилотников (дронов). С учетом динамики развития процесса, было принято решение в качестве сетевой структуры использовать MANET сеть. В данном исследовании использовался подход, позволяющий рассмотреть совместный сценарий поведения узлов сети для достижения максимальной выгоды.
Рассмотрена новая постановка динамической игры управления агентами в сети. Данная игра была исследована с применением методов теории многошаговых игр. Найден алгоритм, позволяющий построить дерево решений для конечношаговой игры. Сформулировано условие существования абсолютного равновесия по Нэшу. Приведен пример игры двух лиц с отсутствием такого равновесия.
Написано программное обеспечение, позволяющее построить дерево решений для конечношаговой игры. Программный продукт протестирован на примере игры двух лиц.
Данное исследование может быть расширено использованием других типов решеток, в частности треугольной и шестиугольной. Данные типы решеток более точно соответствуют архитектуре MANET сетей. Также может быть введен кооперативный поход, позволяющий более точно описать координирование действий спасательных отрядов.
Некоторые результаты данного исследования нашли отражение в следующих публикациях [8], [9].
[1] Новиков Д. А. Игры и сети. // Математическая теория игр и её приложения, 2010. Т 2. Вып. 1. С. 107-124.
[2] Yu F. R. Cognitive Radio Mobile Ad Hoc Networks. Springer, 2011. 507 c.
[3] Zhu Han, Dusit Niyato, Walid Saad, Tamer Basar, Are Hjprungnes. Game Theory in Wireless and Communication Networks. Theory, Models, and Applications. Cambridge University Press, 2012. 554 c.
[4] Петросян Л. А., Зенкевич Н. А., Шевкопляс Е. В. Теория игр. СПб.: БХВ-Петербург, 2012. 424 c.
[5] Петросян Л. А., Седаков. А. А. Многошаговые игры с полной информацией. // Математическая теория игр и её приложения, 2009. Вып. 26.1. С. 121-138.
[6] Dijkstra E. W. A note on two problems in connexion with graphs. // Numerische Matematik, 1959. С. 269-271.
[7] Wilson R. J. Introduction to Graph Theory. Edinburgh: Oliver and Boyd, 1972. 209 c.
[8] Тимонин Н. О. Одна динамическая игра управления агентами в сети. // Процессы управления и устойчивость: Труды 47-й международной научной конференции аспирантов и студентов / под ред. Н. В. Смирнова, Т. Е. Смирновой. СПб.: Издат. Дом С.-Петерб. гос. ун-та, 2016. Принято к публикации.
[9] Gromova E., Gromov D., Timonin N., Kirpichnikova A., Blakeway S. A dynamic game of mobile agents placement on MANET. Submitted to IEEE conference SIMS 2016.