Тип работы:
Предмет:
Язык работы:


О временной состоятельности нормативных принципов оптимальности в динамических играх

Работа №128853

Тип работы

Дипломные работы, ВКР

Предмет

математика

Объем работы50
Год сдачи2019
Стоимость4700 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
17
Не подходит работа?

Узнай цену на написание


Введение 3
Обзор литературы 6
Описание модели «дилеммы заключённого для n лиц» 10
Определение эффективного наказания 15
Модель кооперации в повторяющейся игре 15
Модель кооперации в динамической игре 25
Подъядро игры «дилемма заключенного n лиц» 28
Вектор Шепли для «дилеммы заключенного n лиц» 36
Вектор Шепли стохастической «дилеммы заключенного n лиц» ... 36
Вектор Шепли динамической «дилеммы заключенного n лиц» .... 40
Вывод 46
Список литературы 48


В современном мире многие процессы взаимодействия людей можно описать теоретико-игровой моделью. Одной из основополагающих моделей теории игр является «дилемма заключённого». Она позволяет анализировать взаимодействие двух рациональных агентов в условиях, когда для достижения общей выгоды необходимо поступиться личными интересами (отказаться от выбора строго доминирующей стратегии для достижения Парето- оптимума). Для реализации многостороннего взаимодействия была реализована модель «дилеммы заключённого n лиц», которая впервые была рассмотрена Гамбургером (Hamburger H.) [7]. В ней были сохранены основные принципы взаимодействия, аналогичные классической модели.
Решение подобного рода задач заключается в нахождении равновесных стратегий поведения, а также иных принципов оптимальности в построенной модели. Кроме того, большое количество игроков делает эту задачу более интересной с точки зрения кооперативной теории игр, поскольку даже характиристическая функция выглядит менее тривиально, чем в двухагентной модели.
Эксперименты с частично кооперативным поведением в повторяющейся «дилемме заключённого n лиц» были описаны и проанализированы Страффином [14]. Поскольку взаимодействие лиц осуществляется многоэтапно, а каждый поступок накладывает отпечаток на дальнейшие взаимоотношения, следует рассматривать повторяющийся вариант модели. Ауманн [1] анализирует равновесное поведение в условиях неопределённого количества повторений данной игры.
В данной работе исследуется новый равновесный принцип поведения в условиях данной модели. Строится новая характеристическая функция Петросяна [13] для рассмотрения нормативных принципов оптимальности в динамической модели «дилеммы заключённого n лиц». В частности, находится подъядро Петросяна-Панкратовой [12] динамической игры, которое в т. ч. содержит вектор Шепли.
В первой главе приводится наиболее полное описание модели « дилемма заключённого n лиц», обобщающее уже существующие наработки в этой области, а также построена функция выигрышей игроков, выделены основные положения данной игры. Для наиболее полного понимания строятся таблицы соответствия общей функции выигрыша, выведенной в данной работе, с разными видами таблиц выигрышей, рассматриваемых в более ранней литературе.
В разделе 2 находится новое равновесие по Нэшу в конечной многошаговой игре и доказывается теорема об эффективном наказании при кооперативном поведении игроков в конечной повторяющейся и динамической играх, основанных на модели «дилемма заключённого n лиц». Приводится пример расчёта максимально необходимого количества шагов в повторяющейся и динамической игре для обеспечения эффективного наказания при использовании данной модели для трёх игроков.
В третьем разделе находится ядро динамической модели, а также, основываясь на построении новой характеристической функции Петросяна [13] для многошаговой динамической игры найдено подъядро динамической «дилеммы заключённого n лиц» и доказано, что оно обладает свойством сильной динамической устойчивости.
Последний раздел относится к поискам вектора Шепли в стохастических и динамических играх, основанных на модели «дилемма заключённого n лиц».


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Таким образом, в данной дипломной работе была наиболее общим образом описана игра «дилемма заключённого n лиц». Проведён анализ нового равновесного принципа поведения игроков в условиях динамической модели игры.
Определена функция выигрышей игроков данной модели, зависящая от количества кооперирующихся игроков и, соответственно, стратегии данного игрока. Наиболее полно сформулированы отличительные свойства модели игры для каждого из игроков. Построена характеристическая функция для динамической модели. Построены таблицы сопоставления обобщённой функции выигрыша игроков, сформулированной в данной модели, с различными вариантами частичной записи выигрышей игроков, предложенными в различных источниках.
Выведено ещё одно коалиционно-устойчивое на первых K — к* шагах и индивидуально устойчивое на последних к* шагах решение в конечношаговой повторяющейся игре, каждый шаг которой удовлетворяет рассматриваемой модели. Была доказана теорема об эффективном наказании при кооперативном поведении игроков в повторяющейся игре. Найдено оптимальное наказание в динамической модели «дилеммы заключённого n лиц».
Построено C-ядро динамической модели. Определено D-подъядро Петросяна-Панкратовой [12] для многошаговой динамической игры «дилеммы заключённого n лиц». Доказана его динамическая устойчивость в условиях рассматриваемой модели.
Осуществлён поиск нормативных принципов оптимальности, таких, как, например вектор Шепли в стохастической и динамической играх, основанных на модели «дилемма заключенного n лиц».


1. Aumann R. J. Acceptable points in general cooperative n-person games // Contributions to the Theory of Games (AM-40). 1959. No 4. P. 287-324.
2. Bonacich P. et al. Cooperation and group size in the n-person prisoners’ dilemma //Journal of Conflict Resolution. 1976. No 20(4). P. 687-706.
3. Carroll J. W. Iterated N-player prisoner’s dilemma games // Philosophical Studies. 1988. No 53(3). P. 411-415.
4. Essam E. L. S., Elshobaky E. M., Soliman K. M. Two population three-player prisoner’s dilemma game //Applied Mathematics and Computation. 2016. No 277. P. 44-53.
5. Fox J., Guyer M. «Public» choice and cooperation in n-person prisoner’s dilemma //Journal of Conflict Resolution. 1978. No 22(3). P. 469-481.
6. Goehring D. J., Kahan J. P. The uniform n-person prisoner’s dilemma game: construction and test of an index of cooperation //Journal of Conflict Resolution. 1976. No 20(1). P. 111-128.
7. Hamburger H. N-person prisoner’s dilemma // Journal of Mathematical Sociology. 1973. No 3. P. 27-48.
8. Kannai Y. The core and balancedness //Handbook of game theory with economic applications. 1992. Vol. 1. P. 355-395.
9. Moulin H. Fair division and collective welfare // MIT press. 2004. Vol. 1.
10. Petrosjan L. A., Grauer L. V. Strong Nash equilibrium in multistage games // International Game Theory Review. 2002. No 4(2). P. 255—264.
11. Petrosjan L. A., Grauer L. V. Multistage games // Journal of applied mathematics and mechanics. 2004. Vol. 68. No 4. P. 597-605.
12. Petrosjan L. A., Pankratova Y. B., New characteristic function for multistage dynamic games // Vestnik of Saint Petesrburg University, Applied mathematics. Computer Science. Control Processes. 2018. No 14(4). P. 316324.
13. Petrosyan L. et al. Strong Strategic Support of Cooperation in Multistage Games //International Game Theory Review (IGTR). 2019. No 21(1). P. 112.
14. Straffin P. D. Game Theory and Strategy. Washington: The Mathematical Association of America, 1993. 244 p.
15. Szilagyi M. N. An investigation of N-person Prisoners’ Dilemmas //Complex Systems. 2003. No 14(2). P. 155-174.
... Всего источников – 20.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ