Тип работы:
Предмет:
Язык работы:


Решение с информационной дискриминацией в кооперативных дифференциальных играх

Работа №133156

Тип работы

Дипломные работы, ВКР

Предмет

математика

Объем работы73
Год сдачи2017
Стоимость4600 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
5
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 3
ГЛАВА 1. КООПЕРАТИВНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ С ДИНАМИЧЕСКИМ ОБНОВЛЕНИЕМ ИНФОРМАЦИИ 12
§ 1. Определение усеченной подыгры 12
§ 2. Решение кооперативной усеченной подыгры 15
§ 3. Концепция решения в исходной игре с динамическим обновлением информации 18
§ 4. Построение характеристической функции в игре с динамическим обновлением информации 25
§ 5. Связь решения в усеченных подыграх и результирующего решения 28
§ 6. Кооперативная игра добычи ограниченного ресурса с динамиче­ским обновлением информации 38
ГЛАВА 2. КООПЕРАТИВНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ С ПРЕДПИСАННОЙ ПРОДОЛЖИТЕЛЬНОСТЬЮ И СО СЛУЧАЙНЫМ ОБНОВЛЕНИЕМ ИНФОРМАЦИИ 49
§ 1. Определение случайной усеченной подыгры 49
§ 2. Решение кооперативной случайной усеченной подыгры 51
§ 3. Концепция решения в исходной игре со случайным обновлением информации 53
§ 4. Кооперативная игра добычи ограниченного ресурса со случайным обновлением информации 56
ЗАКЛЮЧЕНИЕ 68
ЛИТЕРАТУРА 69

Актуальность темы. Теория дифференциальных игр в настоящее время является одним из наиболее бурно развивающихся разделов математической теории игр. Главным образом это связано с тем, что математический аппа­рат дифференциальных игр позволяет реалистично моделировать конфликтно-управляемые процессы, непрерывно развивающиеся во времени. Так динами­ка фазовой переменной, описывающей состояние процесса, задается системой дифференциальных уравнений на некотором временном промежутке заданной продолжительности.
Теория дифференциальных игр сформировалась как отдельный раздел ма­тематической теории игр в пятидесятых годах двадцатого века. Одними из пер­вых интересные результаты в этой области получили Р. Айзекс, Л. Берковитц [33], В. Флеминг [36]. Долгое время исследования были посвящены в основном антагонистическим дифференциальным играм. Значительные успехи в данной области связаны с представителями отечественной научной школы Н. Н. Кра­совским [11, 12], Л. С. Понтрягиным [25], Е. Ф. Мищенко, Б. Н. Пшеничным, Л. А. Петросяном [20].
Толчком для развития теории неантагонистических дифференциальных игр послужили задачи конфликтного управления со многими участниками из раз­личных практических областей. В качестве принципа оптимальности в неанта­гонистических дифференциальных играх чаще всего рассматривается равнове­сие по Нэшу в программных или позиционных стратегиях. Основные результа­ты, посвященные исследованию вопроса существования и проблемы построения равновесия по Нэшу, получены в работах А. Ф. Клейменова [7, 8], А. Ф. Коно­ненко [9], С. В. Чистякова [29].
Особый интерес представляют также кооперативные дифференциальные иг­ры [5, 6, 18, 21]. Естественным подходом к изучению кооперативных дифферен­циальных игр, как игр дележей, является попытка переноса результатов класси­ческой кооперативной теории "однократных"игр Неймана-Моргенштерна [13]. Однако при использовании результатов классической теории необходимо допол­нительно исследовать вопрос о динамической и сильно динамической устойчи­вости полученного решения. Попытки применения динамически неустойчивых принципов оптимальности при решении прикладных задач в области эконо­мики, экологии, менеджмента приводят к не реализуемости таких принципов, поскольку в некоторый момент времени возникают условия, когда соглаше­ние о кооперации могут быть пересмотрено. Это обстоятельство впервые бы­ло замечено Л. A. Петросяном в 1977 году. В [14] он сформулировал строгое математическое определение динамической устойчивости принципа оптималь­ности (кооперативного решения), а в работе [17] предложен способ решения проблемы динамической неустойчивости кооперативного решения при помощи схемы выплат, получившей название процедуры распределения дележа (ПРД). Определение сильной динамической устойчивости впервые было дано в работе [15]. Исследованиям проблемы динамической устойчивости посвящены работы [4, 18, 19, 21] и др.
В литературе по кооперативной теории игр и ее приложениям в качестве кооперативного решения часто применяется C-ядро. В частности, в работе [27] приводятся условия существования сильно динамически устойчивого C-ядра в кооперативных динамических (дискретных) играх. В работе [2] впервые были сформулированы достаточные условия для выполнения сильной динамической устойчивости кооперативного решения в неантагонистической дифференциаль­ной игре двух лиц, а в работе [37] данная проблема изучалась для игры трех лиц.
Теория кооперативных дифференциальных игр изучает вопросы построения оптимальных (кооперативных) решений в конфликтно-управляемых процессах со многими участниками на определенном временном интервале. Но множе­ство подобных процессов развивается во времени непрерывно, а их участники непрерывно получают обновленную информацию и адаптируются. Именно для таких процессов был предложен подход позволяющий моделировать коопера­тивные игры с динамическим обновлением информации. Но возникает много вопросов, например, как для таких игр построить кооперативную траекторию, стратегии, ее порождающие, суммарный выигрыш вдоль кооперативной траек­тории, определить распределение суммарного выигрыша между игроками.
В выпускной квалификационной работе описывается новый подход к опре­делению решения кооперативной дифференциальной игры в условиях, когда игроки не имеют полную информацию об игре (уравнения движения, функция выигрыша) на всем временном интервале, на котором задана игра. В любой мо­мент времени игроки принимают решение, используя информацию на времен­ном интервале с продолжительностью меньшей, чем продолжительность исход­ной игры. Информация об игре обновляется в определенные моменты времени и неизвестна заранее. Согласно описанному подходу решение в игре определя­ется как комбинация решений в усеченных подыграх. В выпускной квалифика­ционной работе предложен метод для построения кооперативной траектории и соответствующего решения. Ключевым для построения решения является по­нятие усеченной подыгры, в рамках которой удается описать поведение игро­ков между моментами обновления информации. Оказывается, что в подобных играх любое построенное решение обладает свойством сильной динамической устойчивости.
В выпускной квалификационной работе были исследованы несколько моде­лей и подходов для определения решений в кооперативных дифференциальных играх с динамическим обновлением информации. Для кооперативных диффе­ренциальных игр с предписанной продолжительностью и динамическим обнов­лением информации было определено понятие усеченной подыгры, предложены способы построения условно кооперативной траектории и решений обладающих свойством At-сильной динамической устойчивости. Аналогичный результат по­лучен для кооперативных дифференциальных игр с бесконечной продолжи­тельностью. Была также рассмотрена модель, когда игроки, получая обновлен­ную информацию о структуре игры, не имели точной информации, в течение какого срока эта информация будет является актуальной. Единственное, что им было известно, это то, что информационный горизонт является случайной величиной. Подобный класс игр назван в выпускной квалификационной работе кооперативными дифференциальными играми с предписанной продолжитель­ностью и со случайным обновлением информации. Для них введено понятие случайной подыгры. В описанных постановках в качестве исходного коопера­тивного решения использовались вектор Шепли, пропорциональное решение, С-ядро и сильно динамически устойчивое ПРД-ядро.
Дифференциальные игры со случайной продолжительностью в общей поста­новке были введены в работе Л. А. Петросяна и Е. В. Шевкопляс [16]. В работе рассматривались дифференциальные игры со многими участниками, при этом момент окончания игры не был определен заранее, а представлял собой реа­лизацию некоторой случайной величины с известной функцией распределения. В работах Е. В. Шевкопляс [30, 31] были продолжены исследования коопера­тивных дифференциальных игр со случайной продолжительностью, получены важные результаты, относящиеся к проблеме динамической устойчивости ко­оперативных принципов оптимальности.
Цели и задачи исследования. Целью выпускной квалификационной ра­боты является формализация и построение оптимальных решений о распределении выигрышей в конфликтно-управляемых процессах со многими участниками, когда информация о процессе обновляется динамически с течением времени. Для достижения поставленной цели в работе ставятся и решаются следующие задачи:
1. Формализация поведения игроков на периодах между моментами време­ни, когда информация об игре обновляется, т.е. построение усеченных подыгр.
2. Исследование каждой усеченной подыгры, нахождение кооперативной траектории, построение характеристической функции вдоль кооператив­ных траекторий, получение оптимального решения.
3. Нахождение результирующего решения для игры, определенной на сово­купности всех временных интервалов.
4. Формализация общей кооперативной игры, определенной на совокупно­сти всех временных интервалов, определение характеристической функ­ции для игры с динамическим обновлением информации.
5. Исследование свойства сильной динамической устойчивости (сильной вре­менной состоятельности) результирующего решения дифференциальной кооперативной игры.
6. Построение результирующего решения, соответствующего набору класси­ческих решений в каждой усеченной подыгре, а именно пропорциональ­ного решения, вектора Шепли, C-ядра, сильно динамически устойчивого ПРД-ядра.
7. Исследование связи результирующего решения и решения в каждой усе­ченной подыгре, а именно пропорционального решения, вектора Шепли, C-ядра, сильно динамически устойчивого ПРД-ядра.
8. Изучение различных вариантов или моделей игр с динамическим обнов­лением информации, а именно: кооперативные дифференциальные игры с динамическим обновлением информации, с предписанной или беско­нечной продолжительностью, кооперативные дифференциальные игры со случайным обновлением информации.
9. Апробация полученных теоретических результатов на теоретико-игровой модели добычи ограниченного ресурса, демонстрация свойства сильной динамической устойчивости полученного решения.
Научная новизна полученных результатов. Научная новизна работы заключается в том, что в ней:
1. Построены и исследованы новые математические модели дифференци­альной игры с динамическим обновлением информации с предписанной и бесконечной продолжительностью, дифференциальной игры со случай­ным обновлением информации.
2. Предложены конструктивные методы нахождения результирующего ко­оперативного решения в дифференциальных играх с динамическим об­новлением информации с предписанной и бесконечной продолжительно­стью, дифференциальных играх со случайным обновлением информации.
3. Предложена процедура построения характеристической функции в играх с динамическим обновлением информации на основе значений характери­стических функций в усеченных подыграх.
4. Доказаны теоремы о сильной At-динамической устойчивости в диффе­ренциальных играх с динамическим обновлением информации с предпи­санной и бесконечной продолжительностью, дифференциальных играх со случайным обновлением информации.
5. Определена связь кооперативного решения в игре с динамическим обнов­лением информации и кооперативных решений (пропорциональное реше­ние, вектор Шепли, C-ядро, сильно динамически устойчивое ПРД-ядро), в каждой усеченной подыгре.
Практическая значимость. Полученные в выпускной квалификационной работе результаты представляют практический интерес. Кооперативные диф­ференциальные игры с динамическим обновлением информации, а также их различные варианты являются удобными математическими моделями для опи­сания процессов, происходящих в экономике, экологии, менеджменте и прочих сферах человеческой деятельности.
Методология и методы исследования. В процессе проведения иссле­дования автор опирался на научную методологию проведения исследования, общепризнанные принципы и подходы к исследовательской деятельности в об­ласти прикладной математики, методы теории оптимизации и теории игр.
Структура и основное содержание работы. Выпускная квалификаци­онная работа состоит из введения, двух глав, разбитых на параграфы, заключе­ния, списка используемой литературы, включающего 48 наименований. Объем составляет 73 страниц машинописного текста. Работа содержит 18 рисунков.
Первая глава посвящена описанию и изучению кооперативных дифферен­циальных игр с динамическим обновлением информации, как с предписанной продолжительностью так и с бесконечной продолжительностью. Для коопе­ративных дифференциальных игр с динамическим обновлением информации определено понятие усеченной подыгры, построена условно кооперативная тра­ектория, построено решение. Было показано, что решение обладает свойством At-сильной динамической устойчивости. Также была показана связь между ре­шениями, выбранными игроками в усеченных подыграх и в общей игре. Было введено понятие характеристической функции для общей игры, с помощью нее и решения для общей игры удалось показать, что решения, выбранные игрока­ми в усеченных подыграх, соответствуют результирующему решению, постро­енному на основе новой характеристической функции. В § 1 приводится опреде­ление усеченной подыгры, объясняется каким образом на основе этого понятия можно смоделировать поведение игроков. В § 2 описывается решение усеченной подыгры, строится условно-кооперативная траектория. В § 3 на основе резуль­татов в параграфе 2 строиться решение в игре с динамическим обновлением информации, доказывается свойство сильной At-динамической устойчивости. § 4 посвящен построению характеристической функции в игре с динамическим обновлением информации. В § 5 описывается и формализуется математически связь решений выбранных игроками в усеченных подыграх с результирующим решением в исходной игре с динамическим обновлением информации. В § 6 демонстрируется использование теоретических результатов для кооперативной игры добычи ограниченного ресурса трех лиц с предписанной продолжитель­ностью и динамическим обновлением информации, в качестве принципа опти­мальности используется C-ядро. Приводятся результаты численного моделиро­вания в среде Matlab.
Вторая глава посвящена описанию и изучению кооперативных дифферен­циальных игр с предписанной продолжительностью и случайным обновлени­ем информации. В этом случае игроки, получая обновленную информацию о структуре игры, не имеют точной информации, в течение какого срока эта ин­формация будет верна. Единственное, что им известно, это то, что величина информационного горизонта является случайной величиной. Понятие усечен­ной подыгры здесь основано на понятии дифференциальной игры со случайной продолжительностью и она названа случайной подыгрой. В качестве коопера­тивного решения этой подыгры использовалось сильно динамически устойчивое ПРД-ядро. Для построения С-ядра и сильно динамически устойчивого ПРД- ядро была доработана классическая кооперативная игра добычи ограниченного ресурса для случая трех игроков. В § 1 приводится определение случайной усе­ченной подыгры, объясняется, каким образом на основе этого понятия можно смоделировать поведения игроков, которые получают точную информацию об игре, но уверены только в вероятностных характеристиках длительности этой информации. В § 2 описывается сильно динамически устойчивое ПРД-ядро, как решение случайной усеченной подыгры, строится условно-кооперативная тра­ектория. В § 3 описывается решение в игре с динамическим обновлением инфор­мации, доказывается свойство сильной динамической устойчивости полученно­го решения. В § 4 теоретические результаты применяются для кооперативной игры добычи ограниченного ресурса трех лиц, демонстрируется свойство силь­ной динамической устойчивости выбранного решения, приведены результаты численного моделирования в среде Matlab.
Степень достоверности и апробация результатов исследования. До­стоверность полученных результатов основана на строгом доказательстве всех сформулированных математических утверждений. По теме выпускной квали­фикационной работы опубликовано 5 работ, две из которых ([22], [23]) - в изда­ниях, рекомендуемых Высшей аттестационной комиссией (ВАК) для публика­ции основных научных результатов. Публикации [38], [40], [41] индексируются в базе данных Scopus. В работе [23] аспирант построил новое решение для коопе­ративных дифференциальных игр с предписанной продолжительностью, обла­дающее свойствами сильной динамической устойчивостью - ПРД-ядро. В рабо­те [41] аспирантом была построена модель кооперативных дифференциальных игр с динамическим обновлением информации и стохастическим прогнозом, для этого класса игр было получено решение и доказано свойство сильной At- динамической устойчивости. В работе [38] аспирантом была сформулирована и решена задача определения в некотором смысле оптимального информацион­ного горизонта.
Основные результаты были представлены на семинарах кафедры матема­тического моделирования энергетических систем, на семинарах Центра теории игр, на международной конференции "Game Theory and Management"(Санкт- Петербург, 2015 и 2016 гг.), "Workshop on the Game Theory and Social Choice"(Будапешт, 2015 г.), на XIII международной конференции "Устойчи­вость и колебания нелинейных систем управления"(Москва, 2016 год).
Положения и результаты, выносимые на защиту. На защиту выно­сятся следующие результаты, полученные в ходе исследования:
1. Построены и исследованы новые математические модели дифференци­альной игры с динамическим обновлением информации с предписанной и бесконечной продолжительностью, дифференциальной игры со случай­ным обновлением информации.
2. Предложены конструктивные методы нахождения результирующего ко­оперативного решения в дифференциальных играх с динамическим об­новлением информации с предписанной и бесконечной продолжительно­стью, дифференциальных играх со случайным обновлением информации.
3. Предложена процедура построения характеристической функции в играх с динамическим обновлением информации на основе значений характери­стических функций в усеченных подыграх.
4. Доказаны теоремы о сильной At-динамической устойчивости в диффе­ренциальных играх с динамическим обновлением информации с предпи­санной и бесконечной продолжительностью, дифференциальных играх со случайным обновлением информации.
5. Определена связь кооперативного решения в игре с динамическим обнов­лением информации и кооперативных решений (пропорциональное реше­ние, вектор Шепли, C-ядро, сильно динамически устойчивое ПРД-ядро), в каждой усеченной подыгре.

Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


Основными результатами, полученными в ходе исследования и выносимыми на защиту, являются следующие:
1. Построены и исследованы новые математические модели дифференциальной игры с динамическим обновлением информации с предписанной и бесконечной продолжительностью, дифференциальной игры со случайным обновлением информации.
2. Предложены конструктивные методы нахождения результирующего кооперативного решения в дифференциальных играх с динамическим обновлением информации с предписанной и бесконечной продолжительностью, дифференциальных играх со случайным обновлением информации.
3. Предложена процедура построения характеристической функции в играх с динамическим обновлением информации на основе значений характеристических функций в усеченных подыграх.
4. Доказаны теоремы о сильной ∆t-динамической устойчивости в дифференциальных играх с динамическим обновлением информации с предписанной и бесконечной продолжительностью, дифференциальных играх со случайным обновлением информации.
5. Определена связь кооперативного решения в игре с динамическим обновлением информации и кооперативных решений (пропорциональное решение, вектор Шепли, C-ядро, сильно динамически устойчивое ПРД-ядро), в каждой усеченной подыгре.


1. Воробьев Н. Н. Теория игр для экономистов-кибернетиков. ЕМ: Наука. 1985. 272 с.
2. Громова Е. В., Петросян Л. А. Сильно динамически устойчивое кооперативное решение в одной дифференциальной игре управления вредными выбросами // Управление большими системами. 2015. N 55. С. 140-159.
3. Громова Е. В., Петросян Л. А. Об одном способе построения характеристической функции в кооперативных дифференциальных играх // Математическая теория игр и ее приложения. 2015. N 7. С. 19-39.
4. Данилов Н. Н. Кооперативные многошаговые игры с побочными платежами // Изв. Вузов. Мат. 1991. N 2. С. 33-42.
5. Клейменов А. Ф. К кооперативной теории бескоалиционных позиционных игр // Докл. АН СССР. 1990. Т. 312. N 1. С. 32-35.
6. Клейменов А. Ф. Кооперативные решения в позиционной дифференциальной игре многих лиц с непрерывными функциями платежей // Прикл. математика и механика. 1990. Т. 54. Вып. 3. С. 389-394.
7. Клейменов А. Ф. Неантагонистические позиционные дифференциальные игры. Екатеринбург: Наука. УРО. 1993. 185 с.
8. Клейменов А. Ф. О решениях в неантагонистической позиционной дифференциальной игре // Прикл. математика и механика. 1997. Т. 61. Вып. 5. С. 739-746.
9. Кононенко А. Ф. О равновесных позиционных стратегиях в неантагонистических дифференциальных играх // Доклады АН СССР. 1976. Т. 231. N 2. С. 285-288.
10. Костюнин С. Ю., Шевкопляс Е. В. Об упрощении интегрального выигрыша в дифференциальных играх со случайной продолжительностью // Вестн.
С.-Петерб. ун-та Сер.10: Прикладная математика, информатика, процессы управления. 2011. N 4. С. 47-56.
11. Красовский Н. Н. Управление динамической системой. Задача о минимуме гарантированного результата. М.: Наука, 1985. 469 с.
12. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. М.: Наука, 1974. 456 с.
13. Нейман Д. фон, Моргенштерн О. Теория игр и экономическое поведение. М.: Наука, 1970. 983 с.
14. Петросян Л. А. Устойчивость решений в дифференциальных играх со многими участниками // Вестн. ЛГУ. 1977. N 19. С. 46-52.
15. Петросян Л. А. Сильно динамически устойчивые дифференциальные принципы оптимальности // Вестн. ЛГУ. 1993. N 4. С. 35-40.
...


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ