Введение 4
Основные цели и задачи 6
Обзор литературы 8
1. Основные методы 10
1.1. Постановка задачи оптимального управления 11
1.2. Критерии отбора допустимых решений в случае их неединственности 12
1.2.1. Экономический критерий Басса 12
1.2.2. Математический метод для линейно-квадратичных за¬
дач оптимизации 13
1.3. Принцип оптимальности в кооперативной игре 14
1.3.1. Дележ. Вектор Шепли 14
1.3.2. Принцип динамической устойчивости. Процедура распределения дележа 15
1.4. Дифференциальная игра на сети 16
2. Теоретико-игровая модель управления инвестициями в
рекламу 19
2.1. Постановка задачи 19
2.2. Кооперативный случай 20
2.3. Применение критериев для отбора допустимых решений . . 22
2.3.1. Математический метод для линейно-квадратичных задач оптимизации 22
2.3.2. Экономический критерий Басса 23
2.4. Распределение кооперативного выигрыша 24
3. Теоретико-игровая модель управления объемами вредных
выбросов 27
3.1. Постановка задачи 27
3.2. Равновесие по Нэшу 28
3.2.1. Применение критериев для отбора допустимых решений 33
3.3. Модификация модели 34
3.3.1. Графическая интерпретация 36
3.4. Кооперативный случай 37
3.4.1. Графическая интерпретация 39
3.4.2. Распределение кооперативного выигрыша 41
4. Сетевая дифференциальная игра управления объемами вредных выбросов 42
4.1. Постановка задачи 42
4.2. Функции выигрыша 43
4.3. Решение коалиционной игры 44
Вывод 47
Заключение 49
Список литературы 50
В настоящее время модели управления ресурсами имеют широкое применение в таких важных областях как экономика и экология, поскольку позволяют решать актуальные проблемы.
Грамотная рекламная политика является основным методом привлечения целевой аудитории, и, как следствие, неотъемлемой частью успешного функционирования компании, поэтому вопрос об управлении инвестициями в рекламную кампанию становится актуальным. Также как и вопрос об управлении объемами вредных выбросов в окружающую среду в связи с современной неблагоприятной экологической ситуацией.
В данной работе исследуются теоретико-игровые модели управления ресурсами с многомерной фазовой переменной на бесконечном временном промежутке с постоянной ставкой дисконтирования. В качестве ресурсов рассматриваются инвестиции в рекламу и количество выбросов в окружающую среду.
В первой главе приводятся основные модели и методы, используемые в ВКР. Формулируется постановка задачи оптимального управления на бесконечном промежутке времени с интегральной формой выигрыша и дисконтированием подынтегральной функции, рассматривается метод ее решения, а также критерии для отбора допустимых решений. Поиск оптимальных управлений в кооперативной дифференциальной игре также может быть описан в форме задачи оптимального управления, поскольку игроки объединяются с целью максимизации общего суммарного выигрыша.
Проблема распределения суммарного выигрыша между игроками, в том числе, с учетом фактора времени, описана с точки зрения проблемы динамической устойчивости. Распределение компонент дележа игроков предлагается осуществить согласно процедуре распределения дележа (ПРД).
Кроме того, в главе I формализуется постановка сетевой дифференциальной игры.
Во второй главе изучена кооперативная дифференциальная игра управления инвестициями в рекламную кампанию для случая nсимметричных игроков, которые конкурируют за объем собственных продаж некоторого однородного продукта с учетом амортизации, свойственной рынку. В третьей главе предложена модель управления объемами вредных выбросов при производстве взаимозаменяемых товаров для двух симметричных игроков при отсутствии абсорбции. Дифференциальная игра изучается как в кооперативной постановке, для которой также находится распределение общего выигрыша игроков, так и в некооперативной, в которой рассматривается вопрос существования квадратичного решения задачи. Показывается, что решение в обеих моделях является неединственным, поэтому осуществляется отбор допустимых решений с помощью критериев, предложенных в первой главе. В главах II и III также изучается проблема динамической устойчивости, т.е. реализации при долгосрочном процессе. Для решения данной проблемы используются схемы ПРД из главы I.
В последней главе математическая модель управления вредными выбросами формулируется как дифференциальная игра на сети, в которой находится равновесие по Нэшу.
Основные цели и задачи
Основной целью данной работы является исследование линейно - квадратичной дифференциальной игры с интегральным функционалом при условии бесконечного временного горизонта, дисконтированием функции полезности и, что существенно отличает данную работу от большинства известных широко изученных приложений линейно-квадратичных игр, с многомерной фазовой переменной. Поскольку в задачах такого типа возникает неединственность решений, достаточно широко встречающаяся в экономических работах (см., например, [27]), необходимо рассмотреть вопрос отбора допустимых решений.
Кроме того, актуальным вопросом является распределения полученного суммарного выигрыша в случае кооперации игроков между игроками, а также реализация выбранного игроками способа распределения выигрыша (кооперативного решения) на всем временном промежутке. Таким образом, при длительной эксплуатации ресурсов проблема динамической устойчивости выбранного кооперативного решения становится очень важной и назревает необходимость исследования и решения данной проблемы.
Еще одной целью работы являлась формализация сетевой постановки для дифференциальной игры, сформулированной Л.А. Петросяном в [29] в общем виде, для предложенной модели управления объемами вредных выбросов. Предполагается, что некоторые предприятия объединены “связями”, т.е. общими интересами, которые могут быть основанием для рассмотрения сетевой структуры.
В связи с поставленной целью формулируются следующие задачи:
1) Изучить основные методы, используемые для решения рассматриваемых моделей управления различными типами ресурсов.
2) Формализовать задачу оптимального управления инвестициями в рекламу в кооперативной постановке для nигроков, изучить различные способы отбора допустимых решений из множества полученных решений, а также рассмотреть вопрос распределения между игроками выигрыша, полученного в результате кооперации, в соответствии с принципом динамической устойчивости. Получить аналитические выражения для оптимальных управлений, траектории, значения функционала суммарного выигрыша, а также формулы для процедуры распределения дележа для случая полностью симметричных игроков.
3) Сформулировать модель управления объемами вредных выбросов как дифференциальную игру с многомерной фазовой переменной для двух игроков, рассмотреть игру в некооперативной и кооперативной постановке, найти решение задачи в аналитическом виде. Интерпретировать полученные результаты графически. Получить аналитические выражения для процедуры распределения дележа как средства решения проблемы динамической устойчивости кооперативного решения для случая симметричных игроков.
4) Построить сетевую модель управления объемами вредных выбросов трех игроков в случае образования коалиции двоих из них. Найти управления, максимизирующие выигрыш коалиции.
В ходе проделанной работы были рассмотрены модели управления в дифференциальных играх двумя типами ресурсов: инвестирование в рекламу (в кооперативной постановке для nигроков) и выбросы в окружающую среду (в кооперативной и некооперативной постановке для двух игроков).
Показано, что уравнение Гамильтона-Якоби-Беллмана имеет неединственное решение, которое требует изучения для отбраковки несостоятельных решений. В ходе применения экономического критерия и классического метода, используемого для линейно-квадратичных задач оптимизации (LQR), было установлено:
дифференциальная игра управления рекламой имеет допустимое решение, которое удовлетворяет обоим критериям;
игра управления вредными выбросами в некооперативной постановке не имеет решений в указанных классах функций, полученные результаты также были проинтерпретированы графически.
Кроме того, в случае кооперативной постановки задачи в рассматриваемых моделях было найдено распределение общего выигрыша между игроками в соответствии с выбранными принципами оптимальности, а именно, вектором Шепли, а затем распределение его компонент во времени согласно процедуре распределения дележа (ПРД).
Также для модели управления выбросами была построена дифференциальная игра на сети для трех игроков. Выражения для управлений игроков в коалиционной игре были получены в аналитическом виде.
Таким образом, поставленные цели и задачи были достигнуты.
[1] Беллман Р. Динамическое пргораммирование М.:И.Л., 1960.
[2] Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. М.: Наука, 1974. 455 с.
[3] Frutos J., Martin-Herran G. Selection of a Markov perfect Nash equilibrium in a class of differential games. Dynamic Games and Applications. Vol. 8, № 3. 2018. P. 620-636.
[4] Fershtman C., Nitzan S. Dynamic voluntary provision of public goods. European Economic Review. Vol. 35, № 5. 1991. P. 1057-1067.
[5] Wirl F. Dynamic voluntary provision of public goods: extension for nonlinear strategies. European Journal of Political Economy. Vol. 12, № 3. 1996. P. 555-560.
[6] Dockner E. J. Optimal pricing in a dynamic duopoly game model. Zeitschrift fur Operations Research. Basar T. Informationally nonunique equilibrium solutions in differential games. 1985. P. 1-16.
[7] Leitmann G., and Schmitendorf W. E. Profit maximization through advertising: nonzero-sum differential game approach. IEEE Transactions on Automatic Control. Vol. 23, № 4. 1978. P. 645-650.
[8] Basar T. Informationally nonunique equilibrium solutions in differential games. SIAM Journal on Control and Optimization. Vol. 15, № 4. 1977. P. 636—660.
[9] Driskill R. Durable goods monopoly, increasing marginal cost and depreciation. Economica. Vol. 64, № 253. 1997. P. 137—154.
[10] Cartigny P., Michel P. On the Selection of One Feedback Nash Equilibrium in Discounted Linear-Quadratic Games. Journal of Optimization Theory and Applications. Vol. 117, № 2. 2003. P. 231—243.
[11] Громова Е. В., Громов Д. В., Лахина Ю. Э. О дифференциальной игре управления инвестициями в рекламную кампанию. Труды института математики и механики УРО РАН. Т. 24, № 2. 2018. С. 64-75.
[12] Петросян Л. А., Зенкевич Н.А., Шевкопляс Е. В. Теория игр. СПБ.: Изд-во БХВ-Петербург, 2012. 432 с.
[13] Жуковский В. И., Чикрий A. А. Линейно-квадратичные дифференциальные игры. Киев: Науковая думка, 1994. 320 с.
[14] Olsder G. G., Basar T. Dynamic Noncooperative Game Theory, 2nd Edition. New York: Academic Press, 1999. 519 p.
[15] Dockner E. J., Jorgensen S., Long N.V., Sorger G. Differential Games in Economics and Management Science. Cambridge: Cambridge University Press, 2000. 396 p.
[16] Jorgensen S., Zaccour G. Differential Games in Marketing. Boston: Kluwer Academic Publisher. 2004. 159 p.
[17] Papavassilopoulos G., Olsder G. J. On the linear-quadratic, closedloop, no-memory Nash game. Journal of Optimization Theory and Applications. Vol. 42, № 4. 1984. P. 551—560.
[18] Reddy P. V., Zaccour G.: Feedback Nash equilibria in linear-quadratic difference games with constraints. IEEE Transactions on Automatic Control. Vol. 62, № 2. 2017. P. 590—604.
[19] Шевкопляс Е. В. Устойчивая кооперация в дифференциальных играх со случайной продолжительностью. УБС, 31.1. 2010. С. 162—190.
[20] Singh R., Wisznieszka-Matyszkiel A. Linear-quadratic game of exploitation of common renewable resources with inherent constraints. Topological Methods in Nonlinear Analysis. Vol. 51, № 1. 2018. P. 23—54.
[21] Dockner E.J., Sorger G.: Existence and properties of equilibria for a dynamic game on productive assets. J. Economic Theory. Vol. 71, № 1. 1996. P. 209—227.
[22] Singh R., Wisznieszka-Matyszkiel A.: Discontinuous Nash Equilibria in a Two Stage Linear-Quadratic Dynamic Game with Linear Constraints. IEEE Transactions on Automatic Control. Vol. 64, № 7. 2018. P. 3074-3079.
[23] Kononenko A.: The structure of the optimal strategy in controlled dynamic systems. USSR Computational Mathematics and Mathematical Physics. Vol. 20, № 5. 1980. P. 13-24.
[24] Malafeev O.: Stationary strategies in differential games. USSR Computational Mathematics and Mathematical Physics. Vol. 17, № 1. 1977. P. 37-46.
[25] Basar T.: On the uniqueness of the Nash solution in linear-quadratic differential games. International Journal of Game Theory. Vol. 5, № 2-3. 1976. P. 65—90.
[26] Gromova E., Lakhina Yu. On the selection of the Nash equilibria in a linear-quadratic differential game of pollution control. Frontiers of Dynamic Games. Ed. by L. Petrosyan, V. Mazalov, N. Zenkevich. St. Petersburg. 2018. P. 37-48.
[27] Bass F. M., Krishnamoorthy A., Prasad A., Sethi S. P. Generic and brand advertising strategies in a dynamic duopoly. Marketing Science. Vol. 24, № 4. 2005. P. 556-568.
[28] Александров А. Г. Оптимальные и адаптивные системы: Учеб. пособие для вузов по спец. «Автоматика и упр. в техн. системах». М.: Высшая школа, 1989. 263 с.
[29] Петросян Л. А. Кооперативные дифференциальные игры на сетях. Тр. Ин-та математики и механики УрО РАН. Т. 16, № 5, 2010. С. 143-150.
[30] Мазалов В. В. Математическая теория игр и приложения. Спб.: Изд-во Лань, 2010. 448 с.
[31] Жабко А. П., Котина Е. Д., Чижова О. Н. Дифференциальные уравнения и устойчивость. Спб.: Изд-во Лань, 2015. 310 с.
[32] Лахина Ю. Э. Оптимальное управление инвестициями в рекламу на рынке однородной продукции. Процессы управления и устойчивость. 2018. Т 5. № 1. С. 470-474.
[33] Лахина Ю. Э. О существовании равновесия по Нэшу в некооперативной дифференциальной игре управления объемами вредных выбросов. Процессы управления и устойчивость. 2020.
[34] Лахина Ю. Э. Оптимальное управление в задаче эксплуатации нескольких ресурсов. Архив открытого доступа Санкт-Петербургского государственного университета. 2018. 45 с.