Введение 3
Обзор литературы 5
Глава 1. Линейно-квадратичные дифференциальные игры эксплуатации ресурсов 6
Общее описание игры 6
Задача оптимального управления 9
Упрощение интегрального функционала кооперативной линейно-квадратичной дифференциальной игры 10
Потенциальные игры 11
Глава 2. Об упрощении интегрального функционала кооперативной линейно-квадратичной игры на примере задачи оптимального управления объемом вредных выбросов 14
Постановка задачи 14
Упрощение функции выигрыша в линейно-квадратичной дифференциальной игре 14
Решение кооперативной игры методом максимума Понтрягина . 16
Численный пример 18
Решение кооперативной игры с помощью уравнения Гамильтона—
Якоби—Беллмана 19
Глава 3. О решении линейно-квадратичной дифференциальной игры методом потенциала на примере задачи оптимального управления инвестициями в рекламу 22
Постановка задачи 22
Потенциал игры 22
Применение метода потенциала в решении дифференциальной игры 23
Численный пример 27
Глава 4. О решении линейно-квадратичной дифференциальной игры при известном виде оптимального управления 29
Выводы 31
Заключение 32
Список литературы 33
Дифференциальные игры являются удобным математическим аппаратом для изучения различного рода конфликтно-управляемых задач. В современной экономике огромное число разнообразных процессов может быть описано именно с помощью дифференциальных игр, очень часто имеющих линейно-квадратичную структуру. В частности, такие разноплановые, но актуальные в настоящий момент экономические задачи, как управление объемом вредных выбросов или инвестирование компанией средств в рекламу, описываются именно дифференциальными линейно-квадратичными играми.
В связи с широким использованием упомянутых моделей, неизбежно, что решение игр данного типа носит приоритетный характер. В линейно-квадратичных моделях можно выделить отдельные классы игр, которые могут быть решены за счет некоторых своих структурных особенностей. Именно таким классам игр, а также методам, позволяющим упростить поиск их аналитического решения, и посвящена данная работа.
В главе I осуществляется формальная постановка задачи оптимального управления эксплуатацией ресурсов, объединяющей в себе в том числе и задачу управления объемом вредных выбросов, и задачу управления инвестициями в рекламу. Рассматривается теоретическая база, используемая для решения задач данного типа: принцип максимума Понтрягина и уравнение Гамильтона—Якоби—Беллмана. Дополнительно рассмотрены метод упрощения интегрального функционала линейно-квадратичной дифференциальной игры и метод потенциала. Данные методы позволяют облегчить поиск аналитического решения линейно-квадратичных дифференциальных игр в тех случаях, когда применение принципа максимума Понтрягина и уравнения Гамильтона—Якоби—Беллмана затруднено.
В главе II более подробно рассматривается метод, позволяющий упростить интегральный функционал линейно-квадратичной дифференциальной игры путем замены фазовой переменной. Детально изучается применение данного метода на примере задачи оптимального управления вредными выбросами в кооперативной постановке для числа игроков п = 3. Аналитическое решение данной задачи будет найдено двумя способами: с помощью принципа максимума Понтрягина и с помощью уравнения Гамильтона— Якоби—Беллмана. Также рассматривается численный пример задачи, в котором использованы значения параметров, полученные экспериментальным путем.
В главе IIIрассмотрено применение метода потенциала при решении линейно-квадратичных дифференциальных игр на примере задачи оптимального управления инвестициями в рекламу. Игра изучается в некооперативной постановке с дисконтированием e~ptна бесконечном промежутке времени для числа игроков п = 2. Рассматривается также численный пример задачи.
В главе IV рассмотрен дополнительный метод решения линейно-квадратичной дифференциальной игры, применимый в том случае, когда известен вид искомого оптимального управления. Метод будет применен для решения задачи оптимального управления вредными выбросами в некооперативной постановке для числа игроков п = 3.
В ходе проделанной работы были рассмотрены различные методы решения дифференциальных игр с линейно-квадратичной функцией выигрыша на примере игр эксплуатации ресурсов.
Было проделано преобразование фазовой переменной для кооперативной игры управления выбросами в атмосферу, позволившее структурно упростить интегральный функционал игры. Показано, что применение данного метода значительно упрощает поиск решения рассмотренной задачи.
Также в работе был предложен новый путь решения дифференциальной игры управления ресурсами в рекламную кампанию. Было показано, что игра данного типа принадлежит классу потенциальных игр, решение которых может быть упрощено с помощью нахождения потенциала игры и сведения задачи к соответствующей задаче оптимального управления.
[1] Dockner E. J., Jorgensen S., Long N. V., Sorger G. Differential Games in Economics and Management Science. Cambridge: Cambridge University Press, 2000. 396 p.
[2] Haurie A., Krawczyk J. B., Zaccour G. Games and Dynamic Games. Singapore: World Scientific Publishing, 2012. 465 p.
[3] Петросян Л.А., Зенкевич H. А., Шевкопляс Е. В. Теория игр. СПБ.: Изд-во БХВ-Петербург, 2012. 432 с.
[4] Jprgensen S., Gromova E. Sustaining cooperation in a differential game of advertising goodwill accumulation. European Journal of Operational Research. 2016. P. 294-303.
[5] Olsder G. G., Basar T. Dynamic Noncooperative Game Theory, 2nd Edition. New York: Academic Press, 1999. 519 p.
[6] de Frutos J., Martm-Herran G. Selection of a Markov Perfect Nash Equilibrium in a Class of Differential Games. Dyn Games Appl (2018) 8: 620
[7] Gromova E. (2016) The Shapley Value as a Sustainable Cooperative Solution in Differential Games of Three Players. In: Petrosyan L., Mazalov V. (eds) Recent Advances in Game Theory and Applications. Static & Dynamic Game Theory: Foundations & Applications. Birkhauser, Cham
[8] Gromov D., Gromova E. On a class of hybrid differential games. Dynamic games and applications. 2016. Vol.7, № 2. P. 266-288.
[9] Лахина Ю.Э. Оптимальное управление в задаче эксплуатации нескольких ресурсов. Выпускная квалификационная работа бакалавра.
[10] Pontryagin L.S., Boltyanskii V.G., Gamkrelidze R.V., Mishenko E. Matematicheskaya teoriya optimal’nykh protsessov. Nauka, 1983.
[11] Gromova E.V., Tur A.V., Barsuk P.I. A pollution control problem for the aluminum production in Eastern Siberia: Differential game approach. submitted to SCP 2020
[12] Беллман Р. Динамическое пргораммирование. М.:И.Л., 1960
[13] Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. - М.: Наука, 1974. - 455 с.
[14] Gonzalez-Sanchez D., Hernandez-Lerma O. Potential Differential Games. Dyn Games Appl (2018) 8: 254-279
[15] MondererD.,ShapleyL.S.Potential games. Games and Economic Behavior. 1996. V. 14. P. 124-143.
[16] Dechert W.D. Optimal control problems from second order difference equations. J. Econ. Theory. 1978. V. 19. P. 50-63.
[17] Dechert W.D. Noncooperative dynamic games: a control theoretic approach. University of Houston, 1997.
[18] Владимир В. Мазалов, Анна Н. Реттиева, Константин Е. Авраченков, Линейно-квадратичные динамические потенциальные игры в дискретном времени, МТИП, 9:1 (2017), 95-107; Autom. Remote Control, 78:8 (2017), 1537-1544
[19] Gromova E. Теоретико-игровые задачи со случайной продолжительностью.
[20] Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление, М.: Наука, 1979, 432 с.
[21] Basar T. and Olsder G.J. Dynamic Noncooperative Game Theory, 2nd edition, Classics in Applied Mathematics, SIAM, Philadelphia, 1999. 536 p.