Тема: Решение задачи длительной эксплуатации нескольких ресурсов методами дифференциальных игр
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Основные цели и задачи 6
Обзор литературы 8
1. Основные методы 10
1.1. Постановка задачи оптимального управления 11
1.2. Критерии отбора допустимых решений в случае их неединственности 12
1.2.1. Экономический критерий Басса 12
1.2.2. Математический метод для линейно-квадратичных за¬
дач оптимизации 13
1.3. Принцип оптимальности в кооперативной игре 14
1.3.1. Дележ. Вектор Шепли 14
1.3.2. Принцип динамической устойчивости. Процедура распределения дележа 15
1.4. Дифференциальная игра на сети 16
2. Теоретико-игровая модель управления инвестициями в
рекламу 19
2.1. Постановка задачи 19
2.2. Кооперативный случай 20
2.3. Применение критериев для отбора допустимых решений . . 22
2.3.1. Математический метод для линейно-квадратичных задач оптимизации 22
2.3.2. Экономический критерий Басса 23
2.4. Распределение кооперативного выигрыша 24
3. Теоретико-игровая модель управления объемами вредных
выбросов 27
3.1. Постановка задачи 27
3.2. Равновесие по Нэшу 28
3.2.1. Применение критериев для отбора допустимых решений 33
3.3. Модификация модели 34
3.3.1. Графическая интерпретация 36
3.4. Кооперативный случай 37
3.4.1. Графическая интерпретация 39
3.4.2. Распределение кооперативного выигрыша 41
4. Сетевая дифференциальная игра управления объемами вредных выбросов 42
4.1. Постановка задачи 42
4.2. Функции выигрыша 43
4.3. Решение коалиционной игры 44
Вывод 47
Заключение 49
Список литературы 50
📖 Введение
Грамотная рекламная политика является основным методом привлечения целевой аудитории, и, как следствие, неотъемлемой частью успешного функционирования компании, поэтому вопрос об управлении инвестициями в рекламную кампанию становится актуальным. Также как и вопрос об управлении объемами вредных выбросов в окружающую среду в связи с современной неблагоприятной экологической ситуацией.
В данной работе исследуются теоретико-игровые модели управления ресурсами с многомерной фазовой переменной на бесконечном временном промежутке с постоянной ставкой дисконтирования. В качестве ресурсов рассматриваются инвестиции в рекламу и количество выбросов в окружающую среду.
В первой главе приводятся основные модели и методы, используемые в ВКР. Формулируется постановка задачи оптимального управления на бесконечном промежутке времени с интегральной формой выигрыша и дисконтированием подынтегральной функции, рассматривается метод ее решения, а также критерии для отбора допустимых решений. Поиск оптимальных управлений в кооперативной дифференциальной игре также может быть описан в форме задачи оптимального управления, поскольку игроки объединяются с целью максимизации общего суммарного выигрыша.
Проблема распределения суммарного выигрыша между игроками, в том числе, с учетом фактора времени, описана с точки зрения проблемы динамической устойчивости. Распределение компонент дележа игроков предлагается осуществить согласно процедуре распределения дележа (ПРД).
Кроме того, в главе I формализуется постановка сетевой дифференциальной игры.
Во второй главе изучена кооперативная дифференциальная игра управления инвестициями в рекламную кампанию для случая nсимметричных игроков, которые конкурируют за объем собственных продаж некоторого однородного продукта с учетом амортизации, свойственной рынку. В третьей главе предложена модель управления объемами вредных выбросов при производстве взаимозаменяемых товаров для двух симметричных игроков при отсутствии абсорбции. Дифференциальная игра изучается как в кооперативной постановке, для которой также находится распределение общего выигрыша игроков, так и в некооперативной, в которой рассматривается вопрос существования квадратичного решения задачи. Показывается, что решение в обеих моделях является неединственным, поэтому осуществляется отбор допустимых решений с помощью критериев, предложенных в первой главе. В главах II и III также изучается проблема динамической устойчивости, т.е. реализации при долгосрочном процессе. Для решения данной проблемы используются схемы ПРД из главы I.
В последней главе математическая модель управления вредными выбросами формулируется как дифференциальная игра на сети, в которой находится равновесие по Нэшу.
Основные цели и задачи
Основной целью данной работы является исследование линейно - квадратичной дифференциальной игры с интегральным функционалом при условии бесконечного временного горизонта, дисконтированием функции полезности и, что существенно отличает данную работу от большинства известных широко изученных приложений линейно-квадратичных игр, с многомерной фазовой переменной. Поскольку в задачах такого типа возникает неединственность решений, достаточно широко встречающаяся в экономических работах (см., например, [27]), необходимо рассмотреть вопрос отбора допустимых решений.
Кроме того, актуальным вопросом является распределения полученного суммарного выигрыша в случае кооперации игроков между игроками, а также реализация выбранного игроками способа распределения выигрыша (кооперативного решения) на всем временном промежутке. Таким образом, при длительной эксплуатации ресурсов проблема динамической устойчивости выбранного кооперативного решения становится очень важной и назревает необходимость исследования и решения данной проблемы.
Еще одной целью работы являлась формализация сетевой постановки для дифференциальной игры, сформулированной Л.А. Петросяном в [29] в общем виде, для предложенной модели управления объемами вредных выбросов. Предполагается, что некоторые предприятия объединены “связями”, т.е. общими интересами, которые могут быть основанием для рассмотрения сетевой структуры.
В связи с поставленной целью формулируются следующие задачи:
1) Изучить основные методы, используемые для решения рассматриваемых моделей управления различными типами ресурсов.
2) Формализовать задачу оптимального управления инвестициями в рекламу в кооперативной постановке для nигроков, изучить различные способы отбора допустимых решений из множества полученных решений, а также рассмотреть вопрос распределения между игроками выигрыша, полученного в результате кооперации, в соответствии с принципом динамической устойчивости. Получить аналитические выражения для оптимальных управлений, траектории, значения функционала суммарного выигрыша, а также формулы для процедуры распределения дележа для случая полностью симметричных игроков.
3) Сформулировать модель управления объемами вредных выбросов как дифференциальную игру с многомерной фазовой переменной для двух игроков, рассмотреть игру в некооперативной и кооперативной постановке, найти решение задачи в аналитическом виде. Интерпретировать полученные результаты графически. Получить аналитические выражения для процедуры распределения дележа как средства решения проблемы динамической устойчивости кооперативного решения для случая симметричных игроков.
4) Построить сетевую модель управления объемами вредных выбросов трех игроков в случае образования коалиции двоих из них. Найти управления, максимизирующие выигрыш коалиции.
✅ Заключение
Показано, что уравнение Гамильтона-Якоби-Беллмана имеет неединственное решение, которое требует изучения для отбраковки несостоятельных решений. В ходе применения экономического критерия и классического метода, используемого для линейно-квадратичных задач оптимизации (LQR), было установлено:
дифференциальная игра управления рекламой имеет допустимое решение, которое удовлетворяет обоим критериям;
игра управления вредными выбросами в некооперативной постановке не имеет решений в указанных классах функций, полученные результаты также были проинтерпретированы графически.
Кроме того, в случае кооперативной постановки задачи в рассматриваемых моделях было найдено распределение общего выигрыша между игроками в соответствии с выбранными принципами оптимальности, а именно, вектором Шепли, а затем распределение его компонент во времени согласно процедуре распределения дележа (ПРД).
Также для модели управления выбросами была построена дифференциальная игра на сети для трех игроков. Выражения для управлений игроков в коалиционной игре были получены в аналитическом виде.
Таким образом, поставленные цели и задачи были достигнуты.



