Тип работы:
Предмет:
Язык работы:


Одна задача оптимального управления со случайным моментом окончания

Работа №130568

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы38
Год сдачи2016
Стоимость4750 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
16
Не подходит работа?

Узнай цену на написание


Введение 3
Постановка задачи 4
Обзор литературы 6
Глава 1. Преобразование функционала 7
Глава 2. Примеры 11
2.1. Максимизация математического ожидания 11
2.2. Минимизация дисперсии в классе линейных управлений . . 19
Глава 3. Теоретико-игровая постановка 28
Выводы 35
Заключение 36
Список литературы 37

На сегодняшний день теория управления стремится к максимально
приближенному к действительности построению математических моделей
реальных процессов. При решении данной задачи нельзя не учитывать их
случайный характер. Бесспорно, практически любой жизненный процесс
является стохастическим, так как время его окончания есть случайная величина. В прикладной теории оптимального управления часто рассматриваются экономические процессы, развивающиеся на бесконечном промежутке времени, при условии дисконтирования мгновенного выигрыша.
Недавние события в политической сфере нашей страны, а именно нарушение товарно-денежных отношений из-за введения санкций, привели к
досрочному прекращению многих бизнес процессов. Таким образом, рассмотрение задач оптимального управления со случайным моментом окончания представляется наиболее актуальным.
Как правило, при решении таких задач, под объектом максимизации понимается математическое ожидание соответствующего функционала, зависящего от случайной величины. Однако, результат оптимального
управления может оказаться нежелательным из-за большой вариации результирующего функционала.
Следовательно, имеет смысл определить управляющее воздействие
минимизирующее неопределенность (риск), возникающую из-за случайного характера проблемы. Наиболее очевидной мерой неопределенности является дисперсия, как отклонение от среднего значения.
В данной работе формулируется задача минимизации дисперсии выигрыша в виде задачи оптимального управления. Основным результатом
является упрощение вида дисперсии при выполнении определенных условий. Рассматриваются примеры при линейно-квадратичном виде функции
мгновенного выигрыша и различных функциях распределения момента
окончания управляемого процесса. Примеры рассматриваются как для задачи максимизации математического ожидания результирующего функционала, так и для задачи минимизации его дисперсии. При минимизации
дисперсии управление выбирается в классе функций, линейно зависящих
от времени. Этот класс управлений представляет особый интерес в силу
простоты реализации.



Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе проделанной работы была сформулирована новая задача оптимального управления: задача минимизации дисперсии выигрыша, как случайной величины. Значимым результатом является преобразование функционала дисперсии к стандартному виду, позволяющему применить принцип максимума Понтрягина для дальнейшего исследования. При применении принципа максимума к задаче (6) была значительно упрощена система
обыкновенных дифференциальных уравнений для сопряженных переменных: был понижен ее порядок.
Была решена задача минимизации дисперсии (6) для трех примеров с линейно-квадратичной функцией мгновенного выигрыша и тремя
различными видами функции распределения: равномерное распределение,
треугольное распределение и усеченное экспоненциальное распределение.
Данные распределения были выбраны как наиболее часто использующиеся в моделировании экономических управляемых процессов. Оптимальное
управление искалось в классе управлений, линейно зависящих от времени.
Во всех трех примерах нулевое управление являлось оптимальным.
Была изучена постановка задачи поиска управления, максимизирующего математическое ожидание выигрыша (5) и были исследованы три
примера с линейно-квадратичной функцией мгновенного выигрыша и тремя различными видами функции распределения: равномерное распределение, треугольное распределение и усеченное экспоненциальное распределение.
Была предложена теоретико-игровая постановка задачи, требующая
применения описанных в данной работе методов. Данная постановка задачи имеет большие перспективы для дальнейшей работы: рассмотрение
кооперативной постановки игры, постановка задачи, в которой один из игроков (одна коалиция) стремится максимизировать математическое ожидание выигрыша, другой игрок (другая коалиция) стремится минимизировать дисперсию.
Таким образом, полученная формула для преобразования дисперсии
может быть полезна для дискретных задач, стохастических процессов, игр.


[1] Yaari M. E. Uncertain lifetime, life insurance and the theory of the consumer. Rev. Econ. Stud. Vol. 32, No. 2, pp. 137-150, 1965.
[2] Петросян Л. А., Мурзов Н. В. Теоретико-игровые задачи механики // Литовский математический сборник — г. Вильнюс, — 1966. — T. 6, — С. 423-432
[3] Петросян Л. А., Шевкопляс Е. В. Кооперативные дифференциальные игры со случайной продолжительностью // Вестник СПбГУ. - 2000. - Сер. 1. - Вып. 4. - С. 18-23.
[4] Boukas E. K., Haurie A., Michel P. An optimal control problem with a random stopping time // SIAM Journal of Optimization Theory and Applications Vol. 64, No. 3, pp. 471-480, 1990.
[5] Pliska S. R., Ye J. Optimal life insurance purchase and consumption/investment under uncertain lifetime. J. Bank. Finance, Vol. 31, No. 5, pp. 1307-1319, 2007.
[6] Giri B. C., Goyal S. K., Recent trends in modeling of deteriorating inventory. Eur. J. Oper. Res. Vol. 134, No. 1, pp. 1-16, 2001.
[7] Kostyunin S., Palestini A., Shevkoplyas E. On a nonrenewable resource extraction game played by asymmetric firms // SIAM Journal of Optimization Theory and Applications, Vol. 163, No. 2, pp. 660-673, 2014.
[8] Marin-Solano J., Shevkoplyas E. V. Non-constant discounting and differential games with random time horizon. Automatica, Vol. 47, No. 12, pp. 2626-2638, 2011.
[9] Rockafellar R. T. Coherent approaches to risk in optimization under uncertainty. Tutorials in operations research, Vol. 3, pp.38-61, 2007.
[10] Rockafellar R. T., Uryasev S., Zabarankin M. Generalized deviations in risk analysis. Finance and Stochastics, Vol. 10, pp.51-74, 2006.
[11] Костюнин С. Ю., Шевкопляс Е. В. Об упрощении интегрального выиг-рыша в дифференциальных играх со случайной продолжительностью // Вестник Санкт-Петербургского университета. Серия 10: Приклад¬ная математика. Информатика. Процессы управления. 2011. № 4. С. 47-56.
[12] Понтрягин Л. С. Избранные научные труды. В 3 т. — М.: Наука, 1988.
[13] Petrosyan L., Zaccour G. Time-consistent Shapley value allocation of pollution cost reduction // Journal of Economic Dynamics and Control, 2003. Vol. 27, Issue 3. P. 381-398.
[14] Gromova E., Tur A. A game-theoretic model of pollution control with asymmetric time horizons. Submitted to Contributions to Game Theory and Management, 2016.
+202(1505p2 - 1060аД0 + 183а202)))


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ