Точные штрафы в задаче оптимального управления в форме Лагранжа
|
Введение 4
1 Предварительные сведения 10
2 Полиномы от интегральных функционалов 15
2.1 Постановка задачи 15
2.2 Необходимые условия минимума 18
2.3 Метод наискорейшего спуска 21
2.4 Случай ограничения на правом конце 23
2.5 Дифференциальные свойства функционала ' 24
2.6 Метод гиподифференциального спуска 25
2.7 Некоторые приложения 28
3 Программное управление 31
3.1 Постановка задачи 31
3.2 Сведение к вариационной задаче 32
3.3 Необходимые условия минимума 32
3.4 Метод субдифференциального спуска 35
3.5 Метод гиподифференциального спуска 36
3.6 Численные примеры 38
4 Оптимальное управление 43
4.1 Постановка задачи 43
4.2 Сведение к вариационной задаче 44
4.3 Необходимые условия минимума 45
4.4 Метод субдифференциального спуска 48
4.5 Метод гиподифференциального спуска 54
4.6 Численные примеры 61
5 Дифференциальные включения 66
5.1 Постановка задачи 66
5.2 Эквивалентная постановка задачи 67
5.3 Дифференциальные свойства функционалов <ри I ................ 68
5.4 Необходимые условия минимума 70
5.5 Численные примеры 71
6 Задача Коши 75
6.1 Постановка задачи 75
6.2 Сведение к вариационной задаче 76
6.3 Необходимые условия минимума 76
6.4 Метод наискорейшего спуска 77
6.5 Метод сопряжённых направлений 78
6.6 Численные примеры 79
6.7 Случай неразрешённости относительно производных 80
Заключение 82
Список обозначений 84
Литература 86
1 Предварительные сведения 10
2 Полиномы от интегральных функционалов 15
2.1 Постановка задачи 15
2.2 Необходимые условия минимума 18
2.3 Метод наискорейшего спуска 21
2.4 Случай ограничения на правом конце 23
2.5 Дифференциальные свойства функционала ' 24
2.6 Метод гиподифференциального спуска 25
2.7 Некоторые приложения 28
3 Программное управление 31
3.1 Постановка задачи 31
3.2 Сведение к вариационной задаче 32
3.3 Необходимые условия минимума 32
3.4 Метод субдифференциального спуска 35
3.5 Метод гиподифференциального спуска 36
3.6 Численные примеры 38
4 Оптимальное управление 43
4.1 Постановка задачи 43
4.2 Сведение к вариационной задаче 44
4.3 Необходимые условия минимума 45
4.4 Метод субдифференциального спуска 48
4.5 Метод гиподифференциального спуска 54
4.6 Численные примеры 61
5 Дифференциальные включения 66
5.1 Постановка задачи 66
5.2 Эквивалентная постановка задачи 67
5.3 Дифференциальные свойства функционалов <ри I ................ 68
5.4 Необходимые условия минимума 70
5.5 Численные примеры 71
6 Задача Коши 75
6.1 Постановка задачи 75
6.2 Сведение к вариационной задаче 76
6.3 Необходимые условия минимума 76
6.4 Метод наискорейшего спуска 77
6.5 Метод сопряжённых направлений 78
6.6 Численные примеры 79
6.7 Случай неразрешённости относительно производных 80
Заключение 82
Список обозначений 84
Литература 86
Дифференциальное исчисление, основы которого были заложены в трудах Ньютона [113] и Лейбница [105], безусловно, представляет собой мощнейший аппарат, без которого сложно представить себе успешное развитие многих разделов математики.
Однако с течением времени оказалось, что многие задачи, возникающие в приложениях и в самой математике, требуют исследования недифференцируемых функций и создания полноценного инструмента работы с ними. Такая потребность привела к появлению сравнительно новых разделов математики: негладкого анализа и недифференцируемой оптимизации. Большой вклад в их развитие внесли такие учёные, как В. Ф. Демьянов [20, 24, 82, 83], А. М. Рубинов [28, 29, 85], Л. Н. Полякова [27, 56, 57, 86, 117, 118], В. Н. Малозёмов [26], Б. Н. Пшеничный [58, 59, 60], С. С. Кутателадзе [48, 49], А. Д. Иоффе [97, 35], Н. 3. Шор [74, 75], Дж. Данскин [16], Ф. Кларк [41, 81], Р. Рокафеллар [61, 98], Ж.-П. Обен [52].
Стремительное развитие этих наук и успешное решение многих важных теоретических и прикладных задач подтвердили эффективность этих разделов и окончательно развеяли некоторые предположения о том, что негладкие задачи являются патологией или экзотикой. Напротив, данные разделы прочно вошли в современную структуру математической науки и представляют собой самостоятельные, мощные и постоянно развивающиеся дисциплины, которые, к слову сказать, оказываются даже более широкими, чем классическое дифференциальное исчисление, поскольку обобщают его понятия и позволяют получать многие его результаты как следствия своей, более общей, теории.
Конечно, многие негладкие задачи можно чисто технически или исходя из каких-то общих соображений, сделать гладкими и тогда уже применять к ним весь богатый арсенал методов дифференциального исчисления. Процесс такого сведения получил название «сглаживание». Однако это не всегда оказывается эффективно и просто реализуемо. Простой пример функции, сглаживание которой не позволяет исследовать те её свойства, которые связаны с понятием градиента, приведён в [21]. Ещё одним примером невозможности сглаживания может служить теория точных штрафных функций, которая эффективно при-меняется при решении задач условной оптимизации. Сама же точная штрафная функция является существенно негладкой.
Теория точных штрафных функций получила широкое распространение при решении задач условной оптимизации [33, 123]. Она позволяет сводить исходную задачу при наличии ограничений к задаче безусловной оптимизации. Как показали многочисленные исследования [95, 115, 116, 121], такое сведение часто довольно очевидно даже для сложных задач как конечномерной, так и бесконечномерной оптимизации. Для достаточно широкого класса задач при некоторых естественных предположениях удаётся показать, что построенная функция — точная штрафная. И хотя по построению она оказывается негладкой, для её оптимизации можно применять уже многие хорошо разработанные методы недифференцируемой оптимизации. Отметим, что наряду с получением достаточных условий точности штрафной функции [23, 79, 88, 92] продолжаются разработки различных конструкций точных штрафных функций с полезными свойствами [96, 114, 122]. Идея использования точных штрафных функций была предложена И. И. Ерёминым в [33].
Как уже отмечалось, негладкий анализ с момента его зарождения значительно пополнился различными методами решения задач оптимизации. Многие методы опираются на необходимые условия экстремума, которые, в свою очередь, можно формулировать в терминах таких фундаментальных понятий негладкой оптимизации, как производная по направлению и субдифференциал [24]. Последнее понятие дало название методу субдифференциального спуска. Общая схема метода состоит в поиске направления спуска в данной точке и осуществлению движения с некоторым шагом по этому направлению. В результате получаем последовательность, которая в некоторых случаях сходится к точке экстремума. К сожалению, субдифференциальное отображение является разрывным в метрике Хаусдорфа [24], что не позволяет в общем случае гарантировать сходимость метода. Поэтому наряду с данным методом разрабатывались его модификации [23, 65], а также методы, основанные на других понятиях негладкого анализа. В частности, весьма эффективным оказался метод гиподифференциального спуска, основанный на введённом В. Ф. Демьяновым понятии гиподифференциала, который является обобщением субдифференциала. Гиподифференциальное отображение, в отличие от субдифференциального, является непрерывным в метрике Хаусдорфа для очень широкого класса функций [28], что обеспечивает сходимость метода во многих задачах. Отметим, что преимущество гиподифференциала заключается ещё и в наличии богатого и удобного исчисления. Так, например, эпсилон-субдифференциальное отображение также является непрерывным по Хаусдорфу для широкого класса функций [51], однако применение эпсилон-субдифференциального спуска значительно затруднено, поскольку исчисления эпсилон-субдифференциалов громоздко и очень сложно даже в самых простых задачах [24].
Метод гиподифференциального спуска начал применяться В. Ф. Демьяновым и Г. Ш. Тамасяном и к бесконечномерным, а именно к вариационным задачам [31, 62, 64, 87], и показал там свою эффективность. Он показал не только практическую пользу, но и свою большую теоретическую роль, поскольку позволил выработать единообразный, оптимизационный подход к широкому классу задач и получить многие фундаментальные результаты вариационного исчисления. Задачи оптимального управления относятся к классу наиболее сложных вариационных задач. Теория точных штрафов применялась к задачам теории управления В. Ф. Демьяновым и В. В. Карелиным [84]. В частности, в работе [38] с помощью теории точных штрафов был получен принцип максимума Л.С. Понтрягина для задачи оптимального управления в достаточно общей постановке.
Теория оптимального управления возникла и формировалась под существенным влиянием исследований космических летательных аппаратов. Одна из первых задач оптимального управления была поставлена Д. Е. Охоцимским в статье [54]. Существенным толчком, инициировавшим целую серию как теоретических, так и практических исследований, стали принцип максимума, полученный Л. С. Понтрягиным, В. Г. Болтянским, Е. Ф. Мищенко и Р. В. Гамкрелидзе [55] и метод динамического программирования, разработанный Р. Веллманом [7, 8]. К решению задач оптимального управления применяются различные подходы. Существует класс методов, основанных на сведении исходной задачи к краевой задаче [36, 50, 99, 103, 106, 108, 112, 119], которое осуществляется при помощи принципа максимума. Ещё одну группу методов, опирающихся на принцип максимума, составляют различные методы последовательных приближений [5, 6, 19, 22, 30, 40, 45, 46, 47, 50, 102]. В основе другой обширной группы методов лежат итерационные процессы в пространстве управлений, которые базируются на вариациях минимизируемого функционала [4, 100, 101, 50, 53, 73, 76, 80, 93, 94, 120]. Наконец, целая серия методов базируется на принципе динамического программирования и состоит в основном в переборе в пространстве фазовых координат и анализе вариантов. Многие из перечисленных схем также существенно используют методы математического программирования (например, градиентные методы, метод Ньютона, методы Ритца и Галёркина [9]) и эффективность решения задач управления в значительной степени определяется умением эффективно решать оптимизационные задачи. Конечно, перечисленными методами не исчерпывается необозримое количество схем и подходов, накопившихся с момента возникновения теории управления. Однако, как показывают многочисленные исследования, любой из перечисленных подходов сложно назвать универсальным, охватывающим значительную часть линейных и нелинейных задач. Подтверждением этого является то, что многие методы индивидуальны, рассчитаны на очень узкий класс задач, у многих не доказана или даже не исследовалась сходимость [50], что не мешает считать их эффективными и признанными методами решения задач оптимального управления. Естественно, что для линейных задач удалось осуществить значительное продвижение как в теоретической части (так, например, Н. Н. Красовским разработана полная теория линейных задач оптимального управления, основанная на проблеме моментов [42], В. И. Зубовым — на результатах линейной алгебры [34]), так и в решении вычислительных проблем (например, схема А. А. Абрамова [50] позволяет обеспечить устойчивость счёта). Задача оптимального управления относится к вариационной задаче в достаточно общей постановке. Поэтому неудивительно, что многие результаты вариационного исчисления являются следствиями принципа максимума Л. С. Понтрягина [55]. Здесь же стоит отметить, что многие фундаментальные результаты теории динамического программирования Р. Веллмана также вытекают из принципа максимума [55].
Одной из актуальных задач, исследуемых в данной работе, является построение метода решения задачи оптимального управления в форме Лагранжа с интегральным ограничением на управление. Отметим, что при фиксированной начальной точке к данной задаче может быть сведена и более общая задача оптимального управления в форме Больца [50]. Различные задачи с интегральным ограничением на управление рассматривались В. Ф. Демьяновым и А. М. Рубиновым в работе [30] и А. С. Антипиным и Е. В. Хорошиловой в статьях [1, 2, 3]. Изначальный оптимизационный подход позволяет считать предложенный в работе метод в достаточной степени универсальным. Общая схема этого метода может быть описана следующим образом. При помощи аппарата точных штрафных функций исходная задача минимизации интегрального функционала качества при наличии ограничений в виде нелинейной системы дифференциальных уравнений, начального и конечного положения объекта и при интегральном ограничении на управление сводится к задаче безусловной минимизации некоторого функционала. Далее формулируются необходимые условия минимума данного функционала. Здесь стоит упомянуть, что известный интегральный принцип максимума получается из этого условия как следствие, что ещё раз свидетельствует в пользу достаточной общности применяемого подхода. Отметим, что в случае, если исходная система обыкновенных дифференциальных уравнений линейна относительно фазовых координат и управлений, а минимизируемый функционал является выпуклым, то рассматриваемый функционал оказывается выпуклым, а тогда необходимые условия его минимума являются и достаточными. Как уже говорилось, точная штрафная функция существенно негладкая, поэтому для поиска стационарных точек этого функционала используются методы недифференцируемой оптимизации, в частности, метод субдифференциального спуска и метод гиподифференциального спуска.
В данной работе отдельно исследуется задача нахождения программного управления, целью которого является перевод объекта из заданного начального положения в заданное конечное состояние за фиксированное время. В силу более простой постановки задачи по сравнению с задачей Лагранжа удаётся упростить и применяемый алгоритм решения задачи. В настоящей ВКР также были рассмотрены полиномы произвольной конечной степени от раз-личных интегральных функционалов, сформулированы методы их минимизации для задачи как со свободным, так и закреплённым правым концом, показаны некоторые приложения данных конструкций. Задача Коши как вариационная рассмотрена с помощью описанного подхода отдельно в силу её важности. Наконец, с помощью аппарата точных штрафных функций и опорных функций при некоторых дополнительных предположениях выведен известный принцип максимума для дифференциальных включений. На некоторых примерах продемонстрирован иной подход к задачам оптимального управления, когда осуществляется переход к дифференциальному включению, у которого далее на основе принципа максимума ищется оптимальное решение.
Таким образом, настоящая работа продолжает исследование методов негладкой оптимизации в вариационных задачах, развиваемых в научной школе В. Ф. Демьянова. Более конкретно, идея применения точных штрафов в оптимальном управлении [84] развивается и используется в данной работе для построения конструктивных методов решения задач оптимального управления и исследования дифференциальных включений.
Целью ВКР является разработка единого оптимизационного подхода к решению задач оптимального управления на основе теории точных штрафных функций и методов негладкого анализа, построение прямых методов решения данных задач, изучение задачи нахождения оптимального решения дифференциального включения с применением точных штрафов.
Теоретическая значимость работы состоит в том, что в ней развивается общий подход применения аппарата точных штрафных функций и методов негладкой оптимизации к задачам оптимального управления, а также задачам, содержащим дифференциальные включения. В данной ВКР показано, как с помощью данного аппарата можно получить некоторые фундаментальные результаты, такие как линеаризованный интегральный принцип максимума Понтрягина для задач управления, принцип максимума для дифференциальных включений, автором которого является Благодатских, а также новые конструктивные условия оптимальности для данных задач.
Практическая значимость работы определяется тем, что в ней разработан общий оптимизационный подход к решению задач оптимального управления. Кроме того, в работе строятся прямые методы решения данных задач, получены некоторые конструктивные условия оптимальности в задаче с дифференциальными включениями. Также в работе реализация построенных методов демонстрируется на конкретных примерах, многие из которых возникают в реальных моделях.
Научная новизна. Все основные научные результаты ВКР являются новыми. Работа продолжает исследования [31, 38, 84].
Методы исследования. В настоящей работе применяются современные методы теории экстремальных задач, выпуклого анализа и недифференцируемой оптимизации.
Основные результаты, полученные в ВКР:
• получены необходимые условия минимума полинома от интегральных функционалов;
• построен прямой метод минимизации полинома от интегральных функционалов, опирающийся на метод наискорейшего спуска;
• на основе теории точных штрафных функций получены необходимые (а в случае линейности системы и выпуклости минимизируемого функционала и достаточные) условия минимума в задаче оптимального управления;
• построен прямой метод решения задачи оптимального управления, опирающийся на метод гиподифференциального спуска;
• с помощью теорий точных штрафных функций и опорных функций при некоторых дополнительных предположениях получен принцип максимума для дифференциальных включений;
• построен прямой метод решения задачи Коши, опирающийся на метод наискорейшего спуска и метод сопряжённых направлений;
ВКР состоит из введения, шести глав, заключения, списка обозначений и списка литературы. Леммы, теоремы, следствия, замечания, примеры и таблицы нумеруются в соответствии с главой, параграфом, в которых они находятся. Формулы нумеруются в соответствии с главой, в которой они находятся.
Однако с течением времени оказалось, что многие задачи, возникающие в приложениях и в самой математике, требуют исследования недифференцируемых функций и создания полноценного инструмента работы с ними. Такая потребность привела к появлению сравнительно новых разделов математики: негладкого анализа и недифференцируемой оптимизации. Большой вклад в их развитие внесли такие учёные, как В. Ф. Демьянов [20, 24, 82, 83], А. М. Рубинов [28, 29, 85], Л. Н. Полякова [27, 56, 57, 86, 117, 118], В. Н. Малозёмов [26], Б. Н. Пшеничный [58, 59, 60], С. С. Кутателадзе [48, 49], А. Д. Иоффе [97, 35], Н. 3. Шор [74, 75], Дж. Данскин [16], Ф. Кларк [41, 81], Р. Рокафеллар [61, 98], Ж.-П. Обен [52].
Стремительное развитие этих наук и успешное решение многих важных теоретических и прикладных задач подтвердили эффективность этих разделов и окончательно развеяли некоторые предположения о том, что негладкие задачи являются патологией или экзотикой. Напротив, данные разделы прочно вошли в современную структуру математической науки и представляют собой самостоятельные, мощные и постоянно развивающиеся дисциплины, которые, к слову сказать, оказываются даже более широкими, чем классическое дифференциальное исчисление, поскольку обобщают его понятия и позволяют получать многие его результаты как следствия своей, более общей, теории.
Конечно, многие негладкие задачи можно чисто технически или исходя из каких-то общих соображений, сделать гладкими и тогда уже применять к ним весь богатый арсенал методов дифференциального исчисления. Процесс такого сведения получил название «сглаживание». Однако это не всегда оказывается эффективно и просто реализуемо. Простой пример функции, сглаживание которой не позволяет исследовать те её свойства, которые связаны с понятием градиента, приведён в [21]. Ещё одним примером невозможности сглаживания может служить теория точных штрафных функций, которая эффективно при-меняется при решении задач условной оптимизации. Сама же точная штрафная функция является существенно негладкой.
Теория точных штрафных функций получила широкое распространение при решении задач условной оптимизации [33, 123]. Она позволяет сводить исходную задачу при наличии ограничений к задаче безусловной оптимизации. Как показали многочисленные исследования [95, 115, 116, 121], такое сведение часто довольно очевидно даже для сложных задач как конечномерной, так и бесконечномерной оптимизации. Для достаточно широкого класса задач при некоторых естественных предположениях удаётся показать, что построенная функция — точная штрафная. И хотя по построению она оказывается негладкой, для её оптимизации можно применять уже многие хорошо разработанные методы недифференцируемой оптимизации. Отметим, что наряду с получением достаточных условий точности штрафной функции [23, 79, 88, 92] продолжаются разработки различных конструкций точных штрафных функций с полезными свойствами [96, 114, 122]. Идея использования точных штрафных функций была предложена И. И. Ерёминым в [33].
Как уже отмечалось, негладкий анализ с момента его зарождения значительно пополнился различными методами решения задач оптимизации. Многие методы опираются на необходимые условия экстремума, которые, в свою очередь, можно формулировать в терминах таких фундаментальных понятий негладкой оптимизации, как производная по направлению и субдифференциал [24]. Последнее понятие дало название методу субдифференциального спуска. Общая схема метода состоит в поиске направления спуска в данной точке и осуществлению движения с некоторым шагом по этому направлению. В результате получаем последовательность, которая в некоторых случаях сходится к точке экстремума. К сожалению, субдифференциальное отображение является разрывным в метрике Хаусдорфа [24], что не позволяет в общем случае гарантировать сходимость метода. Поэтому наряду с данным методом разрабатывались его модификации [23, 65], а также методы, основанные на других понятиях негладкого анализа. В частности, весьма эффективным оказался метод гиподифференциального спуска, основанный на введённом В. Ф. Демьяновым понятии гиподифференциала, который является обобщением субдифференциала. Гиподифференциальное отображение, в отличие от субдифференциального, является непрерывным в метрике Хаусдорфа для очень широкого класса функций [28], что обеспечивает сходимость метода во многих задачах. Отметим, что преимущество гиподифференциала заключается ещё и в наличии богатого и удобного исчисления. Так, например, эпсилон-субдифференциальное отображение также является непрерывным по Хаусдорфу для широкого класса функций [51], однако применение эпсилон-субдифференциального спуска значительно затруднено, поскольку исчисления эпсилон-субдифференциалов громоздко и очень сложно даже в самых простых задачах [24].
Метод гиподифференциального спуска начал применяться В. Ф. Демьяновым и Г. Ш. Тамасяном и к бесконечномерным, а именно к вариационным задачам [31, 62, 64, 87], и показал там свою эффективность. Он показал не только практическую пользу, но и свою большую теоретическую роль, поскольку позволил выработать единообразный, оптимизационный подход к широкому классу задач и получить многие фундаментальные результаты вариационного исчисления. Задачи оптимального управления относятся к классу наиболее сложных вариационных задач. Теория точных штрафов применялась к задачам теории управления В. Ф. Демьяновым и В. В. Карелиным [84]. В частности, в работе [38] с помощью теории точных штрафов был получен принцип максимума Л.С. Понтрягина для задачи оптимального управления в достаточно общей постановке.
Теория оптимального управления возникла и формировалась под существенным влиянием исследований космических летательных аппаратов. Одна из первых задач оптимального управления была поставлена Д. Е. Охоцимским в статье [54]. Существенным толчком, инициировавшим целую серию как теоретических, так и практических исследований, стали принцип максимума, полученный Л. С. Понтрягиным, В. Г. Болтянским, Е. Ф. Мищенко и Р. В. Гамкрелидзе [55] и метод динамического программирования, разработанный Р. Веллманом [7, 8]. К решению задач оптимального управления применяются различные подходы. Существует класс методов, основанных на сведении исходной задачи к краевой задаче [36, 50, 99, 103, 106, 108, 112, 119], которое осуществляется при помощи принципа максимума. Ещё одну группу методов, опирающихся на принцип максимума, составляют различные методы последовательных приближений [5, 6, 19, 22, 30, 40, 45, 46, 47, 50, 102]. В основе другой обширной группы методов лежат итерационные процессы в пространстве управлений, которые базируются на вариациях минимизируемого функционала [4, 100, 101, 50, 53, 73, 76, 80, 93, 94, 120]. Наконец, целая серия методов базируется на принципе динамического программирования и состоит в основном в переборе в пространстве фазовых координат и анализе вариантов. Многие из перечисленных схем также существенно используют методы математического программирования (например, градиентные методы, метод Ньютона, методы Ритца и Галёркина [9]) и эффективность решения задач управления в значительной степени определяется умением эффективно решать оптимизационные задачи. Конечно, перечисленными методами не исчерпывается необозримое количество схем и подходов, накопившихся с момента возникновения теории управления. Однако, как показывают многочисленные исследования, любой из перечисленных подходов сложно назвать универсальным, охватывающим значительную часть линейных и нелинейных задач. Подтверждением этого является то, что многие методы индивидуальны, рассчитаны на очень узкий класс задач, у многих не доказана или даже не исследовалась сходимость [50], что не мешает считать их эффективными и признанными методами решения задач оптимального управления. Естественно, что для линейных задач удалось осуществить значительное продвижение как в теоретической части (так, например, Н. Н. Красовским разработана полная теория линейных задач оптимального управления, основанная на проблеме моментов [42], В. И. Зубовым — на результатах линейной алгебры [34]), так и в решении вычислительных проблем (например, схема А. А. Абрамова [50] позволяет обеспечить устойчивость счёта). Задача оптимального управления относится к вариационной задаче в достаточно общей постановке. Поэтому неудивительно, что многие результаты вариационного исчисления являются следствиями принципа максимума Л. С. Понтрягина [55]. Здесь же стоит отметить, что многие фундаментальные результаты теории динамического программирования Р. Веллмана также вытекают из принципа максимума [55].
Одной из актуальных задач, исследуемых в данной работе, является построение метода решения задачи оптимального управления в форме Лагранжа с интегральным ограничением на управление. Отметим, что при фиксированной начальной точке к данной задаче может быть сведена и более общая задача оптимального управления в форме Больца [50]. Различные задачи с интегральным ограничением на управление рассматривались В. Ф. Демьяновым и А. М. Рубиновым в работе [30] и А. С. Антипиным и Е. В. Хорошиловой в статьях [1, 2, 3]. Изначальный оптимизационный подход позволяет считать предложенный в работе метод в достаточной степени универсальным. Общая схема этого метода может быть описана следующим образом. При помощи аппарата точных штрафных функций исходная задача минимизации интегрального функционала качества при наличии ограничений в виде нелинейной системы дифференциальных уравнений, начального и конечного положения объекта и при интегральном ограничении на управление сводится к задаче безусловной минимизации некоторого функционала. Далее формулируются необходимые условия минимума данного функционала. Здесь стоит упомянуть, что известный интегральный принцип максимума получается из этого условия как следствие, что ещё раз свидетельствует в пользу достаточной общности применяемого подхода. Отметим, что в случае, если исходная система обыкновенных дифференциальных уравнений линейна относительно фазовых координат и управлений, а минимизируемый функционал является выпуклым, то рассматриваемый функционал оказывается выпуклым, а тогда необходимые условия его минимума являются и достаточными. Как уже говорилось, точная штрафная функция существенно негладкая, поэтому для поиска стационарных точек этого функционала используются методы недифференцируемой оптимизации, в частности, метод субдифференциального спуска и метод гиподифференциального спуска.
В данной работе отдельно исследуется задача нахождения программного управления, целью которого является перевод объекта из заданного начального положения в заданное конечное состояние за фиксированное время. В силу более простой постановки задачи по сравнению с задачей Лагранжа удаётся упростить и применяемый алгоритм решения задачи. В настоящей ВКР также были рассмотрены полиномы произвольной конечной степени от раз-личных интегральных функционалов, сформулированы методы их минимизации для задачи как со свободным, так и закреплённым правым концом, показаны некоторые приложения данных конструкций. Задача Коши как вариационная рассмотрена с помощью описанного подхода отдельно в силу её важности. Наконец, с помощью аппарата точных штрафных функций и опорных функций при некоторых дополнительных предположениях выведен известный принцип максимума для дифференциальных включений. На некоторых примерах продемонстрирован иной подход к задачам оптимального управления, когда осуществляется переход к дифференциальному включению, у которого далее на основе принципа максимума ищется оптимальное решение.
Таким образом, настоящая работа продолжает исследование методов негладкой оптимизации в вариационных задачах, развиваемых в научной школе В. Ф. Демьянова. Более конкретно, идея применения точных штрафов в оптимальном управлении [84] развивается и используется в данной работе для построения конструктивных методов решения задач оптимального управления и исследования дифференциальных включений.
Целью ВКР является разработка единого оптимизационного подхода к решению задач оптимального управления на основе теории точных штрафных функций и методов негладкого анализа, построение прямых методов решения данных задач, изучение задачи нахождения оптимального решения дифференциального включения с применением точных штрафов.
Теоретическая значимость работы состоит в том, что в ней развивается общий подход применения аппарата точных штрафных функций и методов негладкой оптимизации к задачам оптимального управления, а также задачам, содержащим дифференциальные включения. В данной ВКР показано, как с помощью данного аппарата можно получить некоторые фундаментальные результаты, такие как линеаризованный интегральный принцип максимума Понтрягина для задач управления, принцип максимума для дифференциальных включений, автором которого является Благодатских, а также новые конструктивные условия оптимальности для данных задач.
Практическая значимость работы определяется тем, что в ней разработан общий оптимизационный подход к решению задач оптимального управления. Кроме того, в работе строятся прямые методы решения данных задач, получены некоторые конструктивные условия оптимальности в задаче с дифференциальными включениями. Также в работе реализация построенных методов демонстрируется на конкретных примерах, многие из которых возникают в реальных моделях.
Научная новизна. Все основные научные результаты ВКР являются новыми. Работа продолжает исследования [31, 38, 84].
Методы исследования. В настоящей работе применяются современные методы теории экстремальных задач, выпуклого анализа и недифференцируемой оптимизации.
Основные результаты, полученные в ВКР:
• получены необходимые условия минимума полинома от интегральных функционалов;
• построен прямой метод минимизации полинома от интегральных функционалов, опирающийся на метод наискорейшего спуска;
• на основе теории точных штрафных функций получены необходимые (а в случае линейности системы и выпуклости минимизируемого функционала и достаточные) условия минимума в задаче оптимального управления;
• построен прямой метод решения задачи оптимального управления, опирающийся на метод гиподифференциального спуска;
• с помощью теорий точных штрафных функций и опорных функций при некоторых дополнительных предположениях получен принцип максимума для дифференциальных включений;
• построен прямой метод решения задачи Коши, опирающийся на метод наискорейшего спуска и метод сопряжённых направлений;
ВКР состоит из введения, шести глав, заключения, списка обозначений и списка литературы. Леммы, теоремы, следствия, замечания, примеры и таблицы нумеруются в соответствии с главой, параграфом, в которых они находятся. Формулы нумеруются в соответствии с главой, в которой они находятся.
Приведём краткий обзор результатов, полученных в данной работе.
Во введении даётся обзор литературы по теме работы, обсуждается актуальности исследования, его теоретическая и практическая значимость.
В главе 1 даются основные предварительные сведения, которые используются в после-дующих главах.
В главе 2 рассматривается задача минимизации полинома от интегральных функционалов. Для решения задачи используются метод наискорейшего спуска и метод гиподифференциального спуска. Отмечено, что такие полиномы имеют приложения в некоторых задачах управления, интегральных уравнениях и аэродинамике.
Во главе 3 задача построения программного управления и соответствующего ему программного движения при интегральном ограничении на управление сводится к вариационной задаче минимизации некоторого негладкого функционала на всём пространстве. Для этого функционала выписаны субдифференциал и гиподифференциал, найдены необходимые условия минимума, которые в случае линейности исходной системы по фазовым переменным и управлению оказываются и достаточными. На основании этих условий описываются метод субдифференциального спуска и метод гиподифференциального спуска. Приведены численные примеры реализации описанных методов.
В главе 4 задача построения оптимального управления с интегральным ограничением на управление сводится к вариационной задаче минимизации некоторого негладкого функционала на всём пространстве. Для этого функционала выписаны субдифференциал и ги-подифференциал, найдены необходимые условия минимума, которые в случае линейности исходной системы по фазовым переменным и управлению и выпуклости минимизируемого функционала оказываются и достаточными. На основании этих условий описываются метод субдифференциального спуска и метод гиподифференциального спуска для данной задачи. Приведены численные примеры реализации описанных методов.
В главе 5 продемонстрировано применение теории штрафных функций к задаче оптимального управления дифференциальным включением. Аппарат опорных функций позволяет свести исходную задачу к оптимизационной задаче при наличии ограничений. С помощью точных штрафов эта задача при наличии ограничений сводится к минимизации некоторого негладкого функционала на всём пространстве. При условии непрерывной дифференцируемости опорной функции многозначного отображения дифференциального включения по вектору фазовых координат этот функционал оказывается субдифференцируемым, что позволяет выписать необходимые условия минимума в терминах субдифференциала, совпадаю¬щие при дополнительных предположениях с некоторым классическим результатом для этой задачи.
В главе 6 задача Коши с нелинейной системой и начальным условием сводится к минимизации некоторого функционала на всём пространстве. Для этого функционала выписан градиент Гато, найдены необходимые условия минимума. На основании условий минимума описываются метод наискорейшего спуска и метод сопряжённых направлений для рассматриваемой задачи. Приведены численные примеры реализации описанных методов. Дополнительно исследуется задача Коши с системой, не разрешённой относительно производных.
Дальнейшие исследования могут вестись в направлении применения описанного подхода к задачам оптимального управления с различными ограничениями на управляющую функцию, а также фазовыми ограничениями. Кроме того, аналогичные методы могут быть применены к различным задачам наблюдения и идентификации. Представляет интерес дальнейшее изучение дифференциальных включений с применением аппарата негладкой оптимизации, построение конструктивных методов в этих задачах.
Во введении даётся обзор литературы по теме работы, обсуждается актуальности исследования, его теоретическая и практическая значимость.
В главе 1 даются основные предварительные сведения, которые используются в после-дующих главах.
В главе 2 рассматривается задача минимизации полинома от интегральных функционалов. Для решения задачи используются метод наискорейшего спуска и метод гиподифференциального спуска. Отмечено, что такие полиномы имеют приложения в некоторых задачах управления, интегральных уравнениях и аэродинамике.
Во главе 3 задача построения программного управления и соответствующего ему программного движения при интегральном ограничении на управление сводится к вариационной задаче минимизации некоторого негладкого функционала на всём пространстве. Для этого функционала выписаны субдифференциал и гиподифференциал, найдены необходимые условия минимума, которые в случае линейности исходной системы по фазовым переменным и управлению оказываются и достаточными. На основании этих условий описываются метод субдифференциального спуска и метод гиподифференциального спуска. Приведены численные примеры реализации описанных методов.
В главе 4 задача построения оптимального управления с интегральным ограничением на управление сводится к вариационной задаче минимизации некоторого негладкого функционала на всём пространстве. Для этого функционала выписаны субдифференциал и ги-подифференциал, найдены необходимые условия минимума, которые в случае линейности исходной системы по фазовым переменным и управлению и выпуклости минимизируемого функционала оказываются и достаточными. На основании этих условий описываются метод субдифференциального спуска и метод гиподифференциального спуска для данной задачи. Приведены численные примеры реализации описанных методов.
В главе 5 продемонстрировано применение теории штрафных функций к задаче оптимального управления дифференциальным включением. Аппарат опорных функций позволяет свести исходную задачу к оптимизационной задаче при наличии ограничений. С помощью точных штрафов эта задача при наличии ограничений сводится к минимизации некоторого негладкого функционала на всём пространстве. При условии непрерывной дифференцируемости опорной функции многозначного отображения дифференциального включения по вектору фазовых координат этот функционал оказывается субдифференцируемым, что позволяет выписать необходимые условия минимума в терминах субдифференциала, совпадаю¬щие при дополнительных предположениях с некоторым классическим результатом для этой задачи.
В главе 6 задача Коши с нелинейной системой и начальным условием сводится к минимизации некоторого функционала на всём пространстве. Для этого функционала выписан градиент Гато, найдены необходимые условия минимума. На основании условий минимума описываются метод наискорейшего спуска и метод сопряжённых направлений для рассматриваемой задачи. Приведены численные примеры реализации описанных методов. Дополнительно исследуется задача Коши с системой, не разрешённой относительно производных.
Дальнейшие исследования могут вестись в направлении применения описанного подхода к задачам оптимального управления с различными ограничениями на управляющую функцию, а также фазовыми ограничениями. Кроме того, аналогичные методы могут быть применены к различным задачам наблюдения и идентификации. Представляет интерес дальнейшее изучение дифференциальных включений с применением аппарата негладкой оптимизации, построение конструктивных методов в этих задачах.



