Введение 3
Постановка задачи 9
Обзор литературы 10
Глава 1. Описание модели управления на базе асимптотиче¬ского ПИД-регулятора 12
§1. Общий вид закона системы управления 12
§2. Модель орбитального спуска, согласованная по углу вращения 15
§3. Задача позиционирования яхт в судовом доке 17
Глава 2. Программная настройка коэффициентов усиления 20
§1. Формализация метода 20
§2. Определение условий оптимальности закона управления . . . 23
§3. Построение функций структуры производной функционала . 27
Глава 3. Нейросетевая настройка в задачах автоматического управления 29
§1. Настройка коэффициентов усиления 29
§2. Модификация метода В. И. Зубова программной настройки коэффициентов усиления 31
Выводы 35
Заключение 36
Список литературы 37
Приложение 39
Управление динамическими объектами с помощью нейронных сетей является новым, к тому же, перспективным направлением науки, которое находится на стыке таких дисциплин, как искусственный интеллект, автоматическое управление или нейрофизиология. В сравнении с другими методами нейронные сети имеют ряд достоинств, которые делают их мощным инструментом в теории управления. Например, нейронные сети обладают способностью к обучению на конкретных примерах и дальнейшей обработкой данных, способностью адаптироваться под внешнюю среду или к изменению характеристик самого объекта управления. Также нейронные сети обладают высокой устойчивостью к повреждениям своих элементов в силу выбранного структурного параллелизма.
Нейронная сеть представляет собой некоторую последовательность нейронов, соединенных между собой особой связью (см. рис. 1). Нейронные сети возникли из исследований в области искусственного интеллекта, а именно, из попыток воспроизвести способность биологических нервных систем обучаться и исправлять ошибки, моделируя низкоуровневую структуру мозга. С помощью такой структуры компьютер или машина могут не только анализировать входящую информацию, но и воспроизводить ее из своей памяти.
В программировании, нейрон — это вычислительная единица, которая получает информацию, производит над ней некоторые вычисления и передает ее дальше. Существуют три типа нейронов: входной нейрон, скрытый и выходной. В свою очередь нейроны регулярным образом организованы в слои. Входной слой служит для ввода значений входных переменных. Задача скрытых слоев состоит в их обработке, а выходного слоя — в выводе результатов. Скрытые и выходные нейроны соединены с элементами предыдущего слоя. Таким образом, у каждого из них появляется два основных параметра: входные и выходные данные.
В 1964 году У. Видроу предложил идею по использованию нейронных сетей для управления динамическими объектами, однако детальное исследование данного направления началось лишь в конце 1980-ых годов.
Главной проблемой при решении задач управления динамическими объектами является реализация модели инверсной динамики управляемого объекта. Далеко не всегда удается решить эту задачу аналитическим способом в силу необходимости обращения причинно-следственных зависимостей поведения реального объекта. Однако с помощью обучения, основанного на примерах управления реальными объектами, удается найти приближенное решение поставленной задачи управления.
Одними из первых систем управления были пропорционально- интегральные и пропорционально-интегрально-дифференциальные контроллеры (или ПИ и ПИД-регуляторы). Их использование крайне эффективно, когда точная математическая модель процесса неизвестна. Именно поэтому ПИД-алгоритм так распространен в управлении промышленными процессами, модели которых достаточно сложно определить. ПИД-регуляторы строятся на основе классической теории управления и используются более чем в 90% случаев для управления процессами с замкнутым контуром.
Схема системы автоматического регулирования с обратной связью представлена на рис. 2. В ней блок Rназывают регулятором (Regulator), блок Pявляется объектом регулирования (Process), r— управляющим воздействием (reference), e — сигналом рассогласования или ошибки (error), и — выходной величиной регулятора, а у — регулируемой величиной. В частном случае пропорциональная, интегральная или дифференциальная компоненты могут отсутствовать и такие упрощенные регуляторы называют П, И или ПИ регуляторами.
Пропорциональная часть генерирует выходной сигнал, который противодействует отклонению регулируемой переменной от определенного за-данного значения, наблюдаемого в данный момент времени. Если использовать только пропорциональную часть контроллера, значение регулируемой величины не удастся стабилизировать, так как существует статическая ошибка.
Для устранения статической ошибки, описанной ранее, добавляется интегрирующая часть. Регулируемая величина будет стабилизироваться в течение некоторого времени, если на систему не действуют внешние возмущения. В таком случае сигнал пропорциональной части становится равным нулю, а выходной будет управляться интегрирующей составляющей. Тем не менее, и интегрирующей части может быть недостаточно: могут возникнуть некоторые автоколебания при неправильном выборе значения ее коэффициента.
Дифференцирующая часть пропорциональна скорости изменения отклонения регулируемой величины и предназначена для противодействия отклонениям от целевого значения, которые прогнозируются в будущем. Подобные отклонения могут быть вызваны запаздыванием воздействия регулятора на систему или же внешними возмущениями.
Аналитический синтез параметров ПИД-регулятора представляет собой довольно сложную задачу [2], требующую многократного решения системы нелинейных параметрических уравнений и оптимизации полученных зависимостей параметров. Программно-графическая методика является наиболее частым способом вычисления коэффициентов усиления. Быстрый и приближенный расчет параметров, нацеленный на достижение минимальной скоростной ошибки и максимального быстродействия, эффективно выполняется в режиме общения разработчика системы управления с компьютерной программой, строящей все необходимые для принятия решений характеристики по мере ввода пользователем исходных данных и их анализа. Однако данная методика требует непосредственного вмешательства разработчика системы. Поэтому в дальнейшем будут рассматриваться методы программной настройки коэффициентов усиления регулятора, основанные на работе [3], в режиме реального времени без необходимости участия пользователя и с использованием нейронных сетей.
Системы управление с использованием нейросетей принято относить к классу нелинейных динамических систем. В таком ключе управление движущимися объектами или процессами, оценка их состояния, предсказание дальнейших ситуаций или отслеживание текущего состояния процессов являются неотъемлемыми функциями искусственной нейронной сети.
К настоящему моменту сложилось несколько подходов к определению нейросетевых систем управления. Во-первых, их можно трактовать как функцию адаптивного регулятора нелинейного многосвязного объекта. При таком подходе возможны два варианта функциональной работы нейросети. В первом — обучение и формирование управляющего воздействия на выходе устройства исполнения системы управления происходят одновременно. При этом цель управления объектом и цель обучения нейронной сети совпадают. Отражение этого можно найти в задании целевой функции системы, которая для них является единой. Обучение сети осуществляется в режиме реального времени, в темпе протекания системных процессов. Во втором варианте работу сети можно разбить на два этапа: предварительное обучение нейросети заданной оптимальной функции управления и этапа построения аппроксимации искомой функции в режиме управления объектом при близких к ним или тех же условиях. Целевые функционалы управления и обучения сети объектом могут различаться. Описанный способ использования нейронной сети для управления (супервизорное управление) распространен до сих пор, несмотря на то что процесс синтеза сетевого контроллера и настройка его параметров осуществляется не в реальном времени. Выбор способа обучения сети зависит от особенностей задачи и определяет конкретный тип алгоритма для обучения нейронной сети.
Также нейронные сети часто рассматриваются как идентификаторы для оценивания вектора состояния нелинейных систем и как расширенные фильтры Калмана.
Более того, нейронные сети могут быть использованы в роли отптимизатора для настройки параметров регуляторов с типовыми законами регулирования и для настройки параметров алгоритмов адаптации, реализуемых на основе уже известных методов из теории адаптивных систем.
Для обозначения класса нелинейных систем с применением такого рода искусственных нейросетей используется термин «нейросетевые системы управления».
Даже при исходных реальных условиях системы управления возникают аналитические проблемы, с которыми приходится сталкиваться при проектировании контроллера для такой системы. Применение нейросетевой технологии позволяет в значительной мере уменьшить возникновение математических проблем аналитического синтеза и анализа свойств проектируемой системы. Настраиваемые многослойные нейросети обладают рядом достоинств, оправдывающих их применение в задачах управления нелинейными динамическими объектами. Это, во-первых, универсальные аппроксимационные свойства многослойных сетей, которые играют ключевую роль в формировании нелинейных алгоритмов управления.
Во-вторых, адаптивность нейросетевых структур вследствие их обучения в процессе функционирования, что позволяет корректировать в режиме реального времени функцию управления при неконтролируемых изменениях характеристик объекта, используя при этом текущую измерительную информацию системы.
В-третьих, способность нейросетей к параллельной обработке сигналов, что делает естественным их применение для управления многомерными объектами.
На основе теоремы Стоуна-Вейерштрасса было получено следующее заключение: «с помощью нелинейных нейронных сетей можно сколь угодно точно равномерно приблизить любую непрерывную функцию многих переменных на любом замкнутом ограниченном множеств». Вывод послужил теоретическим обоснованием возможного применения многослойных нейросетей для формирования оптимальных управляющих функций в динамических системах. В силу своей структуры и алгоритмов обучения многослойные сети позволяют решать такие нелинейные задачи теории управления, которые традиционными аналитическими методами не всегда можно решить в полном объеме.
Постановка задачи
Целями настоящей работы является:
1. Построить математические модели для ряда прикладных задач с законом управления на базе асимптотического ПИД-регулятора;
2. Определить коэффициенты усиления закона системы управления на базе асимптотического ПИД-регулятора для выбранных математических моделей;
3. Рассмотреть возможность использования метода программной настройки коэффициентов усиления для нейросетевого управления;
4. Разработать нейросетевой алгоритм настройки коэффициентов ПИД-регулятора для систем автоматического управления.
За последние 20 лет нейроуправление получило значительное развитие. В одном из первых обзоров данной области было обозначено, что задачи разработки нейросистем для управления нелинейными динамическими объектами является наиболее перспективными. Действительно, доминирующая доля внимания была уделена именно этим задачам. Как результат, было получено множество успешных примеров работающих систем описанного вида, а разработанный относительно недавно метод адаптивной критики получил статус эффективного и универсального метода нейроуправления. Кроме того, была продемонстрирована наилучшая адаптация рекуррентных сетей типа NARX для моделирования динамическими системами в сравнении с другими типами сетей, что привело к их распространению в качестве идентификаторов объектов управления в непрямых и прогнозирующих методах нейроуправления.
В данной работе показана возможность построения системы управления на базе ПИД-регулятора. На примере практических задач представлен метод настройки коэффициентов усиления, определяющий программные управления на основе предложенной структуры. Математическим моделированием в системе Simulink проверено, что полученные коэффициенты усиления можно использовать в качестве коэффициентов ПИД-регулятора, гарантирующего требуемое качество управления.
Результаты были представлены на LI международной научной конференции аспирантов и студентов «Процессы управления и устойчивость», а также вошли в статью Кондратюк А. С., Давыденко А. А., Степенко Н. А. Регулировка коэффициентов усиления системы управления на основе ПИД- регулятора // Процессы управления и устойчивость. СПб.: Издательский Дом Федоровой Г. В., 2020.
[1] Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning. Springer, 2014. 739 p.
[2] Никулин Е. А. Основы теории автоматического управления. Частотные методы анализа и синтеза систем / Учеб. пособие для вузов, СПб.: БХВ-Петербург, 2004. 640 с.
[3] Зубов В. И.Лекции по теории управления, М.: Наука, 1975. 496 с.
[4] Рябинин А. Д., Шквар А. М. Некоторые принципы функционального построения инвариантных бионических систем управления // Тр. 4-го Всесоюз. совещания. "Теория инвариантности и теория чувствительности автоматических систем". Киев, 1971. С. 54-64.
[5] Шквар А. М. Функциональные и структурные аспекты построения некоторых нейронных структур управления // Тр. 4-го Всесоюз. совещания. "Теория инвариантности и теория чувствительности автоматических систем". Киев, 1971. С. 78-89.
[6] Абиев Р. Г., Алиев Р. А., Алиев Р. Р. Синтез систем автоматического управления с обучаемым на нейронной сети нечетким контроллером // Изд. РАН. Техническая кибернетика. 1994. №2. С. 192-197.
[7] Lewis F. L., Parisini T. Guest Editorial: Neural network feedback control with guaranteed stability // Int. J. of Control. 1998. Vol. 70. №3. P. 337¬339.
[8] Sanner R. M., Slotine J.-J E. Gaussian Networks for Direct Adaptive Control // IEEE Trans. on Neural Networks. Vol. 3. №6. 1992. P. 837¬863.
[9] Handbook of Intelligent Control: Neural, Fuzzy and Adaptive Approaches / Ed. by David A. White., Donald A. Sofge. N.-Y. Van Nostrand Reinhold. 1992. P. 568.
[10] Suykens Johan A. K., Vandewalle Joos P. L., De Moor Bart L. R. Artificial Neural Networks for Modeling and Control of Non-Linear Systems. Kluwer Academic Publishers. Boston / Dordrecht / London. 1997. 235 p.
[11] Gundy-Burlet K., Krishnakumar K., Limes G., Bryant D. Augmentation of an Intelligent Flight Control System for a Simulated C-17 Aircraft // J. of Aerospace Computing, Information, and Communication. 2004. Vol. 1, № 12. P. 526-542.
[12] Терехов В. А., Ефимов Д. В., Тюкин И. Ю. Нейросетевые системы управления. М.: Высшая школа, 2002. 184 с.
[13] Левантовский В. И. Механика космического полета в элементарном изложении. М.: Наука, 1970. 492 с.
[14] Давыденко А. А., Старков В. Н., Кондратюк А. С. Варианты полета КА над плоскостью эклиптики с учетом притяжения планет // Современные методы прикладной математики, теории управления и компьютерных технологий (ПМТУКТ-2017). Воронеж: Научная книга, 2017. С. 129-132.
[15] Давыденко А. А., Кондратюк А. С., Старков В. Н. Варианты достижения космическим аппаратом гелиополярной области // Процессы управления и устойчивость. СПб.: Издательский Дом Федоровой Г. В., 2017. Т. 4. № 1. С. 95-100.
[16] Давыденко А. А., Кондратюк А. С., Старков В. Н. Управление полётом космического аппарата с солнечным парусом вне плоскости эклиптики // Процессы управления и устойчивость. СПб.: Издательский Дом Федоровой Г. В., 2018. Т. 5. № 1. С. 122-127.
[17] Омату С., Халид М., Юсоф Р. Нейроуправление и его приложения. М.: ИПРЖР, 2000. 272 с.