Текст
                    С. В. Емельянов, С. К. Коровин

Новые типы
обратной связи
Управление
при неопределенности


ББК 22.18 ЕбО УДК 519.71 ЕМЕЛЬЯНОВ СВ., КОРОВИН С.К. Новые типы обратной связи: Управление при неопределенности. — М.: Наука. Физматлит, 1997. — 352 с. — ISBN 5-02-015149-1. Монография посвящена фундаментальным проблемам теории обратной связи. Сформулированы основные тенденции развития теории обратной связи и предложены новые идеи и принципы, ориентированные на реше­ ние задач управления и оптимизации в условиях неопределенности. Вве­ дены принципы бинарности, генерации структур и новые типы обратной связи, сочетание которых с принципами классической теории позволяет до­ биться высокого качества управления при существенной неопределенности и расширяет возможности автоматических систем. Представлены методы, которые могут найти применение при решении задач промышленной авто­ матики и при создании систем управления сложными объектами, например в авиации и космонавтике. Для научных работников, интересующихся проблемами теории обрат­ ной связи, кибернетики, управления и оптимизации, а также аспирантов и студентов соответствующих специальностей. Ил. 263. Библиогр. 98 назв. Р е ц е н з е н т ы : академик В.Л. Маслов, академик Я.3. Цыпкин _ 1602110000-014 „ Е —nn<un«>4 о т — В е з 053(02}-97 ISBN 5-02-015149-1 ов, ь«вл. „ „ „ л © СВ. Емельянов, с к Коровин 1997
Оглавление Предисловие Введение 8 11 Часть I Принципы построения систем автоматического управления Глава 1. Принципы построения линейных систем автомати­ ческого управления 1.1. Постановка задачи управления и предварительные сведения .. 1.2. Принцип регулирования по нагрузке 1.3. Принцип регулирования по возмущению 1.4. Принцип компенсации при косвенном измерении возмущения . 1.5. Принцип двухканальности 1.6. Метод /^-изображений или метод встроенной модели 1.7. Глубокая обратная связь — большой коэффициент усиления .. 1.7.1. Постановка задачи, особенности и идея решения 1.7.2. Проблемы и ограничения метода глубокой обратной связи 1.7.3. О грубости систем с глубокой обратной связью 1.7.4. Метод пространства состояний в анализе систем с глу­ бокой обратной связью 1.7.5. Геометрическая интерпретация систем с глубокой обрат­ ной связью 1.7.6. Влияние амплитудного ограничения на системы с глу­ бокой обратной связью 1.8. Библиографический комментарий 17 17 28 31 35 40 49 56 56 58 62 64 65 65 66 Глава 2. Некоторые принципы построения нелинейных регу­ ляторов 68 2.1. Релейная обратная связь 68 2.1.1. Основные понятия 68 2.1.2. Скользящий режим в точке 71 2.1.3. Режим переключений 73 2.1.4. О прочности режима переключения 75
Оглавление 4 2.1.5. Релейная стабилизация объекта с самовыравниванием . 76 2.1.6. Стабилизация объекта с высоким относительным по­ рядком 78 2.1.7. Робастная стабилизация: разрывность, непрерывность и информация о состоянии 78 2.1.8. Робастная стабилизация объекта с первым относитель­ ным порядком 80 2.1.9. Скользящий режим на отрезке 81 2.1.10. Реальный скользящий режим на отрезке 82 2.1.11. Релейная стабилизация обобщенного объекта 83 2.2. Стабилизация объекта с неопределенным оператором 84 2.2.1. Общие положения 84 2.2.2. Принцип каскадного регулирования 88 2.2.3. Структура объектов каскадного регулирования 92 2.2.4. Стабилизация интервальных объектов 94 2.2.5. Интервальная устойчивость 96 2.2.6. Общие положения теории адаптивной стабилизации . . . 100 2.3. Стабилизация регулятором переменной структуры 108 2.3.1. Астатическая следящая система 109 2.3.2. Астатизм 2-го порядка 114 2.3.3. Астатизм порядка m 115 2.3.4. Астатическая следящая система переменной структуры 116 2.3.5. Скользящий режим на всей прямой 120 2.3.6. Анализ прочности СПС по отношению к параметриче­ ским возмущениям 123 2.3.7. СПС при наличии внешней силы ' 125 2.3.8. Квазирелейное представление ^-ячейки 128 2.3.9. Ограничения, недостатки и проблемы теории СПС . . . . 130 2.4. Библиографический комментарий 131 Часть II Новые типы обратной связи Глава 3. Общие положения т е о р и и новых типов о б р а т н о й связи 3.1. Вводные замечания 3.2. Система базовых понятий 3.2.1. Сигнал-оператор 3.2.2. Типы динамических объектов 3.2.3. Бинарная операция 3.2.4. Типы регулирующих органов 3.2.5. Новые типы обратной связи 3.3. Структурный синтез бинарных систем 3.3.1. Задача стабилизации 3.3.2. Нелинейная обратная связь как средство подавления неопределенности 3.3.3. Задача фильтрации 135 135 137 137 138 139 140 140 141 141 148 150
Оглавление 5 Глава 4. Теория координатно-операторнои о б р а т н о й связи .. 154 4.1. Стабилизация объекта второго порядка с неизвестными па­ раметрами и внешним воздействием 4.1.1. Принцип скаляриэации и уравнение объекта в простран­ стве ошибок 4.1.2. Некоторые замечания к постановке задачи и ее обоб­ щения 4.1.3. Фазовое пространство координата-оператор 4.2. КО-алгоритмы стабилизации 4.2.1. Прямая компенсация 4.2.2. Асимптотическое оценивание или косвенное измерение О-возмущения 4.2.3. Компенсация волнового О-возмущения 4.2.4. Релейная КО-стабилизация 4.2.5. Замечание о прочности систем с релейной КО-связью . . 4.2.6. Линейные КО-алгоритмы стабилизации 4.2.7. Интегрально-релейный КО-алгоритм стабилизации . . . . Глава 5. Скользящие р е ж и м ы высших порядков 5.1. Некоторые предварительные сведения из теории скользящего режима 5.1.1. Уравнения скольжения 5.1.2. Об инвариантности уравнения скольжения по отноше­ нию к возмущениям, удовлетворяющим условию согла­ сованности 5.1.3. Уравнения реального скольжения 5.1.4. Замечание о порядке скольжения 5.2. Алгоритмы скольжения 2-го порядка 5.2.1. Асимптотические алгоритмы скольжения 2-го порядка. 5.2.2. Разрывные асимптотические алгоритмы скольжения 2-го порядка 5.2.3. Финитные алгоритмы скольжения 2-го порядка: ли­ нейная обратная связь 5.2.4. Финитные алгоритмы скольжения 2-го порядка: релей­ ная обратная связь 5.2.5. Алгоритм скручивания 5.3. Финитная стабилизация по выходу Глава 6. Теория о п е р а т о р н о й о б р а т н о й связи 6.1. О назначении операторной обратной связи 6.2. Уравнения движения в пространстве координата-оператор . . . 6.3. Статическая операторная обратная связь 6.3.1. Статические операторная и координатно-операторная обратные связи 6.3.2. Статическая операторная и динамическая координатнооператорная обратные связи 6.3.3. Инерционная координатно-операторная обратная связь. 155 156 157 161 164 165 165 166 168 171 172 176 179 179 180 182 183 187 191 193 196 197 199 200 202 206 206 209 211 212 215 215
Оглавление 6 6.3.4. Инерционно-релейная координатно-операторная обрат­ ная связь 217 6.3.5. Инерционно-релейная координатно-операторная обрат­ ная связь при неизвестном параметре при управлении. . 221 6.3.6. Интегрально-релейная координатно-операторная обрат­ ная связь 222 Глава 7. Теория операторно-координатнои о б р а т н о й связи .. 225 7.1. Динамический статиэм и операторно-координатная обратная связь 7.2. Уравнения движения операторно-координатного объекта 7.3. Статический ОК-регулятор 7.4. Интегральный ОК-регулятор 7.5. Основные свойства и особенности бинарных систем стабили­ зации с различными типами обратной связи 7.6. Разрывная ОК-связь 7.6.1. Интегрально-релейный ОК-регулятор 7.6.2. Скользящие режимы второго порядка в ОК-контуре . . . 225 228 229 231 235 237 237 241 Глава 8. Ограничения, физические основы компенсации воз­ мущений и стабилизация в ы н у ж д е н н о г о движения в бинарных с и с т е м а х 246 8.1. 8.2. 8.3. 8.4. Ограничения операторной переменной О глобальном поведении бинарной системы Физические основы компенсации неопределенности О компенсации координатного возмущения Глава 9. Д и ф ф е р е н ц и р о в а н и е сигналов 9.1. Постановка задачи дифференцирования 9.1.1. Фильтрация 9.1.2. RC-цепочка 9.1.3. Дискретно-разностные аппроксимации 9.2. Следящие дифференцирующие системы 9.2.1. Линейный дифференциатор 9.2.2. Релейный дифференциатор 9.2.3. Дифференциатор переменной структуры 9.3. Следящий асимптотический бинарный дифференциатор 9.4. Финитный бинарный дифференциатор 9.5. Нестандартные дифференцирующие системы 9.5.1. Дифференциатор с "малой" амплитудой разрывов 9.5.2. Нестандартный бинарный дифференциатор 9.5.3. Результаты дискретного моделирования нестандарт­ ного бинарного дифференциатора 247 252 255 256 262 262 264 265 269 271 272 276 280 283 287 288 289 291 297
Оглавление 7 Глава 10. Субоптимальная стабилизация неопределенного о б ъ ­ екта 300 10.1. Постановка задачи оптимальной стабилизации 10.2. Пример задачи оптимальной стабилизации при неопределен­ ности 10.3. Оптимальная стабилизация "в среднем" 10.4. Минимаксная оптимальная стабилизация 10.5. Стабилизация с использованием эталонной модели и глубокой обратной связи по ошибке 10.6. Стабилизация методами теории бинарного управления 10.6.1. Система переменной структуры 10.6.2. Бинарная стабилизация с интегральной КО-связыо . . . . 10.6.3. Стабилизация с использованием скользящего режима 2-го порядка 10.7. Сведение проблемы субоптимальной стабилизации к проблеме асимптотической инвариантности 10.7.1. Основные понятия теории асимптотической инвариант­ ности 10.7.2. Субоптимальная линейно-квадратичная стабилизация . . Заключение Список л и т е р а т у р ы П р е д м е т н ы й указатель 300 302 303 304 306 308 310 311 312 313 314 316 319 322 328
Авторы сердечно признательны Михаилу Юрьевичу Живило, чье искреннее жела­ ние содействовать развитию российской науки вызывает глубокое уважение. Предисловие В данной монографии рассматривается одна из центральных про­ блем теории автоматического управления — задача стабилизации и методы ее решения в развитии, то есть, начав с простейшей поста­ новки задачи и постепенно усложняя ее, авторы анализируют возмож­ ности различных методов ее решения. Усложнение связано с ростом неопределенности в постановке за­ дачи, в соответствии с этим изменяются и методы ее решения. По­ добный подход позволяет рассмотреть общие тенденции в развитии принципов и методов теории автоматического управления. Послед­ нее представляется особенно важным и своевременным, ибо понима­ ние общих механизмов формирования управления важнее знания кон­ кретных методик его синтеза. Нужно отметить, что предлагаемая точка зрения на развитие тео­ рии автоматического управления не считается авторами единственно возможной, поскольку проблема механизма генерации обратной связи далеко не тривиальна и возможны разные подходы к описанию этого механизма. Чем больше будет предложено таких подходов, тем лучше, ибо они приближают нас к пониманию фундаментальных основ меха­ низма обратной связи. Последнее чрезвычайно важно в теоретическом и прикладном ас­ пектах, потому что современные методы стабилизации ориентиро­ ваны в основном на "силовое" решение проблемы, тогда как природа демонстрирует замечательные образцы решения задач стабилизации весьма ограниченными средствами и при весьма стесненных обсто­ ятельствах. Последнее ясно указывает на то, что настоящая теория обратной связи еще не создана, многое остается неясным и основные открытия в этой области знания еще впереди. Касаясь столь сложной и деликатной проблемы, авторы далеки от претензии на исчерпывающее ее решение, но убеждены в том, что предлагаемая ими теория выглядит естественной и убедительной.
Предисловие 9 Как уже отмечалось, изложение построено на переходе от простого к сложному и начинается, естественно, с линейных объектов и мето­ дов теории линейных систем управления. Поскольку упор делается на принципы решения задач и на содержательную интерпретацию ре­ зультатов, то математически строгие утверждения и доказательства не приводятся. Разумеется, все факты и утверждения, вошедшие в монографию, могут быть строго обоснованы, и многие из них хорошо известны по литературным источникам. В монографии сравниваются применения различных методов упра­ вления для решения задач стабилизации при вариации ряда условий: внешних сил, параметров, структуры и порядка объекта. Для этой цели в наибольшей степени подходят, конечно, простые модели объ­ ектов — только такие модели здесь и рассматриваются. При анализе, однако, используются различные формы описания объектов управле­ ния: структурная, операторная, дифференциальная, поскольку неко­ торые факты выглядят наиболее убедительно при одном описании, иные — при другом. В книге четко прослеживается тот факт, что по мере усложне­ ния задачи стабилизации все большая роль отводится нелинейности. Кроме того, выясняется, что без нелинейной обратной связи не может быть хорошей стабилизации и именно нелинейная обратная связь на­ деляет систему управления способностью демонстрировать "нужное" поведение в сложных и постоянно изменяющихся внешних и внутрен­ них условиях. Оказывается, что с некоторого уровня сложности за­ дачи "хороший" регулятор обязательно будет нелинейным. Известно, что в нелинейном мире нет регулярных путей и универсальных мето­ дов, характерных для локальных теорий, так как специфика нелиней­ ности часто играет решающую роль. Для теории, развиваемой в мо­ нографии, весьма полезными оказались структурные методы анализа и синтеза систем, именно поэтому описанию этих методов уделяется достаточно большое внимание. Целенаправленное использование нелинейностей в управлении по­ зволяет запускать в оборот принципиально новые, "несиловые", ме­ ханизмы подавления факторов неопределенности. Это, в частности, приемы, базирующиеся на использовании положительной обратной связи и неустойчивых движений и позволяющие системе саморазго­ няться до тех пор, пока не создадутся условия для подавления помех и факторов неопределенности. Именно положительная обратная связь и неустойчивость в ряде задач играют ключевую роль. Наконец, отметим, что задачу стабилизации не следует рассматри­ вать узко, и что многие важные проблемы теории управления могут быть сведены к задаче стабилизации, например проблемы дифферен-
10 Предисловие цирования и оптимизации. Однако ввиду важности и содержательно­ сти этого класса задач относящиеся к ним исследования вынесены в самостоятельные разделы. Авторы искренне признательны многим людям, сыгравшим важ­ ную роль в появлении и развитии теории бинарного управления: од­ ним — за доброжелательное внимание и заинтересованное отношение еще на этапе первых публичных выступлений, другим — за самоотвер­ женную и творческую работу над актуальными проблемами теории, оппонентам — за суровую, но в итоге полезную критику. Мы выражаем особую благодарность академикам А.А. Красовскому, Е.П. Попову и Я.З. Цыпкину, замечания которых всегда были точными, затрагивали существо вопросов и способствовали правиль­ ному развитию теории. Мы также признательны своим ученикам и последователям, кото­ рые много лет с энтузиазмом продуктивно трудились в этой области и внесли важный вклад в новую теорию. Прежде всего мы хотели бы отметить вклад И.Г. Мамедова, А.Л. Нерсисяна, В.И. Сизикова, А.П. Носова и Л.В. Левантовского. Нам приятно отметить атмосферу доброжелательности, научного творчества и взаимоподдержки, которая сложилась в коллективе Ин­ ститута системного анализа Российской академии наук, что самым благотворным образом отразилось на нашей работе. В этом заслуга первого директора ИСА РАН академика Д.М. Гвишиани. Наконец, мы обязаны отметить кропотливую и исключительно по­ лезную работу по подготовке рукописи к печати, которую взяли на себя А.П. Носов, М.М. Белова, А.С. Фурсов, Л.А. Селиванова, Э.Н. Шо­ лохова, Т.С. Борщова, Т.В. Ковалина. В период написания книги авторы пользовались финансовой под­ держкой в виде грантов Российского фонда фундаментальных иссле­ дований и Европейского экономического сообщества.
Введение В последние годы широко распространилась точка зрения, что разра­ ботка принципиальных вопросов теории автоматического управления в основном завершена, центр исследований сместился в область прило­ жений, создания эффективных методов анализа и проектирования си­ стем управления, а возникновение новых идей и принципов возможно лишь при переходе к объектам новой природы. Нужно заметить, что для такой точки зрения действительно име­ ются основания, и весьма веские. Теория автоматического управле­ ния достигла впечатляющих успехов, сегодня она в состоянии пред­ ложить широкий спектр методов решения разнообразных задач при­ кладной автоматики. Поле практического применения теории упра­ вления огромно, и невозможно представить современную технологию без средств автоматизации, а значит и без использования рекомен­ даций теории управления. Это один аспект. Другой аспект состоит в том, что в теории управления все активнее используется самый со­ временный математический аппарат, а выходящие по теории управле­ ния книги и журнальные публикации в основном имеют обобщающий, подытоживающий характер. Может показаться, что существуют яв­ ные признаки того, что теория управления близка к совершенству и заканчивает свое развитие. Действительно ли положение таково и в теории управления есть готовые решения для каждого конкретного случая? В некоторых слу­ чаях это в самом деле так, но гораздо чаще теория управления дает не рецепты, а лишь рекомендации, которые еще должны пройти экс­ периментальную проверку на адекватность рассматриваемой ситуа­ ции. Поэтому неслучайно существует общепринятая последователь­ ность этапов разработки систем автоматического управления: разра­ ботка математической модели объекта, исследование и идентифика­ ция модели, формулировка требований к свойствам системы, подбор закона управления и проведение имитационного эксперимента, техни­ ческая реализация системы и проведение натурного или полунатур­ ного эксперимента, отладка системы. При этом вся цепочка разра­ ботки или некоторые ее звенья могут использоваться многократно. Если к тому же учесть, что реализация каждого этапа требует опреде-
12 Введение ленных творческих усилий, то становится ясно, что процесс создания и эксплуатации систем весьма сложен и требует привлечения специа­ листов высокой квалификации. Это требование очевидным образом вступает в противоречие с массовым характером автоматизации. Следовательно, такие этапы, как разработка, проектирование и поддержание системы управления являются "узким местом", сдержи­ вающим прогресс в технологии автоматизации. Это своего рода вы­ зов для теории управления, которая должна дать надлежащие методы и инструменты, позволяющие эффективно разрабатывать и эксплуа­ тировать системы управления малыми силами и без привлечения вы­ сококвалифицированных специалистов. В определенной степени разрешению этой ситуации могут способ­ ствовать системы автоматизированного проектирования (САПР),' но не только они. САПР — это инструмент, который только тогда эф­ фективен, когда он хорошо "оснащен" теоретически. В противном случае САПР может справиться с рутинной фазой разработки, но не продвинет решение творческих задач автоматизации, для кото­ рых, собственно, и требуется высокая квалификация. Только развитая теория, дающая не только жесткие рекомендации для определенного класса ситуаций, но и предлагающая правила разумного действия в нестандартных положениях и способы получения адекватного реше­ ния для каждого конкретного случая, может стать тем фундаментом, на котором возможен дальнейший качественный прогресс в автомати­ зации. САПР с элементами "интеллекта" в теоретическом базисе — вот то, что сегодня необходимо. Удовлетворяет ли этому требованию (требованию высокого "ин­ теллекта") современная теория управления? Приходится с сожале­ нием констатировать, что нет, не удовлетворяет. Причин здесь много. Разработчику системы управления все чаще приходится разрешать объективное противоречие между детальностью описания объекта и возможностями дальнейшего аналитического исследования системы, идентификации ее параметров и проблемами синтеза регулятора. По­ жалуй, это самый трудный этап, формализация которого едва ли воз­ можна. И хотя в основе разработки, как правило, лежит некоторый реальный процесс, в автоматике стремятся к построению не точной, а лишь имитационной модели процесса, отражающей его "важнейшие свойства" по отношению к заранее заданным входным и выходным пе­ ременным. Это основное, что отличает модели теории управления от моделей, эксплуатируемых в таких фундаментальных дисциплинах, как физика, химия и т.п. При этом понятие "важнейшие свойства" очень часто имеет интуитивный смысл, плохо поддающийся форма­ лизации. Возможно, поэтому при построении системы управления
Введение 13 приходится итеративно возвращаться к данному этапу и вносить не­ обходимые исправления. В силу отмеченного обстоятельства самым естественным пока­ зался путь к "настолько простым моделям, насколько это возможно". Это привело к образованию набора стандартных моделей, которые в основном и эксплуатируются в теории управления. В настоящее время этот арсенал достаточно беден, и его основу составляют линейные или близкие к ним модели. Таким образом, часто в ущерб реальности, но в угоду теории, сформировался банк упрощенных моделей, с которым и по сей день, в основном, имеют дело в управлении, и что по сути дела является одним из препятствий, о которое "спотыкается" теория управления на практике. Итак, приоритет в направлении развития теории был отдан ана­ литике, и это, в свою очередь, привело к гипертрофированному раз­ витию аналитических методов, часто похожих по своим конечным ре­ зультатам, но различающихся способами их достижения и условиями применения: передаточных функций, дифференциальных уравнений, отображений вход-выход, частотных и временных характеристик и т.д. Но даже при мощном аналитическом аппарате сфера примени­ мости простых моделей не может быть распространена за границы, определенные уровнем их адекватности реальному процессу. Особенно это касается систем автоматического управления, так как разработке вопросов синтеза регуляторов уделялось явно недоста­ точное внимание. Фактически эта область теории управления оста­ ется почти нетронутой. Существует довольно ограниченный набор способов синтеза для небольшого числа стандартных ситуаций. Без преувеличения можно сказать, что сегодня процессы возник­ новения регуляторных механизмов совершенно не ясны. Во всех слу­ чаях появление нового метода синтеза скорее обязано изобретению, чем теории. Поэтому весьма привлекательной представляется задача поиска общих принципов синтеза, позволяющих в конкретных обстоя­ тельствах как бы автоматически получать требуемый закон управле­ ния. Разработка таких общих принципов и предопределит, по нашему мнению, развитие теории управления в ближайшем будущем. Можно попытаться предугадать некоторые черты такого разви­ тия. Прежде всего ясно, что нелинейность должна стать неотъемле­ мым элементом теории. Во-первых, это требование практики: огра­ ничения, нелинейность элементов и т.п. Но дело не только в этом. Примеры других наук (да и теории управления тоже) наглядно де­ монстрируют тот факт, что учет нелинейных явлений многократно обогащает теорию содержательно: нелинейный "мир" несоизмеримо
14 Введение богаче линейного, и именно на этом пути возникают новые явления, принципы и законы. В качестве иллюстрации можно привести пример, когда теория автоматического управления существенно обогатилась благодаря ре­ шению задач об абсолютной устойчивости, исследованию автоколе­ бательных процессов, адаптивного управления. Примеры из других наук, например физики или химии, еще более выразительны. Но эта констатация почти очевидна, гораздо труднее указать какой-либо кон­ структивный путь, ведущий в нелинейный "мир". Существует ли он? По нашему мнению, да, существует. И этот путь лежит в направле­ нии систематического использования важнейшего принципа киберне­ тики — принципа обратной связи. Надо только научиться правильно его применять в нестандартных ситуациях. Сегодня ясно, что этот принцип является основой саморегуляции и развития всего живого. В теории автоматического управления в полную силу пока "рабо­ тают" только отрицательная обратная связь и, соответственно, устой­ чивые процессы. Широкому использованию положительной обрат­ ной связи и неустойчивых процессов препятствует "гнет" линейности. И только при переходе к принципиально нелинейным системам воз­ можно активное вовлечение в оборот новых эффектов, связанных с использованием положительной или знакопеременной обратной связи. Данная монография служит иллюстрацией этой научной парадигмы.
Часть I Принципы построения систем автоматического управления В первой масти монографии дается краткое описание основных прин­ ципов построения систем автоматического управления. Основное вни­ мание уделяется методам компенсации влияния внешнего возмуще­ ния на регулируемую координату. Для простоты рассматриваются только скалярные стационарные объекты управления, что позволяет при необходимости представлять операторы их вход-выходного соот­ ветствия передаточными функциями. Принята форма изложения с параллельным использованием наибо­ лее употребительных в теории автоматического управления способов описания динамических систем: структурного и пространства состо­ яний. Это обеспечивает возможность всестороннего анализа рассма­ триваемых проблем, а также разнообразных интерпретаций получае­ мых решений. Кроме того, на различных примерах можно сравнить достоинства и ограничения обоих способов. Изложение ведется в такой последовательности, которая дает воз­ можность проследить направление эволюции основных идей, принци­ пов и проблем теории управления, а также методов их решения. Это позволяет сформулировать некоторые актуальные проблемы теории управления, для разрешения которых требуются новые идеи. Первая часть монографии состоит из двух глав. В первой главе рассматриваются принципы построения линейных систем автомати­ ческого управления, а во второй — некоторые принципы построе­ ния нелинейных регуляторов. Общие теоретические конструкции со­ провождаются примерами, которые позволяют на простых ситуациях прояснить слабые и сильные стороны каждого подхода. Некоторые важные результаты и выводы, известные из теории автоматического управления и необходимые для лучшего восприя­ тия излагаемого материала оформлены в виде Примеров, являющихся
16 Принципы построения систем автоматического управления самостоятельной структурной единицей текста с названием и номе­ ром, что облегчает их поиск при ссылках. Ниже приведен список таких тем (в скобках указаны номера страниц): • Программное управление неустойчивым объектом (30). • Прямая компенсация возмущения (33). • Косвенная компенсация возмущения (37). • Стабилизация с использованием принципа двухканальности (45). • Стабилизация методом /^-изображения (53). • Устойчивость систем с обратной связью (60). • Неустойчивость систем с обратной связью по отношению к сингу­ лярным возмущениям (63). • Простейшая релейная система (69). • Релейная стабилизация системы второго порядка (73). • Релейная стабилизация неустойчивого объекта с относительным порядком, равным двум (74). • Иерархия обратных связей (88). • Метод включения (98). • Синтез адаптивной системы управления (105). • Точное слежение за задающим воздействием (113). • Режим переключений в системах переменной структуры (117). • Системы переменной структуры с движением по вырожденным траекториям (119). • Скользящий режим на прямой (120). • СПС при сингулярном возмущении (129). • СПС при функциональном возмущении (130). Главы сопровождаются кратким обзором соответствующей науч­ ной литературы в виде библиографического комментария.
Глава 1 Принципы построения линейных систем автоматического управления Ниже вводятся базовые понятия теории автоматического управления и описываются основные механизмы компенсации внешнего возмуще­ ния для линейного объекта управления. 1.1. П о с т а н о в к а задачи управления и предварительные сведения В теории автоматического управления имеют дело с математическими моделями реальных процессов, которые, конечно, всегда неполны и лишь приближенно отражают те черты поведения реального процесса, которые важны в контексте конкретного исследования. Выбранную математическую модель называют объектом управления или просто объектом и для удобства прибегают к графическому его изображению в виде блока с входом и и выходом у (рис. 1.1). При таком структурУ р и Рис. 1.1 ном представлении объект характеризуется оператором вход-выход­ ного соответствия Р, т.е. оператором, устанавливающим связь между множествами входных и выходных сигналов у = Ри. Обычно вход объекта и называют управлением, а его выход у — ре­ гулируемой координатой. В линейной теории управления оператор Р предполагается линей­ ным. Это означает, что для любых чисел a i , a<2 и произвольных вхо­ дов «1, «2 выполняется соотношение P(aiUi + а2и2) = ociPui + а2Ри2. Это допущение, конечно, сильно упрощает дело и обеспечивает воз­ можность аналитического решения задач теории управления, чего, во­ обще говоря, трудно ожидать в нелинейном случае.
18 Глава 1. Принципы построения линейных систем Еще одно важное допущение, которое мы также примем, состоит в инвариантности оператора объекта Р при временном сдвиге. Такие объекты называют стационарными, т.е. не зависящими от времени, и они являются наиболее простыми объектами, изучаемыми в теории автоматического управления. Для стационарных объектов помимо оператора Р, устанавливающего связь между функциями времени, можно ввести эквивалентный ему оператор W{a), устанавливающий связь между преобразованиями Лапласа входа и выхода объекта при специальных, именно при нулевых, начальных условиях, т.е. Y{8) = W{8)U{8), где y(s) = £[i/], [/(s) = £[u], и для скалярных объектов, т.е. объек­ тов, имеющих один вход и один выход, по определению передаточная функция дается выражением Wis) = ^ нач.услзО В этих формулах s — комплексное число, участвующее в односторон­ нем преобразовании Лапласа, функции времени \{t) т.е. 00 e-4t. Из теории этого интегрального преобразования известно, что ука­ занные операции имеют смысл лишь для функций времени ^{t), являю­ щихся оригиналами. В линейных стационарных системах это предпо­ ложение обычно выполнено. Поскольку дальше часто используются передаточные функции, имеет смысл отметить, что передаточные функции конечномерных линейных стационарных скалярных объек­ тов — всегда дробно-рациональные функции комплексной переменной S, т.е. функции, задаваемые отношением двух полиномов /?(в) и а(в) степени m = deg Д(в) и п = deg а(в), соответственно, т.е. W(s) = ^ = W i g " ' + bmg'""^+ ••• +^1 ^^' а{а) 8'* + a„8'^-'^ + ... + ai ' где а,', bj — фиксированные вещественные параметры объекта. При выполнении принципа причинности (следствие не наступает ранее причины, его вызывающей) степень m полинома числителя /?(в) не превосходит степени п полинома знаменателя о(в) передаточной функции W(s) = I3(s)/a(s). Такие передаточные функции называют физически реализуемыми (осуществимыми). Нули полинома y9(s) называют нулями передаточной функции W(8) или нулями объекта, нули же полинома а(в) — полюсами W{8) или полюсами объекта. Передаточная функция 1У(в) = /?(8)/а(в) — невы­ рожденная (несингулярная), если она не имеет совпадающих нулей и
1.1. Постановка задачи управления и предварительные сведения 19 полюсов, что и предполагается выполненным впредь. В этом случае для физически реализуемой передаточной функции число п = deg a(s) называют порядком объекта. Используя невырожденную передаточную функцию объекта, не­ сложно получить дифференциальное уравнение относительно входвыходных функций времени, описывающее тот же самый объект. Дей­ ствительно, по определению имеем равенство Y(S)=:W(S)U{8) = ^U{S), которое после почленного умножения на a{s) преобразуется к виду (s" -I- a „ s " - i + . . . + ai) У(5) = {bm+is"' + . . . + 61) Uis). После применения к этому соотношению обратного преобразования Лапласа получаем искомое дифференциальное уравнение объекта: уМ + а„2/("-^) + . . . -Ь ац/ = бш+хи^"*^ + . . . + Ьщ, где ^е*) = dl'^/dt'' — к-я производная по времени функции (^{i). От­ метим, что порядок старшей производной функции выхода, участву­ ющей в данном дифференциальном уравнении, совпадает с порядком объекта. От одного дифференциального уравнения порядка п можно пе­ рейти к эквивалентной совокупности п дифференциальных уравне­ ний первого порядка, описывающей эволюцию исследуемого объекта в пространстве состояний. Действительно, введем в рассмотрение п функций i j , хг, . . . ,х„, связанных между собой, входом u{t) и выходом y{t) соотношениями ii=«i-l-i, г = 1,2, . . . , п - 1 , п 1=1 m+1 1=1 Нетрудно проверить, что передаточная функция такого объекта от U к J/ совпадает с исходной W{s) = /?(s)/a(s), и, значит, приведен­ ные соотношения также описывают исследуемый объект управления. При этом (a!i, ;Г2, • • •. Хп) образует набор некоторых фиктивных пере­ менных, характеризующих, в отличие, скажем, от у и и, внутреннее состояние объекта. Последнему может быть придан полезный геоме­ трический смысл, если воспользоваться декартовой системой коорди­ нат {xi,X2,.. .,Хп). Тогда каждому внутреннему состоянию объекта в соответствующем п-мерном пространстве отвечает точка х с коор­ динатами («1, «2, • •., Хп), которая также называется фазовой точкой.
Глава 1. Принципы построения линейных систем 20 При изменении времени она вычерчивает в п-мерном пространстве некоторую кривую !„((, х), являющуюся геометрическим образом ре­ шения системы дифференциальных уравнений первого порядка при Xu(t,l) Рис. 1.2 некоторой входной функции и(<) (рис. 1.2). Ортогональная проекция решения *;«(<) на нормаль с^ = (6i, 621 • • • > ^m+i, О, . . . , 0)^ гипер­ плоскости у = сх и определяет соответствующий входу u(t) выход объекта j/(t). Использование векторно-матричных обозначений «1 Х2 X = х„ , А= 1 0 Г 0 0 L ~<ч -02 0 1 .. • . -аз .. • 0 1 0 -On . и , 6= 0 1 С = (61,62, . . . , 6 m + l , 0 , . . . ,0) позволяет представить модель объекта в стандартном для современ­ ной теории управления виде X = Ах + Ьи, у- сх, где дифференциальное уравнение называют уравнением состояния, а статическое соотношение — уравнением выхода. Ргизумеется, все три способа математического описания невырожденного объекта эквива­ лентны и нетрудно указать соответствующие взаимно однозначные преобразования. Подробности этих преобразований опускаем, приве­ дем лишь равенство c(sE-A)-4 = a{s)' в справедливости которого читателю предлагается убедиться само­ стоятельно. Наконец, заметим, что упомянутую выше фиктивность вектора состояния x{t) нужно понимать в том смысле, что в качестве такого
1.1. Постановка задачи управления и предварительные сведения 21 вектора может быть использован любой другой вектор z, связанный с ним невырожденным преобразованием М (deg М ф 0), т.е. Z = Мх. После такой замены получаем уравнения объекта в прежней форме, но с другими параметрами (Ам = МАМ~^, Ьм = Mb, см = сМ~^): Z = Ам^ + Ьми, У= CMZ. При этом, разумеется, вход-выходное соответствие (в частности, пе­ редаточная функция) не изменяется. Действительно, см {sE - АтГ^Ьм = cM-^SE - МАМ-^^МЬ = = cM-'^M(sE - А)-^М-'^МЬ = c{sE - А)-Ч. Таким обрг13ом, если передаточнгш функция W{s) не зависит от вы­ бора фазового вектора, то ее "тонкая" структура, конечно, зависит от него (рис. 1.3). В частности поэтому при исследовании составных У с 1 S А Рис. 1.3 систем удобнее использовать обобщенные передаточные функции, так как при этом особенно просто находится передаточная функция со­ ставной системы. Непосредственные вычисления дают возможность убедиться в сле­ дующих правилах соединения передаточных функций: • при последовательном соединении систем (рис. 1.4) передаточные У = У2 W,(s) « 2 = 2/1 W,(s) Ui=U Рис. 1.4 функции перемножаются и выход системы определяется по фор­ муле y = W{s)u = W2(s)Wi{s)u;
22 • Глава 1. Принципы построения линейных систем при параллельном соединении систем (рис. 1.5) передаточные функ- W,(s) -9 W,(s) Рис. 1.5 ции складываются и выход системы определяется по формуле y=W(s)u= [Wi{s) -^ W2{s)]u- при соединении передаточных функций обратной связью (рис. 1.6) Wi(s) -!iL®_JL W,(s) Рис. 1.6 выход системы преобразуется в соответствии с выражением у = W{8) и = l + Wi{s)W2(s) На рисунках белый сектор сумматора (gi означает прибавление, а чер­ ный — вычитание соответствующего входящего сигнала. Теперь перейдем к описанию постановки рассматриваемой задачи регулирования. Следуя современной терминологии, будем называть эту задачу задачей стабилизации. Суть возникающей в этой связи проблемы управления состоит в выборе такого управления и, при ко­ тором выход объекта у совпадает с заранее предъявленной функцией времени y'(t), выражающей требования к характеру изменения вы­ хода объекта. Функция у' (<) называется задающим воздействием или просто заданием. Непростая сама по себе задача стабилизации услож­ няется воздействием на объект управления внешних возмущений двух типов: координатного /(<) и операторного a{t). Под влиянием внеш­ них возмущений, информация о которых, кстати, часто недостаточна
I.I. Постановка задачи управления и предварительные сведения 23 (например, известен только факт их принадлежности некоторым мно­ жествам функций Т 1/1 А, т.е. f £ Т, а € Л), взаимосвязь между входом и выходом объекта становится неоднозначной и неопределен­ ной, что, разумеется, сильно затрудняет решение задачи стабилиза­ ции (рис. 1.7). Следует, однако, отметить принципиальное различие в |£ e:F У U р Пае л Рис. 1.7 характере влияния на объект возмущений координатного и оператор­ ного типов. Для этого более детально рассмотрим структуру объекта управления и способы воздействия на него возмущений, используя для • л I -9- Pi f. 3F аеЛ Рис. 1.8 этого схему, приведенную на рис. 1.8. Уравнения, описывающие эту схему, имеют вид y = P2[a](f+v), v = Pi[a]u или, более подробно, У = Р7[а] Pi[a]u + P2[a]f = Р[а]и + Pj W / , где явно отражена зависимость операторов Pi и Рг от операторного возмущения а. Теперь наглядно видно качественное различие влияния возмуще­ ний / и а на выход объекта, что подчеркивается обозначениями на структурных схемах. Координатное возмущение / вносит аддитив­ ный и независимый от входа и вклад в реакцию объекта, равный А [о]/- Операторное же возмущение а изменяет только вид или па­ раметры операторов Pi [а], Р2[а] и не имеет независимого от и и / влияния на выход объекта. Таким образом, возмущение моделирует
Глсша 1. Принципы построения линейных систем 24 линейное воздействие внешней среды на регулируемую координату, а возмущение а — "нелинейное" ее воздействие. В линейной теории автоматического управления влияние операторн ного возмущения на процесс управления не изучается, поэтому ниже полагается а = О и на структурных схемах это возмущение не обозна­ чается. Заметим, что задающее воздействие у' также может быть выходом некоторой динамической системы, называемой задатчиком и обозна­ чаемой ниже на структурных схемах знаком 5 (рис. 1.9). Конечно, Рис. 1.9 задатчик, так же как и объект управления, может иметь вход и под­ вергаться влиянию помех, но ради простоты мы такие возможности не рассматриваем. В этих обозначениях и терминах задаче стабилизации может быть поставлена в соответствие структурная схема, приведен­ ная на рис. 1.10. На рисунке е = у' — у — ошибка регулирования, а S 11* "V i у R |/ 1 Р Рис. 1.10 Д — регулятор, формирующий из доступной информации (у', е, / и т.п.) такой сигнал управления «, при котором ошибка регулирования е равна нулю или лежит в допустимых пределах. Охарактеризуем в общих чертах принципигшьные возможности, которыми располагает теория управления для достижения поставлен­ ной выше цели. Во-первых, специалист по автоматизации, как правило, лишен воз­ можности такого прямого влияния на внутреннее устройство техноло­ гического процесса, которое могло бы привести к требуемому равен­ ству у = у' без какого-либо управления. Гораздо чаще ему приходится иметь дело с объектом, который сконструирован без учета этого об­ стоятельства. Поэтому по существу единственная возможность актив­ ного влияния на выход процесса, а значит, и на возможность решения задачи управления связана с манипулированием входным сигналом и.
1.1. Постановка задачи управления и предварительные сведения 25 И здесь, по сути дела, сразу обнаруживаются только две "чистые" стратегии поведения: первая связана с надлежащим формированием входного сигнала из имеющихся сигналов таким образом, чтобы его последующее преобразование оператором объекта привело бы к тре­ буемому результату у = у"; вторая — с изменением оператора входвыходного соответствия с помощью обратной связи. В первом случае, соответствующем использованию прямой связи, к входному сигнгшу и прибавляется вспомогательный сигнал и', за­ висящий, например, от задания у' и преобразованный подходящим оператором R (рис. 1.11а). В результате таких преобразований вы­ ход объекта принимает вид y,.= PRy'+Pu+P2f, и при определенных условиях (например, R = Р~^, Р г / = О, и = 0) может оказаться, что требуемое равенство у = у' достигается. Во втором случае входной сигнал объекта изменяется с помощью обратной связи по схеме, представленной на рис. 1.115, на котором изображен оператор обратной связи R. Отвечающее этой структуре уравнение выхода имеет вид у = Р{и- Ry) + P2f, и после элементарного преобразования находим, что выход объекта, охваченного обратной связью, связан со входом и и помехой / соот­ ношением Р Р ^ " 1 + PR 1-ЬРД"'' из которого видно, что обратная связь меняет операторы передачи от входов и и f к выходу у без какого-либо вмешательства в техноло­ гию процесса — только путем умелого использования информации о выходе. В этом принципе заложены огромные потенцигильные возмож- ii u^=Ry' R Н^ Рис. 1.11 ности, использование которых для нужд автоматизации и составляет главное содержание теории управления. Нетрудно понять также, что сочетание прямых и обратных свя­ зей может привести к еще более глубокому влиянию на объект и, как следствие, к большому расширению возможностей автоматической си­ стемы управления.
26 Глава 1. Принципы построения линейных систем Опишем теперь приведенные выше принципы на языке дифферен­ циальных уравнений, используя для этого следующий пример. Пусть объект описывается дифференциальным уравнением второго порядка У + озу + аху = « + / (1.1) с постоянными параметрами oi, ог и возмущением / . Отметим, что этому примеру при "операторном" описании объекта соответствуют операторы Р и Рг с передаточными функциями W(s) = W2(s) = ^ s2 + 028 + ai ' Пусть R — оператор прямой связи по заданию у' с передаточной функцией WR(s) = b2S + bi, где 61,62 — постоянные параметры. Тогда в соответствии с рис. 1.11а имеем и' = у' + biy, и выход объекта является теперь решением дифференциального урав­ нения у + а2У + а1у = б2у'-f-6iy'+/-I-U, (1.2) которое отличается от исходного уравнения (1.1) дополнительным слагаемым в правой части. Так как общее решение линейного уравне­ ния складывается из произвольного решения однородного уравнения У + а2У + а1У = 0 и частного решения неоднородного уравнения (1.2), то прямая связь влияет только на это частное или, как говорят, вынужденное решение и не оказывает никакого воздействия на его свободное движение. Напротив, если мы используем обратную связь по схеме, предста­ вленной на рис. 1.115, например с тем же самым оператором R, то в ре­ зультате получим дифференциальное уравнение замкнутой системы управления сначала в таком виде: у + а2У + аху = -бгУ - 6iy -I- « -I- / , а после элементарного преобразования — в окончательном виде: y+(a2 + 62)y+(ai+fri)y=w + /. (1.3) Из (1.3) следует, что обратная связь не изменяет правой части уравнения, но может быть использована для изменения параметров дифференциального уравнения. Это означает, что обратная связь влияет не только на собственные движения объекта, но и на выну­ жденные его движения. Разумеется, использование прямой и обрат­ ной связи может только "углубить" влияние на поведение объекта.
1.1. Постановка задачи управления и предварительные сведения 27 Приведенный пример уместно использовать для иллюстрации двух важных для теории автоматического управления понятий. Это поня­ тия статики и динамики системы управления. Рассмотрим уравнение (1.1) и положим сначала, что вход и = О, а возмущение / = /о = const. Тогда получим y + a2Jf + aiy = /оОбщее рещение этого уравнения, как известно, содержит два сла­ гаемых: где J/CB(^) — произвольное решение однородного уравнения и j//(t) — частное решение неоднородного уравнения. В данном случае, что не­ трудно проверить прямой подстановкой, УJ W = — = У' = const. Это решение также называют установившимся решением или ста­ тикой системы, а разницу y{t) — / o / a i — переходным решением, пе­ реходным процессом или динамикой системы. Если объект асимпто­ тически устойчив, а это имеет место при положительных параметрах 01 и 02, то компонента Усв(0 экспоненциально затухг^т до нуля, и объект колебательно (график / на рис. 1.12) или монотонно (график 2 на рис. 1.12) стремится к статическому положению у*, так как в положении покоя у = j / = 0. Если используется прямая связь, то .y(t) ,1 Колебательный переходный процесс .^.^^периодический переходный процесс Рис. 1.12 следует рассматривать уравнение (1.2). Пусть для простоты, как и ранее, / = /о, ы = О и, кроме того, у' — const. Тогда имеем дело с уравнением У + агу -I- aiy = Ьгу' + /о, и из приведенных выше рассуждений следует, что если объект асим­ птотически устойчив, то все решения этого уравнения экспоненци­ ально стремятся к статическому режиму +—/оУ = —У 01 ai
28 Глава 1. Принципы построения линейных систем Следовательно, прямая связь не влияет на динамику, а только на статику системы управления. Так как в желаемом режиме у = у', то разница . , ai — bi , 1 , т} = У -У = у' /о «1 ai определяет ошибку стабилизации и называется статической ошибкой системы управления. Поскольку параметр 6i характеризует прямую связь, то последняя может применяться для уменьшения статической ошибки, например, при 6i = oi ошибка 1 , T] = -—fo. Рассмотрим теперь обратную связь и уравнение (1.3) при тех же предположениях (и = О, / = /о), т.е. исследуем уравнение у + {а2 + Ь2)у + (ai + bi)y = /Q. В этом случае надлежащим выбором параметров обратной связи bi, 63 замкнутую систему управления можно всегда сделать Еи;имптотически устойчивой, следовательно, обратная связь меняет динамику системы. Но не только. Поскольку в установившемся режиме ai+bi' то и статика зависит от обратной связи. В частности, увеличивая параметр 6i, можно уменьшать статическую ошибку. Подчеркнем, что такг1я возможность в системах с прямой связью отсутствует. Перейдем к описанию методов синтеза стг1билизирующих регуля­ торов. 1.2. Принцип регулирования по нагрузке Простейшая задача стабилизации возникает при отсутствии коорди­ натного возмущения, т.е. когда / = 0. В этом случае уравнение объекта имеет вид у = Ри, (1.4) и решение рассматривг1емой задачи дает так называемое программное управление и' = р-'у', (1.5) где Р~^ — оператор, обратный оператору Р, т.е. оператор, удовле­ творяющий равенству РР~^ — 1. Действительно, после подстановки (1.5) в уравнение объекта (1.4) последовательно находим у = Ри' =РР-^у' и задача решена. =у\
1.2. Принцип регулирования по нагрузке 29 Этот принцип регулирования приводит к структурной схеме си­ стемы автоматического управления (рис. 1.13), на котором явно по­ казана связь между заданием у' и управлением и. Поскольку задание V' S у' .jpi е •V у р Рис. 1.13 у' характеризует "нагрузку", с которой функционирует объект, то использованный принцип регулирования удобно назвать принципом регулирования по нагрузке. Подобный способ регулирования имеет хронические слг1бости, среди которых отметим следующие. Во-первых, по физическому смыслу задачи оператор Р "модели­ рует" реальный процесс, и поэтому он удовлетворяет условию фи­ зической осуществимости. Пусть, например, передаточная функция оператора Р имеет вид W(s) = 1/s. Тогда передаточная функция обратного ему оператора Р~^ дается выражением W-^is)=s и, следовательно, имеет степень полинома числителя больше степени полинома знаменателя, а значит, не удовлетворяет принципу причин­ ности, т.е. оператор Р~^ физически неосуществим. Поэтому речь может идти только о приближенной реализации программного упра­ вления и' = Р'^у", а значит, только о приближенном решении рЕи;сматривг1емой задачи стабилизации системой регулирования по нагрузке. Во-вторых, только таким способом, т.е. без привлечения иных идей, нельзя решить задачу стабилизации, когда объект неустойчив (Пример 1). И, наконец, в-третьих, стоит отметить, что в системе програм­ много регулирования реализуемое управление не зависит от факти­ ческого поведения объекта, и потому оперативные коррективы невоз­ можны при непредвиденных отклонениях в поведении объекта или задатчика. В результате даже мгшое возмущение может "увести" выход объекта от предписанного.
Глава I. Принципы построения линейных систем 30 Пример 1. Программное управление неустойчивым объектом. Пусть объект управления имеет передаточную функцию W{s) = а^ +aj« + ai где Qi, 02 — постоянные параметры, и требуется стабилизировать выход объекта в нуле, т.е. считаем, что у' = 0. В соответствии с рекомендациями раздела 1.1, для получения дифференциального уравнения, описывающего ргъссматриваемый объект, сначала находим связь между преобразованиями Лаплгъса входа и выхода (s*+a2a + ai)y(5) = t/{*). а затем выписываем искомое уравнение: (1.6) Следуя изложенной выше процедуре построения систем регулирования по нгорузке, получгъем структурную схему системы управления, приведене S »»+«а«+в1 л u=u* I/*sO ' У 1 I'+Kji+a, Рис. 1.14 ную на рис. 1.14. Сразу замечаем, что передаточную функцию регулятора W~'(e) = « ' + 0 2 ^ + 01 можно реализовать только приближенно, и, следовательно, система управле­ ния нуждается в модификации. Но даже если допустить, что передаточная функция ^'''^(в) реализовгша точно, все-таки возникает серьезная труд­ ность, когда параметр ai < 0. В самом деле, так как и' = Р~^у' = О, то на выходе объекта наблюдаются только собственные колебания, вызван­ ные ненулевыми начальными условиями и описываемые дифференциальным уравнением У + азу + aiy = 0. Ясно, что при ai < О его характеристическое уравнение s' -I-02*-1-01 = 0 имеет положительный корень, а значит, выход объекта у экспоненциально возрги;тг1ет. Иными словами, если объект управления неустойчив, то рассматривае­ мая задача стабилизации принципом регулирования по нагрузке не реша­ ется. Нетрудно понять, что и при у' ^ О устойчивость объекта есть необ-
1.3. Принцип регулирования по возмущению 31 ходимое услс!Ьие работоспособности системы регулирования по нагрузке. Действительно, программное управление и' = Р у' имеет вид и' = у' +ajv' +aiy, и после подстановки его в уравнение объекта (1.6) получг1ем уравнение у + а2У + aiy = y' + ojy' +aiy. Запишем это уравнение относительно ошибки регулирования е = у' — у. Получаем ё + азё + aie = О, и видим, если e(t) -¥ О при t -^ оо, то задача стабилизации решена. Но последнее условие и означает асимптотическую устойчивость свободных движений объекта. Рассмотрим теперь случай, когда объект управления находится на гра­ нице устойчивости ai = О, aj > О, и программное управление реализуется не точно, а с погрешностью е = const, т.е. и = и' + е = е, поскольку и' = Р~^у' = 0. В этом случае выход объекта удовлетворяет дифференци­ альному уравнению у -f- i i y = е, частное решение которого, обусловленное наличием правой части е, неограниченно по времени нарастает по модулю, "уводя" выход объекта от желаемого нуля. Заметим, что этот вывод имеет место и в том случае, когда программное управление реализуется точно, но на входе нейтрального объекта действует постоянная помеха. Таким образом, • принцип регулирования по нагрузке имеет ограниченное примене­ ние при синтезе систем управления и может быть применен, во­ обще говоря, лишь в сочетании с другими принципами регулиро­ вания. В частности, в комбинации с принципом регулирования по возму­ щению, к рассмотрению которого мы теперь и перейдем. 1.3. Принцип регулирования по возмущению Пусть координатное возмущение / , тождественно не равное нулю, приложено к некоторой внутренней точке объекта так, как это по- Рис. 1.15 казано на рис. 1.15. Пусть, кроме того, z = Piu, v = г + f п у = PiV = P2(z + f) = P2P1U + Pi f = Р и + Р2 f, (1.7)
Глава 1. Принципы построения линейных систем 32 где учтено, что Рг Pi = Р- Здесь мы имеем новую ситуацию, по­ скольку выход объекта зависит теперь не только от входа «, но и от возмущения / . Действительно, даже если мы точно следуем прин­ ципу регулирования по нагрузке и применяем соответствующее ему программное управление то в результате получим систему управления, выход которой опреде­ ляется соотношением y=^PP-'y' + P2f = y' + P2f и, как видно, явно зависит от возмущения / , если Р г / ^ 0. В том случае, когда возмущение / можно измерить, для устранения указан­ ной зависимости целесообразно применить принцип регулирования по возмущению. В соответствии с этим принципом управление должно содержать компоненту, пропорциональную возмущению. Применительно к дан­ ному случаю это означает, что управление следует взять в виде суммы двух компонент: программной и компенсирующей, т.е. и = и' +'Df, где V — искомый оператор. После подстановки этого выражения в (1.7) получим соотношение y = P{u'+Vf) + P2f = y' + (Pt> + Рз) / , из анализа которого видно, что задача стабилизации решается точно и выход объекта не зависит от возмущения / , если выполнено равенство PV + P2 = 0, называемое условием компенсации. Описанная выше процедура синтеза приводит к структурной схеме системы управления, приведенной на рис. 1.16. Достоинства такого способа регулирования снижают следующие обстоятельства. р-1 г S у' •ч у Г^ г ' р^ V •-< Рис. 1 .16 Z Pi -<
1.3. Регулировяние по возмущению 33 Во-первых, к а к и ранее, неустойчивые о б ъ е к т ы не м о г у т б ы т ь застабилизированы т а к и м образом. Во-вторых, в нетривиальных случаях (т.е. к о г д а Рх ф c o n s t ) опе­ р а т о р Р , удовлетворяющий условию компенсации, физически неосу­ ществим. Действительно, из условия компенсации имеем равенство V = - Р - 1 Рз = - ( P i Р г ) - ^ = -Р:^, а т а к к а к оператор P i моделирует реальный процесс, т о о б р а т н ы й ему оператор Pj"^ физически неосуществим. В-третьих, условие компенсации дается равенством, и при малей­ шей погрешности Е в правой ч а с т и соответствующего о п е р а т о р н о г о равенства PV-^Pi-E зависимость выхода о б ъ е к т а о т возмущения не устраняется, т а к к а к в э т о м случае имеем y = j / ' - K P P + P 2 ) / = I/'+J5;/, и если Ej ^ О, т о второе слагаемое в э т о м равенстве м о ж е т привести к неприемлемому отклонению выхода у о т з а д а н и я г/'. Существен­ н ы м ограничением э т о г о принципа является т а к ж е предположение о возможности прямого измерения возмущения / , ч т о на п р а к т и к е вы­ полняется редко. П р и м е р 2. П р я м а я к о м п е н с а ц и я в о з м у щ е н и я . Проиллюстрируем возможности и ограничения принципа компенсации по возмущению на объ­ екте из Примера 1. Положим, что в композиции операторов на рис. 1.15 P = PiPu а передаточные фушащи, соответствующие операторам Р\ и Рг, даются выражениями « -t- Ai •» -t- Аг где, естественно, Ai+A2=a2, AiA2=ai. В пространстве состояний этому операторному описанию объекта упрг1вления соответствует система дифференциальных уравнений У + АгУ = г + / , iH-Ai« = u или, что в данном случае удобнее, одно дифференциальное ургшнение вто­ рого порядка y-t-a2y-(-aiy = u - | - / - | - A i / . (1.8) Тогда, следуя изложенному выше принципу регулирования по возмуще­ нию, из условия компенссщии Т> = —РГ' находим передаточную функцию W-o{a) оператора V в виде VVp(5) = -(e-(-A,), что (в сочетании с регулированием по нагрузке для получения программной
34 Глава I. Пршщипы построения линейных систем части и' фушщии упргшления) приводит к структуре системы управления, изображенной на рис. 1.17. Из этой структурной схемы и дифференциаль- s''+a,s+a, Wp(s) -9- "/ s + Xi s + Xj - * - J Рис. 1.17 ного ургшнения (1.8) можно получить соответствующее решение в терминах пространства состояний. После подстановки в правую часть уравнения (1.8) компенсирующего управления и = ~ ( / + Ai/) движение системы описывается однородным дифференциальным ургшнением У + а^у + aiy = 0. Из этого ургшнения, кгж и ргшее, следует, что асимптотическая устой­ чивость объекта — необходимое условие разрешимости задачи в рамках принципа регулировгшия по нагрузке. Но и это ограничение метода далеко не единственное, так как в регуляторе синтезированной системы управле­ ния используются физически неосуществимые операторы с передаточными функциями 3^ +a23+ai и s-f-Ai. Более того, даже если на это закрыть глаза, то все равно построенная система может оказаться неработоспособной, так как она очень чувствительна к малейшему нарушению условия компенсации: u = -(/-f-Ax/). Допустим, что в реализации передаточной функции оператора V допущена погрешность и вместо W^is) использована передаточная функция W:,{s) = -{s + Xi + AX), где ДА — некоторая константа. Тогда ошибка в реализации условия компенсации описывается выражением Е=- ДА «2 + a2S + ai и может быть сколь угодно малой при малой погрешности ДА. По­ скольку ошибка регулирования в данном случг1е определяется выра­ жением е = у' -у= -у-т т—/>
1.4- Компенсация при косвенном измерении возмущения 35 ТО вновь, как и в Примере 1, убеждаемся, что при ai = О, ог > О даже сколь угодно малое постоянное возмущение / может привести к сколь угодно большому отклонению выхода у от задания у'. Таким образом, • возможна лишь приближенная реализация принципа прямой ком­ пенсации. При этом, пожалуй, наиболее существенным его ограни­ чением является необходимость прямого измерения возмущения. Попытка смягчения этого ограничения предпринята в принципе компенсации с косвенным измерением возмущения. Перейдем к рас­ смотрению этого принципа регулирования. 1.4. Принцип компенсации при косвенном измерении возмуидения Одна из классических идей косвенного измерения возмущения может быть проиллюстрирована с помощью рис. 1.18. Pi ^ Р, •^ т Рис. 1.18 Пусть измеряются выход объекта у и его внутренняя координата Z. Тогда в результате преобразования выхода объекта оператором Pj"^ получаем сигнал TJ = Р^^у, который является оценкой сигнала v. Поскольку V = f + Z, а. сигнал z известен, то можно получить оценку возмущения / по формуле и = т) — z. Речь идет об оценках сигналов г и / в связи с тем, что рассматри­ ваемое звено с оператором Р^^ может иметь собственную динамику, с точностью до которой и следует понимать равенства г} fa v, w fa f. Далее следует применить принцип прямой компенсации и сформиро­ вать управление в виде суммы двух компонент: программной и* и компенсирующей Pw, т.е. и = и' + Т>и, где оператор V должен удовлетворять приведенному в предыдущем разделе условию компенсации: V = Pf^.
36 Глава i. Принципы построения линейных систем В результате управление, решающее рассматриваемую задачу ста­ билизации, должно формироваться в виде u= p-'y'-V(Pi'y-z). Этому соответствует структурная схема системы управления, пред­ ставленная на рис. 1.19. Описанному способу компенсации сопут- Р' Т^ / Р2 Р "^ i^L —(^ 7 \ Р; "/ CD Рг" *2 Рис. 1.19 ствует принципиальная трудность — в структуре системы управле­ ния появляется контур внутренней положительной обратной связи (на рис. 1.19 он згшггрихован), который по сути является критическим, так как его устойчивость или неустойчивость определяется скрытыми параметрами. В самом деле, оператор Рц.г этого контура от входа w' к выходу z дается выражением Pi l-VPi Pi l-p-^Pi и, следовательно, возникают проблемы, связанные с делением на ноль. Эти проблемы разрешаются, если принять во внимание скрытые па­ раметры. Действительно, если Pi — модель реального процесса, то факти­ чески в этом контуре действует оператор Pi = PiQ, где Q — опера­ тор, которым пренебрегли при составлении модели. Но при возник­ ших обстоятельствах этот оператор начинает играть существенную роль, и динамические свойства рассматриваемого контура, по суще­ ству, определяются этим оператором, так как оператор контура от и' к Z имеет вид Pu.z = Pi/(^ — Q)- Иными словами, • свойства контура предопределяются неконтролируемыми факто­ рами, что неприемлемо. Как правило, это приводит к неустойчи­ вости собственных движений внутреннего контура. Это означает, что сигнал Z неограниченно нарастает, нарушая правильное функ­ ционирование всей системы управления.
1.4. Компенсация при косвенном измерении возмущения 37 В следующем примере подробно разбираются некоторые особенно­ сти описанного явления. Здесь же подчеркнем, ч т о указанная т р у д ­ ность не единственнг1Я. Все проблемы, связанные с использованием принципа прямой компенсации и отмечавшиеся в предыдущих разде­ лах, разумеется, наследуются и рассмотренными в э т о м разделе си­ с т е м а м и компенсации с косвенным измерением возмущения. П р и м е р 3. Косвенная компенсация возмущения. Для рассмотрен­ ного в Примере 1 объекта проиллюстрируем описанный выше способ компенсгщии возмущения. В соответствии с изложенной теорией для указгшного объекта имеем систему управления, структурнсш схема которой пред­ ставлена на рис. 1.20. Выделим из этой структурной схемы фрагмент с местной положительной обратной связью (рис. 1.21) и более подробно ис­ следуем его свойства. Из рис. 1.21 непосредственно устангшливаем, что Рис. 1.20 -9- s+Xi s + Xi Рис. 1.21 передаточная функция Wu,z{3) от входа и' к выходу z задается равенством 1 1 W^,4s) = 1 - 1 а - | - А Лоо 3 + Xi' и, следовательно, укаэаннгъя положительнгш обратная связь приводит к эф­ фекту использования в прямом канале бесконечного коэффициента усиления fcoo. Допустим, что в этом контуре вместо оператор» Pi с передаточной
38 Глава 1. Принципы построения линейных систем фующией Wi(s) = 1/(а + Ai) стоит оператор Pi = PiQ с передаточной функцией где т = const > О — малый паргинетр. При этом второй множитель моде­ лирует "быструю" динамику оператора Q, не учтенную в исходной модели * + Xi TS+1 «- s + Xi Рис. 1.22 объекта. Тогда имеем структурную схему (рис. 1.22) и описывающие ее соотношения в виде (s + \I){TS + l)z = и, и = и' + (3 + Xi)z. В результате искомая передаточная фушщия Wu,i{s) от и' к г опреде­ ляется однозначно и дается выражением И^и,х(в) = 1 т«(з + A i ) ' Отсюда следует, что объект находится на границе устойчивости и произ­ вольно малое возмущение его параметров может привести к неустойчиво­ сти. Координата z начнет неогргшиченно нарастать по г1бсолютной вели­ чине, приводя к неограниченному же росту ощибки регулирования. Теперь проведем исследование Примера 3 при помощи дифферен­ циальных уравнений, а не с использованием структурного или опера­ торного описания, как это было сделано выше. Из структурной схемы системы управления (рис, 1.20) имеем дифференциальные уравнения, описывающие объект управления Z + Ajz = и, (1.9) (1.10) и уравнения компенсирующей внешнее возмущение связи и = и'-{ш + \1и), u = ri-z, Л = У + Х2у. (1.11) (1.12) (1.13) Из (1.9) и (1.13) имеем, что rj = f + г,и и = - / , поэтому управление в итоге имеет вид u = u'-(/-HAi/). (1.14)
1.4. Компенсация при косвенном измерении возмущения 39 Если К (1.9) применить дифференциальный оператор d/dt + Ai, то с учетом уравнения (1.10) получг1ем уравнение объекта в виде y+a2y + aiy = u + f + Ai/, где, как и ранее, параметры 02 = Ai + Аг, ai = Ai Аз. После подстановки в это уравнение управления из (114) получаем, что движение системы управления описывается уравнением у + а2У + aiy = и' -{f + Ai/) + (/ + Ai/) = и' и не зависит от возмущения. Поскольку (рис. 1.20) « ' = у' + 022/' + o i / и е = J/' - г/, то уравнение движения в ошибках имеет вид 6 + 026 + 016 = 0, (115) и если оно устойчиво, то задача стабилизации решена без прямого измерения возмущения / . Отметим, что если уравнение (112) подставить в уравнение (111), а результат U = ы' + (i + Ai^:) - (»? + AiTj) подставить в уравнение (1.10), то получим i + Ajz = и' + (i + Xiz) - (^ + AIT;) или, после упрощений, ^ + Ai»; = u ' . (1.16) Значит, собственные движения координаты z при таком управлении не определяются однозначно, т.е. имеет место сокргицение полюса и нуля. Положим теперь, что вместо оператора Pi в системе действует опе­ ратор Pi = Pi Q и оператору Q отвечает, как и ранее, передаточная функция W'^(s) = l / ( r s + l ) . Тогда, как это можно понять из рис. 1.20,1.21, вместо дифференциаль­ ных уравнений (1.9), (110) надлежит рассматривать уравнения вида У + А2!/ = / + г, rz + ( r + l ) i + Aiz = u. (1.17) Вновь повторяя преобразования, убеждаемся в справедливости урав­ нения (1.15), но вместо соотношения (116) теперь получаем уравнение TZ + (г + l ) i + Aiz = (i + Aiz) + ы' - (^ + Ai??),
40 Глава 1. Принципы построения линейных систем которое после приведения подобных принимает вид гг + гг = и' — (г) + Ai»;). Отсюда следует, что устойчивость свободных движений переменной Z определяется корнями характеристического полинома (p[s) = T^s^ + Ts, который имеет нулевой корень и, следовательно, отражает погранич­ ную ситуацию: • малого изменения параметров объекта достаточно для возникно­ вения неустойчивого корня, а вместе с ним и неограниченного на­ растания координаты Z. Этот вывод полностью совпадает с результатом, полученным на основе операторного анализа системы управления. Более тонкий под­ ход к косвенному измерению возмущения с последующей компенса­ цией его влияния на регулируемую координату используется в прин­ ципе двухканальности Петрова. 1.5. Принцип двухканальности Принцип двухканальности является эвристическим приемом струк­ турного синтеза инвариантных систем автоматического управления или таких систем, в которых регулируемая координата не зависит от неконтролируемого, т.е. не измеряемого непосредственно, внешнего возмущения. Как всякий эвристический прием, принцип двухканаль­ ности не приводит к однозначному решению и не сводится к какойлибо единственной последовательности действий. Однако централь­ ная идея этого приема весьма прозрачна и может быть сформулиро­ вана следующим образом: для достижения независимости регулируе­ мой координаты системы управления от внешнего возмущения необ­ ходимо организовать, как минимум, еще один дополнительный канал влияния этого возмущения на регулируемую координату и "настро­ ить" его таким образом, чтобы в заданной точке системы управления произошла взаимная компенсация компонент сигналов, обусловленных действием возмущения. К рассматриваемой задаче стабилизации этот принцип построения системы управления с полной компенсацией возмущения можно приме­ нить, например, при следующих обстоятельствах. Пусть компонента Рг оператора объекта Р представлена в виде композиции двух опера­ торов Р^ и Pj'i т.е. Р2 = Р^'Р^, причем выходной сигнал z подсистемы с оператором Pj может быть измерен и, кроме того, при необходимости к этому сигналу может быть прибавлен какой-либо внешний сигнал д.
1.5. Принцип двухканальыости 41 Такому разбиению соответствует структура объекта, показанная на рис. 1.23. Из рисунка видно, что выход объекта у не зависит от возмущения / , когда сигнал v = z + q не зависит от / . Дгшее, так как сигналы 2 и г определяются равенствами z = P^{f + r), г^Р.и', то, очевидно, z = P^f + P2P1U*, и сигнал v не будет зависеть от возмущения / , если сигнал q надлежащим образом зависит от этого возмущения. Это соображение и является неформальным выражением принципа двухканальности. Р," П^ Е,' Рг Рис. 1.23 Перейдем теперь к формальному его обоснованию. В том случае, когда выход г подсистемы Pi известен, т.е. г = Piu', искомую за­ висимость q{f), компенсирующую влияние / на v, можно построить следующим образом. Сначала измеряется сигнал z, затем он преобра­ зуется оператором Ri, а полученный сигнал вычитается из программ­ ного управления к*. В результате получаем структурную схему си­ стемы управления, в которой z = РУ -\- Р^г, г = —Pi Riz + Piu' (рис. 1.24). Подставив первое выражение во второе, получаем равен- Г Р" Ri р' Pi -9h Рис. 1.24 ство Г = —Pi P i (Р2/ -I- P^r) + Piu*. Решаем это равенство относи­ тельно г и находим, что сигнал PiRiP!, 1 -I- Pi P i Р Г Л , 1 + Л P i Р^ (1.18) зависит от внешнего возмущения / , чего не было ранее. Поэтому, следуя рекомендациям из предшествующих разделов и выбирая под­ ходящим образом оператор Рг в системе на рис. 1.25, можно рг1ссчи-
Глава 1. Принципы построения линейных систем 42 тывать на получение искомой, т.е. компенсирующей влияние / на v, зависимости q(f). В этом случае образуется второй дополнительный канал распространения возмущения / (на рисунке обозначен штри­ ховой линией), с чем связано название рассматриваемого принципа инвариантности. Рис. 1.25 Проанализируем полученную систему управления. Поскольку в структурной схеме на рис. 1.25 сигнал z дается выражением то можно, подставив в это соотношение г из (1.18), полупить связь между сигналами z,f и и' в виде ^ ~ l + PiRiP^^'^ l + PiRiPi'' ' Теперь, зная зависимость сигнала v = z-\-q от f, нетрудно подобрать требуемую для обеспечения инвариантности по отношению к / за­ висимость ? ( / ) . Для этого оператор Лг в схеме на рис. 1.25 нужно выбрать в виде Й2 = ^ . (1.19) В самом деле, при таком выборе оператора R2, с учетом соотно­ шения (1.18), нетрудно определить, что Р' 9 = Я2Г= 1 -- l + PiRiPi'J7f +' Riil + PiRiPi) и . Следовательно, сигнал t; выражается равенством V = z + q= -—и и не зависит от неконтролируемого возмущения / , что и требовалось.
1.5. Принцип двухкянальности 43 Структурная схема синтезированной инвариантной системы ста­ билизации приведена на рис. 1.26. Рис. 1.26 Таким образом, независимость выхода объекта у от возмущения / обеспечена, но, вообще говоря, ценой потери требуемого в задаче стабилизации равенства у = у', поскольку теперь Pi' , У Ri Pi'P-^ Ri ^2 s 5 у = -рТУ a выполнение равенства Яг = P'l (1.20) нигде выше не предполагалось. Следовательно, для точного решения задачи стабилизации указанным выше способом требуется либо со­ блюдение условия (1.20), либо введение связи по заданию у', v' = Qy', корректирующей программное управление и' (Q — оператор коррек­ тирующей связи, которая на рис. 1.26 заштрихована). В последнем случае имеем вполне очевидные соотношения y=^^i^' + v')=(^^ + R2PiP^'Q)y=^(i + PQ)y\ при получении которых учтены условия компенсации (119) и введен­ ные ранее обозначения Р = РГ- Р2, Р2 = Р2- Р2- При наличии корректирующей связи в выборе операторов Ri и Дг появляется необходимая для смягчения (но отнюдь не для устранения)
44 Глава 1. Принципы построения линейных систем требований к физической реализуемости степень свободы, стесненная лишь условием компенсации Pi Ri R2 = 1 и условием несмещенности решения задачи стабилизации R2{\^PQ) = P2- Поэтому среди принципов прямой компенсации внешнего возмущения принцип двухканальности имеет, пожалуй, наибольшую сферу приме­ нимости. Однако и он не свободен от серьезных недостатков. • • • • Во-первых, при его использовании, как, впрочем, и в случаях при­ менения других принципов компенсации, мы вынуждены ограни­ чиваться устойчивыми объектами. Во-вторых, в структурной схеме соответствующей системы ста­ билизации (рис. 1.25) возникает контур местной обратной связи с оператором Р\ Р2 в прямом канале и оператором Ri в канале обратной связи. Устойчивость этого контура отнюдь не наступает неотвратимо, и так как выбор оператора Ri стеснен условием ком­ пенсации, то скорее всего придется принимать специальные меры для стабилизации движений в этом внутреннем контуре. В-третьих и в-четвертых, из условия компенсации Ri R2P1 = 1 видно, что в нетривиальном случае (когда Pi — физически реали­ зуемое динамическое звено и, следовательно, степень полинома чи­ слителя соответствующей передаточной функции меньше степени полинома ее знаменателя) точное выполнение условия компенсации в классе физически регшизуемых операторов Ri, R^ невозможно. Поэтому речь может идти только о приближенной компенсации возмущения. К этому же выводу мы приходим и с учетом того обстоятельства, что условие полной компенсации выражается точ­ ным равенством, а для этого необходима информация об истин­ ных значениях параметров объекта, чего на практике, конечно же, нет. Иными словами, применение этого принципа регулирования не приводит, вообще говоря, к грубым системам управления. И, наконец, в-пятых, условия применимости принципа двухканаль­ ности довольно специфичны и предполагают не только наличие ин­ формации о внутренних координатах объекта, но и возможность активного, а по сути дела регулирующего, воздействия на внутрен­ ние координаты. Само собой разумеется, что подобные возмож­ ности, а точнее, их сочетание, встречаются на практике далеко не всегда. Именно поэтому теория управления обратилась к более активному использованию обратной связи. Подробнее об этом поговорим в сле­ дующем разделе, а теперь рассмотрим простой пример, иллюстриру­ ющий особенности применения принципа двухканальности.
1.5. Принцип двухканальности 45 П р и м е р 4. Стабилизация с использованием принципа двухканальности. Рассмотрим объект упргшления третьего порядка, декомпо­ зированный в соответствии с общей теорией метода двухкан<1Льности на три подсистемы (рис. 1.27). Передаточные функции операторов Pi, P j и s + Xi s + Xj Рис. 1.27 Рг" имеют вид Wi(s) = 1/з, Wi{s) = l/(s + Ai), W^'^s) = 1/{з + Аг), где Ai и Аг — известные константы, и пусть координаты г и г измеряются. Требуется без измерения возмуще1ШЯ / обеспечить решение задачи стг1билизации, т.е. добиться точного выполнения ргшенства у = у'. Здесь у' — заданнг^я функция времени. Заметим, что данный объект упргюления можно описать следующими дифференцигьльными уравнениями: У -Агу+г, Z = -Xiz + г + f, г = и. В соответствии с изложенной выше теорией метода двухкгшгшьности дополняем рис. 1.27 местной обратной связью с оператором Ri и местной прямой связью с оператором Дг (рис. 1.28), где Wi(s) и W^ls) — отвечающие • Wi(s) 1 . " f iЪ ' s + Xj * Qг 1 ^^—^ s + Xi JL s 9 • W3CS) Рис. 1.28 R\ и Ri искомые передаточные функщш. Исключаем из уравнешш у=——r-t;, 5 + А2 v = z-^q, q = Wi{s), г = —-г-(/+г), а + Ai аг = и'-Wx{s)z, описывающих эту схему, переменные q и z и находпм сначала равенство 5 + Ai s(s + Xi) + Wi(s) , Wi s(5-|-Ai) +1^1(5) /,
46 Глава 1. Принципы построения линейных систем а затем связь между переменной v = z + q, возмущением / и входом и ' в виде l + W2is)is + Xi) , s-W,{s)W2{s) При выполнении условия полной компенсации (1'19) передаточные функции Wi[s), W2{a) удовлетворяют соотношению Wi{s)W2{a) = S. (1.21) Ясно, что для физически реализуемых передаточных функций это соотно­ шение не может выполняться. Например, если W^^s) = 1, то W\{s) = s, и она физически нереализуема. Разумеется, выбор передаточных функций W\ (в) и W^i^s) еще более стес­ нен, когда требуется обеспечить точное ргшенство у = у' • Действительно, при выполнении условия компенсации (1.21) справедливы равенства \ + W2{s){s^-\i) у = e-l-Aj , , . tJ = e(s-f-Ai)-)-Tyi(s) 5-I-A2 WiW3 = > Wt{s){s + \iy Бели теперь использовать стгшдартный подход к формированию програм­ много управления, когда и* = Р у', а Р — оператор объекта с передаточ­ ной функцией W{s) = ^ 3(e + Ai)(e-l-A2)' то выход системы преобразуется в соответствии с выражением «(« + Ai) , VKj(e) и для обеспечения требуемого условия у = у' необходимо выполнение ра­ венства Из уравнения (1.21) находим передаточную функцию оператора Рг: W2(S) = 1 «-(-Ai Если оператор Лг вольтерровский (т.е. удовлетворяет принципу причинно­ сти), то Ri, — невольтерровский оператор, так как он содержит двукратное дифференцирование. Следовательно, подобнг1я система управления физиче­ ски неосуществима. Э т о означайт, ч т о • в р а м к а х принципа двухканальности добиться точной компенса­ ции возмущения и одновременно обеспечить точное решение за­ дачи стабилизации с использованием только вольтерровских опе­ р а т о р о в невозможно. Поэтому в с т а е т вопрос о приближенной реализации условия ком­ пенсации или об использовании корректирующей связи по нагрузке у* для достижения точного равенства у = у'. Поскольку вторая возмож­ ность подробно обсуждалась при изложении теории данного м е т о д а
47 1.5. Принцип двухканальности компенсации, то исследуем подробно лишь обстоятельства, возникаюпще при приближенной реализации условия компенсации вольтерровскими операторами. Остановим свой выбор в (1.21) сначала на операторах с передаточ­ ными функциями вида Wl{8) = S, W2{S) = 1, а затем невольтерровскую операцию точного дифференцирования за­ меним вольтерровской операцией приближенного (реального) диффе­ ренцирования и вместо 1^1 (s) применим m{s) = TS+l' где г — малая постояннгш времени. При этом предположении условие компенсации, разумеется, не выполнено, так как теперь Wi{s)W2{s) = и, следовательно, для переменной г; имеем выражение rs l + W2{s){s + Xi) . V = s{s + Xi) + Wi{s) ,.^ и + (rfi-f-l)(s-f-Ai) ' а, значит, выход объекта у = v/{s •+• Аг) зависит от возмущения / . Но эта зависимость уменьшается вместе с постоянной времени г, которая может быть взята достаточно малой. Для удовлетворения условия не­ смещенности решения задачи стабилизации следует воспользоваться описанной выше корректирующей связью. Окончательно структур­ ную схему системы стабилизации получаем в виде рис. 1.29. На этом Рис. 1.29
48 Глава 1. Пршщипы построения линейных систем рисунке передаточная функция Q{s) выбирг1ется из условия l + (g + Ai) Q(s) e(s + Ai) + s/(rs + l) s + Az ^^ обеспечивающего такое программное управление и', при котором пе­ редаточная функция от у' к у равна единице, т.е. Эта схема может определить работоспособную систему стабилизации, только если Aj, Аг < О, т.е. когда собственные движения оператора р,= экспоненциально устойчивы. Анализируя формулу (1-22), нетрудно установить, что синтезиро­ ванная система управления точно решает задачу стабилизации, если неизвестное возмущение / постоянно. Действительно, в этом случае второе слагаемое в сумме (1-22) обнуляется. Это как будто бы частное наблюдение составляет главное содержание принципа встроенной мо­ дели или принципа /<Г-изображения, к изложению которого мы перехо­ дим в следующем разделе. Но прежде исследуем вопрос об устойчиво­ сти внутреннего контура с передаточной функцией lyi(s) = s/{rs+l) в обратной связи (рис. 1.29). Действуя стандартным образом, нахо­ дим полином, ответственный за устойчивость этого контура, в следу­ ющем виде: ф)= [TS^ + {XT+1)S+{X+1)]S. Наличие нулевого корня означает, что контур находится на гра­ нице устойчивости и, следовательно, скрытые параметры могут при­ вести к неустойчивости собственных движений внутреннего контура, что, в свою очередь, приведет к нарушению работоспособности всей системы. Последнее свидетельствует о неробастности синтезирован­ ной системы управления. Завершим раздел разъяснением особенностей применения прин­ ципа двухканальности в пространстве состояний. Исходные уравне­ ния рассматриваемого объекта приводились выше. При принятых ра­ нее допущениях (измеряются сигналы 2, г и можно влиять на вход оператора Р2 с передаточной функцией W^'ls) = l/(s-|-Аз)) эти урав­ нения можно переписать в виде У = -Х2У + г + д, z = -Xiz + r + f, г = и. (1.23) Очевидно, что координата у не будет зависеть от возмущения / , если сумма v = z + q не зависит от этого возмущения. Но это озна­ чает, что и скорость изменения координаты v, которая описывается уравнением V = Z + q = -Xiz + r + f + g.
1.6. Метод К-изображеиий или метод встроенной модели 49 не зависит от / . Положим q = г. Тогда, в силу (1.23), из предыдущего уравнения получим выражение v = -Xiz + r + f + u, (1.24) в котором управление и следует подобрать так, чтобы его правая часть зависела только от сигнала v и программы и'. При этом упра­ вление может зависеть только от сигнгиюв г, г и и'. Выразим функцию / из правой части второго уравнения (1-23) и подставим результат в (124). В итоге получим v = z + и. Теперь ясно, что если u = -i + w'+b, (1.25) где к — постоянный коэффициент, то сигнал v удовлетворяет урав­ нению V = kv + и' и не зависит от возмущения / , а значит и выход объекта не зависит от этого возмущения, что нам и требовалось. Отметим, что этот резуль­ тат совпадает с описанным выше результатом, полученным структур­ ным методом при к = 0. 1.6. Метод iif-изображений или метод встроенной модели В классической и современной теории управления весьма популярен метод компенсации возмущения /(<), основанный на точном знании модели, порождающей это возмущение. В линейной теории модель возмущения задается или векторным дифференциальным уравнением i = Hx, f = hx, (1.26) где Н, h — постоянные матрица и вектор надлежащих размеров, или скалярным дифференциальным оператором K{s), аннулирующим воз­ мущение /(<), т.е. K(s)f = 0. (1.27) Здесь K{s) = s"+a„s"~^+ ... +ai, и при всех (i = 1, . . . , п) параметры о,- постоянны. В первом случае возмущение однозначно определяется начгшьным фазовым вектором 1°, так как f = h{sE-H)-^x°, а во втором случае — значениями /(0), /'^^(0), . . . , /^""^^(0). Задание возмущения в виде волновой модели (1.26) или в виде аннулирующего оператора (1.27) — это вопрос удобства. Ранее же использовалась только форма (1.27), и именно для нее академиком B.C. Кулебакиным был развит соответствующий раздел теории инвариантности. Об этом нам напоминает буква К, традиционно используемая в обозна­ чении аннулирующего полинома.
Глава 1. Принципы построения линейных систем 50 Итак, рассмотрим объект (рис. 1.30), подверженный воздействию возмущения f(t) и управлению и. Предполагаются известными анну- р;' р; Pi Рис. 1.30 лирующий оператор K{s) и внутренняя переменная z(t). Требуется выбором управления u{t) обеспечить выполнение точного равенства y(t) = y'{t) при любых f{t), удовлетворяющих (1.27). Из рис. 1.30 и уравнений объекта управления y = Pi'z, z = Pi{f + r), r = Pi« легко понять, что у не зависит от помехи / , если координата г от f не зависит. Но в исходной структуре последнее имеет место только тогда, когда P j / = 0> т.е. когда Р^ — аннулирующий оператор для / , Поскольку надежд на выполнение этого тождества нет, то попы­ таемся изменить оператор между / и г е помощью местной обратной р" Z ^-L^ р' *2 Рг IV Рис. 1.31 связи с оператором R (рис. 1.31). В модифицированной таким образом системе для нахождения зависимости z от f воспользуемся соотноше­ ниями г = Р^(/-Нг), r = Pi{u-Rz). После подстановки второго равенства в первое и приведения по­ добных, находим искомую зависимость в виде Р' г = \-\-PtiPiR + р'гЛ H-P^Pifl (1.28) Координата z не будет зависеть от помехи / , если найдется опера­ тор R такой, что при некотором операторе L имеет место равенство Р' 1 -I- Р;^ Pi Л = LK. (1.29)
1.6. Метод К-изображеиий или метод встроенной модели 51 где К — полином из (1.27). Решая уравнение (1.29) относительно R, находим требуемый оператор R: (1.30) где N = iPiLK)/{LPiPi). Формула (1.30) показывает, что местная обратная связь, обеспечи­ вающая условие инвариантности, должна содержать оператор, обрат­ ный оператору, аннулирующему возмущение. Именно с этим обстоя­ тельством и связано второе название описываемого метода — метод встроенной модели. При выполнении условия инвариантности (1.29) справедливы ра­ венства P!i Z = : Pi U = LKPi ы. 1 -(- Pl^PiR и для окончательного решения задачи стабилизации {у = у") необ­ ходимо подобрать корректирующую обратную связь по нагрузке для нового объекта с оператором Р = Р!^ LKP\ (рис. 1.32). Если объР" LKPi Рис. 1.32 ект Р минимально фазовый, т.е. полиномы его числителя и знамена­ теля устойчивы, то можно использовать стандартную прямую связь по нагрузке (рис. 1.33), которая и решает поставленную задачу, иначе говоря, поддерживает в статике равенство у = у'. V-' S у* ,л •V У и = и* Р Рис. 1.33 Таким образом, минимальная фазовость объекта Р является обя­ зательным, но не единственным условием применения метода /<^-изображения. Другое ограничение связано с физической реализуемостью обратного оператора Р~^.
Глава 1. Принципы построения линейных систем 52 Действительно, оператор местной обратной связи R должен быть физически осуществим, но тогда таковым обязан быть и оператор Р, а следовательно, оператор Р~^ нереализуем. Речь может идти только о физически реализуемой аппроксимации Р ~ ^ оператора Р~^, и, ве­ роятно, задача стабилизации может решаться только приближенно. Для ослг1бления требований минимальной фазовости и физической осуществимости Р~* можно, наряду со связью по нагрузке, использо- Q S у' .6» •V / ^ м У р —4—1 Рис. 1.34 вать обратную связь по ошибке стабилизации e{t), представленную на рис. 1.34, на котором Q и М — операторы соответствующих связей. Из уравнений у = Р{и + Ме), е= у'-у находим соотношение между у и у' в виде P{Q + M) У= 1+РМ у'=Ж(«)у'. (1.31) Таким образом, задача стабилизации не может быть точно решена при ограниченных операторах обратной связи М, так как из равен­ ства P{Q + M) (1.32) = 1 1-1-РМ получаем, что PQ = 1, и значит Q физически неосуществим. Од­ нако надлежащим выбором оператора М можно влиять на устойчи­ вость знаменателя передаточной функции iy(s), а выбором оператора Q добиваться лучшей аппроксимации соотношения (1.32). При этом требование устойчивости нулей оператора.Р сохраняется, потому что такая модификация системы стабилизации не влияет на положение этих нулей. Заметим, что если вовсе отказаться от прямой связи по нагрузке, т.е. принять Q = О в схеме на рис. 1.34, а решение задачи возложить
1.6. Метод К-иэображений или метод встроенной модели 53 на обратную связь, то получим такое соотношение между у и у': РМ , =—У 1 + РМ Ясно, что только при условии \РМ\ 3> 1 можно рассчитывать на удо­ влетворительное решение задачи стабилизации. Но это уже другая тема — тема глубокой обратной связи, к кото­ рой мы перейдем в следующем разделе, а теперь рассмотрим пример к методу 7<Г-изображения. У = Пример 5. Стабилизация м е т о д о м ЛГ-изображения. Ознакомим­ ся с возможностями и недостатками метода /("-изображения при работе с передаточными функциями и в пространстве состояний. Рассмотрим слу­ чаи постоянного и экспоненциального возмущения. С л у ч а й А . Пусть возмущение / = const действует на объект согласно схеме, приведенной на рис. 1.35. Требуется найти оператор R такой, при / 1 s + Xj г 1 s + Xi R=? Рис. 1.35 котором координата г не зависит от / и, кроме того, имеет место ргшенство у •=. у'. Поскольку / = const, то простейший оператор, аннулирующий константу, — оператор дифференцирования, т.е. К = з. Следовательно, согласно изложенной теории, берем R = N{s)/s. Убеждаемся в том, что координата z при таком операторе R не зависит от / . В самом деле, _ f -Rz + u _ sf - N{s)z + su Ho a / = 0 И, значит, _ —N{s)z + su '~ S(5-|-Al) Оператор передачи от u к г определяется выражением s{s^•\^)^•N{s) U, и, следовательно, У= (5 + A2)[s(5+Al)-(-iV(s)]
Глава 1. Принципы построения линейных 54 систем Если попытаться обеспечить равенство операторов Р ~ Р, т.е. S 1 ( * + A 2 ) [ 5 ( 5 + Al) + iV(5)] " (e + A2)(« + Al)' то с неизбежностью получим N(s) = 0. Поэтому направим выбор оператора N{3) на достижение устойчивости "подновленного" объекта Р или, что то же самое, при устойчивом объекте Р — на устойчивость полинома ,fi(s) = s(3 + Xi) + N{s). Устойчивость полинома достигается, например, при N = к = const > О, так как в итоге получаем (^(s) = s^ + 3X1 + к. При Ai > О (это условие выполнено по предположению) и fc > О этот полином — гурвицев. 1 i 1 2 Ai • С S + X.1 S + X2 к S Рис. 1.36 В результате компенсирующем возмущение обратная связь получилась интегральной (рис. 1.36). Нетрудно вычислить, что передаточной функции такого объекта соответствует выражение W{s) = * (e + A2)[s(e + Ai) + * : ] ' Поскольку передаточная функция W{s) имеет устойчивые полюса, то для решения задачи стабилизации можно использовать принцип регулирования W-^s) S у' о. е У W(s) Рис. 1.37 по нагрузке (рис. 1.37) с передаточной функцией, обратной к W(s): цг-\з) ^ (3 + Х2)(з + Xi) + к + А2 Видно, что W ' (s) физически неосуществима и, следовательно, можно го­ ворить только о приближенной ее реализации.
1.6. Метод К-изображений или метод встроенной модели 55 С л у ч а й Б . Задача становится неразрешимой этим методом, если на входе объекта действует экспоненцигшьное возмущение / = е°*, а — const. Аннулирующим для f{t) является оператор К = s — а. Действительно, d /./=(^/-./) = а / - а / = 0. Следуя рекомендациям теории, получаем R= N{s)ls-a, и связь между г н и определяется выражением (д-а) ' ( з - а К з + АО + Щ а ) " ' Выбираем оператор ЛГ(з) из соображении устойчивости полинома ¥>(s) = ( в - a ) ( s - ( - A i ) + iV(s). Ясно, что можно положить N{s) = k\s -{-ki. Тогда при выполнении нера­ венств fci > Ai а, /гг > а — Ai рассматриваемый полином <;>(«) — гурвицев. В результате передаточная функция "подновленного" объекта опреде­ ляется выражением ^^'^ = ( Т Т А ^ Ы ^ ' а обратная к ней передаточная функция W -1, . _ (з-ЬА2)у(з) имеет неустойчивый полюс, и, значит, в данном случае принцип регули­ рования по нагрузке применять нельзя. Ничего в этой схеме не меняет и обратная связь по ошибке е = у' — у, тала как такгш связь не устраняетправых нулей передаточных функций. С л у ч а й В . Вновь рассмотрим объект, представленный структурной схемой на рис. 1.35 с возмущением / = const, но теперь для описания метода /^-изображения используем дифференциальные уравнения. Дгинный объект описывскется дифференциальными уравнениями У + \2У = г, z + Xiz = f + u-v. (1.33) После дифференцирования по t уравнения (1.33) с учетом того, что / = О, имеем Z Xi Z = i) + й, и, следовательно, z не зависит от / . Полагаем «> = kz. (1.34) Тогда Z \i Z + kz = й,п если А; > О, то это уравнение устойчиво и надле­ жащим выбором й(у') можно получить у —> у', что решг1ет задачу. Урав­ нение (1.34) описывает интегргшьную обратную связь, так как '"1 zdt.
56 Глава 1. Принципы построения линейных систем 1.7. Глубокая обратная связь — большой коэффициент усиления Рассмотрим один из наиболее мощных методов решения задач ста­ билизации в условиях неопределенности — метод глубокой обратной связи, который для линейного случая сводится к использованию в ре­ гуляторе большого коэффициента усиления. 1.7.1. Постановка задачи, особенности и идея решения Пусть на объект с оператором Р = Pi Рг действует возмущение / (рис. 1.38). Требуется выбором управления и обеспечить независи- / Рг Рис. 1.38 мость регулируемой координаты у от возмущения / и, кроме того, достижение и поддержание равенства У = «/'• Укажем на некоторые особенности постановки задачи стабилиза­ ции. Во-первых, не предполагается, как ранее, что объект Р обяза­ тельно устойчивый. Во-вторых, возмущение / необязательно является малым или исчезающим со временем. И, наконец, в-третьих, не пред­ полагается наличие возможностей прямого или косвенного измерения возмущения / . В рассматриваемых условиях применение описанных выше мето­ дов невозможно, а потому неизбежно обращение или к обратной связи и принципу регулирования по ошибке в рамках схемы на рис. 1.39, в которой надлежит выбрать оператор обратной связи R', или к со- Jil.A—£. R' '.-4U" Рис. 1.39 Рг
1.7. Глубокая обратная связь 57 четанию принципа регулирования по нагрузке с обратной связью в рамках схемы на рис. 1.40, в которой, кроме того, нужно построить R' ^ Рис. 1.40 оператор прямой связи по нагрузке Q. Идея решения задаии осно­ вана на переходе от схемы на рис. 1.39 к схеме, представленной на рис. 1.41, который осуществляется заменой R' = kR, где к — скаляр­ ный коэффициент усиления, а Я — искомый оператор обратной связи. У" .^ •« е kR -4-4^ Рис. 1.41 Уравнения, описывающие полученную замкнутую систему управления имеют вид y = P2{f + r), r = Piu, u= kR(y'-y). После исключения переменных и и г находим связь между основ­ ными переменными у, у' л f сначала в виде il+kPR)y = P2f + kPRy', (1.35) а после деления на 1 -|- kPR в окончательном варианте: У= Рг , , kPR , \ + kPR' l + kPR (1.36)
58 Глава 1. Принципы построения линейных систем Можно заметить, что при к —^ оо первое слагаемое в выражении (1.36) уменьшается до нуля, а второе стремится к заданию у', что и решает рассматриваемую задачу стабилизации, если, конечно, при каждом значении к -¥ оо замкнутая система асимптотически устой­ чива. Кроме того, использование больших коэффициентов усиления ве­ дет к увеличению значений переменных системы, а поскольку в реаль­ ных системах всегда имеются амплитудные ограничения, то необхо­ димо изучить их влияние на свойства системы. Наконец, следует выяс­ нить, насколько чувствительно решение, даваемое глубокой обратной связью, к вариациям условий задачи, т.е. по отношению к регуляр­ ным и сингулярным возмущениям. Свойства системы, непрерывно зависящие от указанных возмущений, принято называть грубыми. 1.7.2. Проблемы и ограничения м е т о д а глубокой обратной связи В этом и последующих разделах рассмотрим некоторые из упомяну­ тых выше проблем. Здесь мы исследуем условия устойчивости пре­ дельной и допредельной систем и изучим влияние амплитудных огра­ ничений на управление. Из уравнения (1.36) замкнутой системы получаем {l+kPR)y = P2f + kPRy', и, следовательно, при к —^ оо нужно изучать устойчивость свобод­ ного движения или, что то же самое, устойчивость нулевого решения уравнения {l + kPR)y = 0. (1.37) Обозначим передаточную функцию объекта Р через W ( ) - ^"'+1^"' + ^mg"'"^ + ...+bi •^^^"^ s" + a„s"-'+ ...+ai _ b{s) a{s)' a передаточную функцию регулятора R, — как Pn + lS" + PnS"~^ + • • • + ? ! Wnis) = 9 n + i s " + 9 „ s " - i - ( - . . . -f-gi P(s) q(s)' Подстановка этих выражений в исследуемое уравнение (1.37) дает выражение a(s) q{s) _ a[s)q{s) + kb{s)p{s) ya{s)q{s) У' и проблема устойчивости сводится к исследованию при fc —^ оо гурвицевости параметрического семейства полиномов <Pkis) = a{s)q{s)+kb{s)p{s) = v?a,<,(s) +V'b,p(s)- (1-38)
1.7. Глубокая обратная связь 59 Из (1.38) следует, что при fc -> оо часть нулей исследуемого поли­ нома совпадает с нулями полинома ipb^p(s), которые, конечно, должны иметь отрицательные вещественные чг1сти, и это первое ограничение метода. Далее, по условию физической осуществимости, степень по­ линома числителя меньше степени полинома знаменателя, т.е. deg (pk{s) < deg <Pa,q{s), (1.39) и, следовательно, полином (роо («) помимо нулей полинома (pb,p(s) имеет другие нули, которые также должны принадлежать открытой левой полуплоскости переменной s. Из анализа допредельного полинома (1.38) видно, что абсолютные значения его нулей A,(fc), не стремя­ щихся при fc -> 00 к нулям полинома (рь,р{з), увеличиваются до беско­ нечности, так как при любом к должно выполняться равенство ^Pk{Xkik)) =a{Xkik))q{Xkik)) +kb{X,(k))p{Xk{k)) =0. Ясно, что по соображению устойчивости эти нули при к —^ оо должны уходить в бесконечность в левой открытой полуплоскости комплекс­ ной переменной s, и это — второе ограничение данного метода. Для выражения условия (1.39) через параметры системы поделим с помощью алгоритма Евклида полином 'Pa,q{s) = a(s) q(s) на полином (pb,p(s). В результате получим равенство a{s) b{s) = e{s) b{s) p{s) + r{s), (1.40) где 0(s) — чги:тное, a r(s) — остаток деления, причем его степень меньше степени делителя, т.е. deg r ( s ) < deg (b(s)p(s)). (1.41) Используя равенство (1.40), представим полином <Pk(s) в виде <Pk(s) =:b(s)p(s) b(s)p(s) Теперь ясно, что бесконечно растущие при fc —> оо нули полинома fkls) стремятся к нулям полинома d{s) = e{s)+k, так как по доказанному выше и в силу неравенства (141) имеет место "'-*«> b{Xi{k))p{Xi{k)) • Таким образом, к устойчивости полинома Vfc(s) при к -^ оо и устойчивом полиноме <Pb,p(s) ведут только две возможности: если deg Q{s) — 1, т.е. 0(s) = Gjs -|- 0 i , то 63 > 0; если deg Q{s) = 2, т.е. Q{s) = Gss^ -I- 02* -I- 0 i , то 02 > 0, 0 з > 0. Прочие же ситуации, в том числе и deg 0(s) > 2, ведут к неустойчи­ вости.
Глава 1. Принципы построения линейных 60 систем П р и м е р е. У с т о й ч и в о с т ь с и с т е м с о б р а т н о й связью. Изложен­ ную выше теорию проиллюстрируем простым примером, для чего рассмо­ трим объект, представленный на рис. 1.42. Параметры объекта Ai и Лг — необязательно положительные числа, т.е. объект не обязательно устойчив. лч s + Xj 1 s + Xi Рис. 1.42 Применим обратную связь по ошибке е = у' —у с передаточной функцией WR{S) = к 44, Я(») к = const, deg д{з) > deg р(з). В результате получим замкнутую систему управления, структурная схе­ ма которой приведена на рис. 1.43. Нетрудно устгшовить, что связь между S у« > е 9~ 1, Р (S) "4(8) у 1 S + X2 ^ 1 s + Xi Рис. 1.43 переменными у, у' w. f дается выражением кр(з) 1 + {s-\-Xi){s-\-\x)q{s) kp(s) У = e-l-Ai -I- («-(-A2)(3-hAi)g(4) " ' которое после приведения к общему знаменателю п р т ш м а е т вид [ (л -I- Х2){з -(- А,)q{s) + kp{s) ] y{s) = q{s) (s + X^) f + кр{з) у'. Если в последнем равенстве параметр обратной связи fc —>• оо, то в пределе получаем требуемое ргшенство У = У'Из теории также следует, что осмысленность предельного перехода при fc —> оо зависит от устойчивости двух полиномов: <fik(,s) = {з + Х2){з + Xi) д{з) -И кр(з), р{з).
1.7. Глубокая обратная связь 61 Если, например, р(«) = 1, то с неизбежностью q(s) = 1, и все определяется устойчивостью полинома (fik{s) = л^ + (Ai + А2)з + А1А2 + *;, которгм на^ступает только при выполнении неравенства Ai + Аг > 0. Ясно, что последнее нергшенство может и не выполняться. Если же р{з) = л + с, где с = const > О, то при q(s) = 1 устойчивость полинома 4>k{s) = 3^ + [{Xi + Х2) + к] S + Х1Х2 + кс наступает при любых параметрах Ai, А2 и достаточно большом значении коэффициента обратной связи к. При этом следует обратить внимание на то, что передаточнги! функция регулятора физически нереализуема, так как deg q(s) < deg р{з), следовательно, в при­ веденных выше расчетах нужно, как минимум, положить q(s) = 3 + q, q = const > 0. Тогда можно установить, что отвечающий за устойчивость замкнутой си­ стемы полином имеет вид 4>k{s) = 3^ + {Xi + Х2 + q) 3'^ + [А1А2 + (Ai -I-A2)g-|-fc] 3-f-AiA2g-f-fcc, a устойчивость наступает при достаточно больших значениях параметров к тл q. Тем самым мы получим структуру замкнутой системы управле- у' s+c s+q ^ f 1 S + X2 " ^ 6у' Ч 1 s + Xi Рис. 1.44 ния (рис. 1.44), устойчивую при неограниченном увеличении коэффициента обратной связи {к —>• оо) и решающую поставленную задачу стабилизации.
62 Глава 1. Принципы построения линейных систем 1.7.3. О г р у б о с т и систем с глубокой обратной связью Рассмотрим влияние двух типов вариаций оператора объекта: • регулярных вариаций, или вариаций параметров; • нерегулярных вариаций или сингулярных возмущений, меняющих порядок объекта. Для анализа последствий, которые имеют место при регулярных воз­ мущениях, достаточно обратиться к полиному ipk{s) = a{s) q{s) + kb{s) p{8), отвечающему за устойчивость замкнутой системы. Очевидно, что если полиномы ^б,р(«) = b(s)p(s) и ipk{s) гурвицевы (последний при достаточно большом значении к), то, в силу непрерывной зависимости спектра от параметров, малые изменения параметров полиномов a(s) и b{s) (т.е. параметров объекта) не меняют ситуацию качественно% Иными словами, • системы с глубокой обратной связью грубы по отношению к регу­ лярным возмущениям. При сингулярном возмущении меняется порядок объекта, напри­ мер, вместо передаточной функции W{s) = b{s)/a{s) мы имеем дело с передаточной функцией вида WAS) = - 7 ^ , a{s) T(S) где T(S) — некоторый устойчивый, но неизвестный полином степени не ниже первой, т.е. deg T(S) > 1. Тогда за устойчивость замкнутой системы отвечает полином вида <Рк («) = •г(«) a{s) q(s) + kb{s) p(s) и ясно, что если имеет место неравенство deg T{S) > 2, то для физи­ чески реализуемой обратной связи полином fl{s) всегда неустойчив при fc -> оо. Надежда на устойчивость сохраняется только тогда, когда deg T{S) = 1. Но и эта надежда призрачна, так как порядок реального объекта всегда выше порядка его математической модели и,следовательно, • практическое использование глубокой обратной связи всегда ведет к неустойчивости. Следовательно, значение коэффициента усиления, предельно допу­ стимого по соображениям устойчивости, ограничено некоторым кри­ тическим значением kct, т.е. О < к < к„. Последнее, разумеется, не позволяет полностью устранить влияние возмущения / на регулиру­ емую координату у и, как следствие, добиться требуемого равенства у = у', т.е. не позволяет точно решать задачу стабилизации. Иными словами, • системы с глубокой обратной связью негрубы по отношению к син­ гулярным возмущениям.
1.7. Глубокая обратная связь 63 Пример 7. Неустойчивость систем с обратной связью по от­ ношению к сингулярным возмущениям. Пусть в системе с обратной связью (Пример 6) имеется действующее указанным выше способом сингу­ лярное возмущение с оператором т(а) = гз + 1, г = const > 0. Тогда полином замкнутой системы упргъвления описывается выражением ifil{s) = {тз + 1){з + \2){з + Ai)(s + д) + к{з + с) и ясно, что ни при кгисом положительном значении г он не может быть гурвицевым при /с -> оо. Таким образом, построенная в Примере 6 система стабилизгщии неработоспособна при к -^ оо. Заметим, что при к < кет полином (р^(з) устойчив, однако требуемое равенство у = у' не выполняется и, более того, ощибка стабилизащш зависит от возмущения f{t). Выясним, что принципиально нового вносит в полученные резуль­ таты дополнительная прямая связь по нагрузке в соответствии со схе- kR •^ Рх —^ Рис. 1.45 мой, представленной на рис. 1.45. Отвечающие этой структуре урав­ нения имеют вид y = P2{f + r), r=Pi{u + u'), u'=Qy', u= kR{y'-y). После исключения переменных и, и' и г находим искомую связь между переменными у, у' и / в виде {l + kPR)y = P2f + {kPR + PQ)y'. Из этого выражения следует, что рассматриваемая прямг1я связь по нагрузке не влияет на устойчивость системы, так как отвечающий за устойчивость полином 1 -f- kPR не зависит от оператора Q. Точ­ ность компенсации возмущения / также не зависит от оператора Q. Польза от прямой связи состоит в том, что при конечном коэффи­ циенте усиления (к 4С ^сг) с помощью оператора Q можно повысить точность поддержания требуемого равенства у = у'.
64 Глава I. Принципы построения линейных систем 1.7.4. М е т о д пространства состояний в €кналнзе систем с глубокой обратной связью Решим задачу стабилизации объекта из Примера 6 (рис. 1.42) мето­ дами пространства состояний. Дифференциальные уравнения, опи­ сывающие объект в пространстве состояний, имеют вид У + \2У=/+г, г-\- Air = и. (1.42) Применим оператор d/dt+Xi к уравнению (1.42), полагая, конечно, дифференцируемость функции / . Тогда, используя стандартные обо­ значения a2 = Ai-bA2, ai = А1А2, уравнение объекта можно записать следующим образом: y + a2y + aiy=F + u, (1.43) где F = f + Xyf — возмущение, приведенное ко входу объекта, т.е. к управляющему входу. Пусть у' + а2у' + aiy' =Y'. Вычтем из этого выражения уравнение объекта (1-43) и, так как е = у" — у, получим в результате уравнение объекта в отклонениях: ё + огё + aie = Y' - F -и. Определим декартовы координаты xi = е, жг = ^ и запишем урав­ нения объекта управления в фазовом пространстве (xi,a;2)- Имеем XI = Х2) ^2 = —iiaJi — ога^г — и + У — F. При обратной связи и = ка, а = Х2 + cxj, с = const > О, получаем замкнутую систему управления вида ii = Х2, Х2 = -aixi - агхг - к{х2 + cxi) + Y' - F. (1-44) При к -> оо последнее дифференциальное уравнение вырождается в алгебраическое уравнение X2-f-cxi = 0. После подстановки Х2 = —cxi в дифференциальное уравнение (144), получаем уравнение предельного движения в виде Xi = —CXi. Поскольку это уравнение экспоненциально устойчиво, а у' -y = e = xi, то у* — у —> О, и задача стабилизации тем самым решена.
1.7. Глубокая обратная связь 65 1.7.5. Геометрическая интерпретация систем с глубокой обратной связью Если в (1.44) положить oi = const, 02 = const, Y' — F = А = const, TO уравнения замкнутой системы принимают вид i i = ar2, Х2 =-aiXi-a2X2-k(x2 + cxi)+А, (1-45) и полученным аналитическим результатам можно придать геометри­ ческую интерпретацию (рис 1.46). При конечном значении параме^2 ^ \ ° Чг» pi У^Л2(к) а=0 Нк) Рис. 1.46 тра к качественное поведение фазовых траекторий системы (145) ил­ люстрирует рис. 1.46а, на котором Ai(fc), A2(fc) — нули характери­ стического полинома <ph{s), определяющие парциальные движения, а X* = A/{kc + ai) — статическая ошибка. При Л -> ос прямая Ai(fc) стремится к прямой <т = О, прямая Х2(к) занимг1ет вертикальное поло­ жение, а точка х* стремится к нулю. В результате получаем фазовый портрет предельной системы, представленный на рис. 1.466. 1.7.6. Влияние амплитудного ограничения на системы с глубокой обратной связью Пусть в канале управления имеется ограничение на амплитуду сиг­ нала (рис. 1.47). Тогда при использовании глубокой обратной связи наступает, в отличие от предыдущего случая, качественно новая ситу- •i-^-TT Рис. 1.47 sat
Глава 1. Принципы построения линейных систем 66 ация. Поясним это. Пусть sat (•) описывает функцию насыщения или линейную зону с упорами (рис. 1.48а). Если и = fc<r, то зависимость к 1 V U -1 J/. 0 1" -1 -I к 1 .. .;, -1 / ! 0 Г -1 U а к Рис. 1.48 v{<j) подобна sat(«), но с измененной зоной линейности (рис. 1.486). Ясно, что при Л -4 00 функция sat {ко) превращается в функцию иде­ ального реле (рис. 1.48в). В результате взамен гладкого управления и = к(т получаем разрывное управление и = sgn сг и вместо линейной системы — релейную систему, фрагмент которой показан на рис. 1.49. г L. 1 Рг . V U 0 -1 Рис. 1.49 Поведение релейных систем разительно отличается от поведения линейных систем. Некоторые важные особенности поведения релей­ ных систем рассматриваются в следующей главе. Подводя итог обсуждению темы, можно сделать следующий вывод: • не существует линейного регулятора, робастно решающего задачу стабилизации при наличии неизвестного внешнего возмущения. 1.8. Библиографический комментарий Работы [ 13, 56, 58, 77, 78, 95-97] заложили теоретическую базу клас­ сической теории автоматического регулирования. Действительно, ан­ глийский ученый Дж. Максвелл (J. Maxwell) впервые в [95] матема-
1.8. Библиографический комментарий 67 тически исследовал вопрос об устойчивости пары "паровая машина — регулятор" и сформулировал критерий асимптотической устойчиво­ сти линейного уравнения третьего порядка. Русский математик И.А. Вышнеградский в статье [13] уточнил модель Максвелла и провел исчерпывающее качественное исследова­ ние произвольной трехмерной системы. Он впервые поставил вопрос о качестве переходного процесса в системе автоматического управле­ ния и математически описал границы областей в пространстве па­ раметров уравнения системы с различным типом качественного по­ ведения его решений, дал практические рекомендации по настройке регулятора Дж. Уатта (J. Watt). Словацкий инженер А. Стодола (А. Stodola) сформулировал не­ обходимые условия устойчивости произвольного полинома и привлек внимание немецкого математика А. Гурвица (А. Hurwitz) к проблеме необходимых и достаточных условий устойчивости. Эта задача была решена Гурвицем в 1895 г. с использованием результатов Ш. Эрмита (Sh. Hermitte), но еще ранее, в 1877 г., эквивалентные условия устой­ чивости были найдены Е. Рауссом (E.J. Routh) [97]. Наиболее общие методы исследования устойчивости и основные по­ нятия современной теории устойчивости движения даны A.M. Ляпу­ новым в диссертации [56]. Частотные методы и структурные схемы стали широко приме­ няться в теории управления после работ Г. Найквиста (Н. Nyqwist) [9б],Г.Блейка(Н. Black) [77], Г. Воде (Н. Bode) [78] и А.В. Михай­ лова [58]. Ученые провели исчерпывающее исследование устойчиво­ сти замкнутых обратной связью систем по частотным характеристи­ кам объекта и регулятора. Основные постановки задач и базовые принципы теории автома­ тического регулирования имеют глубокие корни. Считается, что аме­ риканец М. Бултон (М. Boulton) в 1788 г. и француз Ж.-В. Понселе (J.-V. Poncelet) в 1826 г. ввели в научный обиход принцип разомкну­ того регулирования. Авторство принципа обратной связи датиру­ ется 1788 г. и приписывается американцу Дж. Уатту. Интеграль­ ную компоненту в обратную связь ввел в 1837 г. француз Л. Молини (L. Molinie), производную — немцы, братья Уильям и Вернер Сименсы (William & Werner Siemens) в 1844 г. Регулирование по нагрузке впер­ вые было предложено Ч. Портером ( С Т . Porter) в 1908 г., релейная обратная связь, по-видимому, впервые использовалась Ч. Шофилдом (C.L. Schofield) еще в 1836 г., пропорциональное регулирование при­ менялось в 1870 г. американцем Д. Вудбери (D.A. Woodbury). С современной трактовкой методов прямого управления можно ознакомиться по работам [1, б, 11, 12, 64, 67]. Принцип двухканальности изложен в [61, 62, 67]. Метод Кулебакина подробно описан в [49, 52]. Теория и методы большого коэффициента усиления, повидимому, впервые систематически изложены в монографии [57].
Глава 2 Некоторые принципы построения нелинейных регуляторов Релейные системы являются простейшим видом принципиально нели­ нейных динамических систем, они описываются дифференциальными уравнениями с разрывными характеристиками и потому часто их на­ зывают разрывными системами. В теории автоматического управле­ ния интерес к исследованию разрывных систем связан с использова­ нием сервомеханизмов типа полный вперед-полный назад, а также ввиду наличия амплитудных ограничений на сигналы. В этой главе мы рассматриваем некоторые специальные вопросы теории релейных систем, представляющие интерес в общем контексте монографии и прежде всего в связи с ангшизом возможностей релейной стабилизации в условиях неопределенности. 2.1. Релейная обратная связь 2.1.1. Основные понятия Релейная система — это система, в структурной схеме которой име­ ется хотя бы один релейный элемент (РЭ). В теории автоматического управления релейной считают, как правило, обратную связь, изобра­ женную на рис. 2.1, на котором sgn (•) — нелинейная операция, устана- R Т^ а sgn \' у Р и Рис. 2.1 вливающая связь между управлением и и выходом а регулятора R по формуле и — sgn (X. Если релейных элементов несколько, то систему называют каскадной релейной системой. Характернсш особенность РЭ — разрывность, что вносит суще­ ственную специфику в методы анализа и синтеза релейных систем, а
2.1. Релейная обратная связь 69 т а к ж е н а к л а д ы в а е т о т п е ч а т о к на их качественное поведение и функ­ циональные возможности. Типичные модели релейного элемента изо­ бражены на рис. 2.2. и 1 1 Г • -Д, А 0 а 0 -1 -д Т а -1 РЭ с гистере­ зисом 2Д Идеальный РЭ Д о- -1 РЭ с мертвой зоной 2Д Рис. 2.2 Необходимость рассмотрения релейной системы естественно воз­ никает, когда в системе управления используется реальный привод (силовой механизм т и п а "полный вперед — полный назад") либо ре­ лейная система выступает в качестве удобной абстракции, например, в виде предельной системы (рис. 2.3) для системы с глубокой о б р а т н о й связью при наличии амплитудного ограничения в кангше управления. sat(.) 1 е к<7 R i/ 1 /:i/k -1 -1/к: / 0 1' и к — оо [ Р Рис. 2.3 П р и м е р 8. П р о с т е й ш а я р е л е й н а я с и с т е м а . Рассмотрим простей­ шую следящую систему первого порядка, представленную на рис. 2.4. S е у' 7) "V 9 к • ' У 1 s+a Рис 2.4 • i: 4S>'
70 Глава 2. Некоторые принципы построения нелинейных регуляторов Движение тахой системы можно описать уравнениями у + ау = и + f — объект, и = ке — регулятор, е = у' — у — оишбка слежения. (2.1) Для анализа свойств системы (2.1) удобно переписать уравнение ее дви­ жения относительно "ошибки". Прямыми вычислениями находим e = y'-y =y ' - t i - f - a y \ . =-{k + a)e + y' + ay'-f. (2.2) Пусть e(t, jfc) — какое-либо решение уравнения (2.2). Ясно, что Б т e{t,k) = 0 при любом параметре а, "практически" произвольном задании y'{t) и воз­ мущении f{t). Пусть теперь в кгмале обратной связи исследуемой системы S 2/* i е • к -—• У sat —1 Г 1 s+a Рис. 2.5 имеется ограничение типа sat (•) — насыщения (рис. 2.5). Тогда при А; —^ оо возникает качественно новая ситуащш и "ургшнение в ошибках" имеет вид ё = —а е — sat (ке) + F, где для удобства использовано обозначение F = y' + ay'-f. В пределе при к -> оо имеем дело с релейной системой ё =-ae-sgne-t-F. (2.3) Система (2.3) разительно отличается о т системы (2.2). Ясно, ч т о для неустойчивого о б ъ е к т а (т.е. когда а < 0) з а д а ч а слежения реша­ ется системой (2.3) только при выполнении неравенства \ae + F\< 1, иначе говоря, только п р и определенных начальных условиях и только для ограниченного возмущения F. Следовательно, • релейной обратной связью стабилизируются более узкие, по срав­ нению с линейной обратной связью, классы о б ъ е к т о в и только при действии ограниченных по амплитуде возмущений.
2.1. Релейная обратная связь 71 2.1.2. Скользящий р е ж и м в точке В релейных системах часто возникает скользящий режим. Для пояс­ нения приведем следующий пример: ё + ае = —sgn е, (2.4) а = const. Фс13овое пространство системы (2.4) одномерно (рис. 2.6). \а\ \а\ Рис. 2.6 Из (2.4) нетрудно понять, что неустойчивый объект (т.е. когда а < 0) стабилизируется в нуле для любых начальных условий е(0) из интервала (—1/|а|, 1/|а|), тогда как устойчивый объект (т.е. а > 0) стабилизируется в нуле на всей прямой для любых начальных условий (—оо,оо). В окрестности точки О фазовые траектории системы (2.4) направлены навстречу друг другу и, следовательно, фазовая точка не может покинуть точку 0. Решение е = О не является "классиче­ ским" и должно пониматься в каком-то ином смысле, например по А.Ф.Филиппову [72]. Такому решению отвечают бесконечно частые переключения релейного элемента. Эти переключения ассоциируются со скользящим режимом. Исследуем скользящий режим в системе (2.4) более подробно. Для этого представим ее геометрически в виде многообразия на плоско­ сти (е,ё) (рис. 2.7). Слева от нуля движение происходит по прямой ё-\- ае = 1, а справа — по прямой ё -f- ае = —1. Отрезок [ 1 , - 1 ] на оси е = О есть отрезок скользящего режима, когда скачком ме­ няется уравнение движения. Выясним, что произойдет с системой при появлении задержки в переключениях РЭ. Задержка в переключе­ нии может быть пространственной или временной. В первом случае (рис. 2.8а) релейный элемент имеет петлю гистерезиса шириной 2Д и для него используем обозначение sgnд е, а во втором случае (рис. 2.86) переключение происходит через время г после смены знака входным сигналом. Соответствующий элемент обозначен через sgn^ е = sgner, где т — постоянная времени запаздывания. 1 1 "' д -Д 0 -1 Ри с. 2.7 е бг е 0 е-" -1 а б Рис. 2.8
72 Паава 2. Некоторые принципы построения нелинейных регуляторов Уравнения движения релейной системы при наличии задержки да­ ются выражениями ё + ае = — 8§пд е и ё + ае = — sgn^ е, которым соответствуют рис. 2.9а и 2.9^. При всем отличии в существе явле- 1 -т б 0 г "-С Рис. 2.9 ния задержки качественно картина поведения систем в случаях а и 5 на рис. 2.9 схожая: скользящий режим в точке разрушен, возникает режим переключений с предельным циклом в окрестности нуля, "раз­ мер" которого по входной переменной пропорционален постоянным Д или г, характеризующим задержку. Это позволяет нам сделать следующий вывод: • скользящий режим в точке не является прочным, и, следовательно, задача релейной стабилизации не имеет робастного решения. В заключение приведем структурные схемы релейной системы с пространственной (рис. 2.10а) и временной (рис. 2.106) задержками в переключениях. Ф- s+a Л . е s+a Рис. 2.10
2.1. Релейная обратная связь 73 Пример 9. Релейная стабилизация системы в т о р о г о порядка. Рассмотрим более сложную задачу, а именно: исследуем особенности релей­ ной обратной связи, стг1билизирующей объект второго порядка (рис. 2.11). S У^ 1 е 0 -1 у |/ . 1 JL «2 Рис. 2.11 Ургшнение движения такой системы при у' = О, очевидно, имеет вид ё = —sgn е — / , (2.5) Ясно, что необходимым условием стабилизируемости является нергшенство 1/1 < 1, ограничивающее класс допустимых возмущений. Если это условие выполнено, то вместо (2.5) без потери общности можно рассматри­ вать однородное уравнение ё = —sgn е. (2.6) 2.1.3. Р е ж и м переключений Ф а з о в ы й п о р т р е т системы (2.6) образуется "сшиванием" по оси е = О фазовых трг1екторий из двух полуплоскостей: ё = -1 (/), ё= 1 {II). Фазовые т р а е к т о р и и — суть отрезки парабол с вершинами на оси 6 = 0 (рис. 2.12), и поэтому система (2.6) является консервативной. Рис. 2.12
74 Глава 2. Некоторые пршщипы построения нелинейных регуляторов При наличии пространственного или временного запаздывания из­ менения фазовых портретов показаны на рис. 2.13а и 2.13^ соответ­ ственно, из которых видно, что в рассматриваемых системах необра­ тимо наступает неустойчивость. Иными словами, релейные системы t / "^ • л V' I'fb.0 \ • • Ч} 'Уп) Рис. 2.13 С ВЫСОКИМ относительным порядком негрубы. Напомним, что отно­ сительный порядок линейного стационарного объекта равен разности степеней полиномов знаменателя и числителя передаточной функции. Из Примера 9 можно сделать следующий вывод: • для придания грубости релейной системе следует уменьшить до единицы относительный порядок передаточной функции от входа релейного элемента до его выхода. Пример 10. Релейная стабилизация объекта с относительным порядком, равным двум. Рассмотрим теперь релейную систему стабили­ зации объекта с относительным порядком, равным двум (рис. 2.14). Вновь 1 S 1 е - ^J — ш 0 -1 |/ 1 s(s + ] ) — i. Рис. 2.14 без потери общности полгъгаем j / ' = 0. Тогда уравнение движения системы на рис. 2.14 относительно координаты ошибки имеет вид ё -I- ё -I- sgn е = - / . (2.7) Необходимое условие стабилизируемости в нуле дается очевидным неравен­ ством 1/1 < 1. Это неравенство вместе с устойчивостью в нуле уравнения ё -I- ё -I- sgn е = О (2.8) гаргштируют стг1билизируемость системы (2.7) в нуле.
2.1. Релейная обратная связь 75 Для анёишза устойчивости уравнения (2.8) используем геометрические представления, т.е. метод фгкзовой плоскости. Ход фазовых траекторий уравнения (2.8) при е > О, когда действует уравнение ё + ё + 1 = О, и при е < о, когда действует уравнение ё + ё - 1 = О, показаны на рис. 2.15а и 2.156 соответственно. В результате "сшивания" фазовых траекторий имеем итоговый фазовый портрет системы, изобра­ женный на рис. 2.15в. Из ангишза этого фазового портрета становится ясно. Рис. 2.15 что 1/L < 1, а значит каждая траектория "скручивается" к началу коорди­ нат. Этс(,т же факт можно установить аналитически с помощью функции Ляпунова -|e| + f Ее производная в силу уравнения (2.8) имеет вид i) = esgn е -f- е ё = esgn е -Ь ё(—ё — sgn е) •2 -е . Поскольку многообразие {ё = 0} \ {0} не содержит целых траекторий, то нуль уравнения (2.8) асимптотически устойчив. 2.1.4. О п р о ч н о с т и рехсима переключения Убедимся, ч т о устойчивость нуля уравнения (2.8) ё-\- ё + sgn е = О не сохраняется при наличии пространственной или временной з а д е р ж к и в переключении. В самом деле, пусть имеет место пространствен­ ная з а д е р ж к а величиной Д . Тогда вместо уравнения (2.8) поведение системы можно описать уравнением ё + ё+ sgnд е = О (2.9)
76 Глава 2. Некоторые принципы построения нелинейных регуляторов и проиллюстрировать рис. 2.16. После "сшивания" фазовых траекто­ рий по границам разрыва получаем итоговый фмовый портрет урав­ нения (2.9), в котором нетрудно усмотреть существование предель­ ного цикла (рис. 2.16в). Следовательно, релейная система стабилиза- Рис. 2.16 ции (2.8) является негрубой, так как качественно меняет поведение при вариации условий задачи. 2.1.5. Р е л е й н а я с т а б и л и з а ц и я о б ъ е к т а с с а м о в ы р а в н и в а н и е м Интересно выяснить, остается ли справедливым вывод, сделанный в предыдущем разделе, для более простых объектов. Рассмотрим воз­ можности релейной обратной связи при стабилизации объекта с само­ выравниванием, т.е. объекта, асимптотически устойчивого при ну- S у« ^ е "i V 1 -1 / У 1 s^+s+1 ' J Q9' Рис. 2.17 левом управлении. Для простоты ограничимся объектом, изображен­ ным на рис. 2.17. При у' = О исследованию подлежит уравнение ё + ё + е + sgn е = —/. Ясно, что при выполнении условия | / | < 1 исследование стабилизируемости сводится к анализу устойчивости свободных колебаний системы управления, описываемых уравнением ё + ё + е + sgn е = 0. (2.10)
2.1. Релейная обратная связь 77 Вновь используем для этой цели геометрические представления, т.е. фазовую плоскость. Фазовые траектории уравнения (2.10) со­ стоят из отрезков фазовых траекторий уравнения ё + ё + е + 1 = О, действующего при е > О (рис. 2.18а), и фазовых траекторий уравнения ё - | - ё - | - е - 1 = 0, действующего при е < О (рис. 2.186). После "сшивания" траекто­ рий по границе разрыва е = О получим итоговый фазовый портрет (рис. 2.18б), на котором видна тенденция к скручиваемости траекто­ рий системы к началу координат. Последнее обусловленно тем, что Рис. 2.18 1/L < 1. Ангшитическое исследование устойчивости уравнения (2.10) проводится с использованием функции Ляпунова v = Р -\-е^ + \е\, про­ изводная которой i) = —ё^. При нашичии пространственного запаздывания Д в переключениях уравнения (2.10) фазовые портреты претерпевают естественные изме­ нения и принимают вид, показанный на рис. 2.19. На рис. 2.19в можно наблюдать предельный цикл в окрестности нуля, что эквивалентно не­ грубости исследуемой релейной системы.
78 Глава 2. Некоторые принципы построения нелинейных регуляторов 2.1.6. Стабилизация объекта с высоким относительным порядком Рассмотрим произвольный линейный объект с относительным поряд­ ком г = п — тп, где г > 3, п и m — порядок полинома знаменателя и чи­ слителя соответственно (например, объект, приведенный карие. 2.20). ' \•V •ж 9 S е 1 -1 / у 1 s"+anS°"4. . + ai •—(ar—— Рис. 2.20 При у* = О исследованию подлежит устойчивость нуля уравнения е("' -I- а„е("~^' -|- . . . + aje -Ь sgn е = - / . Вновь при условии все сводится к устойчивости свободных колебаний е(") + а„е<"~^) + .. • + aie -f- sgn е = 0. (2.11) Но нуль последнего уравнения всегда неустойчив при п > 3, что следует из неустойчивости характеристического уравнения, соответ­ ствующего ситуации, возникающей после замены релейного элемента sgn е на линейный усилитель ке при достаточно большом значении ко­ эффициента усиления к. О правомерности такой замены при анализе устойчивости нуля мы говорили выше. 2.1.7. Робастная стабилизация: разрывность, непрерывность и информация о состоянии Рассмотренные выше случаи позволяют проследить очевидную зави­ симость между непрерывностью, разрывностью и количеством ин­ формации, необходимой для стабилизации линейных объектов. При­ ведем характерные примеры. Стабилизируем объект е -(-02 ё + От ё = и (2.12) с помощью линейной обратной связи и — —ке при выполнении соот­ ношений 0102 > fc > О, oi > 0. Ни при каких параметрах oi, 02 объект (2.12) не стабилизируется в нуле релейной обратной связью
2.1. Релейная обратная связь 79 U = —sgn е. Если, однако, в закон релейной обратной связи ввести дополнительную информацию о производных е и ё, например u = - s g n ( e + e), U = - s g n ( e + e + e), то устойчивость нуля при 01,02 > о будет обеспечена. Иными сло­ вами, • существуют ситуации, когда переход от разрывного элемента к непрерывному, в частности, к линейному элементу не только по­ вышает прочность системы управления, но и позволяет решить задачу при меньшем объеме информации о ее состоянии. Аналогичная зависимость существует между прочностью системы и непрерывностью ее нелинейных элементов. Для пояснения рассмо­ трим уравнение ё -Ь ое 4- sgn е = О, а = const > 0. На плоскости (е,ё) ему соответствует рис. 2.21а, со скользящим режимом в нуле. При наличии запаздывания г в переключении раз­ рывного элемента имеем дело с уравнением ё-Ьае-t-sgnCr = О, er=e(f-r), которому соответствует рис. 2.216. На этом рисунке видно возникно­ вение режима переключения с предельным циклом. При достаточно малом запаздывании т можно прибегнуть к аппроксимации е^ = е — гё и вместо sgnвт использовать разрывной элемент вида sgn (е — те), что не меняет качественную картину явления (рис. 2.21в). Ситуация мее-гё=0 Рис. 2.21 няется качественно, если реле заменить наклоном, т.е. от р£1зрывного элемента перейти к непрерывному элементу, например к элементу типа насыщения. Тогда для анализа устойчивости в нуле следует иметь дело с ли­ нейным уравнением ё-\- ае + кбт = О, к = const > О, которому соответствует характеристический квазиполином s -|- а + +ке~''^ = 0. При достаточно большом значении коэффициента усиле­ ния к у этого уравнения всегда есть нули \{к) в правой комплексной
80 Глава 2. Некоторые принципы построения нелинейных регуляторов полуплоскости, стремящиеся при к —> оо к нулям уравнения е~'^ = 0. Последние, очевидно, имеют положительные вещественные части. С другой стороны, если к конечно, а г мало, то с помощью аппрокси­ мации е"*'' к 1—ST анализ устойчивости можно свести к исследованию полинома первого порядка (1 — кт) s + а + Аг = 0. Очевидно, что при выполнении неравенств 1 — А:г>0, а + Аг>0 наступает устойчивость, т.е. предельный цикл исчезает. Подводя итог исследованию, можно сделать вывод о том, что ре­ лейная стабилизация годится только для объектов с относительным порядком г < 2. Поскольку стабилизация при г = п — m = 2 была рас­ смотрена выше, то теперь можно исследовать особенности релейной стабилизации при г = п — т = 1. 2.1.8. Робастная стабилизация объекта с первым относительным порядком Рассмотрим релейную систему управления, структурная схема кото­ рой изображена на рис. 2.22. В данном случае относительный порядок А. S+C и и Рис. 2.22 объекта г = т — п = 2—1 = 1. Для введения переменных состояния удобно объект управления представить в виде схемы, приведенной на рис. 2.23. Тогда поведение исследуемого объекта управления можно U+/ S+C Рис. 2.23 описать уравнениями i = w 4- / , у = х + сх, const. После введения переменных состояния по формулам ц = х, Х2 = х и при необременительном условии у' = О получаем уравнения движе­ ния рассматриваемой системы в стандартном виде: XI = Х2, Х2 = - S g n (Г2 -I- CXi) -I- / . (2.13)
2.1. Релейная обратная связь 81 При выполнении условия | / | < 1 исследование стабилизируемости системы (2.13) сводится к анализу устойчивости нуля уравнений (2.14) Х2 = - S g n ( x 2 + CXi). Для исследования этой системы построим ее фазовый портрет, кото­ рый получается в результате "сшивания" по линии о- = жг + cxj = О фазовых траекторий двух систем _ Г 3Ci = Х2, г -• / XI - Х2, XI - - 1 , действующих, соответственно, в полуплоскостях (т < О и (т > 0. 2.1.9. Скользящий реж:им на отрезке Траектории систем Ei,S2 — суть параболы, которые при с > О рас­ положены так, как это показано на рис. 2.24. На рисунках обозна- (т=0 £7 = 0 Рис. 2.24 чены две точки Aw. В, являющиеся точками касания фазовых траек­ торий систем Ej и Ег прямой линии <7 = 0. Координаты этих точек определяются из условий касания (о- = О, (Т = 0): А = (1/с^,—1/с), В — (—l/c"^, 1/с). После "сшивания" фазовых траекторий получаем итоговый фазовый портрет, изображенный на рис. 2.25. V Vi*- ^ С^ Xl сг=0 Рис.2 .25
82 Глава 2. Некоторые принципы построения нелинейных регуляторов Из рис. 2.25 можно сделать выводы о том, что: • отношение 1/L < 1 и, следовательно, изображающая точка за ко­ нечное число переключений релейного элемента попадает на отре­ зок АВ; • на отрезке АВ идет "встречное" движение по фазовым траекто­ риям систем El и Ег и, следовательно, изображающая точка не может покинуть отрезок АВ, т.е. возникает скользящий режим. Для нахождения уравнения движения в скользящем режиме прове­ дем эвристические рассуждения. В режиме скольжения (7 = Х2 + СХ1 = О, но по определению Х\ = ж, Х2 = Xi ^= X. Значит, за уравнение скольжения можно принять уравнение вида X + сх = 0. При О О оно экспоненциально устойчиво, что влечет за собой устой­ чивость рассматриваемой релейной системы. 2.1.10. Реальный скользящий р е ж и м на отрезке Пусть в релейной системе (2.14) имеется пространственное запаздыва­ ние Д в переключении релейного элемента, т.е. фактически мы имеем дело с системой _ f i i = ^2 Ч^й. {X2 + CXi). (2.15) Для получения ее фазового портрета следует наложить фазовые портреты систем Ef (рис. 2.2ба) и Ej ( 2.2б<5). Тогда в результате мы Х2 ^ * . " * \ i ^ » ' .i\ N Рис. 2.26
2.1. Релейная обратнгл связь 83 будем иметь фазовый портрет системы (2.15). Этот фазовый портрет приведен на рис. 2.27. .Х2 ч v=o Рис. 2.27 Из анализа рис. 2.27 видно, что: в окрестности начала координат возникает предельный цикл; скользящий режим превращается в режим переключений, называ­ емый реальным скользящим режимом; последний характеризуется конечной частотой переключений релейного элемента и конечной "амплитудой" отклонения изображающей точки от линии (Г = 0. Следовательно, рассмотренная релейная система управления, как и все рассмотренные до этого, не является прочной, т.е. при наличии не­ идеальности переключений, из асимптотически устойчивой системы она превращается в диссипативную. • • 2.1.11. Релейная стабилизация обобщенного объекта Рг1ссмотрим произвольный объект с относительным порядком, рав­ ным единице, и релейную систему управления таким объектом, пред­ ставленную на рис. 2.28. Передаточная функция W{s) = h{s)/a{s) в S ' \ 9 е 1— -1 / у b(s) a(s) ' Чу' Рис. 2.28 схеме на рис. 2.28 задается отношением двух полиномов 6(s)=6„e"-l+6„_iS"-2-l-...-b6i, a(s) = в"-Н a„s"-^ + . . . + 0 1 ,
84 Глава 2. Некоторые принципы построения нелинейных регуляторов откуда следует, что устойчивость системы в нуле при условии | / | < 1 возможна только тогда, когда полином b{s) гурвицев, а полином a(s) не имеет нулей в правой полуплоскости переменной s и не более двух его нулей лежит на мнимой оси плоскости переменной s. Подобные объекты называют минимально фазовыми. Из сказанного выше следует вывод о том, что релейная обратная связь является стабилизирующей, если: • объект минимально фааовый; • имеет относительный порядок г < 2; • задание и возмущение равномерно ограничены. Кроме того, релейные системы не являются прочными, а их решения, а значит, и их свойства зависят от возмущений. 2.2. Стабилизация о б ъ е к т а с неопределенным оператором Качественно новую ситуацию в объекте управления создает неопре­ деленность, в частности,' неопределенность параметрическая. Для ре­ шения задачи стабилизации необходимо привлечение новых методов синтеза и алгоритмов управления. Рассмотрению некоторых уже из­ вестных подходов к этой проблеме и посвящен настоящий раздел. 2.2.1. Общие положения При расчете обратной связи обычно используется математическая мо­ дель объекта с оператором Р (рис. 2.29а), однако, как правило, опе­ ратор объекта управления известен с некоторой погрешностью АР, и поэтому фактически стабилизируется объект с неопределенным опе­ ратором Р + АР (рис. 2.296). Если погрешность Д Р в определен/ / Р+ДР Рис. 2.29 ном смысле мала, а регулятор R, рассчитанный по точной модели Р, делает замкнутую систему (рис. 2.30а) прочной, то тот же са­ мый регулятор годится и для стабилизации неопределенного объекта (рис. 2.306). Математическим выражением прочности замкнутой си­ стемы управления служит сохранение качественного поведения дина­ мической системы при вариации условий задачи, в частности, при малых регулярных и сингулярных возмущениях.
2.2. Стабилизация объекта с неопределенным оператором 85 Ситуация качественно меняется, когда в описании объекта неопре­ деленность АР не мала и такова, что поведение систем управления, изображенных на рис. 2.30, принципиально разтличается. Например, система на рис. 2.30а устойчива, а на рис. 2.306— неустойчива, и так далее. у' S *6 у е R \' S е !/* и У Р R \' Р+АР ^ Рис. 2.30 Главнгш трудность в подобных ситуациях состоит в том, что по­ грешность АР и, следовательно, информация о ней не могут быть использованы в алгоритмах управления. Иными словами, обратная связь, стабилизирующая неопределенный объект, либо должна сооб­ щать системе очень высокий запас прочности, что едва ли возможно, либо должна сама каким-то образом меняться в процессе управления, улавливая информацию о факторах неопределенности. Во всяком случае стандартные методики синтеза управления, ос­ нованные на точном знании оператора объекта, теперь неприменимы. Например, принципы регулирования по нагрузке и по возмущению уже не приводят к желаемому результату. Действительно, систему прямой компенсации (рис. 2.31) можно описать соотношением у = Pu + APu+(P2 + AP2)f u=P-'-y-P-^f у' + (ДРг - АРР^^) f + AP Р - 1 у, и ясно, что отклонение регулируемой координаты у от задания у' может быть неприемлемым. P,+AR Pi+APi Рис. 2.31 Сказанное справедливо и для метода большого коэффициента (глу­ бокой обратной связи), хотя он менее других методов связан с ис­ пользованием полной информации об объекте и действующих на него возмущений.
86 Глава 2. Некоторые принципы построения нелинейных регуляторов В самом деле, рассмотрим последствия, которые возникают при устремлении коэффициента к к бесконечности (рис. 2.32), где струк- S е '" " 6V i kR / у Р+ЛР Рис. 2.32 тура воздействия возмущения /(<) та же, что и в системе на рис. 2.31. Уравнение этой системы управления имеет вид y = {P + AP)kRe + {P2 + ДРг) /• Поскольку е = у' — у, то для ошибки стабилизации имеем выражение е = —к {Р + АР) Re — (Рг + АРг) / . После приведения подобных и деления на к получаем уравнение 1 + {P + AP)R e = ~(P2 + AP2)f. В пределе, при к -> ос, возникает уравнение {Р + AP)R = е, ко­ торое ответственно за основные черты поведения системы с Ьлубокой обратной связью. Видно, что это поведение зависит от факторов неопределенности. Следовательно, глубокая обратная связь в общем случае не обеспечивает стабилизацию неопределенного объекта. Если, однако, неопределенность каким-либо способом структури­ рована, то возможности по стг1билизации такого неопределенного объ­ екта расширяются. Пусть, например, неопределенность в операторе объекта АР может быть приведена к управляющему входу. В этом случае говорят, что неопределенность удовлетворяет условию согласо­ ванности или, иначе, matching condition (МС-условию). При выполне­ нии МС-условия неопределенный объект можно представить схемой, изображенной на рис. 2.33. Для такого объекта применение глубо- Ji -Л- АР Рис. 2.33
2.2. Стабилизация объекта с неопределенным оператором 87 кой обратной связи может дать желательный результат, т.е. застг^билизировать неопределенный объект при устремлении коэффициента обратной связи к к бесконечности по схеме рис. 2.34. В самом деле. е S . ) kR ^ 1' V Р • |ф| т АР Рис. 2.34 объект, представленный на рис. 2.34, может быть описан уравнением y = Pu + PAPy + P2f, а обратная связь — уравнением и = к Re. Поскольку е = J/' — у, то уравнение замкнутой системы управления относительно ошибки регулирования имеет вид (l + kPR)e = -PAPy-P2f. После почленного деления на коэффициент к получим соотношение ^l + PR)e = -lpAPy-lp2f, из которого при fc —> 00 находим предельное уравнение движения в следующем виде: PRe = Q. Это уравнение не зависит от неопределенности АР, возмущения / и свидетельствует о принципиальной возможности решения задачи ста­ билизации. При этом, конечно, необходимо помнить о тех проблемах, которые возникают при устремлении к в бесконечность: негрубость, усиление влияния ограничений и т.п. Поэтому, принимая во внима­ ние принципиальную возможность разрешения задачи, следует искать альтернативные методы.
88 Глава 2. Некоторые принципы построения нелинейных регуляторов 2.2.2. Принцип каскадного регулирования Как выяснилось, весьма часто простым увеличением коэффициента усиления главной обратной связи (рис.2.34) задача стабилизации не решается, так как предельная система неустойчива. Напомним, что для устойчивости при введении глубокой обратной связи по выходу необходимо, чтобы объект был минимально фазовым и имел относи­ тельный порядок г < 2. Понятно, что эти условия выполняются далеко не всегда. По­ этому представляют интерес методы, использующие местные глубо­ кие обратные связи, когда указанные выше условия реализуются ло­ кально, в каком-то месте структурной схемы системы. Такие местные глубокие обратные связи, надлежащим образом со­ гласованные, порождают иерархию коэффициентов усиления и связан­ ную с этим раэнотемповость движений в различных контурах обрат­ ных связей. Одновременно это часто упрощает синтез управления, так как при решении локальной задачи стабилизации обычно имеют дело с системой более низкого порядка по отношению к порядку ис­ ходной системы. Часто разнотемповость в системе имеет физическую природу (на­ пример, в электромеханических системах), и поэтому подобный спо­ соб управления не кажется искусственным. Такую иерархию глубоких обратных связей вводит принцип каскадного регулирования. Пример 11. Иерархия обратных связей. Рассмотрим задачу ста­ билизации в нуле объекта, покгъзанного на рис. 2.35. Считается, что кон- i + Xj ^— ттг '—^— S + A.1 Рис. 2.35 станты Ai, Лг и внешние силы / i , /2 неизвестны, а для управления могут использоваться только координаты у и г. Дифференциальные ургшнения этого объекта имеют вид У + Аг у = /г -Н г, Z + Xi Z = fi + и. (2.16) (2.17) Очевидно, что в этой задаче условия применимости стандартных методов компенсации не выполнены. Определенные трудности возникают и 1фи ис­ пользовании обычной глубокой обратной связи, так как возмущение /г не удовлетворяет МС-условию. Поэтому организация обрей'ной связи по име­ ющейся информации u = -k{cy+z) (2.18)
2.2. Стабилизация объекта с неопределенным оператором 89 и устремление к -^ оо не дает требуемого результата, так как предельная система описывается ургщнением y + {c + \-i)y = /2, (2.19) которое следует из (2.16), (2.17), (2.18). Поскольку это ургквнение згшисит от фсккторов неопределенности Аг, /г, то решение задачи стабилизгщии не гарантируется (рис. 2.36). Например, при с + Лг > О свободные движения уравнения (2.19) устойчивы, но при конечном значении параметра с выну­ жденное решение уводит координату у от желаемого нуля. В то же время ^ S + X2 S+Xi Рис. 2.36 при стремлении параметра с к бесконечности (2.19) поставленная задача стабилизации решается, причем ни на каком этапе ее решения не требуется информация о параметрах объекта Ai, А2 и возмущениях / i , /2, которые могут быть любыми. Пример 11 демонстрирует полезность пошагового устремления в бесконечность п а р а м е т р о в обратной связи. Здесь Л —)• оо и с —»• ос, но т а к , ч т о с/к —)• 0. Последнее соотношение и устанавливает т у иерар­ хию коэффициентов усиления, о которой говорилось ранее. Именно э т а идея и эксплуатируется принципом каскадного регулирования. Справедливости р а д и нужно з а м е т и т ь , ч т о использование допол­ нительной информации о состоянии о б ъ е к т а позволяет обойтись при решении рассматриваемой задачи только одной глубокой о б р а т н о й связью. Продемонстрируем т а к у ю возможность. Для э т о г о продиф­ ференцируем уравнение (2.16): У + Лгу = /2 + г , (2.20) умножим уравнение (2.16) почленно на Ai: AiJ/ + AiA2y = A i / 2 + A i z . (2.21) Р е з у л ь т а т ы (2.20), (2.21) сложим и у ч т е м , ч т о уравнение (2.17) имеет вид Z + Xi Z = fi + и. В и т о г е получим уравнение о б ъ е к т а в виде i/ + ( A i + A 2 ) y + A i A 2 y = : F - i - t i , где F = /2 + A i / 2 + / i - (2.22)
90 Глава 2. Некоторые принципы построения нелинейных регуляторов Достоинство полученного уравнения (2.22) состоит в том, что те­ перь возмущение согласовано с управлением, т.е. удовлетворяет МСусловию, поэтому использованная процедура и называется приведе­ нием возмущения к управляющему входу. При этом, конечно, нужно допустить дифференцируемость функции /гСОДля объекта (2.22) возможно применение стандартной глубокой обратной связи и = —к{су + у) по схеме, представленной на рис. 2.37, в которой устремление к в бесконечность при с > О решает задачу 9- s + Xi ^ s + Xi ^ Рис. 2.37 стабилизации, ибо предельная система описывается экспоненциально устойчивым уравнением первого порядка у + су = 0. Ограничения рассмотренного метода очевидны, они связаны: • с дифференцируемостью функции /г, чего может и не быть; • с наличием информации о производной у, что также представляет проблему. Вернемся теперь к исходной постановке задачи стабилизации из Примера 11 и решим ее с использованием только доступной инфор­ мации об объекте, прямо следуя основной идее принципа каскадного регулирования. Рассмотрим первое уравнение объекта Рг: У+ >^2У = f2-\-V, (2.23) в котором произведена замена переменной z на v. Будем считать сигнал V управлением для объекта Рг- Заметим, что возмущение /г для объекта Рг удовлетворяет МС-условию и, следовательно, есть воз­ можность для применения глубокой обратной связи. Пусть v(y) — обратнгш связь, стгьбилизирующая у в нуле для объекта (2.23). Но на объект Рг фактически действует сигнал z, поэтому имеется рассогла­ сование е = V — Z на. его входе. На устранение этого рассогласования
2.2. Стабилизация объекта с неопределенным оператором 91 (что, конечно, решает рассматриваемую задачу) и направляется вы­ бор управления и на входе объекта Pi: (2.24) Z + Xiz = fi + u. Для синтеза подходящего управления и удобно записать уравнения движения объекта Pi (2.24) относительно ошибки е = D — 2. Диффе­ ренцируя последнее уравнение по t и производя замены по формулам Z = i = Д 4- U - Ai v + Ai е. V • находим искомое уравнение движения в виде (2.25) ё + Xie = (р— и, где (f — v + Xiv + fi. Объект (2.25) также удовлетворяет МС-условию, и поэтому уместно применение глубокой обратной связи по ошибке в стандартном виде и = kic. В результате имеем замкнутую систему управления с уравнением движения вида e + {ki -I-Ai)e = ip. При fci —»^ оо объект (2.25) стабилизируется в нуле, что и требо­ валось доказать. Поскольку ясно, что обратная связь v = —к-^у при А;2 ^ 00 стабилизирует объект Рг в нуле при любых Аг и /г, то можно теперь изобразить структурную схему синтезированной системы кас­ кадного регулирования (рис. 2.38). Каскадность этой системы упраV е —9— А 1 -^ s + Xi Рис. 2.38 вления следует из того, что обратная связь и = kie способна подавить возмущение f = k2y + Xik2y + fi только в том случае, если выполняется условие lim — fci-*oo кз-¥оо *1 0.
92 Глава 2. Некоторые принципы построения нелинейных регуляторов Последнее условие и устанавливает иерархию коэффициентов уси­ ления местных контуров обратных связей, а вместе с этим вводит в систему каскадность. Если структурную схему полученной системы стабилизации представить в виде схемы, изображенной на рис. 2.39, то появляется возможность полезных содержательных интерпрета­ ций. При таком представлении видны два контура обратных свя- • s + Xj ®- -к2 -| Z Рис. 2.39 зей, причем внутренний контур является более "быстрым" (в пределе бесконечно более "быстрым", чем внешний контур) и, значит, можно считать переменные внешнего контура как бы "замороженными" по отношению к переменным внутреннего контура. Поэтому если вну­ тренний контур устойчив, то можно считать, что 6 = 11 — г = Ои, сле­ довательно, внутренний контур как бы "передает" или индуцирует на входе объекта Рг управление v. В связи с этим принцип каскадного регулирования иногда называют принципом индуцированных обрат­ ных связей. 2.2.3. Структура объектов каскадного регулирования Рассмотренную выше (рис. 2.39) структуру системы каскадного ре­ гулирования нетрудно обобщить на случай произвольного числа m каскадов (рис. 2.40). При этом стабилизация выхода объекта у в нуле /tn-1 Т Рт -^ Рт-1 Н ^ А Pl HgK- hPi Н?»--^ *^2^ Zm-1 Рис. 2.40 8к-^^ ftrnfm
2.2. Стабилиэа1щя объекта с неопределенным оператором возможна при установлении для локгтьных глубоких обратных связей определенной иерархии коэффициентов усиления lim —— = 0 , ki -+00 г = 1, . . . , m — 1. К,- Подобным образом можно стабилизировать дгилеко не все объекты, а только те, которые допускают структурную композицию, приведен­ ную на рис. 2.40. Суть этой композиции в том, что поведение каждого контура не должно зависеть от переменных внутренних (по отноше­ нию к нему) контуров, т.е. должны выполняться соотношения Zi = Pi (/,• + Zi+i), i = 1, . . . , m - 1, Zm = yHa языке дифференциальных уравнений последнее означает, что правая часть уравнения движения объекта в форме Коши должна иметь "треугольную структуру", т.е. старшая по номеру переменнгш может входить только строго в предшествующее уравнение и не должна входить в прочие уравнения с меньшими номерами. Пример таких уравнений движения в фазовом пространстве {zi,Z2, ... ,Zm) приведен ниже: Zl = <Pl{zi,t) + Z2, Z2 = 'P2{zi,Z2,t) + Z3, Zm = Vm(-Zl, ... ,Zm,t) + U. Только в этом случае каждую старшую переменную можно интерпре­ тировать как управление для предшествующих переменных и уста­ навливать иерархию обратных связей. Подобные объекты принято называть объектами с треугольной структурой. Изложенное выше показывает, что принцип каскадного регулиро­ вания является довольно эффективным средством стабилизации не­ определенного объекта, поскольку: • синтез обратной связи является итеративным и на каждой итера­ ции приходится иметь дело с объектом низкого порядка; • нет необходимости иметь полную информацию о фазовом векторе объекта; • допускаются и нестационарная неопределенность и произвольные внешние воздействия; • учитывается разнотемповость физических процессов, протекаю­ щих в реальной системе. При этом система каскадного регулирования не свободна и от недо­ статков: использование больших коэффициентов усиления понижает прочность системы и повышает роль амплитудных ограничений, кро­ ме того, требуется "треугольная" структура системы, что ограничи­ вает класс стабилизируемых неопределенных объектов. 93
94 Глава 2. Некоторые принципы построения нелинейных регуляторов 2.2.4. Стабилизация интервальных объектов Рассмотрим теперь проблему стабилизации в нуле линейного объекта y ( " ) + a „ y ( " - i ) + oij/ = u + / , (2.26) называемого далее объектом Р, постоянные параметры ai, . . . , а„ ко­ торого неизвестны, а даны только границы содержащих их отрезков, т.е. известны числа af,...,a^ такие, что а,- G [а,~, af]. Эти, из­ вестные с точностью до интервала, числа называют интервальными и обозначают символом [а,], г = 1 , ...,п. В соответствии с этим объект Р называется интервальным объек­ том [Р] и записывается в виде J/("^+Ia„]i/("-i)-H[ai]3/ = u-f-/. (2.27) Кроме того, интервальный объект может быть задан уравнением гением состояний X = [А]х + [Ь]и + [d\f, (2.28) У = [с]х, где [А], [Ь], [d\ и [с] — интервальные матрица и векторы соответ­ ственно. Заметим, что переход от описания (2.27) к (2.28) всегда воз­ можен, тогда как обратный переход может и не существовать. При стабилизации интервального объекта (2.27) фактически приходится иметь дело с семейством объектов, и этому может быть дана соот­ ветствующая геометрическая интерпретация. Пусть а = ( a i , . . . , a „ ) — вектор параметров или точка в век­ торном пространстве параметров А, определяющая конкретный объ­ ект (рис. 2.41). Тогда [а] = {[ау], ... ,[а„]) — интервальный вектор [а] 1- olZ "2 Рис. 2.41 параметров или множество — полиэдр в пространстве Л, определяю­ щий семейство объектов. Поэтому фактически обратная связь должна быть стабилизирующей для любой точки полиэдра. При этом не воз­ никает никаких проблем, когда полиэдр "мал", так как есть теоремы, свидетельствующие о непрерывной зависимости решений от параме­ тров. Но как быть, когда полиэдр нельзя считать "малым"?
2.2. Стабилизация объекта с неопределенным оператором 95 Возможно применение нескольких подходов. Например, можно вы­ брать медиану каждого i-ro отрезка аГ = (а+ + аГ)/2 и ввести полуширину того же отрезка Aai = {af -аГ)/2, i=l,...,n. Это позволяет выделить стандартный объект Р"* с фиксированными (в нашем случае — с медианными) параметрами у(п) + а;Г2/^""^^ + ...+аТу = ь, (2.29) а разницу между (2.29) и (2.27) определить как неизвестное возмуще­ ние fiy У'"-'^) = (an - а-)у("-1) + ...+{ага^)у, для которого, однако, известна мажоранта <рм{у, ..., 1/("-^)) = Аа„|у("-1)| + ...+ АаМ, т е . 1^1 < <рм- При таких переобозначениях проблему стабилизации интервального объекта Р из (2.27) можно свести к стандартной про­ блеме стабилизации медианного объекта Р"* из (2.29) при наличии помехи ifi в правой части, т.е. у(п) ^ amj^(n-l) + ^ „mj^ ^ У ^ _^ _ ^ (2.30) Если теперь имеется информация о фазовом векторе (у, у^^\ ..., у("-1))^ то рассматриваемую проблему стгьбилизации решает глубокая линейная обратная связь и = -к {сгу + С2У^^) + ...+ с„_1у("-2) + j/("-i)), (2.31) если только полином отвечающий обратной связи (2.31) при к -^ оо, гурвицев. В самом деле, с обратной связью (2.31) интервальный объект [Р] описывается уравнением у(") + [а;Г + it]y^""^^ + . . . + К + ikci]y = / . После почленного деления на к имеем i,w + т-' у("-^Ч ...+ y = -j^{f -<р) и после устремления коэффициента обратной связи к в бесконечность получаем уравнение предельного движения которое, по предположению,'асимптотически устойчиво.
96 Глава 2. Некоторые принципы построения нелинейных регуляторов Конечно, возможности такого подхода ограничены стандартными (для систем с бесконечно большим коэффициентом усиления) требова­ ниями к прочности и т.п., которые отчасти можно ослабить примене­ нием идеи каскадного регулирования. Но в целом проблема стабили­ зации общего интервального объекта с ограниченным коэффициентом усиления в обратной связи остается по-прежнему актуальной. 2.2.5. Интервальная устойчивость Альтернативой глубокой обратной связи является, правда только до определенной степени, метод, базирующийся на теории интервальной устойчивости. Предлагаемая теория основана на разнообразных критериях лока­ лизации нулей, в ЧЕ1СТН0СТИ, на критериях устойчивости политопов — полиномов с интервальными коэффициентами. Например, соглгьсно критерию Харитонова, для устойчивости политопа [^] = s» + [a„]5("-i)-b...-H[ai] необходимо и достаточно устойчивости следующих четырех полино­ мов: у И = af + a^s + a^s^ + a^s^ + ... <p++ = aj" -I- a j s -I- a^s^ -f a j s ^ -I- . . . (pt+ = «i" + o j s -I- a^s^ + a^s^ + ... <p'^t = af + at^ + «J*^ + 04 s^ + ... Условия Харитонова, вообще говоря, избыточны, т.е. в некоторых случаях можно обойтись проверкой устойчивости и еще меньшего чи­ сла полиномов. Например, для политопа второго порядка [<р] = s^ + [a2]s + [ai] достаточно проверить устойчивость только одного полинома ip = s"^ + a j s -f-af, что, впрочем, прямо следует из рис. 2.42. Поскольку необходимые i ^^^l • • • 1<р] '^ (с) 0 V/. V/// V / / / '« Рис. 2.42 и достаточные условия устойчивости политопа [(р] состоят в поло­ жительности его коэффициентов, то достаточно проверить только
2.2. Стабилизещия объекта с неопределенный оператором 97 точку (=). Если, однако, проводить локализацию нулей политопа бо­ лее точно, то потребуются дополнительные условия. Например, пра­ вая ветвь параболы 4ai = al (2.32) определяет на плоскости (ai, аз) границу апериодической устойчиво­ сти, и ясно, что для чисто апериодических процессов прямоугольник [а] = ([ai],[ai]) должен целиком лежать ниже параболы (2.32), а для колебательных — выше ее (рис. 2.43). Поэтому потребуется наложить / / / / / / / / / / / / / / / / / / •« Рис. 2.43 условия на точки (=), (:f) в первом случае и на точки (=), (±) — во втором случае. Если, кроме того, потребовать степени устойчивости, равной чи­ слу »7 > О у политопа [<р] = s'^ + [oj]* -|- [ai], то условия проверки этого свойства еще более усложняются, что видно на рис. 2.44, где пунк­ тиром обозначена граница области G со степенью устойчивости не меньше т}. Политопы, отвечающие прямоугольнику [а]', всегда имеют комплексно сопряженную пару нулей с вещественной частью не более. 4 a i = Oj k«i Я 7'/ 0\/7//2rj ///• ////////////////a. Рис. 2.44
98 Глава 2. Некоторые принципы построения нелинейных регуляторов чем —т), т о г д а к а к политоп, отвечающий прямоугольнику [а]", всегда имеет только вещественные нули, не превосходящие число —т). З а м е т и м , ч т о т е о р и я интервальной устойчивости сегодня предста­ вляет собой хорошо р а з в и т ы й раздел теории устойчивости движения. Здесь м ы ограничимся вышеприведенными замечаниями и перейдем к проблемам использования критериев интервальной устойчивости в з а д а ч а х стабилизации, в частности рассмотрим м е т о д включения. П р и м е р 12. М е т о д в к л ю ч е н и я . Рассмотрим интервальный объект У + Ыу + [а1]у = [Ь]и, (2.33) где [Ь] — интервальный коэффициент усиления, Ь € [6~,Ь''"], причем Ь~ > 0. Очевидно, что кгисую бы обратную связь с конечными коэффициентами усиления мы ни взяли, замкнутги! система будет неопределенной, а Гфи ли­ нейной обратной связи — интервальной системой. Поэтому естественно попытаться задать свойства замкнутой системы с помощью желаемого ин­ тервального полинома Мж = s^ + [а2]жЗ + [ai]mТогда цель регулирования будет достигнута при линейной обратной связи u = -kiy-k2y, (2.34) если ее параметры ki, ki будут удовлетворять следующим включениям: [ai -f- bki] С [ai]x, [02 + Ькг] С [а2]ж- Трудности, с которыми сталкивается рассматриваемый метод, видны из рис. 2.45, Действительно, для достижения асимптотической устойчиво"1 Гь+ik 1 ^ '"(1 ,^ •^ Г/, f ^ -^"^ ^ ^ ^^V-'-A [о] ^гк ±) 1 1 — ь-к ( .i . ! ! [o-l-bJk] 1 0 Рис. 2.45 сти начг1льный прямоугольник [а] нужно с помощью вектора к = {}i2^k\) "перенести" в открытый положительный ортгшт плоскости (a2,ai). При этом происходит ргкгширение границ пересекаемого прямоугольника [a]ib, так как коэффициент Ь неизвестен и меняется от Ь~ до Ь"*".
2.2. Стабилизация объекта с неопределенным оператором 99 Для достижения требуемого качества регулирования, кроме всего про­ чего, нужно noneicTb "размытым" прямоугольником [а]* вовнутрь прямо­ угольника [а]ж, что довольно трудно. Для этого нужно проверить принад­ лежность прямоугольнику [а]ж двух диагональных вершин прямоугольника [а]к, например ф и © . Конечно, если ослабить требования к качеству переходных процессов и добиваться лишь, к примеру, стабилизируемости, т.е. гигимптотической устойчивости замкнутой системы, т о процедура синтеза обратной связи заметно упрощается. Так, при стабилизгщии интервального объекта (2.33) с помощью линейной обратной связи (2.34) достаточно выбором параметров ^1, ^2 удовлетворить интервальные неравенства [а2+Ьк2]>0, [ai-l-bfci] > 0 , которые эквивалентны следующим числовым неравенствам: 02 +Ь~к2>0, а^ +Ь~к2>0. Спргведливость последнего утверждения иллюстрируется рис. 2.46. [a+Vk] V/////////// «2 Рис. 2.46 Структурнгш схема системы стабилизации в нуле интервального объ­ екта с помощью линейной обратной связи приведена на рис. 2.47 и, разуме­ ется, не зависит от способа расчета ее параметров к\ иfcj,т.е. используется ли метод включения или метод интервальной устойчивости. с ь i9 «2 с)-| ki У 1 s4[aj]s+[a ll Рис. 2.47
100 Глава 2. Некоторые принципы построения нелинейных регуляторов В заключение заметим, что рассмотренные методы стабилизации не могут быть применены, если в правой чгигги имеется неисчезающее, пусть даже известное, возмущение /(<), т.е. в случае, когда стабили­ зируется объект вида У + [а2]у + [ai]y = [Ь]и + / . Отсутствие информации о коэффициенте 6 не позволяет применить даже метод прямой компенсации возмущения, а так как в обратной связи U= -kiy-k2y используются ограниченные коэффициенты, а помеха /(<) не стре­ мится к нулю при t —> 00, то замкнутая система, в лучшем случае, будет диссипативной. Следовательно, • методы стабилизации, основанные на интервальной устойчивости, имеют свою область применения, но не исчерпывают проблему в целом. В частности, они не годятся для тех случаев, когда параметры объ­ екта меняются. 2.2.6. Общие полоясения теории адаптивной стабилизации Рассмотрим проблему стабилизации неопределенного объекта с опе­ ратором Р + АР и положим для простоты, что у' = о, / = о, т.е. будем решать задачу стабилизации свободных колебаний объекта. Сделаем также стандартное предположение о том, что неопреде­ ленность АР удовлетворяет условию согласованности JIJIH МС-условию. Тогда проблема сводится к выбору регулятора R, стабилизи­ рующего выход объекта Р 4- АР в нуле (рис. 2.48). Ранее мы уже R -9 ч АР Рис. 2.48 доказали принципиальную возможность решения такой задачи ста­ билизации методом большого коэффициента, но это приводит, как неоднократно подчеркивалось, к непрочным системам управления.
2.2. Стабилизация объекта с неопределенным оператором 101 При использовании в обратной связи конечных коэффициентов пе­ редачи (именно это является признаком прочной системы) в теории адаптивного управления регулятор R конструируют в виде двух ком­ понент _ Д = Д + ДД, где выбор первой компоненты R направляют на стабилизацию опре­ деленного объекта Р, тогда как вторая компонента Д Д должна ком­ пенсировать (устранить) влияние неопределенности Д Р на поведение системы. Это соображение приводит к схеме системы, представленной на рис. 2.49, где часть системы, обведенную контуром, обычно называют обобщенным объектом. Оператор ^""TTPR этого обобщенного объекта выбором регулятора Д наделяется всеми требуемыми в постановке задачи стабилизации свойствами, в том чи­ сле и асимптотической устойчивостью. Поэтому фактически про­ блема стабилизации сводится к взаимной компенсации на входе объ­ екта сигналов с контуров обратной связи ДД и Д Р соответственно (рис. 2.50). Идеальным решением задачи был бы выбор оператора Д Д ДК , ^ R у Р AR Ф Q> - - \ АР АР Рис. 2.49 Рис. 2.50 на основе тождества AR-\-AP = О, но оператор Д Р неизвестен, и по­ этому следует позаботиться о получении его асимптотической оценки Д Р , так чтобы Д Р ->• Д Р t-^oo. Тогда, полагая, точнее говоря, осуществляя настройку оператора обратной связи Д Д по правилу ДД=-ДР, (2.35)
102 Глава 2. Некоторые принципы построения нелинейных регуляторов можно рассчитывать на асимптотическое решение задачи стабилиза­ ции, так как в этом случае справедлива асимптотика AR + AP = -AP + AP-^0, t-^oo. В теории адаптивного управления получение оценки АР возлага­ ется на специальный измеритель с оператором D, а реализация "на­ стройки" (2.35) — на "адаптатор" с оператором А. В результате получается схема, представленная на рис. 2.51. Такой адаптивной си­ стеме стабилизации можно дать содержательную интерпретацию в терминах основных принципов регулирования. Описанный выше способ компенсации операторного возмущения АР похож на способ косвенной компенсации координатного возмуще­ ния /(f) с помощью принципа регулирования по возмущению. Дей­ ствительно, по доступной информации о параметрах объекта Р, его входах и выходах вырабатывается оценка возмущения Р, которая за­ тем используется для компенсации АР = —АР. Все так, как и при D Ж R AR D -9 АР Рис. 2.51 Р+АР -f Рис. 2.52 компенсации неизмеряемого прямо возмущения /(<). Это наблюдение позволяет сделать вывод о том, что адаптивная стабилизация осно­ вана на сочетании двух основных принципов регулирования: • принципа обратной связи при управлении свободным движением; • принципа регулирования по нагрузке для компенсации оператор­ ного возмущения А Р (рис. 2.52). На рисунке двойными тонкими линиями обозначен контур регулирования по нагрузке. Данный вывод является принципиальным для любых схем адаптив­ ного управления и по существу может считаться неотъемлемым при­ знаком адаптации. Хотя, разумеется, возможны вариации в реализа­ ции идеи адаптации. Приведем некоторые уточняющие замечания.
2.2. Стабилизация объекта с неопределенным оператором 103 З а м е ч а н и е 1. Имеются варигщии описанной выше схемы адаптгщии. Например, для выполнения условия компенсации ДЛ+ДР=0 можно менять не только (а может быть и не столько) оператор регулятора AR, но и оператор объекта Д Р . Для этого, разумеется, должна иметься соответствующая возможность представления Д Р в виде суммы Д Р = ДР' + ДР", где Д Р ' — неизвестная, а Д Р " — настраиваемг1Я часть. В этом случгке го­ ворят о методе нгкстраивг1емого объекта, в отличие от предыдущего случая, когда мы имели дело с настргкиваемой обратной связью. Замечание 2. Поскольку оценка Д Р вырабатывается по измерениям координат объекта р или системы Рс, а также их входов, то понятно, что наиболее просто это делается тогда, когда изменения Д Р происходят "мед­ леннее" изменений этих переменных. В этом смысле говорят о квазиста­ ционарном изменении оператора Д Р , а фгжтически при расчете обратной связи ориентируются на стационарный оператор Д Р . Бели построенная та­ ким образом адгиггивная система прочна, то она сохраняет работоспособ­ ность и при "медленных" изменениях в силу устойчивости прочных систем по отношению к постоянно действующим возмущениям. Замечание 3 . Нг1личие внешнего воздействия / на неопределенный объект упргшления (рис. 2.53) еще более усложняет ситуацию, так как при этом вносится дополнительн£1Я неустранимая погрешность в оценку Д р , если только Д / -/^ О при t —¥ оо. Поэтому вместо требуемого условием компенсгщии ргшенства ДД+ДР=0 имеем смещенное на некоторую величину Д ^ рг1венство Д Д + Д Р = Д(г, и проблема, следовательно, состоит только в том, насколько оператор Д ^ искажает поведение объекта Рс (рис. 2.54). Если возмущение исчезающее. AQ Г Р+АР Рис. 2.53 У Г Рс Рис. 2.54 т.е. / —> О, а вместе с этим и Д Q —> О при t —^ оо, то в установившемся режиме проблемы не возникг1ет. Если же возмущение не исчезающее, т.е. Д / 7^ О при t -)• оо, но, нгшример, огргшиченное, т.е. (/| < /о = const, то
104 Глава 2. Некоторые принципы построения нелинейных регуляторов из-за использования ограниченных коэффициентов передачи в регуляторе можно рассчитывать, вообще говоря, только на диссипативность замкнутой системы упргюления с радиусом диссипативности порядка /о. Замечание 4. При определенных условиях адаптивный подход поро­ ждает стабилизаторы универсального действия, т.е. тгисие регуляторы, для применения которых нет необходимости точно знать не только параметры объекта, но даже и его порядок. Подобные регуляторы называются уни­ версальными. Для успешного их использования требуется выполнение сле­ дующих условий: • МС-условия (условия согласованности); • минимальной фазовости объекта Р. Действительно, в этом случае можно применить глубокую обратную связь вида kR с коэффищ1ентом усиления к и оператором R (рис. 2.55). Такая обратнёкя связь при к -^ оо обеспечивгъет стгъбилизгщию, если асим- kR 1' У Р • f S Y АР Рис. 2.55 птотически устойчиво уравнение предельного движения РЯу = 0. (2.36) Последнее уравнение при А; ^ оо следует из уравнения движения замкнутой системы (1 -I- kPR)y = (Рг + ДРг)/ + РАРу, соответствующего рис. 2.55. Рассмотрим условие асимптотической устойчивости для уравнения (2.36) подробнее. Пусть объект Р стационарен. Тогда его можно представить передаточной функцией Wp{s) I3m(s) an{s) ' Аналогично, оператору регулятора R поставим в соответствие пере­ даточную функцию
2.2. Стабилизация объекта с неопределенный оператором 105 где /3, а, S, f — полиномы комплексной переменной s, а индексы т, п, I я г — степени соответствующих полиномов. Тогда уравнение предельного движения PRy = Q эквивалентно уравнению p,r^{s)Si{s)Y(s) = 0, (2.37) где Y{s) = С[у] — одностороннее преобразование Лапласа функции y{t). Из (2.37) видно, что полином /?m(s) должен быть гурвицевым, что и означает минимальную фазовость объекта Р. Непрочность рассматриваемой системы с глубокой обратной свя­ зью в универсальном стабилизаторе преодолевается тем, что коэффи­ циент обратной связи зависит от переменных состояния, например, от выхода объекта к= к{у,...), и монотонно увеличивается до тех пор, пока не наступает, при указан­ ных выше условиях, устойчивость (при / —> 0) или диссипативность (при 1/1 < /о) следующего уравнения: + PRjy = {P2 + Д Р з ) / + (.Щ^'") РАРу. Пример 13. Синтез адаптивной системы управления. Рассмо­ трим на примере стабилизации в нуле объекта второго порядка Х2 = axi +bu, \ • I с неопределенными коэффициентами а и Ь > О, одну из наиболее распро­ страненных методик синтеза адаптивного управления. Замкнем объект (2.38) обратной связью U = —fclXl — ^2^2 и сформируем алгоритмы адглтации Л переменных ^i, ^2: *:i=6, ^2=6, (2.39) т.е. г1лгоритмы настройки параметров ki, /сг, таким образом, чтобы пове­ дение замкнутой системы Е*: XI = Х2, Х2 = —{bki — a)xi — bfcjxa, было бы подобно (может быть, даже близко) поведению некоторой эталон­ ной системы Е-,: «1 = 22, 22 = - 7 1 2 1 - 7222.
106 Глава 2. Некоторые принципы построения нелинейных регуляторов Здесь 71 и 72 — назначенные положительные числа; Е.у-систему будем также называть моделью. После введения обозначений bAfci = bki — а — 711 ЬАк2 = bfcj — 72 замкнутую адаптируемой обратной связью Е;ь-систему можно представить в стандартном виде XI = 1 2 , Х2 = —71^1 — 721^2 — b/\kixi — ЬАк2Х2. в условиях гипотезы квазистационарности Aki = ki, А^г = ^2, и по­ этому формально удобно считать, что адаптируются не сами коэффици­ енты ki и ^2, а их отклонения от требуемых значений, т.е. згккон адаптации А можно згшисать в обобщенном виде Aki = ^1, ДЛг = ^2Для получения конкретного алгоритма адгштации Л используем квадра­ тичную форму t)(x) = (х, Нх) с положительно определенной (2 х 2)-матрицей Н = [hi,h2]'*', тгисую, что при некотором (желаемом) положительном числе Л > О, определяющем степень устойчивости Е-^-системы (модели поведения замкнутой системы), ее производная в силу Е-^-системы имеет вид I) 1 = Is., -2Xv. Поскольку выбор параметров модели 7i, 72 ничем не огргшичен, такие мат­ рица Н и число А существуют. Введем теперь в рассмотрение квадратичную форму V{x,k) в расши­ ренном простргшстве переменных {х, к} выражением ,^, ,, =, , Vix,k) bfAkj Akl\ vix)+-i^-^+^j, где Pi, 132 — некоторые положительные числа. Ее производная в силу Е*системы с алгоритмом адглтации Л дается выражением ^ U = ^ U - ( ^ - . ( г )>(А^1-1 + А . 2 Х 2 ) - Ь Ь ( = -2\{х,Нх) Aki(xia-^\-\-Ak2(x2(T-^\ -Ь где "• = ( Нх, ( 1 ) ) = {^2,х). ^ + ^ ) = 40) , (2. Теперь ясно, что если правые части алго­ ритма адаптации выбрать в виде $1 = /?lXl<T, ^2 = /32Х2<Т, то производнскя (2.40) принимает вид V = -2Х{х, Нх) и становится знгикоотрицательной в простргшстве {х, к}, откуда и следует стабилизируемость рассматриваемой системы.
2.3. Стабилиза1щя регулятором переменной структуры 107 Заметим, что сходимость погрешностей оценок Afci, Д^г к нулю при этом не гарантируется, поскольку для такой сходимости требуется опре­ деленная отрицательность v в расширенном фазовом пространстве {х, к}. Заметим также, мто при нгшичии координатного- возмущения / , т.е. при стабилизации объекта Р' : XI = Х2, Х2 = —ахх -\-Ьи + f указгшным выше способом, в итоговом выражении для производной v по­ явится дополнительное слагёкемое, пропорционгшьное возмущению v = -2\{xi,Hx) + b(Tf, которое при неизвестном / нарушает знакоотрицательность v и Хфи ограни­ чении 1/1 < /о ведет к диссипативности системы по основным переменным, т.е. задача стабилизации не решс1ется точно. В заключение приведем с т р у к т у р н у ю схему адаптивной системы стабилизации, синтезированной в Примере 13. Она представлена на рис. 2.56, на к о т о р о м /i2i и Лгг — компоненты в е к т о р а Лг = i^^ "22 Рис. 2.56 В даьнейшем э т а структурнг1я схема потребуется нам для сравнения.
108 Глава 2. Некоторые принципы построения нелинейных регуляторов 2.3. Стабилизация регулятором переменной структуры Рассмотрим теперь еще одну попытку окончательного решения рас­ сматриваемой в монографии проблемы путем использования регуля­ торов с переменной структурой. Идея принципа переменности структуры состоит в скачкообрг13ном изменении связей между функционгшьными элементами регуля­ тора в зависимости от фазового состояния замкнутой системы упра­ вления, которую в таком случае называют системой управления пе­ ременной структуры (СПС). Если рассматриваются линейные объект и функциональные элементы регулятора, то соответствующую СПС можно интерпретировать как совокупность линейных подсистем и правил перехода от одного элемента этой совокупности к другому при пересечении фазовой точкой разделительных гиперплоскостей в фа­ зовом пространстве системы, которые называют поверхностями ргизрыва. Если же объект или функциональные элементы нелинейны, то речь идет о совокупности нелинейных подсистем и, соответственно, о нелинейных поверхностях или многообразиях разрыва. И в первом и во втором случае СПС — нелинейная динамическая система — описывается дифференциальными уравнениями с разрыв­ ными правыми частями. Синтез СПС сводится к выбору поверхно­ стей разрыва и исходной совокупности подсистем, гарантирующих решение поставленной задачи управления. Мы не излагаем здесь те­ орию СПС, просто хотим подчеркнуть, что СПС предназначены для робастного управления объектом со структурированной неопределен­ ностью (рис. 2.57), где S — задатчик, Р — известный оператор объ­ екта, АР — неизвестная компонента оператора объекта, приведен­ ная к управляющему входу, Rvss — регулятор переменной структуры. Особенности синтеза Rvss поясним на примерах. Н2>- Rv н»АР Рис. 2.57
2.3. Стабилизация регулятором переменной структуры 109 2.3.1. Астатическая следящая система Рассмотрим простейшую следящую систему с дробно-рациональной передаточной функцией объекта вида W(s) — l/a(s), где a(s) — по­ лином степени п = deg a(s) > 1 (рис. 2.58). Если регулятор R в схеме -9 R W(s) Рис. 2.58 на рис. 2.58 выбран таким образом, что ошибка слежения е = у' — у асимптотически стремится к нулю при < —>• оо, то такую следящую систему называют астатической, в противном случае система стати­ ческая. Для пояснения основных проблем, связанных с построением аста­ тической следящей системы в рамках линейной теории, запишем урав­ нение движения системы, изображенной на рис. 2.58, относительно ошибки слежения в операторном виде, после чего имеем уравнения a(s)e = a(s)y' — и = a(s)y' - Re u=Re или, после приведения подобных, получаем уравнение [a{s) + R{s)]e = a{8)y'. (2.41) Стоит подчеркнуть, что в (2.41) R{s), вообще говоря, — тоже дробно-рациональная функция, R{s) = к lis) 4s)' (2.42) с коэффициентом усиления к и полиномами 7(*)> '^(*)i удовлетворяю­ щими условию физической осуществимости deg S{s) > deg 7(*)Положим для определенности, что deg S(s) > 1. С учетом этого заме­ чания уравнение (2.42) можно преобразовать к следующему виду: [ a{s) 6{s) + к 7(s) ] е = a{s) S{s) / . (2.43) Из (2.43) видно, что теоретически данная следящг1я система будет астатической тогда и только тогда, когда полином a(s) S{s)+'f(s) гурвицев и полином a(s)<J(s) содержит множитель /C(s), аннулирующий
110 Глава 2. Некоторые принципы построения нелинейных регуляторов функцию задания, т.е. такой, что K{s)y' = О, (2.44) либо, если такого множителя K{s) нет, то: 1) полином 7(e) должен быть гурвицев; 2) в пределе при к —¥ оо поведение системы описывается асимптоти­ чески устойчивым уравнением l{s)e = 0. (2.45) Впрочем, так как большие коэффициенты усиления приводят к не­ грубым системам, то реально при синтезе астатических систем при­ ходится ориентироваться на конечные коэффициенты передачи, а зна­ чит, и на гурвицевость полинома a{s) 5{s) + 7(5) и условие (2.44). Если аннулирующий полином IC{s) является гурвицевым, то выпол­ нение указанных выше условий не вызывает принципигшьных ослож­ нений. Другое дело, когда полином /C(s) — неустойчивый, например /С(в) = s^ — а^, о = const > 0. Тогда мы сталкиваемся с серьезными проблемами. В самом деле, полином S{s) не может быть неустойчи­ вым, ибо в противном случае неустойчива собственная динамика ре­ гулятора (2.42) и его выход u{t) экспоненциально нарастает со всеми вытекаюпщми отсюда негативными последствиями: выходом за пре­ делы зоны линейности и т.п. Следовательно, неустойчивые компо­ ненты (множители) аннулирующего оператора K{s) должны быть од­ новременно множителями полинома a(s), что, конечно, неве{)оятно. Это рассуждение показывает, что • в рамках линейной теории управления, предполагающей исполь­ зование только ограниченных коэффициентов передачи в регуля­ торе, построить гютатическую систему слежения за экспоненци­ ально растущим сигналом у' невозможно. Мы рассмотрели две грубые ситуации: экспоненциально устойчи­ вые и экспоненциально неустойчивые K{s). Проанализируем теперь пограничную ситуацию, когда задание j / ' — полиномиально рги;тущая функция времени, т.е. у' = Cm+l^ + С ^ * ' " - Ч . . . +С1, где с,- — некоторые константы, (t = 1, . . . , m -(- 1), а число m — по­ рядок полинома, т.е. Cm+i ф 0. Простейшим оператором, аннулиру­ ющим полином (2.45), очевидно, является оператор ( т -I- 1)-кратного дифференцирования K{s) = s"*'^^. Естественно предполагать, что в систему слежения он привносится регулятором, т.е. S{8) = 5-+1 S'{S), где S'(s) — некоторый устойчивый полином. Но в таком случае, в силу необходимого условия устойчивости, для обеспечения гурвицевости
2.3. Стабилизация регулятором переменной структуры 111 характеристического полинома замкнутой системы a(s)S'(s)s'"+^-\-k'y{s) (2.46) требуется выполнение неравенства deg f{8) > m + 1. Если полином (2.46) гурвицев, то система слежения без ошибки воспроизводит по­ линомиальный сигнал (2.45), и тогда говорят, что регулятор fis) '+1 S'{s) R{8) (2.47) обеспечивает астатизм (m + 1)-го порядка. Заметим, что, в силу из­ вестного разложения экспоненты »а« =т=0Е{atrг! задачу слежения за экспоненциально растущим сигналом y'{t) = y4oy можно интерпретировать как задачу построения системы с бесконеч­ ным порядком астатизма. Ясно, что указанным выше способом построить такую систему слежения нельзя из-за неограниченно возрастающей сложности регу­ лятора. Это наблюдение только подтверждает сделанный ранее вывод о том, что • в рамках линейной теории невозможно построение робастной аста­ тической следящей системы. Может показаться, что и в рамках принципа комбинированного управления, когда управляющий сигнал формируется в виде суммы сигнала обратной связи по ошибке слежения и^ = Ле и сигнала прямой связи по нагрузке Uy = Ну' (рис. 2.59), этот принципиальный вывод неверен. н Uy S ^ У^ « R у W(s) Рис. '2.59 ue J "Ч > — 1
112 Глава 2. Некоторые принципы построения нелинейных регуляторов Разберем и эту ситуацию, полагая, как и ранее, что W{s) ~ l / a ( s ) , R[s) = j{s)/5{s). Из рис. 2.59 имеем следующее уравнение движения относительно ошибки: = a{s) е — a{s) у' — и [a{8)-H{s)]y'-R{s)e. u=Hy'+Re После приведения подобных имеем дело с уравнением [ais)S{s)+y{s)]e = S{s)[a(s) - H{s)]y'. (2.48) В (2.48) оператор прямой связи H{s) надлежит выбрать так, чтобы правая часть обратилась в тождественный нуль. Имеется несколько очевидных возможностей решения этой задачи. С п о с о б I . Можно, например, положить H{s) = a{s), тогда прямая связь определяется выражением «у = a(s) у' и предполагает п-кратное точное дифференцирование задающего сиг­ нала (напомним, что deg a(s) = п). По неоднократно приводившимся выше соображениям от этого решения, как неробастного, приходится отказываться. С п о с о б П . Можно понизить кратность дифференцироваЦия вос­ производимого сигнала y'(t), если deg /C(s) < deg a{s), где K.{s) — оператор, аннулирующий y'[t). В самом деле, поделим по­ лином a{s) на IC(s), так как, вообще говоря, все нули tC{s) не являются нулями oi{s). В результате деления получится некий остаток y{s), т.е. a{s) = a'{s)ICis) + T,is), (2.49) причем справедливы неравенства deg y{s) < deg K-{s) < deg a{s). Теперь для достижения г1статизма достаточно (при том условии, что характеристический полином (p(s) = a(s) J(s) + j(s) — гурвицев) по­ ложить H(s) = ф). (2.50) Подставляя (2.50) в (2.49), а результат — в (2.48), получаем уравнение [а{8) Sis) + f(s) ] е = 5(8) [e'(s) IC{s) + ф) - n{s) из которого и следует сказанное выше. ]у'=0,
2.3. Стабилизация регулятором переменной структуры 113 С п о с о б I I I . Если же deg K.{s) > deg a{s) и у о п е р а т о р а K{s) есть устойчивые нули, т.е. он представим в виде IC{s) = lC-{s)K+{s), где /C_(s) — гурвицев полином, т о э т и нули можно в к л ю ч и т ь в число нулей полинома S(s), т.е. в з я т ь последний в виде S(s)^S'(s)IC-{s). Если при э т о м еще окажется, ч т о deg lC+{s) < d e g a(s), т о возможен синтез оператора прямой связи H{s) по т о й же схеме, ч т о и в Способе II. При невыполнении последнего неравенства использо­ вание прямой связи по нагрузке к а р д и н а л ь н ы м образом не влияет н а возможность построения астатической следящей системы. Из приведенного выше анализа следует, ч т о в любом случае п о т р е ­ буется операция т о ч н о г о м н о г о к р а т н о г о дифференцирования, ч т о не позволяет г о в о р и т ь о решении рассматриваемой з а д а ч и . П р и м е р 14. Т о ч н о е с л е ж е н и е з а з а д а ю щ и м в о з д е й с т в и е м . Про­ иллюстрируем теоретические выкладки предыдущего раздела на простей­ шем примере и рассмотрим следующую постановку задачи: требуется син­ тезировать обратную связь, обеспечивающую точное слежение регулируе­ мой координатой у за задающим воздействием у' (рис. 2.60). Уравнение е S .6 •V J ' R У 1 S Рис. 2.60 системы слежения относительно ошибки е таково: ё = у' то задачу решает любг1я обратная связь вида и = ке, и. Если у' = О, к = const > О, так как в этом случае уравнение замкнутой системы ё — —ке экспоненщ1ально устойчиво. Если же у' ^ О, нашример у' = const (т.е. задание растет линейно), то статическая обратная связь и = ке уже не решает за­ дачу, так как уравнение движения в отклонениях имеет ненулевую правую
114 Глава 2. Некоторые прииципы построения нелинейных регуляторов часть в положении равновесия ё = —ке + у', и, следовательно, появляется статииеская ошибка, т.е. установившееся при t —> оо значение ошибки регу­ лирования е(оо) = у'/к. Разумеется, увеличением коэффициента усиления обратной связи к эту погрешность слежения можно устранить, но при этом возникают характерные для систем с глубокой обратной связью проблемы, о которых говорилось в главе 1. Если в системе на рис. 2.60 дополнительно использовать прямую связь по нагрузке, т.е. сформировать управление в виде суммы U = ке + у', то получится астатическая следящая система со структурной схемой, приведенной на рис. 2.61, и уравнением движения вида ё = —ite. Последнее асимптотически устойчиво при А; > О, что и решает рассматриваемую задачу. S Uy yS S к f^ "«<L 'W у 1 S Рис. 2.61 Иными словами, построена астатическгш комбинированнгья следящая си­ стема, в которой для достижения астатизма необходимо использовать опе­ рацию точного дифференцирования, и это в таком тривиальном случг^е! В этой связи естественным представляется следующий вопрос: • нельзя ли обеспечить астатизм (нулевую установившуюся ошибку) при ограниченных коэффициентах регулирования и без использо­ вания операции точного дифференцирования? 2.3.2. А с т а т и з м 2-го порядка В предыдущем примере у' = const. Продифференцируем по t уравне­ ние объекта ё = у' — и и введем обозначение и = V. (2.51) Тогда получим уравнение вида ё = —v. Следовательно, рассматрива­ емая задача слежения сведена к задаче стг^билизации свободных коле­ баний. Последняя задача решается, например, применением линейной обратной связи v = k2e + kie (2.52) при положительных коэффициентах ki, к^-
2.3. Стабилизация регулятором переменной структуры 115 Действительно, соответствующая замкнутая система управления описывается устойчивым уравнением ё + Лгё + kie = 0. Из (2.51) и (2.52) получг^м искомую обратную связь в виде пропорционально- S ^ 1— к, —1 у 1 я Рис. 2.62 интегрального или ПИ-закона и = Лгс + ki I е dt. Структурная схема соответствующей следящей системы представлена на рис. 2.62. 2.3.3. Астатизм порядка т По индукции ясно, что если у' (t) — полином по t степени т, т.е. в нуль тождественно обращаются все его производные, начиная с ( т + 1)-й, то для достижения астатизма в этом случае потребуется не менее, чем m интегрирований ошибки слежения (рис. 2.63). При m —> оо поki S yS е ,6 У- S кг у 1 S Рис. 2.63 ^ ,
116 Глава 2. Некоторые принципы построения нелинейных регуляторов рядок линейного регулятора растет до бесконечности, что, конечно, практически неприемлемо. В частности, таким путем нельзя постро­ ить астатическую систему для экспоненциально растущего задания у' = е"', а = const > О, так как =" = Еиг т! и для этого по указанной методике потребуется использование беско­ нечномерного регулятора. Как же быть? 2.3.4. Астатическая следящгкя система п е р е м е н н о й структуры Исследуем систему, структурная схема которой дана на рис. 2.64. Особенность рассматриваемой системы состоит в том, что знак ко- S ,e^'^ "V > е 1 ±к У 1 S Рис. 2.64 эффициента обратной связи по выходу у определяется знаком ошибки слежения е. Именно, уравнение движения имеет вид у = ку sgn е, и если ^ > О, то при е > О выход объекта экспоненцигшьно нарастает (рис. 2.65а), так как у =^ ку, у = у(0)е*', а при е < О выход объекта экспоненциально убывает (рис. 2.656), так как у = —ку, у = у(0) е~**. .у н У(0)' 0 't Рис. 2.65
2.3. Стабилизация регулятором переменной структуры 117 Если теперь положить к > а и sgn j/(0) = sgn /?, т о при |j/(0)| < (/?| экспонента j/(0) е**, а при |j/(0)| > |/?| экспонента у(0) е~*' з а конечное время "догонит" з а д а ю щ у ю экспоненту /Зе"*^ (рис. 2.66). Возникает I/ у(0)е'=' 1 ^/^ _^J_ -^Jr^C^ — Скользящий fi Tlv^ режим 1 Ч У(0) 1 0 h ^ ^ y^e-^^W-*!) Рис. 2.66 режим переключений, и выход о б ъ е к т а y[t) точно воспроизводит за­ дание y'{t) By скользящем режиме. Следовательно, • астатиэм оо-го п о р я д к а д о с т и г н у т с помощью статической раз­ рывной обратной связи с конечными коэффициентами усиления и без использования производной о т задания. Рассмотренный случай демонстрирует э ф ф е к т и в н о с т ь использо­ вания разрывной знакопеременной обратной связи. Оказалось, ч т о э т о не исключение, а правило, т.е. регулярное использование неустой­ чивых с т р у к т у р является фундаментальной идеей т е о р и и обратной связи, альтернативной д р у г и м фундаментгшьным идеям т е о р и и упра­ вления (идеям точной компенсации и глубокой обратной связи) и от­ к р ы в а е т п у т ь к построению р о б а с т н ы х систем управления, в т о м чи­ сле и р о б а с т н ы х следящих систем. Э т а идея явилась ключевой для теории систем управления переменной с т р у к т у р ы , ф р а г м е н т ы кото­ рой излагаются далее на к о н к р е т н ы х примерах. П р и м е р 15. Р е ж и м ы переключений в системах переменной с т р у к т у р ы . Рассмотрим задачу стабилизации в нуле объекта второго порядка у = и при условии, что имеется информация только о координате у и знаке ее производной у. Поскольку ни при кгжом фиксированном к обратная связь U = -ку (2.53) не является стабилизирующей, то ясно, что линейными средствами эту за­ дачу не решить. Будем менять коэффициент обратной связи (2.53) в зависимости от у и sgn у, например, следующим образом: к(у,у) = { ки *2, УУ>0, УУ<0.
118 Глава 2. Некоторые принципы построения нелинейных регуляторов Тогда замкнутая система упргшления имеет разрывную обратную связь и описывгкется уравнением у= -к{у,у)у. (2.54) Пусть О < к2 < 1 < ki, тогда при к = ki фазовыми траекториями системы будут эллипсы, вытянутые вдоль оси у (рис. 2.67а), а при к = к2 — эллипсы, вытянутые вдоль оси у (рис. 2.676). "Сшивание" отрезков фазовых трг1екторий дг1ет итоговый фг13овый портрет устойчивой системы (рис. 2.67в). Поскольку 1/L = /cj/fci, то ординаты точек последовательного переключе_ е К®) ^•?г V U V 1 ^ • • . ^ Рис. 2.67 ния фазовой траектории оси у образуют геометрическую прогрессию со знаменателем ki , что и влечет асимптотическую устойчивость нуля системы (2.54). Заметим, что построенная система прочна, т.е. ее качественное поведе­ ние сохраняется при малых задержках (временных или пространственных) в переключениях. Структурнгш схема исследованной системы приведена на рис. 2.68. Вновь мы имеем дело с обратной связью, параметры которой претерпевают разрывы в функции фазового состояния системы. У 1 У 1 S S kl.kj Рис. 2.68
2.3. Стабилизация регулятором переменной структуры 119 Пример 1в. Системы переменной с т р у к т у р ы с движением по вырожденным траекториям. Рассмотрим задачу стабилизации в нуле объекта у=и при условии, что в обратной связи может быть использована информация о регулируемой координате у и знаке линейной комбинации (Г = у + су, с = const > 0. (2.55) Вновь ясно, что никакгш линейнгья обратная связь вида U= -ку не решсъет задачи стабилизации. Сделгъем коэффициент к разрывным, на­ пример, по следующему пргшилу: I/ \ / с^. ус^ > О, тогда получим систему с разрывной обратной связью, описываемую ургшнением У = -c^|y|sgn а. Для анализа этой системы используем метод фазовой плоскости. В области ytr > О (на рисунке она обозначена знаком ф) поведение системы описывается уравнением у = —с'у, его фазовые траектории — эллипсы (рис. 2.69а). При у<т < О (на рисунке эта область обозначена знаком G) движение подчинено уравнению у = с*у и его фазовые траектории — ги­ перболы (рис. 2.696). В результате "сшивания" фазовых траекторий по гра­ ницам разрыва получгьем асимптотически устойчивую систему (рис. 2.69в). В исследуемой системе стсъбилизации каждая тргъектория за конечное время сг=0 Рис. 2.69 достигает линии <г = О и далее не покидает ее. Действительно, в силу (2.55) выполнено равенство у -1- су = О и y(t) —> О при t —> О, что и требовалось.
120 Глава 2. Некоторые принципы построения нелинейных регуляторов Недостаток данной системы управления состоит в ее непрочности. Малые задержки в переключениях качественно меняют ее поведение: апериодические переходные процессы могут стать колебательными (рис. 2.70а) или даже может наступить неустойчивость (рис. 2.706). 1 \ s^^ 1 \ 1 1 \ \ 0, / ; ; ч Рис. 2.70 2.3.5. Скользящий р е ж и м на всей прямой При рассмотрении режимов переключения и движения по вырожден­ ным траекториям выявляются определенные достоинства принципа переменности структуры, в том числе: простота закона обратной связи, уменьшение объема информации, необходимой для стабилиза­ ции объекта по сравнению с линейной обратной связью. Но видны и недостатки этих режимов: колебательность переходного процесса в режиме переключений и трудность организации движения по выро­ жденным траекториям при изменении параметров объекта и действии внешних сил. Не имеют в этих случаях простого ответа и вопросы, связанные с прочностью систем управления, а также с возможностью переноса методов синтеза на многомерные системы. Поэтому актуа­ лен следующий вопрос: • возможно ли при сохранении достоинств принципа переменности структуры устранение или ослабление указанных выше недостат­ ков? Ответ на этот вопрос положителен, но для этого следует использовать скользящий режим на прямой. Пример 17. Скользящий режим на прямой. Вновь рассмотрим задачу стабилизации в нуле объекта у= и при условии, что в обратной связи возможно использование информации о координате у и знаке линейной комбинации <т = у -)- су, с = const > 0. Ясно, что линейнс1я обратная связь и = —ку ни при каком фиксированном коэффшдаенте к задачу не решает.
2.3. Стабилизация регулятором переменной структуры 121 Применим принцип переменности структуры, положим и = ф{у, у)у и уа > 0 , У<т<0, 0(у,у) = | ll[ где константы fci < О, ^2 > О, с > 0. Тогда в секторе уи > О на фгьзовой плоскости (у, у) движение системы управления описывается ургшнением (/): у = fciy, ki < О, фазовые траектории которого — эллипсы (рис. 2.71а). В секторе у/т < О действует уравнение ( / / ) : у = к2у, к2 > О, и движение происходит по гиперболическим кривым (рис. 2.716). Видно, что асимптотическсш устойчивость не наступает ни при положительных, ни при отрицательных значениях к. Если, однако, фазовые траектории "сшить" по линиям разрыва (т = О, у = О, то получим асимптотически устойчивую систему (рис. 2.71 в). Обозначения / и / / на рисунках соответ- / Скользяший режим Рис. 2.71 ствуют областям действия структур (/) и ( / / ) . На прямой (Т = О фазовые траектории уравнений (7) и ( / / ) направлены "встречно" (рис. 2.72), где f', f'^ — фазовые скорости. Формгъльно это означает, что (г& < О, когда (Т / 0. о-=0 Рис. 2.72 Следовательно, фазовгш точка не может покинуть прямую разрыва (Т = О, при дальнейшем движении выполнено равенство и = О и этому движению отвечает фазовый вектор f" = af' + (1 — а)/'\ о >0, направленный вдоль прямой разрыва а = 0.
122 Глава 2. Некоторые принципы построения нелинейных регуляторов Строгий ангииз движения системы в скользящем режиме дает те­ ория А.Ф. Филиппова (определение решения, условия его существо­ вания, единственности, продолжимости вправо и т.д.). Здесь огра­ ничимся эвристическими рассуждениями. Поскольку в скользящем режиме выполнено равенство <т = у + су = О, то I/(t) = i/(ti)e-«(*-*0, где ti — момент возникновения скользящего режима. Поскольку с > О, то y{t) -^ О при t —> оо, что и требуется. Значит, задача стаби­ лизации решена. Заметим, что даже если бы имелась информация о линейной комбинации <г = у + су, а не о ее знаке, как выше, то для получения аналогичного результата с помощью линейной обратной связи и = —к<т потребовалось бы устремление к —^ оо. Здесь же ко­ эффициенты fci и Аг2 конечны, что и обеспечивает прочность системе управления. Таким образом, • в результате сочетания не являющихся асимптотически устойчи­ выми структур (/ — эллиптической, / / — гиперболической) воз­ никло устойчивое движение, которого не было ни у одного из них, т.е. появилось новое качество. Иными словами, введение в обратную связь разрывного статиче­ ского элемента на два входа (^'-ячейки) (рис. 2.73) наделяет замкну- S i—• \l/ — e у <f\^ 1 Рис. 2.73 тую систему управления новыми качествами: • г1симптотической устойчивостью при пониженных, по сравнению с линейной обратной связью, требованиях к объему информации; • понижением порядка уравнения движения для всех траекторий, кроме асимптот (рис.2.71 в); • нечувствительностью к вариациям параметров объекта и к дей­ ствию внешней силы; • прочностью по отношению к сингулярным возмущениям. И хотя сделанные выше выводы почти очевидны, приведем всетаки необходимые обоснования.
2.3. Стабилизация регулятором переменной структуры 123 2.3.6. Анализ прочности СПС по отношению к параметрическим возмущениям Рассмотрим систему переменной структуры, показанную на рис. 2.74, и исследуем ее свойства в предположении, что параметры объекта oi, 02 и 6 известны с точностью до диапазонов о," < «• < «J*"' ^= 1.2. 0<6<Ь-, т.е. имеется информация только о числах а* и 6~, тогда как значения параметров объекта и характер их изменения во времени неизвестны. S 1Й ь * 9 * т а у b i^+ajS+a, Рис. 2.74 Подобные возмущения объекта называют регулярными, поэтому рассматриваемая задача есть задача анализа прочности СПС по от­ ношению к регулярным возмущениям. Положим для удобства у* = 0. Тогда имеем дело с уравнением переменной структуры У + а2У + а1у = bipy, в котором характер переключений определяется действием ^-ячейки: Г fci, у<т>0 1*2, усг <0, <г = у+ су. в области j/<T > О действует уравнение У + а2У + (oi - f>ki)y = О, и при выполнении неравенства о|<4(о1 -bki),
124 Глава 2. Некоторые принищпы построения нелинейных регуляторов в зависимости от знака параметра аа, движение осуществляется по скручивающимся (рис. 2.75а) или раскручивающимся (рис. 2.756) спи­ ралям (разумеется, все параметры считаются постоянными). В обла- <т=0 Рис. 2.75 сти уо- < о действует уравнение y + a2y+{ai —6^2) J/ = О, и при выпол­ нении условия aj — Ьк2 < О структуре II отвечают гиперболические фазовые траектории (рис. 2.7ба). Разумеется, положение асимптоти­ ческих траекторий (асимптот) меняется при изменении параметров объекта, и если при любых допустимых oi, 02, Ь выполнено неравен­ ство 6^2 > с(с — ог) + oi, то асимптота, отвечающая устойчивому движению, расположена так, как это показано на рис. 2.76а. .После "сшивания" фазовых траекторий структур I и II получаем фазовый портрет, изображенный на рис. 2.766, на котором заштрихованы "ко- о-=0 Рис. 2.Г6 сые" секторы с началом в точках М, М' и L, L', заметаемые фазо­ выми траекториями СПС при тех или иных допустимых сочетаниях параметров ах, oj, 6. Как и ранее, почти всегда фазовая точка за ко­ нечное время попадает на линию переключения (7 = 0, где и возникает скользящий режим.
2.3. Стабилизация регулятором переменной структуры 125 В скользящем режиме движение подчинено уравнению т.е. и в этом случае понижается порядок уравнения движения и до­ стигается независимость движения от параметров объекта, при этом допускается произвольное изменение параметров. Все сказанное выше справедливо, если имеют место условия • "попадание" на прямую разрыва (Г = О, • скользящий режим существует на всей прямой а = 0. Необходимым и достаточным условием попадания является отсут­ ствие вещественных положительных нулей у полинома ip{s) = s"^ + 02 s + (af - 6"iti). Достаточное условие существования скользящего режима имеет вид d(T lim -т-<0, 7->+о at - lim da-r>0 7->-o dt ~ (2.56) И, так как равенство & ={c- а2)(т - [c(c - аг) 4- ai]y + Ьфу, выполняется при ki < min с{с - аг) - 01 ^2 > шах <ч,ь с{с - аг) - ai <ч,ь Заметим, что в условиях стабилизируемости методами СПС от­ сутствуют ограничения на скорость изменения параметров объекта, тогда как для линейных систем такие ограничения имеются, как, на­ пример, в методе замороженных коэффициентов. 2.3.7. СПС при наличии внехпней силы Рассмотрим проблему синтеза регулятора переменной структуры для системы, представленной на рис. 2.77. ^ s'+a^s+a, Рис. 2.77
126 Глава 2. Некоторые принципы построения нелинейных регуляторов Уравнения движения системы относительно ошибки и ее производ­ ных имеют вид e + a2e + aie =-bu + F, (2.57) где F = y' + а2у' + aiy' - bf, и параметры возмущения F находятся в диапазонах аГ < а, < af, 1) 2) t = 1,2; О < 6" < 6. Возможны два варианта постановки задачи: функция F{t) известна; функция F{t) не измеряется, но известна ее мажоранта Fm(t), т.е. при всех t справедлива оценка \F{t)\ < Fm(t). Требуется стабилизировать объект (2.57) в нуле с использованием ин­ формации об ошибке е и ее производной ё. Заметим, что традици­ онные средства компенсации F, кроме глубокой обратной связи, для этой цели не годятся. При синтезе обратной связи воспользуемся приемом из Примера 17. Возьмем линию переключения на плоскости (е, ё) в виде (т = е + се и запишем выражение для ее производной в силу уравнений движения (2.57). Имеем &={с- а2)<г - [ с(с - аг) + 01 ] е - Ь« + F. (2.58) Сформируем управление в виде суммы двух компонент и = Ue + up, где первую компоненту Ue выберем, как и ранее, с разрывным коэф­ фициентом, т.е. { ki, е<т > «2. е<т < После подстановки этих выражений в (2.58) получим & = {с- 02)0- + &0 + buF + F, (2.59) где &Q = -[с{с - аз) -I- ai]e -|- ЬфеС. Бели параметры ^е-ячейки выбраны так, как в Примере 17, а именно: . c{c-a2) + ai ki < mm -i J-', ai,b 0 «2 > max ai,b с{с-02)+ r-^ ai , 0 TO будет выполнено неравенство (Т&о < 0. Если теперь вторую компо­ ненту управления up выбрать так, чтобы имело место условие <т{Ьир + F)<0, (2.60)
2.3. Стабилизация регулятором переменной структуры 127 то, как это видно из выражения ,2 а&= (с — а2)(т +ff&o+ a{buF + F), (2.61) на поверхности а = О выполняется условие (Т(т < О, и имеет место скользящий режим. Более того, неравенство (2.60) гарантирует также и попадание изображающей точки на поверхность а = 0. Действи­ тельно, если при F = О выполнены условия попадания точки на по­ верхность (Г = О, то третье слагаемое в (2.61) эти условия усиливает. Таким образом, если у полиномов 9?='=(s) =s^ + afs + af - b~h нет положительных вещественных нулей, то условия попадания обес­ печены неравенством (2.60). Неравенству (2.60) удовлетворяет множество функций up. Укажем некоторые из них, характерные для СПС. В первом варианте при из­ вестном возмущении F таковой является функция Up = фр F, <rF>0, фр (TF<0, где b~ li < —I, b~ l2 >l. Bo втором варианте при неизвестном возму­ щении F форма закона сохраняется, но вместо функции F использу­ ется ее мажоранта FmUp = ^pFm, фр = {'" I h, ff>0, ff<0, где 6- h < - 1 , b- h > 1. В структуре синтезированной системы управления д,пя случая из­ меряемого возмущения, изображенной на рис. 2.78, видны две V'-ячейки, что прямо характеризует эту систему как систему переменной \L1 Ч-р Up а S у' -^^ У % tb t| ' + • , » + • ! Рис. 2.78 "" ffi f * к. р*
128 Глава 2. Некоторые принципы построения нелинейных регуляторов структуры. В СПС скачкообразно меняется не только коэффициент обратной связи ^е, но и коэффициент прямой связи по возмущению. Заметим, что ^-ячейка является функциональным элементом на два входа, и ее можно представить в виде релейного элемента с изме­ няющейся "полкой" или, иначе, величиной коммутируемого сигнала. Это хорошо видно при так назывг1емом квазирелейном представлении ^-ячейки. 2.3.8. Квазирелейное представление ^'-ячейки Стандартное отображение ^-ячейки дано на рис. 2.79. Вход и выход V Рис. 2.79 V'-ячейки связаны между собой выражениями , ^ ' , ^ ( ki, \ *2, еа > О, ео- < 0. Без потери общности положим hi = —Аз = —к, и тогда имеем для V'-ячейки выражение V = —Arsgn {е<т) и, следовательно, СПС-й закон обратной связи имеет вид и = фе = —к\е\ sgn ст. Последнее представление и называют квазирелейным представлением V'-ячейки. Ему соответствует схема на рис. 2.80 или более подробная схема на рис. 2.81. На рис. 2.81 знак Н используется для обозначения |е| abs к^^ к^ к fcsgn<r О {SF felelsgncr -к -|е| Рис. 2.80 Рис. 2.81 мультипликатора, т.е. оператора перемножения сигналов, а abs(-) обозначение операции вычисления абсолютного значения.
2.3. Стабилизация регулятором переменной структуры 129 Пример 18. СПС при сингулярном возмущении. Исследуем влия­ ние на свойства СПС, синтезированной в Примере 17, временной задержки в переключениях, т.е. рассмотрим качественное поведение решений следу­ ющего уравнения: у + а2у + aiy = -bk\y\ sgn^ и, IT = у + су, sgn^ <т = sgn a(t - т), где все константы и параметры удовлетворяют стандартным условиям, а т — достаточно малгш постояннгш времени запаздывания. Индекс т озна­ чает, как обычно, что ^'-ячейка "срабатывает" не в момент смены знака входным сигналом, а через время т. Отсюда следует, что вместо идеаль­ ного скользящего режима, имеющего место при т = О (рис. 2.82 а), воз- о-=0 Рис. 2.82 никает режим переключении, называемый реальным скользящим режимом (рис. 2.826). Если при идеальном скольжении фазовая точка принадлежит линии а = 0: (у, у) е Go = {(у, у) |<г = о}, то для достаточно малого г при регишном скольжении фазовая точка нахо­ дится в некоторой окрестности линии (Т = О, т.е. {y,y)&Gr={g(y,y)\W\<5{r)\y\}, где 1$ = 0(т), т.е. S — величина порядка г. Из рассмотренного примера следует, что асимптотическая устой­ чивость сохраняется при таком сингулярном возмущении, в отличие от релейной системы (рис. 2.826). Формально сходимость решения к началу в режиме реального скольжения следует из дифференциаль­ ного уравнения и неравенства, описывающих этот режим: у + су = <т, ](г\<6\у\. Ясно, что при достаточно мгиюм S (т.е. малом г) имеет место экспо­ ненциальная сходимость к нулю. Иными словами, • СПС прочна по отношению к сингулярным возмущениям.
130 Глава 2. Некоторые принципы построения нелинейных регуляторов Пример 19. СПС при функциональном возмущении. Рассмо­ трим влияние на качественное поведение СПС функциональной неидеаль­ ности, например, положительного гистерезиса величиной Л > О в пере­ ключениях ^-ячейки. В таком случае имеем дело с уравнением У -I- 02У -f- oiy = -bk\y\ sgпд <т, в котором переключения происходят на поверхности <г = у + су, а все параметры и их выбор описаны в Примере 17. Свойства рг1зрывного элемента sgnд tr тгисовы, что переключение насту­ пает только на линиях \IT\ = Л после прохождения нуля о- = О, поэтому вместо стандартного фазового портрета СПС с идегльным скользя1цим ре­ жимом имеем реальный скользящий режим в полосе \<т\ < Д (рис. 2.83). Это, Рис. 2.83 конечно, ведет к диссипативности, т.е. к потере свойства асимптотической устойчивости. Формально этот фгист следует из соотношений у + су = (г, \а\ < Д. Следовательно, • СПС не является прочной по отношению к функциональным воз­ мущениям. 2.3.9. Ограничения, недостатки и проблемы теории СПС Рассмотренные выше примеры и многие другие результаты по теории и практике систем переменной структуры позволяют сделать выводы, важные для развития теории обратной связи. Приведем только неко­ торые из них. • Параметры реального скользящего режима зависят от скрытых параметров г, Д в рассмотренных выше примерах. Возникающие при этом "биения", т.е. режимы высокочастотных колебаний в
2.4. Библиографический комментарий 131 окрестности (т = О, негативно сказываются на работе механиче­ ских и электромеханических приводов, которые весьма часто ис­ пользуют на практике в качестве силовых установок. Это обсто­ ятельство делает невозможным практическое использование клас­ сических СПС. • Моделирование стандартного скользящего режима на дискретной ЭВМ возможно только методами 1-го порядка (Эйлера, Адамса и т.д.), так как методы более высоких порядков требуют существо­ вания производных от правой части дифференциального уравне­ ния. Это условие не выполняется для уравнений, описывающих СПС. При "дискретном" скольжении имеют место следующие со­ отношения: (T~0(/i), 6-~0(/i), где Л — шаг дискретизации, которые означают, 'что отклонение траекторий от линии скольжения пропорционально шагу дискре­ тизации. Для повышения точности скольжения нужно уменьшать шаг дискретизации h, что немедленно приводит к увеличению вре­ мени расчетов, так как последние имеют порядок 1/h. Именно это обстоятельно делает невозможным прямое использование СПС по скользящим режимам в системах прямого цифрового управления, • Трудности стабилизации неопределенного объекта с относитель­ ным порядком г, таким, что 1 < г < п — 1. В значительной степени эти трудности связаны с получением информации о состоянии не­ определенной системы, в частности, с получением "хороших" оце­ нок производных выходного сигнала объекта. В связи с перечисленными обстоятельствами можно сформулировать следующую проблему: построить систему управления со свойствами идеальной СПС, но с гладкой обратной связью, прочной по отно­ шению к регулярным, сингулярным, функциональным и структурным возмущениям. Эта проблема и рги;сматривг1ется во второй части мо­ нографии. 2.4. Библиографический комментарий Интерес к исследованию разрывных систем возник очень давно, на­ пример, в классической механике он появился в связи с анализом влия­ ния кулоновского трения и гистерезисных явлений, а в электротехнике и радиотехнике — в связи с появлением стг1билизаторов, различных генераторов, экономичных усилителей мощности и т.п. Было замечно, что релейные системы склонны к автоколебаниям, но наряду с этим некоторые движения в релейных системах мало чув­ ствительны к параметрам и потому оказались полезными при компен­ сации влияния факторов неопределенности на свойства системы ре­ гулирования. Потребность в целенаправленном использовании этого
132 Глава 2. Некоторые принципы построения нелинейных регуляторов свойства, а также необходимость в средствах подавления автоколеба­ ний привели к созданию теории релейных систем. На первых этапах значительный вклад в эту теорию внесли Х.Л- Хазен (H.L. Hazen) [91], И. Флюгге-Лотц (I. Flugge-Lotz) [90] и Я.З. Цыпкин [75]. С совре­ менным состоянием теории релейных систем можно ознакомиться по книгам [9, 14]. Интерес современной теории управления к релейным системам свя­ зан прежде всего с задачами оптимального быстродействия при огра­ ниченных ресурсах [60, 94]. Некоторые г1спекты релейной стабилиза­ ции в условиях неопределенности рг1Ссмотрены в работе [7]. Матема­ тические методы анализа скользящих режимов, возникающих в релей­ ных системах, можно найти в [71]. Проблемам управления неопреде­ ленными объектами посвящено много работ, см., например, [46, 55, 69, 73, 74, 76]. Основы теории систем автоматического управления переменной структуры изложены в монографии [15].
Ч а с т ь II Новые типы обратной связи Во второй части монографии излагаются теоретические основы по­ строения нового класса нелинейных систем автоматического управле­ ния. Математическую основу построения таких систем управления составляет принцип бинарности, в соответствии с которым коорди­ наты и операторы нелинейных управляемых систем рассматриваются в виде единой совокупности ее переменных состояния и между ними не проводится принципиального различия. Более того, каждый эле­ мент такой совокупности может выступать в качестве координаты или оператора, а содержательная интерпретация переменной состоя­ ния предопределена ее ролью в конкретном локальном преобразова­ нии, и эта роль может, разумеется, меняться от преобразования к преобразованию. Это означает, что операторы могут подвергаться преобразованиям, аналогичным тем, которые используются для пре­ образования координат. Это обстоятельство немедленно ведет к необ­ ходимости введения новых типов обратной связи, когда целью обрат­ ной связи служит не формирование переменной, как в классической теории регулирования, но оператора. Сочетание принципа бинарности с принципом регулирования по отклонению позволяет перейти к автоматическому формированию за­ конов управления в условиях, когда априорной информации недоста­ точно для прямого синтеза обратной связи, сообщающей замкнутой системе управления требуемой совокупности свойств. Во второй части развивается понятийный аппарат новой теории, синтезируются обобщенные структуры замкнутых систем с новыми типами обратной связи. Значительное внимание уделяется анализу конкретных примеров. Б и б л и о г р а ф и ч е с к а я с п р а в к а . Общие принципы теории но­ вых типов обратной связи сформулированы в [18, 19, 79]. Первое систематическое изложение этой теории можно найти в [17]. Раз-
134 Новые типы обратной связи личным ее аспектам посвящены работы [20, 21, 37-42, 85-88]. Ста­ билизация неопределенных систем с использованием нестандартной обратной связи рассмотрена в работах [26-28, 31-36, 44, 45, 81-84]. Математическая теория разрывных систем разработана А.Ф. Фи­ липповым в работе [72], а с различными прикладными аспектами стандартных скользящих режимов можно ознакомиться в трудах [9, 14, 68]. Скользящим режимам высших порядков посвящены работы [22, 23, 80]. Наиболее подробное на сегодня изложение этой теории содержится в статье [25]. С проблемой получения высококачественных производных сигналЬв можно ознакомиться по работам [1, б, 49]. Математические во­ просы дифференцирования рассмотрены в монографии [66], различ­ ные дискретные аппроксимации можно найти в книге [65], современН£1Я трактовка проблемы дифференцирования дана в [2]. Проблема оптимального управления в ее современном виде офор­ милась благодаря ргьботам Л .С. Понтрягина (принцип максимума) [63] и Р. Беллмана (принцип оптимальности) [4]. Оптимальное управле­ ние — наиболее прорг1ботанный и динамично развивающийся раздел теории управления. Классическая теория представлена в рг1ботах [3, 5, 8, 10, 50, 54, 70, 94]. Численные аспекты оптимального управления обсуждались в монографии [59]. Современная трактовка основных идей оптимального управления дана в книге [51]. Обобщения изло­ женного в разделе метода субоптимального управления можно найти в работах [29, 30, 43].
Глава 3 Общие положения теории новых типов обратной связи Основу новой теории составляет принцип бинарности, раскрывающий двойственную природу сигналов в нелинейных динамических систе­ мах: сигналы могут выступать либо в качестве переменных, над ко­ торыми осуществляются преобразования, либо в качестве операто­ ров, определяющих эти преобразования. Принцип бинарности позво­ ляет возложить синтез оператора стабилизирующей обратной связи на вспомогательную нелинейную систему с обратной связью. Разви­ тие этой концепции и соответствующих методик синтеза привело к необходимости рассмотрения трех новых типов обратной связи: опе­ раторной, операторно-координатной и координатно-операторной. В данной главе излагаются основные понятия, определения и прин­ ципы построения систем автоматического управления с новыми ти­ пами обратной связи. 3.1. Вводные замечания Из предыдущего раздела следует вывод о том, что традиционная тео­ рия систем автоматического управления развивалась в основном в рамках структурных схем, приведенных на рис. 3.1. Проблема сине S 9 У R lle-L К Л R D 2^ р ¥ %р АР Рис. 3.1 теза системы управления сводится в рамках этих структур к выбору по априорной информации об объекте, помехе и целях регулирования оператора регулятора R, решающего задачу стс1билизации, т.е. обес­ печивающего условие: е —»• О при t -> оо.
136 Глава 3. Теория новых типов обратной связи Если априорной информации достаточно для решения задачи син­ теза, т.е. информация точна и допускаются лишь малые отклонения АР от модели линейного оператора Р, а внешних сил / —• от их вол­ новой модели, если, кроме того, цели регулирования заданы не очень "жестко", то для синтеза стабилизирующего оператора R вполне при­ менимы описанные в предыдущем разделе классические методы син­ теза. В тех случаях, когда отклонение АР не мало, а об изменениях ха­ рактеристик объекта управления можно получить в режиме on-line не­ обходимую информацию, в таких случаях можно организовать, также в режиме on-line, поднастройку оператора обратной связи R по схеме на рис. 3.15, принятой в теории адаптивного управления. Если же изменения оператора объекта АР происходят интенсивно и к тому же неконтролируемым образом, помеха / не является волно­ вой, кроме того, сформулированы "строгие" требования к качеству регулирования, а также имеются ограничения на фазовые перемен­ ные и управление, то традиционные методы синтеза стабилизиру­ ющих регуляторов неприменимы и следует искать новые подходы к синтезу САУ в таких сложных условиях. При определении направления поиска, как обычно, полезно обра­ титься к опыту и аналогиям. Вспомним, что принцип обратной связи заменил принцип регулирования по возмущению, когда это возмуще­ ние стало неизвестным. И если при известном возмущении целью син­ теза регулятора было получение "программы" u'{t), то при отсут­ ствии информации о возмущении целью синтеза регулятора стало по­ лучение его оператора R, вырабатывающего требуемый сигйал упра­ вления u{t) с помощью обратной связи. Сами же значения сигнала u{t) стали несущественными, важно лишь то, что при правильном выборе оператора R замкнутая система управления имеет требуемое свой­ ство, а именно e{t) -> О, t ^ 00. Указанный выше переход от формирования сигнала к формированию оператора, вырабатывающего нужный сигнал, можно возвести в прин­ цип и дать ему, например, следующую формулировку: • при дефиците информации следует переходить от программного формирования функции (элемента) к синтезу алгоритма (опера­ тора), генерирующего функцию. Как функция времени u{t) — элемент некоторого множества допусти­ мых управлений, так и оператор R — только элемент множества И стабилизирующих обратных связей. Поэтому для получения требуе­ мого оператора R при дефиците информации используем сформулиро­ ванный выше принцип. Именно, будем синтезировать не сам опера­ тор обратной связи R, но алгоритм его формирования, а поскольку все это происходит в условиях неопределенности, то без механизма обратной связи здесь не обойтись. Заметим, что эта идея является явной альтернативой идее адаптивного управления (рис. 3.16), когда с
137 3.2. Система базовых понятий помощью процедуры идентификации реализуется "программная" ге­ нерация требуемого оператора R. Сформулированный выше принцип впредь будем называв принци­ пом генерации. Разумеется, принцип генерации может быть распро­ странен и на формирование алгоритма, генерирующего оператор R, и т.д. и т.п. При применении принципа генерации естественным обра­ зом возникают следующие первоочередные вопросы: • каким образом осуществлять синтез контура генерации; • что будет ошибкой или регулируемой координатой такого контура; • что следует применять в качестве регулирующего органа в этом контуре; • можно ли из этой идеи извлечь практическую выгоду, ведь контур генерации можно рассматривать как часть регулятора, и откуда следует, что такой синтез регулятора "по частям" проще синтеза регулятора "в целом". На некоторые из этих вопросов ответы даются легко, на другие однозначных ответов нет вообще. Это означает, что в реализации намеченного плана по автоматическому синтезу стабилизирующих ре­ гуляторов в условиях неустранимой неопределенности по априорной и текущей информации много эвристики и произвола. 0тчг1сти это можно устранить с помощью следующей системы базовых понятий. 3.2. Система базовых понятий Для придания развиваемой теории конструктивного характера нам потребуется ряд нестандартных для классической теории управления понятий, и ключевое из них вводится в следующем пункте. 3.2.1. С и г н а л - о п е р а т о р Для обозначения того, что изменению подвергается оператор, будем применять двойную стрелку (рис. 3.2). Соответствующую перемен­ ную обозначаем буквами греческого алфавита, например //, и пазы- Ж Рис. 3.2
Глава 3. Теории новых типов обратной связи 138 BBjeu сигналом-оператором или для краткости 0-сигналом (рис. 3.3а) в отличие от обычных переменных, обозначаемых латинскими бук­ вами и одинарными стрелками (рис. З.Зб) и называемых сигнгиамикоординатами или К-сигнг1лами. Поскольку всякий 0-сигнал, как и К- Рис. 3.3 сигнал, имеет физический носитель, то ясно, что различие между Ои К-сигналами условное и предопределяется интерпретацией участия сигнала в локальном преобразовании у = Pi(n, х) = Р2{х, /i) (рис. 3.4). В первом случае (рис. 3.4а) преобразуется сигнал х, а сигнал /i опре- Г 1 Pi Рис. 3.4 деляет оператор преобразования. Во втором случае (рис. 3.46) все с точностью до наоборот. Таким образом. О- и К-сигналы образуют общую совокупность переменных состояния нелинейной системы, и поэтому удобно ввести преобразователи подобия, действия которых можно полностью уяснить из анализа рис. 3.5. Введенная типизация б Рис. 3.5 сигналов естественным образом влечет типизацию основных струк­ турных элементов системы автоматического управления. 3.2.2. Типы динамических объектов В зависимости от типа входного и выходного сигнгиюв динамиче­ ского звена возможно выделение четырех основных типов динамиче­ ских объектов, изображенных на рис. 3.6. Нужно заметить, что в раз-
3.2. Система базовых понятий 139 личных дисциплинах объекты подобных типов используются давно, однако клги:сификация их по указанным выше признакам не проводи- К О ко ок d Рис. 3.6 лась. Приведем лишь некоторые примеры объектов разных типов: К-объект: стандартный колебательный радиоконтур, преобразую­ щий входные напряжения в выходные; О-объект: колебательный контур с вариконом, преобразующий ем­ кость контура в частоту колебаний; КО-объект: стандартный колебательный контур, вход — напряже­ ние, выход — характеристика; ОК-объект: устанавливает связь между параметрами колебатель­ ного контура и выходным напряжением. 3.2.3. Бинарная операция Из предыдущего изложения видна важная роль, отводимая элементу на два независимых входа, изображенному на рис. 3.7. Такой элемент К. р Рис. 3.7 описывается уравнением у = /?(^, х) и называется бинарным элемен­ том. Бинарный элемент может быть: линейным по х: у = ;3i(/i)x; линейным по /х: у = ц02х; линейным по Z и /i, тогда он называется билинейным.
140 Глава 3. Теории новых типов обратной связи Простейший билинейный элемент — множитель с масштабирова­ нием, описываемый уравнением у ~ к fix. Бинарный элемент называется сепарабельным, если Бинарный элемент обобщгьет понятия релейного элемента и V'-ячейки. Так, релейный элемент можно получить из бинарного при fi = const, а ^/'-ячейку — при /?i = sgn fi, /32{x) > 0. 3.2.4. Типы регулирующих органов Элемент системы управления, выходная переменная которого оказы­ вает непосредственное влияние на вход объекта, называется регул'ирующим органом. Регулирующие органы бывают статическими и ди­ намическими. В классической теории управления регулирующим органом чаще всего выступают статический усилитель (рис. 3.8а) или интегрирую­ щий усилитель (рис. 3.86), т.е. линейные звенья. При использовании Рис. 3.8 «h. Рис. 3.9 бинарного элемента регулирующие органы становятся нелинейными и появляются дополнительные возможности по управлению их свой­ ствами. Примеры статического и динамического бинарного регули­ рующего органа даны на рис. 3.9. 3.2.5. Новые типы обратной связи При расширенном наборе типов динамических звеньев представляется оправданным помимо обычной или, иначе, координатной обратной связи (КОС) ввести в обиход еще три новых типа обратной связи:
3.3. Структурный синтез бинарных систем 141 координатно-операторную, или КООС, операторно-координатную — ОКОС и операторную — ООС (рис. 3.10). Теперь мы располагаем У^ Sy iff* е е у' Ru Sy "i 9 • R, и У iV а Р=^ Ru I'y б 0=0 Sp [=c>5f=J>| RM | = | ] -^ u p в i=| Р kJ P. Ф=^ г Рис. 3.10 необходимым минимумом базовых понятий и можем приступить к из­ ложению основных фактов теории. 3.3. Структурный синтез бинарных систем 3.3.1. Задача стабилизации Рассмотрим стандартную задачу стабилизации неопределенного объ­ екта Р (рис. 3.11) в условиях, когда по априорной информации о координатном / G F и операторном а € А возмущениях требуется выбрать оператор Лц стабилизирующей обратной связи (рис. 3.12). Предположим, что по условию задачи требуется не только добиться S е у' i ' Ru fsF У Р К р т. еЛ leA Рис. 3.11 Рис. 3.12
Глава 3. Теории новых типов обратной связи 142 стабилизации, т.е. "устойчивости" ошибки регулирования, но и обес­ печить заданное качество переходного процесса. Пусть, например, в переходных процессах требуется выполнение соотношения Se{c)e = е, где Se{c) — известный оператор, с — его параметр, с Е С. При этих естественных допущениях возможно провести структур­ ный синтез бинарной системы стабилизации. Действительно, сле­ дуя изложенной выше общей концепции бинарного управления, отка­ жемся от априорного выбора оператора обратной связи Лц по схеме на рис. 3.12 и перейдем к его автоматическому выбору с помощью сигнала-оператора /х по схеме, представленной на рис. 3.13. В ре- S у' 1 е ' V 7^ Р • ' Ru / у и е Р Ре 1foe А Рис. 3.13 ^ \\asA Рис. 3.14 зультате этого перехода проблема выбора конкретного оператора Дц заменена более простыми проблемами выбора семейства стабилизиру­ ющих операторов R, маркируемых сигналом-оператором f^, и форми­ рования требуемого значения самого сигнала-оператора /х. Обсуждение проблемы выбора семейства операторов R пока от­ ложим и займемся принципами формирования надлежащего /л. По­ скольку качество системы управления в поставленной задаче выра­ жено через ошибку регулирования, то систему на рис. 3.13 можно представить в виде нового (обобщенного) объекта Ре (рис. 3.14), име­ ющего выходом ошибку регулирования е, а входом — сигнал-оператор fi, т.е. Ре является нелинейным объектом ОК-типа, на который дей­ ствует неизвестное возмущение а Е А. Для теории регулирования это стандартная постановка задачи стабилизации, решаемая с помощью рассмотренных в предыдущем разделе принципов регулирования. В частности, если ввести в рассмотрение сигнал е' =See, где Se — оператор, отражающий требования к эталонному поведению ошибки, то можно ввести в рЕ1Ссмотрение новую ошибку регулирова­ ния <т = е' — е, для стабилизации которой в нуле (а это дает решение
3.3. Структурный синтез бинарных систем 143 исходной задачи, так как из сг = О следует требуемое соотношение See = е) целесообразно использовать обратную связь по схеме, пред­ ставленной на рис. 3.15, где Д^^ — оператор координатно-операторнои <т '\б^ Se R, е /* *^ Ре ' ' 1 аеА Рис. 3.15 обратной связи, для синтеза которого могут быть применены все из­ вестные приемы синтеза стабилизирующей обратной связи при нгшичии неизмеряемого координатного возмущения а £ А. Разумеется, при этом возникают неизбежные особенности, обусло­ вленные нелинейностью объекта Ре, но по крайней мере принципиаль­ ных трудностей нет. Это означает, что • сложная проблема компенсации неизвестного операторного возму­ щения сведена к традиционной и хорошо изученной проблеме ком­ пенсации координатного возмущения. Схеме на рис. 3.15 можно сопоставить более детальную схему си­ стемы управления с двумя типами обратной связи: с координатной и координатно-операторнои. На рис. 3.16 представлена схема с двумя локальными регуляторами: К-регулятором Н^ и КО-регулятором Rf,. a '' St Se -——\9 D K»l • e j' ^ V Sy V 1Й ' Ru К у p Ре ^ \ Рис. 3.16 |a€ A и
Глава 3. Теории иовых типов обратной связи 144 Изложенный прием синтеза структуры регулятора можно трак­ товать как способ получения нелинейного регулятора R в схеме на рис. 3.17, и, вообще говоря, априорно не очевидно, почему этот не­ линейный регулятор должен иметь именно такую структуру. В пре- а Se R, Я S '' б><г е ^ R Ru / у и р г Ja € Л Рис. 3.17 дыдущей схеме оператор 5е(с), определяющий эталонное свойство си­ стемы управления, зависит от параметра с, который часто задан неод­ нозначно, а только с точностью до принадлежности некоторому мно­ жеству С, т.е. с ^С- Естественно полагать, что, меняя параметр с в пределах множества С, можно улучшить некоторые характеристики системы. Например, хорошо известно, что снижение коэффициентов усиле­ ния в обратной связи благоприятно сказывается на помехозащищен­ ности системы, уменьшает влияние ограничений и т.п. С другой сто­ роны, если в схеме на рис. 3.16 оператор Яц реализует статическую бинарную операцию, т.е. Им — кцх, с = const, то 0-сигнал ц выполняет роль коэффициента передачи и потому дол­ жен быть ограничен, т.е. |/i| < 1. Проанализируем теперь режим работы структуры на рис. 3.15, ко­ гда выполняется требуемое равенство <т — 0. Последнее эквивалентно двум равенствам 5е(с)е = е, e = Pe(a)fi. При заданном параметре с из первого соотношения находим зависи­ мость е(с), а затем, из второго уравнения, — требуемое значение Осигнала ^ = р-\а)е{с), (3.1) которое, естественно, зависит от неизвестного параметра а, и именно поэтому его нельзя было вычислить по априорным данным.
3.3. Структурный синтез бинарных систем 145 Второй вывод из (3.1) состоит в том, что когда параметр а ме­ няется в широких пределах, то пределы изменения сигнала /i также должны быть достаточно большими, что может оказаться несовме­ стимым с ограничением Ы < 1(3.2) Имеется одна принципиальная возможность выполнения равенства (3.1) при соблюдении ограничения (3.2). Она, очевидно, связана с из­ менением параметра с € С в зависимости от 0-сигнала fi. Реализация этого плана означает переход от схемы на рис. 3.15 к схеме системы, представленной на рис. 3.18, где теперь предполагается наладить из­ менение параметра с с помощью 0-сигнала р, т.е. с = с{р). Поскольку Г Se е" •^ а RM 1 ¥ €/1 Рис. 3.18 в этом случае р. — выходной, а /> — входной сигнги, то мы имеем дело с управлением 0-объектом (рис. 3.19), который заменяет схему на рис. 3.18. Вновь мы приходим к стандартной задаче управления неопреде­ ленным объектом, для решения которой естественно использовать обратную связь, в данном случае, разумеется, операторного типа. По­ скольку целью регулирования по постановке задачи является выполне­ ние ограничения \\х\ < 1, то проблему можно трактовать (без потери общности) как проблему стабилизации 0-сигнала ^ в нуле. Поэтому нет необходимости в задатчике, и после применения обратной связи по регулируемой координате получаем структуру системы, изобра­ женную на рис. 3.20, где Rp — оператор 0-регулятора. ^^ "1Г Рис. 3.19 Ьф Кц РРис. 3.20 (J
Глава 3. Теории новых типов обратном связи 146 Раскрывая строение объекта Ре с помощью рис. 3.18, находим сна­ чала систему с двумя типами обратной связи (рис. 3.21), а после дета­ лизации (рис. 3.22) обнаруживаем, что в системе управления на самом деле использованы три типа обратной связи. S. —9— I аеА Рис. 3.21 г— Se 1 ? -^ .1Г '^ Ю *м 1 ' 1 р '^р /* ы— е • Sy К 1 '—1 ' <> у i| (/ 1 1 и р _J ^аеА V. J Рис. 3.22 Из приведенных схем легко увидеть, что 0-связь действует согла­ сованно с ОК-связью и направлена на стабилизацию (т в нуле. В предыдущей схеме выбор оператора 0-обратной связи Rp доста­ точно произволен, и поэтому в этой схеме имеется еще достаточно свободы, чтобы наделить тр?.екторию дрейфа параметров оператора Se(c) c(t) е с теми или пными нужными свойствами. Это может оказаться весьма кстати, так как оператор Se (с) ответственен за ка­ чество системы управления. Пусть, например, требуется приблизить функцию c{t) к функции c'(t) € С, используя для этого дополнитель-
3.3. Структурный синтез бинарных систем 147 ное воздействие v на объект управления Р, суммируемого с основ­ ным сигналом u{t). Для синтеза регулятора, решающего эту задачу, объект на рис. 3.22 от входа v к входу c{t) можно представить КОобъектом Ре (рис. 3.23). Вновь, следуя классической традиции, для ре­ шения задачи слежения за сигналом с* (t) прибегаем к услугам обрат­ ной связи, в данном случае — операторно-координатного типа, и в ре­ зультате получаем структуру, представленную на рис. 3.24, где Rv Sc Z V Рс с Рс Пае/ 1 Рис. 3.23 Рис. 3.24 Se — задатчик 0-сигнала с', v — 0-ошибка регулирования, FUJ — ОК-регулятор. После раскрытия внутреннего устройства Рс-объекта получаем систему управления со всеми возможными четырьмя типами обратной связи (рис.3.25). Еще раз подчеркнем, что оконтуренная часть на рис. 3.25 является, по сути дела, нелинейным регулятором, априорный синтез которого традиционными средствами невозможен, а вновь предложенная теория, базирующаяся на принципе бинарности, дает требуемый результат. So "' -^JDV " - - IVv —• а S. - ^•—• р 1^" : i 1 ' R,, 1 1 91 1 R« »жр /^— v^ V S "1 ^ -^-^J у — Ru V р —^ — J. еА Рис. 3.25 -^
148 Глава 3. Теории новых типов обратной связи 3.3.2. Нелинейная обратная связь как средство подавления неопределенности Главная идея продемонстрированного выше подхода к структурному синтезу динамических систем состоит в сведении сложной новой за­ дачи к последовательности традиционных и решаемых, по крайней мере принципиально, известными средствами задач. Для простоты был использован только принцип регулирования по отклонению, который в сочетании с принципом бинарности позво­ лил получить достаточно большое разнообразие структур нелиней­ ных систем. Разумеется, это разнообразие еще более увеличится, если привлечь к структурному синтезу и другие известные принципы ре­ гулирования, которые без особых оговорок, в силу своей общности, применимы и в рассматриваемой задаче стабилизации. Мы опускаем связанные с этим детали, отмечая только принципиальную сторону предлагаемого подхода. Сама идея нового подхода может быть также сформулирована как принцип генерации структур: процедуру Синтеза сложного регуля­ тора следует представить в виде последовательности задач синтеза, решаемых традиционными средствами. Разумеется, не каждая проблема допускает такую декомпозицию, но число таких проблем достаточно велико. Рассмотрим, например, задачу о понижении размерности замкнутой системы. Из структур­ ной схемы на рис. 3.25 видно, что при обнулении ошибки ОК-контура, т.е. при выполнении равенства (3.3) (Г = 0, появляется дополнительная связь между переменными состояния S,e = е, (3.4) нгшичие которой означает их зависимость, а значит, порядок системы понижается на pcL3MepHOCTb связи. Поэтому естествен вопрос: нельзя ли наладить регулярное вырождение порядка путем установления свя­ зей вида (3.3). Но как этого добиться? Ведь если в схеме на рис. 3.26 для вырождения использован естественный управляющий вход, то в •^ Рис. 3.26 R;.
3.3. Структурный синтез бинарных систем 149 схеме системы на рис. 3.27, отвечающей равенству (3.4), такого упра­ вляющего входа нет. Следовательно, стандартными средствами эту е е Se Рис. 3.27 задачу не решить, но если вспомнить, что оператор ^е зависит от параметра с, т.е. Se(c), то именно этот параметр или, что то же са­ мое, О-сигнгил £, поскольку с = с(^), можно считать управлением и рассматривать как ОК-объект с оператором Р^ (рис.3.28). Теперь, Ре Рис. 3.28 строго следуя изложенному выше подходу, синтезируем структуру, представленную на рис. 3.29. Далее выбираем оператор S'^ и регуля­ тор Rf так, чтобы с некоторого момента времени выполнялось ра­ венство а' = е\ — е = 0. Это равенство вместе с равенством (3.4) устанавливает связи S'^e = е, See = е, и, следовательно, происходит дальнейшее понижение порядка системы. s; ^ К« е Рё oil Рис. 3.29 Действуя последовательно указанным способом, можно п-мерный объект за конечное число итераций свести к объекту первого порядка и в результате получить структуры, представленные на рис. 3.30. Этому факту можно дать следующую содержательную интерпрета-
Глава 3. Теории новых типов обратной связи 150 цию: добавлением к сложному и неопределенному объекту сложного нелинейного регулятора можно предельно упростить и сделать про- sV Ф Ji! s; Г - ^ SI , 1 , 1 I Ru P Та еЛ Рис. 3.30 гнозируемым поведение замкнутой системы. Иными словами, предла­ гаемый регулятор является "поглотителем" сложности и неопреде­ ленности объекта. 3.3.3. З а д а ч а ф и л ь т р а ц и и Одна из основных задач теории управления — задача фильтрации. Типичная постановка этой задачи такова. Задан оператор Р же­ лаемого преобразования полезного сигнала х в выходной сигнал if (рис. 3.31). Фактически к полезному сигналу всегда добавляется по­ меха ^ (рис. 3.32), что приводит к отклонению выхода от требуемого значения. Поэтому оператор Р уже не является наилучшим и ставится Рис. 3.31 Рис. 3.32 задача об определении наилучшего оператора в схеме на рис. 3.32, ми-
3.3. Структурный синтез бинарных систем 151 нимизирующего "расстояние" между jf и у, т.е. -Popt = argminr(j/* - у), где г ( - , ) — надлежащим образом определенное расстояние, напри­ мер, среднеквадратическое уклонение, когда речь идет о случайных сигналах. Стандартно сигналы х и ^ считаются случайными процессами с известными статистическими свойствами. Чгице всего известны фор­ мирующие фильтры этих сигналов с операторами Рх и Р( соответ- Рис. 3.33 ственно (рис. 3.33), где S — белый шум. При таком представлении сигналов X, ^ структурная схема фильтра принимает вид, предста­ вленный на рис. 3.34. Если формирующие фильтры Р(, Р^ известны и стационарны, то фильтр Р также стационарен и называется филь- -9 Рис. 3.34 тром Винера. Если же Р^, Рх известны, но нестационарны, — филь­ тром Калмана-Бьюси. Методы синтеза этих фильтров известны. Проблема возникает тогда, когда оператор помехи Р( неизвестен, что можно смоделировать действием возмущения а £ А (рис. 3.35). J. еА Рис. 3.35
Глава 3. Теории новых типов обратной связи 152 Поскольку в данном случае имеет место операторное возмущение, то для его компенсации следует использовать также операторное воздей­ ствие /л (рис. З.Зб). В результате проблема выбора оператора опти­ мального фильтра может быть возложена на КО-обратную связь по стандартной для теории бинарного управления схеме (рис. 3.37). Рх i'i т^ I еЛ оеЛ Рис. 3.36 Sy '" ба9 ^ • Нд у iV /*—' ^ j — ' ¥а еА Рис. 3.37 Структура задатчика 5у показана на рис. 3.38. Разумеется, расчет КО-оператора Л^, обратной связи должен производиться статистиче­ скими методами. Рис. 3.38 Теперь перейдем к рассмотрению простых примеров, которые про­ иллюстрируют особенности синтеза регуляторов новых типов. Этому рассмотрению предпошлем таблицу "Проблема — тип нелинейной опе­ рации" , в которой можно наглядно усмотреть план по проверке полез-
3.3. Структурный синтез бинарных систем 153 ности изложенной выше конструкции на стандартных задачах теории управления. Тип нелинейной операции Проблема Унарная Бинарная Стабилизация Фильтрация и дифференцирование Оптимальность Инвариантность Заштрихованный столбец таблицы отражает достижения класси­ ческой теории регулирования, в которой бинарная операция не ис­ пользовалась активно. Достоинства и недостатки получаемых при этом результатов упоминались выше. Во втором столбце таблицы клетки не заштрихованы, и еще предстоит разобраться, что нового дает принцип бинарности для решения этих задач.
Глава 4 Теория координатно-операторной обратной связи в данной главе на сравнительно простом примере подробно разби­ раются принципы синтеза систем стабилизации с координатно-опера­ торной обратной связью, а также основные свойства и особенности таких систем управления. Для удобства излагаемую далее теорию называем КО-теорией. КО-теория содержит регулярные методы ана­ лиза и синтеза систем управления с КО-регуляторами в структурной схеме, представленной на рис. 4.1, или, что то же самое, методы упра­ вления КО-объектом, изображенным на рис. 4.2. е« с >3е _ а -ч «•М Г" У Sy • Ru - ^ и К У R Ру *е • Рис. 4.1 Se iff- К, *\ М е Ре /• Ч| Рис.4 .2 Особенность и отличие этой теории от классической теории ста­ билизации видны непосредственно из рис. 4.1 и 4.2, прежде всего это принципиальная нелинейность объекта управления Ре-
4.1. Стабилизация объекта второго порядка 155 Следовательно, стандартные методы синтеза обратной связи не­ применимы и нужно искать новые подходы. Продемонстрируем по­ лезность и конструктивность использования для этой цели изложен­ ных в предыдущей главе принципов генерации и бинарности новых типов обратных связей. 4.1. Стабилизация объекта второго порядка с неизвестными параметрами и внешним воздействием Рассмотрим простейший объект второго порядка Е'': XI = 12, Х2 = axi+bu y = CXi + f, (4.1) +Х2, с неизвестными параметрами а, 6 и возмущением / , удовлетворяю­ щими включениям аеА = {а\\а\<ао}, Ь е В = {Ь \0 <Ь- <Ь <Ь+}, /eF*='{/|l/l</m}, где числа оо, 6^ и функция / „ известны. Этот объект, называ­ емый далее Е^-системой, позволяет дать содержательный набросок КО-теории, отражающий, практически без изъятий, ее основные по­ ложения и результаты. В задаче стабилизации Е*"-системы требуется указать робастную гладкую обратную связь по состоянию, стабилизирующую Е^-систему при произвольном изменении параметров а £ А, Ь £ В и любом воз­ мущении f Е F. Из предшествующего изложения совершенно ясно, что стандарт­ ные подходы к этой задаче не гарантируют ее решения, ибо: • глубокая обратн£1Я связь неробастна; • адаптивное управление неприменимо, так как не выполнены основ­ ные условия: квазистационарность параметров и действие исчеза­ ющего возмущения; • методы СПС ориентированы на использование разрывного упра­ вления, когда робастность не достигается. При синтезе КО-регулятора будем следовать рекомендациям об­ щей теории систем с новыми типами обратной связи, но прежде ука­ жем два полезных и сильно упрощающих дело нгьблюдения.
156 Глава 4. Теория коордиматно-операторной обратной связи 4.1.1. Принцип скаляриэации и уравнение объекта в пространстве ошибок Этот принцип позволяет при естественных условиях и при выполне­ нии МС-условия (т.е. условия согласованности возмущения) свести задачу стабилизации многомерного объекта к задаче стабилизации скалярного объекта. Действительно, нетрудно убедиться, что выход Е^-системы экспо­ ненциально стремится к нулю (что и означает решение задачи ста­ билизации), если при некотором числе d > О обеспечено выполнение связи xi-|-rfxi=0. (4.2) Величину (Т = ii + dXi =: Х2 + dxi назовем ошибкой реализации желаемой связи (4.2). Теперь очевидно, что стабилизация ошибки <т в нуле и будет озна­ чать решение исходной задачи. Но отсюда еще не следует, что задача стала скалярной. Для того чтобы убедиться в этом, перейдем от ис­ ходного пространства координат (xi,X2) к пространству ошибок — координатам (xi, <т). Для этого находим сначала, что О' = XI -f dx\ = Х2 -f dx2 = axi + bu -|- / -f dx2. Из уравнения a = X2 + dxi выражаем переменную X2: X2 = <T — dxi. В уравнениях S''-системы заменяем X2 найденным выражением. результате получаем искомые уравнения движения в виде XI = -dxi + (т, &i=da+{a + d^)xi + bu + f. В (4.3) (4.4) Уравнение (4.3) будем называть далее Ef-системой, а (4.4) — Е^системой. Из уравнений (4.3), (4.4) видно, что при <г —> О автома­ тически следует, что и xi —* 0. Следовательно, для решения задачи стабилизации можно ограничиться скалярным Ез-уравнением. Если ввести обозначение f = f + (a + d^)xr, то указанными преобразованиями исходная проблема сводится к ста­ билизации скалярного Е2-объекта вида & = dcr + bu + f, (4.5) находящегося под воздействием неизвестного возмущения f Е F, для которого известна только мажоранта ^ = { / | \f\<{d^+ao)\xi\ + fm=fm}.
4.1. Стабилизация объекта второго порядка 157 Поскольку уравнение (4.6) а — Х2 + dxi = О определяет прямую на плоскости (11,12)1 т о геометрически принцип скаляризации означает создание выбором управления условий, при ко­ т о р ы х прямая (4.6) является а т т р а к т о р о м , т.е. п р и т я г и в а ю щ и м ин­ в а р и а н т н ы м множеством (рис. 4.3а). В пространстве ошибок э т о т а т т р а к т о р превращается в одну из осей координат (рис. 4.36). VV JJ tr W Рис. 4.3 Сделаем ряд замечаний, касающихся сведения общей з а д а ч и ста­ билизации к скалярной задаче и связанных с ней проблем управления скаляризованным о б ъ е к т о м E j вида (4.5). 4.1.2. Н е к о т о р ы е замечания к постановке задачи и ее обобщения При скаляризации задачи стабилизации необходимо и м е т ь ввиду сле­ дующее. Замечание 1. Рассмотрение объекта только с двумя неизвестными параметрами а £ А, b G В XI = Г2, Х2 = axi +bu + f нисколько не огргшичивает общности результата, так как уравнениям про­ извольного объекта с тремя неизвестными параметрами Xl = Х2, Х2 = aiXi + 0 2 x 2 •^Ьи + f, где oi £ Ai, 02 € А2, Ь £ В, следующей нестационарной заменой перемен­ ных: XI = C{t)zi, Z2 = il,
158 Глава 4. Теория координатно-операторной обратной связи можно придать требуемый в рассматриваемой постановке задачи вид i j = Zz\ +bu+ f. Здесь ~ c + ojc + aic ~ Ь 7 / « -с ^=c' •^=7' если только c(t) — решение дифференциального уравнения 2с+020 = 0. З а м е ч а н и е 2. Принцип скаляризации применим к Тфоизвольным объ­ екта общего положения с одним входом и одним выходом, т.е. к объектам вида Xi = Xi+i, n 1 = 1 , . . . , n — 1, Xn= Yl <»' ^i + W + / . y= ex. Ы1 Действительно, в дгшном случае достаточно выбрать новую ошибку в виде п-1 <г = х„+ /_]<i,- Xi, di = const > О, и в (n — 1)-м уравнении D-системы заменить х„ на выражение п-1 х„ = — У di Xi + <r, isl a вместо последнего ургшнения в Е-системе записать уравнение п <т = (dn-i -а„)<т+ ^J"*'^' + " + /• ISl в результате получим две подсистемы: Ei-систему (п — 1)-го порядка Xi = xi+1, «' = 1, . . . ,п — 2, п х„_1 = — ^ diXi + <т, isl и скалярную Ез-систему сг = dir + U + f, у = с'х + Спв, где х' = col («1, . . . , i n - i ) , с = (с', с„). При этом, если параметры di таковы, что El-система при <г = О Xi = Xi+i, • = 1, • •. , п — 2, п Х п - 1 = — Х^ diXi isl экспоненциально устойчива, то вновь из условия <т -f О следует, что Xi -+ О, что является формгкльным выражением принципа скаляризации.
4.1. Стабилизация объекта второго порядка 159 З а м е ч а н и е 3. Указанному выше преобразованию координат, лежа­ щему в основе принципа скаляриэации, соответствует структурнгья схема объекта, иллюстрируемая рис. 4.4. Особенность указанной на рисунке де­ композиции в том, что El-система полностью определена и асимптотически Zj 1ГабЛ J Рис. 4.4 устойчива, Ез-система скалярна, подвержена влиянию факторов неопреде­ ленности {а, / } и эффективно упргшляема. Отметим, что в общем случае для систем со многими входами и многими выходами, описываемых уравнениями х = Ах + Ви, U е Д"*, У = Сх, у € Д^ принцип скгшяризации также имеет место, при этом, однако, Ег-система имеет размерность т , совпадающую с размерностью вектора управления * = Dff + СВи + 7, и если detCB ф О, то заменой и = ( C B ) ~ ' f вместо одной т-мерной задачи получаем m одномерных задач стабилизации. Замечание 4. Полагая, что в E''-системе возмущение отсутствует, т.е. / = О, а все параметры постоянны: ii=X2, X2=axi-|-6u, 5/ = c x i + X 2 , найдем передаточные функции от входа и к выходам у и (г = xj Ч- dx\ соответственно. Нетрудно получить выражения (4.7) Ь ^ a^-l-a из сравнения которых можно усмотреть следующее: при с > О вместо пе­ ременной а можно использовать выход объекта у, и тогда, по сути дела, принцип скаляриэации приводит к задаче стабилизации выхода ^''(') = Ь «2 Й +7 а- ' И'.(5) = у = су -I- Ьи -f- / , т.е. объект 2-го порядка можно заменить объектом 1-го порядка. Как видно из (4.7), такой объект имеет относительный порядок г = 1 и является минимально фгкзовым.
160 Глава 4. Теория координатно-операторной обратной связи З а м е ч а н и е 5. Выбор обратной связи, стабилизирующей Е^-объект: а = da + Ъи + f, особенно прост, когда имеется полная информация о параметрах и возму­ щениях. В самом деле, при этих предположениях управление и = t; — f/b сводит задачу стабилизации к тривиальной & = dff + V, когда выбор управления t; очевиден. Если же параметры или возмущение не­ известны, то проблема становится сложнее, так как методы стабилизации классической теории регулировгшия: глубокая обратнг^я связь (и = —fcu, к —> оо), адгштивная обратная связь (и = —ка, к = la^, f = const > 0), си­ стема переменной структуры (и = —fm sgntr), при известных достоинствах имеют недостатки и ограничения по применению. З а м е ч а н и е 6. Покажем, что линейная обратная связь u = —k2<T — kix\ (4.8) с ограниченными коэффициентами годится для стабилизгщии свободных движений неопределенного объекта с постоянными априорно ограничен­ ными параметрами (названного ранее интервальным объектом) (Г = d<T + Ьи + (а - d^)xi, (4.9) но, вообще говоря, не решает задачи при изменении параметров а, Ь или при наличии внешнего возмущения cr = d(r + bu + {a-d^)xi+f, f & F. (4.10) Действительно, после подстановки (4.8) в (4.9) и при f = О получим & = {d-bk2)(T + {a-d^-bki)xi, (4.11) и для анализа асимптотики (т{1) это уравнение следует дополнить уравне­ нием для ошибки I I , т.е. xi = -dxi+iT. (4.12) Характеристический полином замкнутой системы (4.11) и (4.12) дается выражением det s+d -1 bki -a + d'^ s + bki -d = s^ +bk-iS-\-bki -a + dbk2 = 0 , и ясно, что при выполнении следуюхцих условии к2>0, b~ki+db~k2> а~ (4.13) замкнутая система асимптотически устойчива. При изменении параметров условия (4.13) уже не гарантируют устойчи­ вость системы, а действие возмущения даже 1фи устойчивости свободных движений не гарантирует стабилизируемости.
4.1. Стабилизация объекта второго порядка 161 Но даже при постоянных параметрах и / = О качество переходных про­ цессов может сильно варьироваться с изменением параметров и не соответ­ ствовать предъявляемым к системе требованиям. Таким образом, может быть сформулирована следующая проблема: • как добиться независимости свойств замкнутой системы от факто­ ров неопределенности при ограниченных коэффициентах передачи в каналах обратной связи? 4.1.3. Фазовое пространство координата—оператор Принцип скаляризации тесно связан с новыми типами обратной связи и принципом бинарности. Именно, если переменную <г взять в каче­ стве ошибки КО-контура регулирования и использовать КО-обратную связь, то естественным образом возникает стандартная для теории бинарного управления структура, изображенная на рис. 4.5. При этом s+d+l е« 'V Ь 9 '^ D " К;, е ^ S • б^ е У Ре •t Л7 Ru u b (s+c) Рис. 4.5 центральными Становятся следующие проблемы выбора: оператора R^, оператора Д^, типа бинарной операции. Перейдем к решению этих проблем, однако напомним, что при этом важная роль отводится нижеследующим преобразованиям. Довольно очевидно, что движение в системе xi = —dxi -f- (Г, & = d<r + a*xi + bu + f, а* = а — (Р близко к требуемому, задаваемому уравнением xi = —dxx, и слабо зависит от факторов неопределенности { а , / } , если при достаточно мгшом числе S > Q выполнено следующее неравенство: \<T\<SW\. (4.14)
162 Глава 4. Теория коордииатио-операторной обратной связи Это утверждение довольно ясно также из геометрических пред­ ставлений, так как выполнение условия (4.14) означает, что фазо­ вая траектория не покидает секториального множества d (рис. 4.6), окружающего прямую (т = 0. Поэтому целью управления может быть <T=S\x^\ q=.S\x^\ < T = - J | Xjl Рис. 4.6 приведение и удержание фазовой точки в Gg- Для анализа движения и синтеза управления в множестве Gs = {х \ \сг\ < S\xi\} удобно ис­ пользовать нелинейную замену координат ^ = (T/XI. Геометрический смысл указанной замены поясняет рис. 4.7, откуда следует, что ^ опре­ деляет наклон прямой (т = ^xi. Поэтому ^ можно считать параметром <т=4х Рис. 4.7 или, более общо, операторной переменной, если воспользоваться сле­ дующими соотношениями. Переменные <7 и xi связаны дифференци­ альным оператором ir(d/dt): (т ^ xi -\- dx\ = dt •¥d xi ='Ш х\. Аналогичную связь можно установить между переменными а^ и xi:
4.1. 163 Стабилизация объекта второго порядка где '^^ ( л ) = Л+ d-C Поскольку ^ определяет оператор К(, то ее уместно ншвать опера­ торной переменной. Следовательно, пространство (xi,^) можно на­ звать фазовым пространством координата-оператор, или, коротко, КО-пространством. Какую же пользу можно извлечь из указанной замены переменных? Для ответа на этот вопрос достаточно найти уравнение изменения новой переменной ^ = (T/XI. Положим пока, что / = О, тогда имеем последовательно: • _ (т Xl (Г XI _ dcr + Ьи + a*xi Xi Xi а а — dx\ _ Xi Xi Xl Xl Если теперь ввести обозначение ц = и/хх и назвать /i новым управле­ нием, то проблема стабилизации свободного движения параметриче­ ски неопределенного объекта <т = cf(T -f a'xi + bu сводится к проблеме стабилизации определенного объекта, находяще­ гося под воздействием координатного возмущения а*, так как теперь мы имеет дело с уравнением Е{ вида ^di-ai-d) + b^L + a\ Иными словами, путем нелинейной замены ^ = (T/XI сложная про­ блема стабилизации неопределенного Е^-объекта (рис. 4.8а,б) транс­ формирована в хорошо изученную проблему компенсации координат­ ного возмущения для Е{-объекта (рис. 4.8в). Обсуждению и сравне- Г? 2? ^ ] | абЛ ] | 06/1 Рис. 4.8 нию вариантов выбора управления fi на основе стандартных приемов компенсации посвящена последующая часть параграфа, а здесь от­ метим, что, хотя принципиально проблема синтеза стабилизирующей
164 Глава 4. Теория координатио-операторной обратной связи обратной связи решена, сложности все-таки неизбежны, так как при­ менение известных принципов должно проходить в новых условиях, поскольку объект принципиально нелинеен: XI = ~dxi+^xi, be В, а* еА*. Ввиду того что эти уравнения действуют на множестве Gs, & 6 мало, второе уравнение можно линеаризовать и, без больших потерь в общ­ ности, ограничиться рассмотрением уравнения первого приближения Завершг1Я этот раздел, заметим, что в ходе преобразования коор­ динат было введено следующее обозначение: U / * = —. которое, по сути дела, задает статическую бинарную операцию u = l3{ii,xi) =ЦХ1, определяющую оператор Д„ координатной обратной связи в струк­ турной схеме на рис. 4.5. Разумеется, это не единственная, но, быть может, простейшая воз­ можность. Можно было бы использовать и динамическую бинарную операцию, например операцию интегрального XI J fidt или инерционного типа U — =zT/i+ •//xrft, I ftdt, г ==( const. т Xl в любом случае общие выводы, конечно, сохраняют силу, однако вместо скгиярного объекта пришлось бы иметь дело с объектом более высокого порядка, например, при интегральной бинарной операции стабилизируемая система описывается системой уравнений i = 2d^ + bni + a', fii=zfi. 4.2. КО-алгоритмы стабилизации Воспользуемся стандартными методами классической теории регули­ рования для синтеза управления, стабилизирующего скалярный объ­ ект: i = 2d^ + b^i + a-d\ (4.15) а ел, be В, d>Q.
4.2. КО-алгоритмы стабилизации 165 4.2.1. Прямая компенсация В уравнении (4.15) параметр d^ можно интерпретировать как извест­ ное возмущение, и при известном параметре 6 с помощью прямой ком­ пенсации ^L = ^l + — (4.16) влияние этого "возмущения" устраняется, ибо i=2d^ + bfii + а. Если же параметр 6 неизвестен, то прямая компенсация в "лоб" не проходит, но ее можно успешно сочетать с идентификацией параме­ тров. Об этом скажем чуть позже, а сейчас заметим, что управлению (4.16) в исходных переменных отвечает обратная связь вида d^ и = ЦХ1 = 1Л1Х1 + -7-Xi, имеющая бинарную и линейную составляющие. Заметим, что если параметр а тоже известен, то необходимости в бинарной компоненте не возникает. 4.2.2. Асимптотическое оценивание или косвенное измерение О-воэмущения Рассмотрим вариант задачи стабилизации объекта ^ i = 2d^ + a + bfii, (4.17) когда параметры а, Ь фиксированы, 6 известен, а — любой элемент из А. Для получения оценки а неизвестного параметра а используем наблюдатель i = {2d-kl)<p-\-a + k,^ + b^^, а = —kiif — ^), ^1,^2 = const. После вычитания (4.17) из (4.18) и введения обозначений е = (р —^, а z=a — а с учетом того, что параметр о фиксирован, т.е. а = 0, получим уравнения наблюдателя относительно ошибок (е, а) e= i2d-k.)e^a, а = -«26. ' 'Здесь и далее для простоты вместо а' = а — tfi пишем а, полагая, что компо­ нента d? уже скомпенсирована.
166 Глава 4. Теория координатио-операторной обратной связи Характеристический полином наблюдателя (4.19) имеет вид det s-i2d-ki) *2 -1 S = £^ + s{ki - 2d) + Jfc2 = о и является гурвицевым при выполнении неравенств Агг > О,fci> 2d. Поэтому оценка а асимптотически (экспоненциально) сходится к чи­ слу а. Если теперь управление ц сформировать в виде ti=Mi-j, (4.20) то произойдет асимптотическая компенсация возмущения а, так как ^ = 2d^ + bni + a- о, и, следовательно, а — а —> 0. Таким образом, при выборе управления ^i достаточно иметь дело со свободным движением объекта: i = 2d^ + bfix. В исходных переменных алгоритму управления (4.20) соответствует алгоритм вида а « = /iXi = filXi - -Xi, где вторую компоненту естественно называть адаптивной. словами, • Иными описанный способ асимптотического оценивания постоянного воз­ мущения а реализует стандартную процедуру адаптивного упра­ вления. Если, однако, а = а(<), то теория адаптивного управления не дает рекомендаций по синтезу стабилизирующего управления, тогда как развиваемая теория легко переносится на этот случай. 4.2.3. Компенсация волнового О-возмущения Пусть известен дифференциальный оператор К (d/dt), аннулирующий 0-возмущение, т.е. .(i),.o. Например, известны числа г, р такие, что а+ра + г = 0, (4.21) но неизвестно начальное условие а(0), что делает возмущение а неиз­ вестным.
4.2. КО-алгоритмы стабилизации 167 Согласно рекомендации кл£1Ссической теории регулирования при стг1билизации объекта i = 2d^ + bn + a (4.22) следует по уравнениям (4.21), (4.22) составить уравнения наблюда­ теля, вырабатывающего асимптотическую оценку а возмущения а. Такой наблюдатель строится стандартным образом и имеет вид а = —ра - г — к2(<р - <). После почленного вычитания (4.21) и (4.22) из (4.23) и перехода к ошибкам оценивания е = (fi — ^, а =а—а уравнения наблюдателя принимают вид е = ( 2 ^ - Ы е + а, а = —ра — «ге. Характеристический полином системы (4.24) дается выражением det S + (fei - 2d) -1 Аз S+ р = s^ + (p + ki- 2d)s + к2+ p{ki - 2d) = О, и ясно, что наблюдатель экспоненциально устойчив, когда ki>2d-p, k2>p{ki-2d). Последнее условие легко выполнить, и, следовательно, наблюдатель (4.24) дает асимптотическую оценку ~ ехр а—^а. В силу полученной асимптотической оценки управление а peuieieT задачу компенсации переменного возмущения a(t) и сводит исходную задачу стг^билизации к тривиальной задаче стабилизации объекта ^ = 2de + 6^i. Отметим, что аналогичный результат невозможно получить, дей­ ствуя в рамках стандартной концепции адаптивного управления.
Глава 4. Теория коордииатио-операторной 168 обратной связи 4.2.4. Релейная К О-стабилизация При отсутствии волновой модели 0-возмущения, но при известной ма­ жоранте а°, т.е. такой функции или постоянной, что \a{t)\<a°, для стабилизации объекта возможно применение разрывной, в частности, при а° = const, релей­ ной обратной связи И= -*sgn^. Тогда замкнутая система описывается уравнением ^ = 2d^ — к sgn ^ + а, к = const (4.25) и при выполнении условия к>а° существует окрестность, в которой нуль уравнения (4.25) асимптоти­ чески устойчив. Представление о качественном поведении решений уравнения ^ = 2d^-ksgn^ +a (4.26) можно получить из рис. 4.9а, изображающего многообразие решений уравнения (4.26), или рис. 4.96, на котором показан ход фазовых тра­ екторий в КО-пространстве (iCi,^). Скользящий режим в релейной J к+а 1 Скользящий режим ' ~ ^ -S О -к+а Рис. 4.9 системе не является прочным и "размывается" до реального скользя­ щего режима при введении пространственной задержки Д или малого запаздывания в переключения, т.е. если вместо (4.26) мы имеем дело с уравнениями вида ^ = 2d^-A:sgnд^^-a, ^ = 2di - ksgn^^ + а. (4.27)
4.2. КО-етгоритмы стабилизация 169 Сказанное иллюстрируют рис. 4.10, где Д(г) — "амплитуда" ре­ ального скользящего режима. Все отмеченные свойства релейной си­ стемы хорошо известны и ранее уже отмечались. Сейчас же гораздо Рис. 4.10 интереснее посмотреть на то, какие движения в исходном координат­ ном пространстве {xi, гг) соответствуют указанным выше движениям в КО-пространстве ( i i , ^ ) . Сначала сделаем это формально, использовав первое уравнение объекта в переменных (xj,^), т.е. уравнение XI = -dxi + ^ari = -{d - i)xi. При возникновении идеального скользящего режима имеет место ра­ венство ^ = О и, следовательно, переменная х\, а вместе с ней и выход объекта у экспоненцигиьно убывают до нуля, так как xi = —dxj. В режиме реального скольжения выполняется условие |^| < Д < J и также имеет место экспоненциальная устойчивость, если S < d, что, конечно, выполнено. Поэтому полученная система бинарного управле­ ния с релейным КО-алгоритмом экспоненциально устойчива как при идеальных, так и при реальных переключениях. Иначе говоря, • она прочна по отношению к неидеальностям в переключениях, при­ чем не только временного, но (!) и пространственного типа. Можно сказать, что прочностные свойства нелинейной разрывной системы зависят от места расположения в ее структуре разрывного (релейного) элемента. Рассмотрим теперь построенную бинарную систему с релейным КО-алгоритмом стабилизации в исходном координатном простран­ стве (х1,хч). Поскольку и = /ХГ1, а — ^xi, ^ = —fcsgn^, то имеем последовательно и — —кxisgn ^ = —кxisgn — — —к\х\\sgn XI (т. (4.28)
^лава 4. Теория координатно-операторной обратной связи 170 Распространим действие этого алгоритма управления за пределы множества Gs на всю плоскость (2:1,12), тогда этот алгоритм стано­ вится стандартным алгоритмом управления систем переменной струк­ туры. Действительно, последнее выражение в (4.28) определяет стан­ дартную V'-ячейку: f -к, Х1(г> О, , ^о [ к, xiff < О, и, следовательно, фазовый портрет рг1СсматриБаемой системы в ко­ ординатах (xi,X2) имеет уже знакомый вид (рис. 4.11). Изменение и = фХ1, Ф=< Скользящий режим <т=0 Рис. 4.11 структуры системы происходит на прямых а; = О и (Т = 0. Струк­ турная схема синтезированной таким обргьзом бинарной системы с релейной КО-обратной связью приведена на рис. 4.12. Для сравнения на рис. 4.13 дана структура той же системы в стандартном варианте СПС. Из сравнения рисунков видно, что теория бинарного управле­ ния позволяет вскрыть тонкое устройство разрывной обратной связи к °' ITл '12У s+d -к М sgn W 1, Щ й 1 •I2SI b Xi Iff U b / }ь аеА Рис. 4 .12 1>ав A Рис. 4.13
4.2. КО-ллгоритмы стабилизации 171 и, следовательно, представляет возможности регулярного синтеза та­ кой обратной связи, тогда как в теории СПС вид обратной связи был угадан. Еще одна принципиальная особенность КО-обратной связи — ее знакопеременность в зависимости от положения фазовой точки на плоскости. Формально это следует из формулы и = fiXi = —^|ii|sgn (Т, следовательно, fi = —ksgn{xia). Иными словами, • работоспособность систем с КО-связью достигг1ется только при переменности структуры системы. 4.2.5. Замечание о прочности систем с релейной КО-связью Между классической СПС и изучг1емой бинарной системой управления есть, однако, принципиальное различие, которое проявляется при на­ личии неидеальностей в переключениях. Именно, в бинарной системе при появлении временной или пространственной задержки в пере­ ключениях выполнено неравенство |^| < Д и, следовательно, асимптотическгш устойчивость сохраняется, а фазовый портрет имеет вид, показанный на рис. 4.14а. Для стандартной СПС при временной за­ держке переключения фазовый портрет совпадает с портретом на Рис. 4.14 рис. 4.14а, но при пространственной задержке отличается от него и имеет вид, указанный на рис. 4.145. Следовательно, • бинарная система управления, замкнутая КО-релейной обратной связью, прочна по отношению к этим возмущениям, тогда как классическая СПС не является прочной. Таким образом, показано, что при отсутствии волновой модели 0-возмущения а, т.е. \а\ < а", и любом 0-возмущении 6 > 6min > О, т.е. Ь £ В, синтези­ рованный алгоритм бинарного управления с КО-релейной обратной связью • пока единственный из известных робастно решгьет задачу стг1билизации неопределенного нестационарного объекта. Это и есть первый практический "выход" КО-теории стабилизации.
172 Глава 4. Теория коордииатно-операториой обратной связи Одним из недостатков рассмотренного алгоритма является нали­ чие "биений", сопровождающих режим релейного скольжения, в кото­ ром фунционируют, конечно, все физические системы. Другой недо­ статок связан с трудоемкостью точной цифровой реализации сколь­ зящего режима в реальном времени, поскольку в этом случае можно применять схемы аппроксимации только 1-го порядка, но тогда "ам­ плитуда" отклонения от линии скольжения имеет порядок шага дис­ кретизации Л, т.е. М~о(л). Поэтому важно иметь ответ на следующий вопрос: • существуют ли непрерывные алгоритмы стабилизации, сообщаю­ щие замкнутой системе описанные выше свойства? Пожалуй, ясно, что в общем случае ответ на этот вопрос отрицателен, но в чгигтных случаях можно указать такие алгоритмы. Оставаясь пока в рамках КО-теории, укажем некоторые из них. 4.2.6. Линейные КО-алгоритмы стабилизации Рассмотрим ситуацию, когда при стабилизации объекта ^ = 2d^+bn + a известные параметры а Е^ А,Ь £ В можно считать постоянными. При неизвестном 6 метод асимптотического оценивания неприменим и сле­ дует поискать иные приемы стабилизации. Такие приемы развиты в классической теории регулирования, и они предполагают использо­ вание линейных обратных связей с интегральной компонентой: так называемые ПИ- (пропорционально-интегральные) и ПИД- (пропор­ циональные интегрально-дифференциальные) законы регулирования. По прежде рассмотрим пропорциональные законы. П - з а к о н ы р е г у л и р о в а н и я . В этом случае fi = —k^, к — const, замкнутая система управления описывается уравнением ^ = -(bife-2d)^-|-a, и при выполнении условия 6-fc>2cf она асимптотически устойчива с положением равновесия в точке а 4сс = bit-2d Фазовый портрет замкнутой системы управления в координатах («1, ^) приведен на рис. 4.15. Точка ^оо на рисунке определяет статизм
4.2. КО-алгоритМы стабилизации 173 системы стабилизации в координатах (xi,f). Рисунку 4.15 соответ­ ствует фазовый портрет в исходных координатах (xi,a:2) (рис. 4.16), где прямая а — (,жХ\ является асимптотой, определяющей доминант- 0 Рис. 4.15 Рис. 4.16 ное движение. Напомним, что анализ проводится при условии \$\ < <J, т.е. в множестве G<r = {(xi,X2) | H < < J | x i | } , поэтому трг1ектории вне d пока на рисунках не указываются. Таким образом, если |^оо| < <5, то статизм в КО-контуре регули­ рования не нарушает асимптотики системы управления в исходном пространстве, но поскольку асимптота а = ^ooXi не совпадает с тре­ буемым положением <г = О, то появляется отличие в асимптотическом поведении (в степени устойчивости), что может быть интерпретиро­ вано как динамический статизм. Для устранения последнего можно устремить коэффициент А; -> ос, но это эквивалентно введению глубо­ кой обратной связи в КО-контуре, так как « = \ix\ = —к(,х\ = —к<т. Как известно, это ведет к непрочной системе, что не соответствует цели исследования. Поэтому теперь рассмотрим возможности, предо­ ставляемые ПИ-законом регулирования в КО-контуре.
174 Глава 4. Теория координатно-операторной обратной связи ПИ-законы регулирования. В этом случае Ii = -k2^-ki Udt (4.29) и при замыкании такой обратной связью исследуемого объекта i = 2d^ + bfi + a (4.30) получалм систему управления второго порядка ^+{bk2-2d)i (4.31) + bkii = 0. Уравнение (4.31) получено в результате подстановки продиффе­ ренцированного соотношения (4.29) в продифференцированное урав­ нение (4.30). Из уравнения (4.31) ясно видно, что при выполнении условий Ь~к2 > 2d, fci > О наступает асимптотическая устойчивость нуля уравнения. В зависимости от соотношений параметров ki, Лг эта устойчивость может быть колебательной или апериодической. Кроме этого, степень устойчивости также может быть назначена по произ­ волу надлежащим выбором параметров кх, fcjНа рис. 4.17 в координатах (^,^) изображены фазовые траектории, отвечающие колебательным и апериодическим переходным процессам в замкнутой системе ^ -f- (6А2 — 2с/)^ + bki^ = 0. На рис. 4.18 при- Рис. 4.17 .л <т=0 Рис. 4.18 t*2
4.2. КО-адгоритмы стабилизации 175 ведены соответствующие им проекции фазовых траекторий на плос­ кость (г1,а;2)Результирующий алгоритм стабилизации, отвечающий ПИ-закону КО-обратной связи, имеет вид и = fiXi = —Л2 ^Xi — kixi ^dt = (4.32) = —к^ст — kixi I — dt. J xi Обратной связи (4.32) отвечает (напомним, что это соответствие имеет место только в пределах множества Gs) структурная схема, представленная на рис. 4.19. Нетрудно понять, что синтезирован- •• »+d <т ^ J— 1 1 1 1 к. а ] b ^1 f. и у 9' sA Рис. 4.19 ная система бинарного управления является прочной по отношению к сингулярным возмущениям и, следовательно, основная цель синтеза достигнута: • описан непрерывный алгоритм управления, обеспечивающий при любом постоянном а € А асимптотическое "движение" по требуе­ мой траектории а = xi + dxi = 0. Следовательно, эффект малой зависимости движения от фактора не­ определенности достигается не с помощью большого коэффициента усиления или скользящего режима, а, единственно, применением над­ лежащей КО-обратной связи.
176 Глава 4. Теория координатно-операторнои обратной связи 4.2.7. Иятегрально-релейный КО-алгоритм стабилизации Из структуры системы на рис. 4.19 видно, что для реализации ПИзакона в КО-контуре обратной связи необходимо использовать опера­ цию деления, от которой можно избавиться, если вместо интегральной компоненты применять релейно-интегральную компоненту. Именно, исследуем последствия, наступающие при законе fi = -.k2^-ki / Sgn^rft. В этом случае поведение замкнутой системы определяется уравнением ^+{bk2-d'^)i + bkisgni = 0. (4.33) При Ь~к2 > d'^,ki > О фазовый портрет уравнения (4.33) образуют отрезки параболических траекторий уравнений 'i + {bk2-d'')i^±bkx, "сшитых" по линии разрыва ^ = О (рис. 4.20а). Поскольку имеет ме­ сто демпфирование (бАгг — <f^ > 0), то движение по этим траекториям асимптотически стремится к нулю. "Темп" скручивания регулиру­ ется параметром ^2- В исходном пространстве (х\,Х2) соответствую­ щие переходные процессы иллюстрируются рис. 4.205. .Xj .л . • • • • • • • л >*Г^. . \ с^-Шл fe.~^^ * ' . ' : ' ^ ' X •.••••••.'•'. \ •• • 1 . л . ' - •' \ •VV/jir \:>^сг= Рис. 4.20 Структурная схема бинарной системы с такой пропорционгшьной релейно-интегральной КО-связью приведена на рис. 4.21, и видно, что этот регулятор проще в реализации КО-регулятора с ПИ-законом. Отметим, в частности, что при бАгг = d^ система в 0-пространстве {^,i) становится колебательной: ^-l-6*isgn ^ = 0.
4.2. КО-аиггорнтмы стабилизации 177 И хотя координата ^ т^ О, асимптотическая устойчивость по основ­ ным переменным гарантируется, если |^(0)| < S. Соответствующие этому случаю графики даны на рис. 4.22. к. г> s-t-d а •\i 1- 1 ki s -1 \ ^1 b s* + « fl , ' <a- eA Рис. 4.21 X2 0 E'.fVr-.- _ _ з; Ш Рис. 4.22 В заключение отметим, что в рассмотренных гладких бинарных системах не наступает финитное (как в СПС) "обнуление" ошибки <г, и поэтому речь можно вести только об асимптотическом устранении зависимости свойств системы от неконтролируемых факторов. Од­ нако при более "хитрых" законах КО-регулирования появляется воз­ можность финитной стабилизации ошибки а в нуле, при этом система имеет определенную степень гладкости.
178 Глава 4. Теория координатно-операторной обратной связи Более подробное обсуждение этих вопросов составляет предмет следующих тем. Здесь же подчеркнем следующее: • асимптотической независимости движения в системе управления неопределенным объектом можно добиться без использования глу­ бокой обратной связи или скользящего режима, а только примене­ нием нелинейной обратной связи КО-типа. Это второй практиче­ ский результат КО-теории; • физическая основа компенсации неопределенности состоит в ис­ пользовании на некоторых этапах движения положительной обрат­ ной связи, которая позволяет управляющему сигналу "нарасти" до величины, достаточной для компенсации неопределенности. Это происходит подобно тому, как описано в главе 2 при решении за­ дачи о воспроизведении задающего воздействия с помощью одного интеграла.
Глава 5 Скользящие режимы высших порядков Из предыдущего изложения видна та важная роль, которая принад­ лежит скользящему режиму в задачах управления в условиях неопре­ деленности. Достаточно вспомнить релейные системы, системы пе­ ременной структуры, системы с координатно-операторнои обратной связью. Краткое исследование, проведенное в соответствующих раз­ делах монографии, показало, что при определенном сходстве имеется глубокое различие в скользящих режимах, проявляющееся, в част­ ности, под воздействием факторов неопределенности и помех. Бо­ лее детальное исследование показывает, что существует много видов скользящего режима и объединяет их только факт наличия разрывов правой части дифференциальных уравнений, описывающих поведение соответствующих динамических систем. Далее мы дадим содержа­ тельный набросок того раздела общей теории скользящих режимов, который связан со степенью гладкости на рещениях системы функ­ ции, определяющей поверхность разрыва. Степень гладкости решения естественным образом упорядочивает скользящие режимы, и появля­ ется возможность введения нового понятия — порядка скольжения. 5.1. Некоторые предварительные сведения из теории скользящего режима Изложим некоторые факты из теории скользящих режимов, необхо­ димые для понимания дальнейшего изложения. Скользящие режимы возникают в разрывных динамических систе­ мах, например в системах управления вида X = /(х) +6(х)и, где управление и (обратная связь) терпит разрывы на гладком мно­ гообразии М = {г € Л" I (т{х) = 0} , именно: •(г), Ф)={:-i •(х), (7{x)>Q, (т(х)<0, и''фи-
180 Глава 5. Скользящие режимы высших порядков Скользящий режим имеет место в тех точках многообразия М, к которым фазовые траектории х* (t) динамических систем x = f^ix) = f{x)-\.b{x)u^ix) подходят с разных сторон многообразия и трансверсально его пересеVo-(x) /+(х) Рис. 5.1 кают (рис. 5.1). В таких точках выполнены следующие неравенства: ±(V.T(x),/±(x)>|^(,)=o<0. Объединение всех таких точек х G М образует множество Msi С М, нгаываемое далее областью скольжения (на рис. 5.1 она выделена). 5.1.1. Уравнения скольжения Для получения уравнений, описывающих движение в скользящем ре­ жиме (далее они называются уравнениями скольжения), можно ис­ пользовать процедуру Филиппова. Опишем необходимый фрагмент этой процедуры. Соединим прямой концы фазовых векторов f^{x). Всякий вектор fa{x), упирающийся в эту прямую, дается выпуклой комбинацией / „ = а/"*" -|- (1 — oi)f~ фазовых векторов / * ( х ) . Один из этих векторов принимается за искомый (рис. 5.2). Именно, поскольку / ^ , ki "^<г=0 ' ^ >«/+(х) Рис 5.2
5.1. Предварительные сведения 181 в режиме скольжения (т = О, то искомый фазовый вектор должен удо­ влетворять уравнению где V(T — градиент функции (т{х) в точке х. Решая последнее урав­ нение относительно параметра а, находим (V<T, ( / - - / + ) ) • Соответствующее дифференциальное уравнение имеет вид х = и. =f--a*if--f+) = и описывает движение по поверхностям уровня а{х) = const. Для получения уравнения скольжения нужно дополнить его равенством «г = О, X € Mgi. Уравнениям скольжения i = fsi{x), <т(ж) = 0, а:€М,1 можно придать полезную геометрическую интерпретацию. Введем в рассмотрение на многообразии М оператор Р{х) = Е- f-{x)-f+{x){V<T{x),{.)) {V<T(x),{f-(x)-f+(x))) • Поскольку Р'^ = Р, то этот оператор является оператором локального проектирования на многообразие с = О вдоль прямой (параллельно), задаваемой вектором Д / = / " — / + (рис. 5.3). Поэтому уравнения Рис. 5.3 скольжения можно записать в виде ^= Рд/Г, Рм = Е- А/(У<т,(-)) (V<r,A/)
182 Глава 5. Скользящие режимы высших порядков Для рассматриваемого уравнения х = f + Ьи вектор Д / = / + Ьи~ - f- Ьи"^ = Ь(и~ - и"*") = ЬАи, и если Ди ф О, то векторы Д / и 6 коллинеарны. Следовательно, верно равенство а так как по свойству оператора проектирования ' ^ • ' - ( - ^ > = ' - b(Va,b) = 0, <V<T,6) то уравнения скольжения можно записать в более компактном виде: X = Pbf, (7 = 0, l€Msl. 5.1.2. Об инвариантности уравнения скольжения по отношению к возмущениям, удовлетворяющим условию согласованности Напомним, что внешнее возмущение <p{t, х) удовлетворяет условию со­ гласованности (МС-условию), если оно действует в канале управления x = f + b{u + (p). (5.1) В силу указанного выше свойства РьЬ = 0. Уравнения скольжения по многообразию М для возмущенного (5.1) и невозмущенного X = f + Ьи объектов совпадают и даются формулами x = Pbf, <г = О, х£ Msi С М. (5.2) Именно этот математический факт проясняет тот интерес, кото­ рый постоянно проявляется в теории управления и ее приложениях к идее интегргшьного многообразия и ее реализации с помощью разрыв­ ной и глубокой обратных связей. Здесь уместно заметить, что уравнения (5.2) описывают также движение в системе с глубокой обратной связью X = f + Ьи = / - кЬ(т, к = const > О, (5.3) и=—к<7 Т.е. при устремлении коэффициента обратной связи в бесконечность {к -> оо), если выполнено условие (Vff,b)>0.
5.1. Предварительные сведения 183 Для того чтобы убедиться в этом, можно воспользоваться при­ веденными выше геометрическими соображениями или нижеследую­ щими выкладками. В силу уравнения движения находим & = {V<Tj)-k{V,(T,b)a, (5.4) и при указанных выше условиях изображающая точка "мгновенно" достигает поверхности а(х) = О и далее ее не покидает, а значит, во время движения имеет место равенство & = О- Воспользуемся теперь следующим эвристическим приемом: выразим из уравнения & = О про­ изведение к<т, а результат подставим в уравнение (5.3), тогда получим уравнение которое вместе с равенством <т = О и задает уравнение движения си­ стемы с глубокой обратной связью. Видно, что оно совпадает с полу­ ченным выше уравнением скольжения разрывной системы. В определенной степени стандартную разрывную систему и си­ стему с глубокой обратной связью можно рассматривать как два по­ люса реализации одной и той же идеи — идеи скольжения по гладкому многообразию. В одном случг1е это скольжение осуществляется беско­ нечно гладко, а в другом — с разрывом уже первой производной функ­ ции, задающей поверхность скольжения. Оказывается, что между этими двумя крайними системами существует бесконечно много си­ стем, "скользящих" по той же поверхности, но обладающих различной степенью гладкости. О некоторых таких промежуточных системах и идет речь в данной главе. 5.1.3. Уравнения реального скольлсения Практически, т.е. в реальных ситуациях, переключения разрывного элемента происходят не точно на многообразии М = {г ] <т(г) = О}, но всегда в некоторой его окрестности 0(М) = { х | И х ) | < Л ( Д ) } , где А(А) — "амплитуда" отклонения траекторий разрывной системы i = / ^ от многообразия М (рис. 5.4). Здесь и далее Д — параметр. Рис. 5.4
Глава 5. Скользящие режимы высишх порядков 184 характеризующий неидеальность переключении, например временную или пространственную задержку, быструю немоделируемую динами­ ку и т.п. Подобный режим скольжения принято называть реальным скользящим режимом. При малых амплитудах А(А) его можно также характеризовать "частотой" переключения W(A), для которой верна оценка W(A) < ^ М . , ^ ^ - 2Л(Д)' где II/II = m i n ( | | / ~ | | , ((/•'"II). При устранении неидеальности пере­ ключения (т.е. при Д —> 0) "амплитуда", как правило, уменьшается до нуля, а "чгютота" растет до бесконечности, т.е. lim W(A) = оо, lim А{А) = 0. Д-vO Д-fO ^ ' При этом реальное скольжение переходит в идеальное (рис. 5.5) и весьма важен вопрос о порядке этого перехода по параметру Д. о-=0 Рис. 5.5 Прежде чем точно определить то, что здесь имеется в виду, полу­ чим уравнения реального скольжения. Напомним, что при идеальном скольжении (а- = 0) искомый фазовый вектор правой части уравнения движения /eq (рис. 5.5) находится в результате решения уравнения <r = (Vo-,/ec,) = 0. При реальном скольжении выполнено неравенство |<т| < А{А), и искомый вектор правой чг1сти системы реального скольжения / „ на­ ходится из неоднородного уравнения <T = (V<r,/„). В частности, если система имеет вид x = f + b{a + !fi), то последнее уравнение можно переписать следующим образом: (Г = (V<T, / ) Н- (V<r, Ь)и„ + (Vtr, b)<p. (5.5)
5.1. Предварительные сведения 185 Если {Vo-,6)^0, то (У<г,/) & {Va,b) ^ (Va,b) ""- ^' и после подстановки найденного значения в уравнения движения (5.5) находим {Va,b) (V<r,6>- Если использовать оператор проецирования (V<T, 6) то последнее уравнение принимгьет вид ^ = ^^-^ + ^ ( V ^ ^'-'^ к1 < А(А) (5.7) и вместе с ограничением определяет движение в реальном скользящем режиме. Представляет интерес исследование близости решений идеального и реального скольжения (обозначим их Xid(t) и x(t) соответственно), выпущенных из одной начальной точки х° £ М при одном и том же возмущении <p{t). Решение идеального скольжения описывается урав­ нениями iid = Pbfixid), cr(xid) = О, а решение реального скольжения имеет вид х = Рь/{х) + -^^^-^&, \а(х)\<А(А). Положим для простоты и без потери общности, что вектор b П = 7= ГТ- = c o n s t , <Va,6) тогда оператор Рь = const, и после вычитания первого уравнения из второго для ошибки е = X — Хи получаем следующее уравнение: £ = Рь[ f{xid +£)- f(xid)]-\-h&. По теореме Лагранжа для некоторого вектора 0 G [a^id, ^^id + е] имеет место равенство f{xid+e)-f{xid) = ^{e)e,
186 Глава 5. Скользящие режимы высших порядков поэтому впредь имеем дело с уравнением вида ox Поскольку е(0) = О, то последнее дифференциальное уравнение эквивалентно интегральному уравнению t t t £{t) = /Ме{т)dT + h f &dT= 0 0 f ЛГе(г)dr + h(r{t). 0 Полагая, что на некотором отрезке [О, Т] \т < D, от интегрального уравнения переходим к скалярному неравенству для нормы ошибки с 1 1 Ф ) 1 1 < ^ ^ / | И г ) | | й г + ||Л||Л(Д). После применения леммы Гронуолла-Беллмана находим на отрезке [О, Т] искомую оценку Таким образом, из принадлежности траекторий реального сколь­ жения окрестности многообразия М 0{М)={х I |о-|<Л(Д)} следует их близость на конечном интернете времени к соответствую­ щим траекториям идеального скольжения с точностью порядка А(Д), т.е. с точностью реешьного скольжения. Отсюда следует, что • нужно стремиться к повышению порядка реального скольжения по отношению к параметру Д, ибо тогда большей точности при­ ближения к идеальному скольжению можно добиться при большей неидеальности. Иными словами, это и есть прямой путь к повышению прочности си­ стемы управления. Аналогичная проблема возникеъет при дискретном моделировании разрывных систем, когда роль параметра неидеальности выполняет шаг дискретизации временной шкалы
5.1. Предваритедьньге сведения 187 и разрывы имеют место на множестве дискретных моментов времени {tj}. В этом случае окрестность 0{М) реального скольжения харак­ теризуется неравенством W{tj)\<A(h) и для повышения точности моделирования нужно уменьшать шаг дис­ кретизации h, но тогда растут вычислительные затраты. Выгоды от уменьшения Л возрастают с ростом порядка малости функции Л(Л) по Л, т.е. чем выше число г в соотношении A{h) ~ Л^ тем более высокая точность счета достигается при заданном шаге интегрирования h. Проведенные рассуждения актуализируют данную проблему изы­ скания средств повышения порядка функции А{А) по малому параме­ тру Д, определяющему "точность" реального скольжения. 5.1.4. Замечание о порядке скольхсения От чего же зависит и чем определяется порядок скольжения? Для ответа на этот вопрос рассмотрим движение в скользящем режиме разрывной системы i = f^{x) = f{x) + b(x)u^{x) (5.8) по гладкому многообразию Мо={х\ (т{х) = 0} . (5.9) Из (5.8), (5.9) имеем равенства (T = {V<T,/±) = (V<r,/)-KV<T,6)u±, (5.10) и если векторные поля / * ( х ) трансверсальны Мо, то (Vcr, b)|^^ т^ О и на многообразии Мо возможен скользящий режим. При этом «г = О и ^^q = (V(T,/)-l-{V(T,b)Ueq = 0. (5.11) Вычитав (5.11) из (5.10) при <т — О я вводя обозначения « - Ueq, получаем = {Va,b)uf. <7=0 Напомним, что с такими уравнениями мы ранее уже имели дело и анализировали их свойства при наличии неидеальности переключений.
Глава 5. Скользящие режимы высших порядков 188 Пусть для определенности выполнено неравенство (V(T, 6) > О, то­ гда для управления —sgniT имеем уравнение скольжения = -{V<T,b) >sgn<r, Mo которому при идеальных переключениях соответствует рис. 5.6а, а при неидеальных — рис. 5.65. Из этих рисунков видно, что рассмо- (Va-,6) 0 а -А -(Vo-,6) Рис. 5.6 тренная система имеет 1-й порядок малости по параметру неидеаль­ ности Д, так как при реальном скольжении \сг\ < А, \&\ < const. Припишем такому реальному скольжению 1-й порядок по параме­ тру Д. В пределе при Д —> О имеем соотношения <т = О, jo"! < const, определяющие стандартный режим идеального скольжения, который характеризуется непрерывностью переменной <т и разрывностью ее производной а. Такому идеальному скольжению также удобно припи­ сать 1-й порядок. Из предыдущего следует, что трансверсальность пересечения мно­ гообразия скольжения MQ траекториями систем i = / * приводит к скольжению 1-го порядка (идеальному и реальному). Поэтому более высокий порядок скольжения наступает только тогда, когда векторь ные поля / * ка^саются многообразия скольжения Мо, т.е. когда имеет место тождество сг(х) = 0. (5.12) Мо Множество точек х, удовлетворяющих (5.12), обозначим через Mi. При выполнении условия (5.12) скользящий режим на пересечении
5.1. Предварительные сведения 189 Mo n Ml может возникнуть, если разрывна и знакопеременна вторая производная ir = (V<7, / ± ) = (V<T, /> + {V&, 6)u±, т.е. (V<T, 6) ^ О на Mo n Ml. Сказанное иллюстрируют рис. 5.7. На рис. 5.75 показан ход тра­ екторий такой системы при взгляде с торца на пересечение MQ П M I . Поскольку в этом случае функции а и & непрерывны, а функция ir раз- МоПМг 2 Рис. 5.7 рывна, то в идеальном скользящем режиме имеем соотношения <т = 0, (7 = О, |<г| < const. Следуя принятой выше концепции, такому режиму скольжения нужно присвоить 2-й порядок. Для определения порядка режима реального скольжения по пара­ метру неидеальности Д допустим, что при достаточно малом Д > О реальный скользяш;ий режим удерживается в окрестности пересече­ ния Мо П Ml, т.е. при некоторых константах Ло(Д), Л1(Д), Лз (Д) имеют место следующие неравенства: \а\<Ао{А), И<Л2(Д), А- <\&\<А+{А), (5.13) причем И т Ло(Д) = lim Л ^ Д ) = О, д->о д-».о lim Л ^ ( Д ) > 0 . д->о ^ ^ ' Пусть г(Д) — какой-либо интервал неопределенности а. Ясно, что г(Д) —> О при Д —> 0. Тогда по теореме Лагранжа для некоторой точки в из этого интервсша |t^(0)| < 2 m a x | < r | < 2Л1(Д) г(Д) • (5.14)
Глава 5. Скользящие режимы высших порядков 190 Аналогично, для того же интервала находим для некоторого 6 ' \<т{е')\ <2max|<r| < 2Ао{А) г(Д) • (5.15) Из сопоставления (5.13), (5.14) и (5.15) находим, что AI~0{T), А2^0{Т^), и если г ~ 0(A), а это, как правило, имеет место, то Ai ~ 0(A), А2 ~ О ( Д ' ) . Последнее означает, что рассматриваемый реальный скользящий ре­ жим имеет 2-й порядок по параметру неидеальности Л. В частности, если параметр А = h, где h — шаг дискретизации временной шкалы при численном моделировании разрывной системы, то для реального скольжения 2-го порядка гарантируется соответ­ ствующая точность 2-го порядка по Л выполнения связи о- = О и, следо­ вательно, аналогичная точность приближения траектории реального скольжения к соответствующей траектории идеального скольжения. 0(1)- п *1 0 «2 ti и Г2 0(1) О(т^) О(г') у^"--у-^ :хг Рис. 5.8 Сказанное выше иллюстрируют рис. 5.8. Описанная концепция естественным образом обобщается на произвольный порядок сколь­ жения, именно: пусть Lf(-) — оператор дифференцирования по на­ правлению векторного поля / * , т.е. для гладкой функции ip(x) L'jD<p(x) = (V<p,f'^), /± = /-h6u±.
5.2. Алгоритмы скольжения 2-го порядка 191 При кратном применении этого оператора имеем равенство L'f(p = Lf {Ь'г ^(р), I — целое число. Заметим, что в тех случаях, когда это имеет смысл, между произ­ водными по времени функции (х(х) и системой х = f{x) справедливо следующее равенство: dfc Пусть при последовательном дифференцировании функции <т{х) и все ее производные до порядка (г — 1) включительно непрерывны, а г-я производная о-^'') = IJ(T разрывна и знакопеременна. Тогда, если пересечение Mr = Мо П Ml П ... П Мг_1, где М, = { I | < T ( ' ) ( X ) = 0 } , / = 0,1,...,Г-1. не пусто, то оно является многообразием идеального скольжения по­ рядка г. Если, кроме того, при реальном скольжении обеспечено выполне­ ние следующих неравенств для / = 0,1, . . . , г — 1 : |<г(')|<Л(Д), кМ|<Лг(Д), >lr(A)>const > 0 , где А — параметр, характеризующий неидеальности переключений, то точность реального скольжения по (г имеет порядок Д', так как к(')|^0(дг-'), / = 0,1,...,г-1. 5.2. Алгоритмы скольжения 2-го порядка Рассмотрим некоторые алгоритмы скольжения 2-го порядка. Прежде всего уточним математическую модель, с которой пред­ стоит иметь дело. Вновь рассмотрим гладкое многообразие Мо = {х I <т{х) = 0}. Поведение в его окрестности 0(Мо) разрывной системы х = f + bu"^ можно изучать по скалярному уравнению вида «r = (V<r,/)-KV(T,6)«±. (5.16) Пусть Ueq — решение для х € 0{Мо) уравнения 0 = <V(T,/>-»-(V«r,6>Ueq, (5.17)
192 Глава 5. Скользящие режимы высших порядков тогда, после вычитания (5.17) из (5.16), получим, что в окрестности 0{Мо) действует уравнение Если обозначить правую часть последнего уравнения через и, то тем самым изучение движений в окрестности 0(Мо) можно свести, без ущерба для общности, к следующему стандартному уравнению: & = и. (5.18) Особенность такого уравнения при анализе скользящих режимов 2-го порядка состоит в том, что функция и непрерывна и такова, что фазовые траектории исходной системы касаются многообразия в точках скольжения 2-го порядка, иными словами, и обращается в нуль на пересечении MQDMI, где, как и раньше, Mi = {x\ ff(z) = 0}. Проблема стабилизации скалярного объекта (5.18) непрерывным управлением сводится следующими заменами к стандартной проблеме стабилизации в нуле объекта 2-го порядка ^' = ''" ''^ = "' (5.19) (7 = (Ti, обратной связью I/{(TI,(T2), которая при скольжении 2-го порядка мо­ жет быть и разрывной. Разумеется, наиболее привлекательны те обратные связи I/(<TJ,<T2), которые финитно стабилизируют объект (5.19) в нуле по выходу, однако не будем пренебрегать и асимпто­ тически стабилизирующими обратными связями по состоянию или по выходу. Описанная выше конструкция допускает естественное обобщение. Так, проблема организации скользящего режима г-го порядка на мно­ гообразии MQ эквивалентна проблеме финитной стабилизации по вы­ ходу в нуле следующей системы г-го порядка: о-,=(Г,+1, i = 1,2, . . . , г - 1 , (5.20) (Тг = f, <Т = <Ti. в самом деле, в этом случае в желаемом режиме имеем равенства <т = 0-1 = 0-2 = . . . = <Тг = О, которые означают, что движение происходит по пересечению МоПЛ/1 П . . . Л Л / г ,
5.2. Алгоритмы скольжения 2-го порядка 193 где, как очевидно, множества М,- определяются следующими соотно­ шениями: Mi = {x |<т<''){х) = 0}. Порядок скользящего режима можйо связать с относительным по­ рядком исходного объекта по управлению, если за его выход принята переменная <т(х). Проще всего и без потери в общности это можно по­ яснить на примере линейного стационарного объекта. Действительно, пусть связь между входом и и выходом а объекта определена дробнорациональной передаточной функцией W{s) = p(s)/a{s) (рис. 5.9). W(s) Рис. 5.9 Тогда при относительном порядке единица, т.е. когда dega(s) -deg/9{s) = 1, производная <т может претерпевать разрывы, если управление и раз­ рывно и, следовательно, возможен скользящий режим 1-го порядка. При условии, что deg Q{S) - deg ^(s) = г, функции ffC), I = 0,1, . . . , r — 1 не зависят явно от управления, а функцияff^*"'— зависит, и, следовательно, при разрывном управле­ нии и разрывы может претерпевать только (т^''\ а значит, в системе в принципе возможен скользящий режим не ниже г-го порядка. Та­ ким образом, порядок функции, задающей поверхность разрыва, по управлению (т.е. номер первой производной Ли, явно зависящей от управления) и определяет порядок скользящего режима, если, конечно, последний устойчив. Рассмотрим конкретные примеры алгоритмов скольжения 2-го по­ рядка подробнее. 5.2.1. Асимптотические алгоритмы скольжения 2-го порядка При решении задачи асимптотической стабилизации в нуле объекта (Е-системы) сначала исследуем возможности линейной обратной связи и =-ki<Ti - к20-2. (5.21)
194 Глава 5. Скользящие режимы высших порядков При постоянных параметрах обратной связи ку, ki возможны три основных вида экспоненциально затухаюыщх переходных процессов: колебательные (рис. 5.10), апериодические (рис. 5.11) и монотонные (рис. 5.12). В последнем случае используется глубокая обратная связь. Рис. 5.10 <T2+rf<Ti=0 Рис. 5.11 ^=0 Рис. 5.12 вводимая устремлением в бесконечность общего множителя к параме­ тров ki, Аг2, т.е. в этом случг1е обратная связь (5.21) имеет вид U = -к^ = -к{(Г2 + dcri), d = const > 0.
5.2. Алгоритмы скольжения 2-го порядка 195 Соответствующие рис. 5.10-5.12 ситуации в исходном фазовом пространстве X разрывной системы i = / ± = / + Ьи=»= иллюстрируют рис. 5.13, 5.14. Особенности таких алгоритмов сколь­ жения обусловлены характерными свойствами линейных систем ста^ билизации. В частности, для уменьшения времени переходного про- Рис. 5.13 Рис. 5.14 Рис. 5.15 цесса (а это желательно) необходимо увеличивать демпфирование, но это понижает прочность системы. Кроме того, при наличии неопре­ деленности в описании исходной системы i = / * информация о про­ изводной (72 может отсутствовать, а ее восстановление стандартными методами наьблюдения невозможно. Поэтому следует обратиться к не­ линейным алгоритмам стабилизации. Рассмотрим сначала ситуацию, когда многообразие скольжения — Мо, и только оно является многообразием разрыва обратной связи, например, и = -к2 <Т2 —fcisgn а\.
196 Глава 5. Скользящие режимы высших порядков В ЭТОМ случае замкнутая система &1 = (Г2, {Г2 — —*1 sgn ах - ^2 сг асимптотически устойчива в нуле, что проверяется пробной функцией V = kil + 2Г^^' производная которой имеет вид ^2 2 И тождественно обращается в нуль только в начале координат. Каче- Рис. 5.16 ственное представление о характере движения в окрестности пересе­ чения Мо П Ml в этом случае дают рис. 5.15, 5.16. 5.2.2. Разрывные асимптотические алгоритмы скольхсения 2-го порядка Если разрывы управления допускаются не только на многообразии скольжения Мо, то экспоненциальную стабилизацию Е-системы в нуле обеспечивает следующий закон СПС: и = -fc|<Ti|sgn^, ^ = <Г2 + 2</(Ti, d = const > 0. Действительно, уравнения замкнутой системы имеют вид &! = <Т2, &2 = -A;|<ri|sgn^, и при выполнении неравенства k>d^
5.2. Алгоритмы скольжения 2-го порядка 197 на прямой ^ = О за конечное время (кроме асимптотических траек­ торий) возникает скользящий режим (рис. 5.17, 5.18), который явля­ ется скользящим режимом 1-го порядка относительно переменной ^, но 2-го порядка относительно переменной (Г\. Разрывные алгоритмы Рис. 5.17 Рис. 5.18 скольжения обеспечивают более прочное по сравнению с линейными алгоритмами решение задачи стабилизации по неоднократно упоми­ навшимся причинам. Представляет интерес, однако, синтез финит­ ных алгоритмов стабилизации. 5.2.3. Финитные алгоритмы скользкения 2-го порядка: линейная обратная связь Финитнг^ стабилизация возможна только в классе линейных нестаци­ онарных или же нелинейных (разрывных) обратных связей. Прежде всего естественно рассмотреть стабилизирующие возмож­ ности линейной обратной связи. Именно, применим для стабилизации в нуле Е-системы (Tj = (72, (72 = U
Глава 5. Скользящие режимы высших порядков 198 за конечное время rj > О линейную обратную связь с переменными па­ раметрами и = —kW = —iti<Ti—А:2<Г2, где для удобства введены векторы к^ = {ki,k2) и ff = («Ti,«гг); здесь ^ — знак транспонирования. Общее решение Е-системы дается формулой Коши t •тА W{t) = е tA budr о где матрица А и вектор 6 имеют вид л=[У.]. '=[?] Положим и(0 = - б " ^ е - ' ^ I, где вектор I определяется из равенства ?(»j) = О, т.е. V (То = !• -'•^ ЬЬ^е-"^ dr l= W(0,v)l. .0 Поскольку Е-система управляема, то граммиан управляемости W(0,T]) невырожден при любом »; > О, и поэтому / = W~^(0,T))WO, ЧТО и по­ зволяет найти управление, решающее задачу в виде "программы" « = - 6т^-м^ 'е W-\0,T,)Wo. Для нахождения соответствующей обратной связи выразим <го из равенства а результат подставим в предыдущую формулу для и. Получим сле­ ду юхцую формулу: jTg-M и = w-^iO,r,)e -tA 1-1^(0,0^^-40,»;) ' которая и определяет искомую обратную связь. Поскольку W{0,t)W-\Q,r})^l при t —> т;, то коэффициент обратной связи неограниченно возрастг1ет за конечное время, т.е. -tA k(t) = - l-W{0,t)W-^{0,T)) •ОС,
5.2. Алгоритмы скольжения 2-го порядка 199 Последнее, конечно, неприемлемо в приложениях. Для явного вы­ ражения параметров Ari(t) и k2(t) через параметры Е-системы нужно использовать следующие формулы: 6*"^ = »'-'(».')= [б/.^ tt]- »v'-^ = H,ii. 5.2.4. Финитные алгоритмы скольжения 2-го порядка: релейная обратная связь Рассмотрим теперь нелинейную обратную связь, которгш также обес­ печивает финитную стабилизацию, но ограничена при любых «г. Пусть скалярная гладкая функция д{<т) такова, что д{0) = 0, д' д ограничена, решение дифференциального уравнения а = д(<т) существует при лю­ бом (г(0) и это решение за конечное время попадает в нуль. Например, такими свойствами обладает функция ^((г) = —dsgner \(т\р, 0.5 < р <1, d = const > 0. Тогда обратную связь, финитно стабилизирующую Е-систему &1 = <Т2, <^1 — U, можно выбрать релейной, например в виде « = -*sgn^(<ri,<r2), При достаточно большом коэффициенте к > О кривая (Тг = 9{<''i) будет кривой скольжения, она достига1ется из любого начального по­ ложения за конечное время, что и гарантирует финитность времени стабилизации г) (рис. 5.19). Рис. 5.19
Глава 5. Скользящие режимы высших порядков 200 5.2.5. Алгоритм скручивания Исследуем стабилизирующие свойства разрывной обратной связи вида и = —ki Sgn <Ti — к2 Sgn (Т2, где ibi > ^2 — положительные параметры. Замкнутая система при этом описывается уравнениями ffl = (Т2, &2 = -ki sgn (Ti - ^2 sgn ег2, a отвечающие ей траектории, состоящие из отрезков параболы, изо­ бражены на рис. 5.20. -iki+ki) ki+k2 *2\ -(fci-Jkj) Рис. 5.20 Пусть to, ti, t2, ta и t^ — последовательные моменты переключе­ ния управления, а ri = ti — to, Т2 = t2 — ti я т.д. — интервалы времени между переключениями. Соотношения между последователь­ ными значениями переменных «ri, (Тг в моменты переключений даются, очевидно, следую1Щ1ми выражениями: ai = ± (г\/{к\ -\- Л2) в первом и третьем квадрантах, (Тх = ^а^Ккх — ^2) — во втором и четвертом. Поэтому между квадратами (Т2(0) и (Т2((2) имеет место соотношение '^2(M = ^ ^ ' - l ( 0 ) = 'e<Ti(0). Аналогично имеем a^{t\) = Kal{t2) = к^а^О). Пусть i — номер полного оборота фазового вектора вокруг нуля, тогда последовательные значения переменной а-2 связаны следующими соотношениями: к2(«)1 = «к2(« - 1 ) 1 = . . . = /с*к2(о)|, ,- = 1 , 2 , . . . , откуда следует сходимость переходных процессов Е-системы к нулю, если только к < 1. Докажем, что эта сходимость финитна.
5.2. Алгоритмы скольжения 2-го порядка 201 Пусть Ti — время i-ro оборота. Очевидно, что т;-= г'+ г • + г^ + г^ где для промежутков rj (j = 1,2,3,4) нетрудно получить выражения .• _ к2(<'о)| .• _ к2(4)1 г; = Ал + *2 к2(4)1 ^ ki-k2' к2(П)| п• ' = ki-k2 Используя последние соотношения, нетрудно убедиться, что верна сле­ дующая оценка: Ti < 1 ki-k2 (k2(4)| + 2|<T2(4)l+k2(<i)|) = 1 ifcj _ jt2 (^ + 2v;?+«)1<Г2(4)| = i i ± ^ | o ^ 2 ( O I Поскольку для времени переходного процесса верна оценка сверху 1=1 ki-k2 «=i * l - * 2 1=1 и ряд Yl " ' сходится при /с < 1, то это и означг1ет, что время Т пе1=0 реходного процесса ограничено. Иными словами, любая фазовая тра­ ектория "скручивается" в нуль за конечное время, что и проясняет название алгоритма. Соответствующие этому поведению иллюстра­ ции даны на рис. 5.21. cri <т=0 2^^z:*^ М0ПМ1 Рис. 5.21 В заключение этого раздела заметим, что релейный алгоритм и алгоритм скручивания можно применять и при дискретных измере­ ниях, но в этой ситуации они превращаются в алгоритмы реального
202 Глава 5. Скользящие режимы высших порядков скольжения 2-го порядка. Именно, пусть t,- — моменты измерения функции (r(t) с постоянным шагом h = t.+i — t,-. Тогда релейный ал­ горитм реального скольжения 2-го порядка задается выражением u{t) = д - кsgn[Si(Ti -g{(Ti{ti))], t е [ti,ti+i], где Si(Ti = (Ti{ti) — <Ti{ti-i), a алгоритм дискретного скручивания, со­ ответственно, — выражением u{t) = -kisgnai{ti) - k2Sgn[6i(ri], t G [<.,t.+i]. 5.3. Финитная стабилизация по выходу Вновь рассмотрим задачу финитной стабилизации в нуле Е-систем1^ с уравнением выхода (т •= ai. Удобно уравнения Е-системы свести к одному уравнению второго порядка а = и. Зададимся обратной связью вида и =—kisgntr — r—rrjT&, fci.fcj = const > о, (5.22) особенность которой состоит в том, что коэффициент демпфирования Jt2/|<^P^^ в уравнении замкнутой системы <^+ГТГ72'^ + ''18«п<' = 0 (5-23) неограниченно нарастает при приближении к многообразию скольже­ ния Мо = {х\(т{х) = 0}. Именно с этим "физическим" эффектом связаны надежды на финитно стабилизационные возможности обратной связи (5.22). Перейдем к анализу уравнения замкнутой системы (5.23). Прежде всего замечаем, что при замене <г —^ —<т вид уравнения, а значит, и его фг13овые траектории сохраняются, поэтому достаточно ограничиться анализом его решений при ег > О, так как траектории в квадрантах <т<г > О {(Т& < 0) подобны. Качественно фазовые траектории исследуемого уравнения •^ + ПлП^ + fci sgn от = О
5.3. Фгшитная стабилизация по выходу 203 представлены на рис. 5.22, на котором &о — начальное значение ско­ рости, СГ2 — точка второго пересечения фазовой траектории с осью <т = О (т.е. второго пересечения многообразия Мо), &, = <т(<») — ми­ нимальное значение скорости на интервале движения [<i,<2]. где <i — момент обнуления скорости & (т.е. момент максимального удаления изображающей точки от многообразия Мо), <2 — момент попадания на Мо. При <т > О имеем дело с уравнением ff + —^& + ki = О, л/cr которое нетрудно преобразовать к виду а затем, так как при < = О верны равенства &(0) = &о, <т(0) = О, после интегрирования по­ лучаем соотношение Рис. 5.22 & + kit + 2k2<T^^^ = (ro. При < = <1 из (5.24) находим (учитывая, что kiti + 2/r2<Tj <T(<I) (5.24) = 0) = &о. Поскольку ti > О, то из последнего равенства имеем первое из необ­ ходимых нам далее неравенств, именно: 1/2 <Го (5.25) Подставим t = t» в (5.23). Тогда, учитывая, что <T(t,) = О, получим равенство L • 1 L 1/2 1/2 n k2a;+ki(T,' ^^2 . <т, = — —-о-,. ki Но очевидно (рис. 5.22), что а» <a-i, &, < &2, а поэтому из последнего равенства получаем цепочку неравенств 1/2 .^ =0, 1/2 или *2/ • N ^ ^^2/ .V из которых можно извлечь второе из требуемых соотношений, именно: -&2 < Р-(г\'\ «2 (5.26)
204 Глава 5. Скользящие режимы высших порядков После подстановки (5.25) в (5.26) получаем следующее неравенство между скоростями двух последовательных пересечений многообразия скольжения MQ: &о ^ 2Jfc2в силу отмеченной выше симметрии уравнений замкнутой системы аналогичное неравенство имеет место для любых двух последователь­ ных моментов пересечения многообразия MQ, т.е. справедливо нера­ венство < ! • Отсюда получаем оценку вида |<т,| < 7'|'''о|> и если выполнено условие 7= — <1 то стабилизируемость доказана, так как при этом | ( 7 , | ->^ О, < -)• 00, а из неравенств типа (5.25) следует также, что и |<г,| -> О, < -> оо, где at — максимумы отклонений от многообразия скольжения MQ • Докажем теперь, что время переходного процесса конечно. Для этого подставим t = t2 в уравнение (5.24). Получим равенство и, следовательно, для промежутка времени Ti = f2 — О между двумя пересечениями многообразия MQ имеет место следующая оценка: &0-&2 J l — '2 — Г «1 1+7 < О-О—, «1 . Естественно, что аналогичная оценка справедлива для каждого 1-го интервала, т.е. «1 Но время Т переходного процесса конечно, так как в неравенстве 1+ 7 ^=Е^.<т^Е1'-1 i=l *1 ' 1=1 по докгизанному ранее |<г.|< 71^.-11, оо и, значит, ряд Y1 \'^i\ ограничен. « • = 1 0<7<1,
5.3. Финитная стабилизация по выходу 205 Таким образом, имеет место финитная стабилизация S-системы обратной связью вида (5.22). Проведенное исследование обосновы­ вает рис. 5.23, на котором изображен финитный переходный процесс, заканчивающийся к моменту времени т). Рис. 5.23 в завершение данного раздела укажем причину, по которой обрат­ ная связь и = —ki dsgn <r — ^2 |^|l/2 названа обратной связью по выходу. Дело в том, что поведение ис­ следуемой выше Е-системы и нижеследующей системы, описываемой интегродифференциальным уравнением f t &{t) = —ki I sgn crdr — k^ I \(r\^'^sgn adr + ao, 0 0 суть одно, но для реализации управления, стоящего в правой части последнего уравнения, требуется информация только о выходе <т. Разумеется, все выводы сохраняются и в случае использования обратной связи вида и = -kisgn(T-k27-r-, О </)<!. Наконец, заметим, что все изложенные выше результаты без суще­ ственных изъятий могут быть перенесены на произвольный порядок скольжения. Следует, однако, отметить тот факт, что при управлении неопределенной системой информация о переменных (Т,- (г > 1) может отсутствовать, а их оценивание с помощью стандартных наблюдений может оказаться невозможным. Это серьезная и пока не решенная проблема.
Глава 6 Теория операторной обратной связи в данной главе свойства систем стабилизации из главы 3 улучшаются путем использования дополнительной нелинейной обратной связи опе­ раторного типа. Напомним, что "по легенде" операторная обратная связь должна обеспечить "сближение" динамических свойств задатчика и системы управления с координатной и координатно-операторной обратными связями. Подобное сближение требуется осуществить без использования какой-либо информации о факторах неопределен­ ности, а только путем установления дополнительной нелинейной связи между переменными системы. Результатом использования такой не­ линейной связи должно быть повышение качества переходных процес­ сов и уменьшение их зависимости от факторов неопределенности. 6.1. О назначении операторной обратной связи В теории координатно-операторной обратной связи (глава 4) рассмо­ трены различные алгоритмы стабилизации простейшего неопределен­ ного объекта i = 2d^ + b(ji + a (6.1) с неизвестными параметрами, принадлежащими известным множе­ ствам а£А, ЬеВ. Одним из наиболее эффективных и простых в реализации оказался пропорционально-интегргшьно-релейный закон стабилизации sgni dt, (6.2) где ki,k2 — фиксированные параметры обратной связи. Структурная схема соответствующей замкнутой системы (6.1), (6.2) приведена на рис. 6.1 (смысл стрелок на интеграторе в законе (6.2) будет пояснен позднее). Уравнения движения замкнутой системы в пределах линей­ ной зоны интегратора (рис. 6.1) и при постоянных параметрах а и Ь в координатно-операторном пространстве следуют из (6.1), (6.2) и
6.1. о назначении операторной обратной связи 207 имеют вид ^ + (6*2 - 2d)i + 6*1 sgn^ = О, (б.З) xi = —dxi +^xi, откуда ясно, что чем больше коэффициент jfcj (т.е. чем "глубже" ли­ нейная обратная связь), тем выше темп затухания операторной пере­ менной ^. Это и является целью решаемой задачи стабилизации. Но к» »+d Г' 1- а •V. г S -1 .,J sgn Р •^ ^\ b »Ч « t . . f>, аеЛ Рис. 6.1 для фактического управления верно следующее выражение: и = fixi = —к2(г - kixi / sgn {(TXi) dt, из которого видно, что с увеличением параметра *2 растет воздей­ ствие по переменной <т и, следовательно, прочность замкнутой си­ стемы снижается. При увеличении же параметра к\ переходный процесс по оператор­ ной переменной становится колебательным. Поэтому важно изыскать средства, которые: • обеспечат достаточное демпфирование переходных процессов в си­ стеме (6.3) без увеличения коэффициента ki, а быть может, позво­ лят и вовсе отказаться от линейной компоненты в обратной связи (*2 = 0); • позволят устранить колебательность операторной переменной ^, что «есьма желательно по причинам, упоминавшимся выше. Кроме того, если параметр 6 меняется, то закон стабилизации (6.2) неизбежно приводит к статизму по операторной переменной ^, что, как известно, эквивалентно динамическому статизму по основной пе­ ременной XI.
208 Глава 6. Теория операторной обратной связи Отметим, без подробного комментария, что изменения параметра а с ограниченной скоростью, т.е. когда \а\ < const < bki, закон (6.2) допускает. В связи с этим возникает вопрос о принци­ пиальной достижимости сформулированных выше целей упраления и путях их достижения. Можно, конечно, анализируя уравнение (6.1) ^ = 2d^ + bn + а, попытаться угадать соответствующий алгоритм стабилизации опера­ торной переменной ^ в нуле, что, конечно, возможно. Но кажется бо­ лее предпочтительным попытаться воспользоваться рекомендациями общей теории, изложенной в главе 3. Именно, использовать для ре­ шения поставленной задачи операторную обратную связь (далее, для краткости, 0-связь), реализуемую по схеме рис. 6.2. Это вполне есте- Рис. 6.2 ственно, так как с физической точки зрения назначение 0-связи со­ стоит в сближении динамических свойств задатчика 5е и объекта Р^. Понятно, что при наличии такого сближения "легче" управлять объ­ ектом и потому коэффициенты усиления в КО-контуре можно умень­ шить. Если в предыдущей схеме символом Ре обозначить объект опера­ торного типа с выходом /л и входом р, то проблема синтеза оператора 0-связи Rp, по крайней мере в содержательном плане, может быть
209 6.2. Уравнения движения сведена к стандартной проблеме синтеза обратной связи, которую ил­ люстрирует рис. 6.3. Разумеется, при этом проявятся важные особен- . 1 — ^ 1 Р S ц ^ • Rp Рис. 6.3 ности В управлении таким объектом, и прежде всего принципиальна нелинейность его уравнений движения. Поэтому в первую очередь получим уравнения движения исследуемой системы, поскольку пара­ метры d эадатчика Se в схеме на рис. 6.2 теперь переменны и зависят от р, т.е. dp = d{p), и если р = p{t), то dp = dp{t). 6.2. Уравнения движения в пространстве координата-оператор Напомним, что в исходном ( r i , а;2)-координатном пространстве ста­ билизируемый объект описывается следующими уравнениями: XI = Х2, Х2 = axi + bu. Следуя общей процедуре синтеза бинарного управления, введем КО-ошибку сГр = Х2 + dpXi = xi + dpXi, которую впредь будем помечать индексом р, отличая ее тем самым от прежней ошибки <г = хз + dxi. Теперь можно определить в области Gs = { (хьагз) I \<г\ < 5\xi\, S = const } новую операторную переменную ^ = сгр/х1. (6.4) Для перехода к описанию в координатно-операторном, далее, для краткости, КО-пространстве («i,^) потребуется уравнение изменения операторной переменной ^. Дифференцируя выражение (6.4) и исполь-
210 Глава 6. Теория операторной обратной связи зуя равенства х^ = ахх + Ь«, Х2 = <Гр — dpXi, имеем последовательно: с _ ^Р Xl "'р *1 _ iC2 + dpX2 + dpXl Xi Xi Xi X2 ^ Xl _ axi + bu + dp(Tp - rfjzi + dpXi ~ Xl = "p - dpXi Xl Xl Zf. _ = 2rf^ + 6 — + ( a - r f 2 ) + d ^ _ ^ 2 . Xl Если, как и ранее, использовать в главном контуре простейшую бинарную операцию и = fixi и рассматривать стабилизацию в малом, когда можно пренебречь квадратичными членами, то искомые урав­ нения можно записать в следующем виде: xi — -dpXi+ixi, i = 2dp( + bp + a-dj + dp. ^ • ' Эти уравнения отличаются от применявшихся ранее уравнений xi = -dxi+^xi, i = 2d( + bfi + a-d^ зависимостью параметра d задатчика Se от операторной переменной р и наличием производной dp^O ъ правой части (6.5), так как теперь dp = dp{t). Поскольку 0-закон (т.е. функцию р) можно формировать независимо от КО-закона (т.е. функции (х), постольку член dp, по существу, можно интерпретировать как дополнительное управление, привлекаемое для стабилизации 0-переменной ^ в нуле. Практически, однако, удобно синтезировать не производную dp, а при выбранной функциональной зависимости d{p) (например, без потери общности, в виде dp = d + р) оператор 0-связи Rp (рис.6.2) и, в отдельных случаях, оператор КО-связи R,,. Для дальнейшего упрощения уравнения Ре-объекта (рис. 6.3) и по­ лучения его окончательного вида будем считать, что при всех из­ менениях параметр р мал по отношению к d. Это предположение вполне оправдано, более того, нужно стремиться к его обеспечению, поскольку в желаемом режиме стабилизации, когда 'р = О, основная переменная xi изменяется, согласно (6.5), в соответствии с уравне­ нием Xl = -dpXi = -{d + p)xi. Тогда качество переходного процесса близко к эталонному, опре­ деляемому уравнением i j = —dxi, если выполнено упомянутое выше соотношение порядка между параметрами dn р. Но если принять это допущение, то можно приближенно заменить dp = (d + p)^d^ + 2dp.
6.3. Статическая операторная обратная связь 211 Наконец, если, как и ранее, для удобства сначала ввести обозначение а* = а- d\ а затем, для простоты, "звездочку" не указывать (т.е. осуществить замену а* -^ а), то окончательно уравнения движения исследуемого объекта в 0-теории принимают вид XI =-{d + р)х1 + (хи i = 2{d + p)^ + bfi + a-2dp + p, а€А,ЬеВ. (6.7) (6.8) Далее этот объект (6.7), (6.8) для удобства обозначаем символом Pp. Если же рассматривается только второе уравнение Рр-объекта (6.8), то его, как условлено выше, обозначаем символом Pg. Из уравнений (6.7), (6.8) виден нелинейный, точнее билинейный, характер уравнений движения (это обстоятельство принципиально и неоднократно отмечалось выше), но, что важно и что обеспечивает успех всего мероприятия, так это аффинность уравнений движения по управлению (т.е. по паре {fA,p)). Последнее позволяет применять для решения задачи стабилизации методы классической теории ста­ билизации. 6.3. Статическая операторная обратная связь Рассматривая уравнение Ре-объекта i = 2{d + p)^ + bn + a-2dp + p, аеА, be В, нетрудно понять, что обратная связь р = Rp/л может быть статиче­ ской или динамической, в зависимости от вида оператора Rp, однако только во втором случае ввиду наличия производной р в правой части (6.8) КО-связь fi = R^CTp может быть разрывной. Исследование естественно начать с анализа возможностей отрица­ тельной статической 0-связи, когда р = -qfi, (6.9) где q > О — коэффициент усиления 0-связи. Имеем в результате следующие уравнения движения: XI = -{d-qn)xi+ixi, i = 2{d-qn)i-{-bn-\-a-qix, 6 = 64- 2Qd. (6.10)
212 Глава 6. Теория операторной обратной связи После выбора оператора 0-свяэи Rp = —д свободным остается вы­ бор оператора КО-связи R^. Применяя разные операторы R^, по­ лучаем варианты бинарной системы управления с 0-связью. Есте­ ственно начать рассмотрение с простейших вариантов выбора опера­ тора R^. 6.3,1. Статические операторная и координатно-операторная обратные связи При использовании статической КО-связи fi = —Ц, к = const > О второе уравнение движения в (6.10) принимает вид ^ = 2(d -Ь дН)^ - Щ + gki + а. После приведения подобных и выделения главной части имеем сле­ дующее линейное уравнение: если, конечно, 1 > дк. При выполнении неравенства (6- -I- 2gd)k > 2d уравнение асимптотически устойчиво и предельное (т.е. установив­ шееся) значение переменной ^(t) определяется выражением а а ^~ ^ (6 -I- 2gd)k - 2d ^ bk-2d(l-gk)' ^^'^^^ Ошибка ^оо определяет статическую 0-ошибку, которая порождает динамический статизм в основном контуре. Поскольку в пределе основная переменная удовлетворяет уравне­ нию XI = -{d + gk^oo)xi + ^00^1 = -[d+{qkl)^^]xi, то величина упоминавшегося динамического статизма дается следую­ щим выражением: _ а{1-дк) ^°° Ьк - 2d(l - дк) • Стоит заметить, что статическая ошибка в системе (6.10) без Освязи (т.е. при 9 = 0) определяется выражением а ^оо = bk-2d' из сравнения которого с (6.11) следует, что в бинарной системе с Освязью заданная величина динамического статизма достигается при
6.3. Статическая операторная обратная связь меньшем значении параметра к, нежели в бинарной системе без Освязи. Это немедленно следует из того, что 1 bk-2d l-qk > bk- 2d{l - qk)' Действительно, после освобождения от знаменателей имеем сна­ чала, что {Ьк - 2d) + 2dqk > {bk - 2d) - qk{bk - 2d), а после приведения подобных получаем тривиальное неравенство О > -qbk^. Более того, поскольку динамический статизм l-qk С(9) = bk-2d(l-qk) монотонно убывает с ростом параметра q, то величина динамического статизма ^^(з) может быть сколь угодно приближена к нулю при gfc -> 1, хотя нуль недостижим, ибо при g = О все эти уравнения не действуют. Следовательно, • использование статической 0-связи оправдано даже в том триви­ альном случае, когда применяются только статические нелинейные обратные связи. Для содержательной интерпретации последнего вывода полезно по­ лучить выражение для закона управления по основной переменной, т.е. закона, выраженного через исходные переменные Xi, х^. Делая обратную замену ц = —к^ и используя равенство р = —qfi, имеем по­ следовательно : ы = /ill = -k^xi = -ксгр = -к[х2 + (d+ p)xi] = = -k[x2 + {d- qfi)xi ] = -k{x2 + dxi) + qkpxi — -kcr + qku. Разрешая последнее равенство относительно управления и, находим, что ifc u=-а, а = xi + dxi. l-qk Иными словами, построенная нелинейная бинарная система упра­ вления на множестве Gs эквивалентна линейной с коэффициентом уси­ ления и при qk —¥ —I нг1ступает эффект большого коэффициента усиления, хотя во всех контурах системы управления применяются конечные ко­ эффициенты усиления. Этот эффект является прямым результатом использования нелинейности и положительной обратной связи. 213
Глава 6. Теория операторной обратной связи 214 Структурная схема рассмотренной системы приведена на рис. 6.4. Напомним, что эта схема работоспособна только при ограничении р »+d —1 р==Ф -к =: \м •» а f ("— ^~] и a^i b WasA Рис. 6.4 \<т\ < 6\xi\. Фазовый портрет в координатах (xi.xj) этой системы управления в пределах множества Gs приведен на рис.6.5, на кото­ ром колебания относительно линии «г = О отсутствуют. К недостат­ кам этой схемы следует отнести наличие в регуляторе внутреннего статического контура (выделен на рис. 6.4) обратной связи. Это при- '• ст=0 Рис. 6.5 ВОДИТ К негрубости системы, ибо влияние неопределенной динамики может привести к нежелательным последствиям: колебаниям или не­ устойчивости. Поэтому следует подумать над способами повышения прочности системы со статической 0-связью.
6.3. Статическгм операторная обратная связь 215 6.3.2. Статическая операторная и динамическая координатнсьоператорная обратные связи Изучим теперь возможность стабилизации Ре-объекта i = 2{d + p)i-\-bn-¥aаеА, 2dp + p, b€B, с помощью статической 0-связи р = —qfi, q = const, и различных видов динамической К 0-связи /1 = R^a, где R^ — дифференциальный, интегральный или какой-либо иной опе­ ратор динамического преобразования. После исключения р получаем уравнение стабилизируемого объ­ екта, зависящее только от КО-закона управления в следующем виде: ^ = 2(d-qfi)^ + biJi + a-qtt, b = b + 2qd. (6.12) Прежде всего рассмотрим случай, когда используется координатнооператорная связь другого вида. 6.3.3. Инерционная координатно-операторная обратная связь В этом случае параметр b Е В предполагается известным, поэтому КО-закон можно взять, например, в виде qfi — bfi = к^, к = const > 0. (6.13) При выполнении неравенств g < О, 6~ = Ь~ -I- 2qd > О этот КО-закон естественно назвать инерционным, так как передаточная функция от ^ к ц имеет вид инерционного звена (рис. 6.6а или, более подробно, рис. 6.66). После подстановки (6.13) в (6.8) получаем уравнение заМ q S к ^ • Л^^ •^ Л * - • b qs-b б Рис. 6. 6 к 4
216 Глава 6. Теория операторной обратной связи мкнутой системы в виде qfi-b~ к^. В положении равновесия (/iooi^oo) этой системы выполнены равенства 2(d-?^ioo)^oo +а = к^оо, разрешая которые с точностью до величин порядка 1/к получаем с ~ а „ji к-2d' ,, с^ '^^ 400 — , А*оо — к ~ п bk-2d Для анализа устойчивости этого положения равновесия в матом запишем уравнения движения системы (6.14) в отклонениях 6=^-^оо, Ь = И-Иоо, удерживая лишь члены первого порядка малости. После элементарных преобразований получим уравнения 6 = -(fc-2d)6, 6 = - 6 + - 6 , Ч Я из анализа которых легко усмотреть, что точка (/ioo,^c») асимптоти­ чески устойчива, если k>2d, b= b+ 2qd>0. Для определения предельного движения основной координаты xi воспользуемся первым уравнением системы (6.10). Получаем XI = -(d - qfioo)xi +^00^1 = -{d-qHoo -^00)^1- Следовательно, число определяет в этом случг1е величину статизма. Устремлением параме­ тра ^: -^ 00 устранить этот статизм невозможно, так как г е* - ^ °g к^'^°°~ ь ~ b + 2qd' Однако уменьшением параметра q его можно сделать произвольно ма­ лым, хотя устранить вовсе таким путем нельзя, так как q > 0.
6.3. Статическая операторная обратная связь 217 Структурная схема исследованной системы стабилизации приве­ дена на рис. 6.7. Напомним, что она действительна только при огра­ ничении \<т\ < S\xi\. Рисунок с проекциями фазовых траекторий этой s+d ^-2-^=J= ^ qs-Ъ ' Ф=^ ё $•'+« 1ГоеЛ Рис. 6.7 системы на множество Gs в плоскости («1,352) подобен рис. 6.5 и по­ этому не приводится. i Поскольку прочность этой системы из-за наличия динамики в 0 контуре не вызывает сомнений, то можно констатировать, что • в рассмотренной бинарной системе поставленная задача стабилиза­ ции решается непрерывным управлением сколь угодно точно и ко­ лебания фазового вектора относительно линии <т = О отсутствуют. Однако для реализации требуется знать параметр 6 £ JB, да и сама реализация сложна, так как требует операции деления. Для преодо­ ления этих недостатков рассмотрим иной вид КО-связи. 6.3.4. Инерционно-релейная координатно-операторная обратная связь Вновь будем считать параметр 6 € S известным и определим КОсвязь уравнением вида qft — bfi = кsgn^, А: = const > 0. (6.15) При замыкании такой обратной связью Ре-объекта i = -2{d-qn)^+'b,i-i-a-qfi получаем замкнутую систему стг^билизации со следующим уравнением движения: ^ = 2{d - qfi)^-кsgni +а. (6.16)
218 Глава 6. Теория операторной обратной связи Удобство КО-закона (6.15) состоит в том, что при g < О пере­ менная fi автоматически ограничивается по модулю, что, безусловно, полезно, так как и = fixi и в главном контуре управления перемен­ ная ц выполняет функцию коэффициента усиления, который, как из­ вестно, по соображениям прочности нужно ограничивать. Отметим, что этого эффекта не было в других системах с рассмотренными КОзаконами, и в них это ограничение нужно обеспечивать специально. Подробнее об этом позже, а сейчас приведем структурную схему, объясняющую название закона (рис. 6.8). Поскольку переменная fi Рис. 6.8 ограничена, то из анализа уравнения (6.16) очевидно, что при достаточно большом значении параметра ifc, именно к > а, в точке ^ = О возникает скользящий режим. Для определения уравнения движения в скользящем режиме сначала из уравнений ( = О, ^ = О находим эквивалентное значение разрывного элемента затем найденное значение подставляем в уравнение (6.15) изменения переменной (л и получаем следующее уравнение движения: qfi — bfi = а. (6.17) Это уравнение устойчиво при g < О и при фиксированном параметре а имеет положение равновесия /*<» = -а/ЬТеперь можно установить уравнения движения системы в сколь­ зящем режиме. Поскольку при ^ = О для основной переменной xi действует уравнение XI =-{d - qii)xi, (6.18) то в скользящем режиме это уравнение должно быть дополнено урав­ нением (6.17). Если, однако, параметр q достаточно мал, то можно считать, что fi{t) 2 ^оо, и уравнение (6.18) упрощается (используем замену 6 = 6-1- 2ad) до следующего уравнения: XI = -{d - qiioo)xi = -{d-\-qa/b)xi.
6.3. Статическая операторная обратная связь 219 Из последнего уравнения, в частности, следует, что динамический статизм определяется равенством и может быть сделан сколь угодно малым путем уменьшения параме­ тра q. При этом статизм неустраним вовсе, ибо значение 9 = О не допускг^ется. Поэтому проекция хода фазовых трг1екторий этой си­ стемы на множество Gs в плоскости (х\,Х2) подобна изображенной на рис. 6.5Для пояснения физического эффекта, эксплуатируемого в рассма­ триваемой системе стабилизации, полезно записать алгоритм стаби­ лизации в исходных переменных. Поскольку в скользящем режиме ^ = О, а <Тр = ixi, то и (Т^ = 0. Но « = /xii, и, следовательно, <Тр = xi-\- dx\ — qfixi = <r — qu = 0. Таким образом, имеет место равенство и = tr/q, которое означает, что в скользящем режиме исследуемая нелинейная обратная связь эквива­ лентна линейной с коэффициентом усиления 1/q, который может быть сделан сколь угодно большим q —> —О, что и обеспечивает решение за­ дачи стабилизации. чм-ьм к —» чм-ьм 2Д(г) О о-=0 Рис. 6.9 Рис. 6.10 Действительно, в этом случае в исходных переменных система опи­ сывается уравнениями XI = Х2 Х2 = axi + i(x2 + dxi) и при g -> о ей отвечает фазовый портрет на рис. 6.9. Таким образом, • предложенная обратная связь решает поставленную задачу стаби­ лизации сколь угодно точно, но с неустранимым динамическим статизмом. При этом колебания операторной переменной ^ устраняются полно­ стью (^ = 0), а коэффициент передачи к уменьшается по сравнению с предыдущим законом.
Глава 6. Теория операторной обратной связи 220 Нетрудно также понять, что эта система прочна. В самом деле, пусть имеется запаздывание г > О в переключениях, т.е. вместо за­ кона (6.15) имеем дело с КО-законом вида q^ — bfi = к sgn т ^, /г = const > 0. (6.19) В координатах (g/i — bfi,^) уравнениям (6.15) и (6.19) соответствуют графики на рис. 6.10, откуда немедленно следует оценка |^| < Д(г), что и означает прочность системы, так как Д('') —> О при г -> 0. Структурная схема синтезированной бинарной системы приведена на рис. 6.11, и для сравнения на рис. 6.12 дана схема, эквивалентная ей при возникновении скользящего режима. Из сравнения рис. 6.7 и 6.11 / t+d Xi or b ' 1 u НаеЛ Рис. 6.11 Рис. 6.12 видно, что последняя система стабилизации при тех же возможностях проще в реализации. Следует, однако, позаботиться о дальнейшем ее упрощении и, если это возможно, исключить использование информа­ ции о параметре 6 6 В.
6.3. Статическая операторная обратная связь 221 6.3.5. Инерционно-релейная координатно-операторная обратная связь при неизвестном параметре при упрхшлении В этом пункте для стабилизации Ре-объекта (6.8) ^ = 2 ( d - g / i ) ^ + b / i - | - a - g / i , b = b + 2qd аеА, be В, применяется инерционно-релейная КО-связь вида qfi — b~fi = ksgn^, к = const > О, b- =b- + 2qd, (6.20) которая может быть использована и тогда, когда значение параме­ тра 6 неизвестно. Отметим, что допускаются изменения неизвестных параметров а, 6 во времени произвольным образом. Структура ре­ гулятора (6.20) совпадает со структурой регулятора на рис.6.8 при замене 6 на 6~. Подстановка (6.20) в (6.8) дает уравнение замкнутой системы в следующем виде: i = 2{d- qn)i + (6 - b-)ii -ksgni + a. (6.21) Поскольку и в этом случае переменная ц равномерно ограничена (при g < 0), то, очевидно, существует такое число а", что при fc > а° в точке ^ = О возникает скользящий режим. В скользящем режиме можно считать выполненными равенства ^ = 0, ^ = 0, тогда из уравнения (6.21) эквивалентное значение разрывного сигнала определяется в виде ^sgneq^ = a - | - ( 6 - 6 " ) / j . После подстановки этого значения в уравнение регулятора (6.20) находим уравнение движения операторной переменной /i в скользящем режиме g / i - 6 / i = a, (6.22) которое в точности совпадает с уравнением скольжения для перемен­ ной /* из предыдущего пункта. Поэтому верны все сделанные ранее выводы и, в частности, о том, что уравнение скольжения по основной переменной после окончания переходного процесса уравнения (6.22) дается выражением XI = -{d + qa/b)xi. Следовательно, • и в этом случае имеет место неустранимый (хотя и сколь угодно малый при q —> —0) динамический статизм.
222 Глава 6. Теория операторной обратной связи Сохраняются также все замечания и о прочности системы управления, и о физическом смысле эффекта компенсации возмущений а, Ь. Ход проекций фазовых траекторий на множество Gt в плоскости {xi,X2) показан на рис. 6.5, а для получения структуры системы до­ статочно в схеме на рис. 6.11 заменить параметр 6 на 6~ и добавить двойную стрелку J^ 6 € В, действующую на объект Р и отражающую влияние фактора неопределенности. Достоинство регулятора (6.20) состоит в том, что он эффективно действует при любых неизвестных параметрах а^ А,Ь ^ В. 6.3.6. Интегрально-релейная координатно-операторная обратная связь Максимально возможное упрощение системы управления достигается при использовании интегрально-релейного закона g/i = Jk8gn^. (6.23) В этом случае замкнутая система управления описывается (6.23) и уравнением ^ = 2((f-?/i)^-|-6/i-»-a-Jtsgn^, b = h-{-2qd. (6.24) При возникновении скользящего режима можно считать выполнен­ ными в надлежащем смысле равенства а поэтому эквивалентное значение разрывного сигнала имеет следую­ щее значение: После его подстановки в уравнение регулятора (6.23) находим точные и асимптотические уравнения скольжения для переменных /i и zi в виде известных уже из предыдущего выражений qii-bn = a, xi = -{d-qn)xi- tioo=-a/b, xi = (d + qa/b) xf, -{d+qa/b)xi. Поэтому справедливы все выводы, сделанные в пунктах 6.3.4 и 6.3.5. Единственная трудность в проведенном рассуждении состоит в том, что факт возникновения скользящего режима в точке ( = О не просто усмотреть из уравнений замкнутой системы (6.23), (6.24). По­ скольку нас интересует анализ в малом, то этот вопрос^можно иссле­ довать с помощью функции Ляпунова вида « = (1/2)^ (6.25)
6.3. Статическая операторная обратная связь 223 Действительно, полагая для простоты, что параметры а,Ь = const, после дифференцирования функции (6.25) в силу уравнений движения (6.23), (6.24) находим v = i = ^[2(d- qn)i + bfi + a- asgn^] = (6.26) = 2{d-qfi)e-\^\[d-(b(i + ^)4t^a Далее заметим, что в положении равновесия ^ = О, 1/1 + 0 = 0, поэтому в его окрестности в (6.26) доминирует член —d|^|. Следова­ тельно, существует число 7 > О такое, что 11 < -7lf I = -7\/2и = -7*>А. Решая последнее дифференциальное неравенство, находим оценку из которой следует, что в некоторой окрестности положения равнове­ сия скользящий режим всегда возникает через конечное время, что и требовалось доказать. Структурная схема синтезированной бинарной системы управле­ ния представлена на рис. 6.13. Пожалуй, она наиболее простая из всех рассмотренных ранее, причем основные стабилизирующие свойства сохраняются. •+d P-,—, X. <r „ J' г- > 1 - J ' -i • -1 sgn _I —i^— q M (Ч ,; , Xi Рис. 6.13 и b ¥ [ , sA
224 Глава 6. Теория операторной обратной связи Проведенное исследование показало, что с помощью 0-связи можно значительно повысить качество переходных процессов бинарной си­ стемы управления, в частности: • • устранить колебательность фазового вектора в множестве Gs; повысить прочность системы управления путем уменьшения ко­ эффициентов передачи в главном канале и, более того, вовсе отка­ заться от использования в КО-законах демпфирующей компоненты м = -Ы; • понизить размерность замкнутой системы на 2 порядка, напри­ мер с 3-го до 1-го (при сочетании с динамической разрывной КОсвязью); • сколь угодно точно достигнуть (правда, в ущерб прочности) тре­ буемого качества переходных процессов. При этом статическую 0-связь неизбежно сопровождает статизм (ди­ намический статизм в основных переменных), что, впрочем, есте­ ственно для любой статической обратной связи. Вопрос об исполь­ зовании динамической 0-связи здесь не затрагивается. В следующей главе используем ОК-связь для устранения указанного статизма.
Глава 7 Теория операторно-координатной обратной связи Данная глава посвящена качественному исследованию бинарных си­ стем автоматического управления с разными типами обратной связи. Потенциально подобные нелинейные динамические системы стабили­ зации должны обладать самыми совершенными свойствами, близкими к тем идеальным, которые можно наблюдать у систем управления с глубокой обратной связью. Однако, в отличие от последних, бинарная система стабилизации прочна в классе регулярных и сингулярных воз­ мущений. Пожалуй, эта глава в наиболее полной степени демонстри­ рует использование эффекта нелинейности в задачах стабилизации су­ щественно неопределенного объекта. Итоговые уравнения движения системы стабилизации принципиально нелинейны, достаточно сложны и обладают глобально устойчивыми решениями, которые мало зависят (а в некоторых случаях не зависят) от факторов неопределенности и могут быть описаны простейшими дифференциальными уравнениями. Подобные нелинейные уравнения есть прямой результат применения разработанной в монографии теории.О возможности получения подобных уравнений другими методами сегодня ничего неизвестно. 7.1. Динамический с т а т и з м и операторно-координатная обратная связь В предыдущих главах было установлено, что стабилизация в нуле не­ определенного объекта XI = Х2, Х2 = axi +bu, а G А, b Е В, с помощью трех типов обратной связи (рис. 7.1), достигается при лю­ бых, в том числе и переменных, параметрах объекта а Е А, b € В. При этом в множестве Gs = {x\ \(T\<S\xi\} предельное движение описывается уравнением XI = -(d + poo)xi,
226 Глава 7. Теория операторно-координатной обратной связи В котором число роо определяет динамический статизм Роо = -qa/kb, 6 = 6 - 2qd, отклоняющий это предельное движение от эталонного движения, за­ данного уравнением xi = ~dxi (рис. 7.2). аеА,ЬеВ Рис. 7.1 Рис. 7.2 Статизм можно устранить устремлением Аг -> оо, но это понижает прочность системы управления. Можно, напротив, устремить пара­ метр ? -> О, что не исключается, но в пределе (т.е. при g = 0) 0-связь размыкается, а без этого для достижения аналогичного качества пе­ реходного процесса нужно увеличивать коэффициенты усиления либо согласиться на колебания фазового вектора относительно многообра­ зия <т = 0.
227 7.1. Динамический статиэм Стоит отметить, что устремление параметра 5 -> О, как это сле­ дует, например, из уравнения интегрально-релейного КО-регулятора fi=-8gn ^, я означает, по существу, введение глубокой обратной связи в КО-контуре регулирования, так как при этом k/q -¥ оо. Это, как известно, ведет к потере прочности и, хотя значения скрытых параметров в регуляторе можно считать меньшими, нежели значения скрытых па­ раметров в объекте, и, следовательно, критическое значение коэффи­ циента усиления этого контура, при превышении которого требуется устойчивость, выше, тем не менее в принципиальном плане следует поискать новые средства для точного решения рассматривг^мой за­ дачи стабилизации. Важно также отметить, что в системах со статической 0-связью и разрывной КО-связью при возникновении скользящего режима упра­ вление в главном контуре описывается выражением и = (k/q) (т, и хотя, быть может, k/q > ксг, неустойчивость не наступает. Обосно­ вание этого факта почти очевидно и здесь не приводится. Для устранения динамического статизма воспользуемся операторно-координатной обратной связью или, коротко, ОК-связью, охваты­ вающей объект управления по схеме рис. 7.3. В этой структуре подле- \ Sd " > Rv dp _ е ( 5е И - ^ - Ч 1 RM 1==Т1 Ч|— =Ц jH 1 , "Р |^= 1 Pjr ——® У* '""V Sy У Р^ и' [аеЛ.беВ Рис. 7.3 1
228 Глава 7. Теория операторно-координатной обратной связи жат заданию или синтезу операторы 0-задатчика Sd и ОК-регулятора Rf,. Напомним, что dp = d{p). Выделенная часть схемы на рис. 7.3 является типичным ОК-объектом, и поэтому рассматриваемую за­ дачу укрупненно иллюстрирует рис. 7.4. Поскольку эта схема стан- Sd с>5е=Ф Rv Рис. 7.4 дартна для теории обратной связи, то и методы решения задачи могут быть стандартными. 7.2. Уравнения движения операторно-координатного объекта Исходные уравнения объекта в координатном пространстве имеют те­ перь следующий вид: XI = Х2, ае А Х2 = axi + b{u + v), (т = сх\ + Х2, b £ В. Здесь наличие ОК-связи отражено компонентой v в управлении. После введения, с учетом действия 0-связи, ошибки (Гр = Х2 + dpXi и операторной переменной ^ = <Тр1х\ в множестве действуя стандартным образом (см. главы 4, 6), находим уравнение изменения операторной переменной в множестве d, которое в первом приближении имеет следующий вид: ^ = 2dp^ + 2dp + p + a + b и +V Хх (7.1) Положим, как обычно, бинарную операцию в К-контуре статической: и = P^{fx,xi) = fixi,
7.3. Статический ОК-регулятор 229 аналогично распорядимся выбором бинарной операции в ОК-контуре: где, как принято выше, /х и »/ — операторные переменные. При таком выборе уравнение (7.1) принимг1ет следующий вид: i = 2df^ + 2dp + p + a + b(fi + r)), (7.2) где ц и Г) можно рг1ссматривать в качестве управлений. Сохраняя преемственность, положим 0-связь статической: р = —qfi, q = const, а воздействие на параметр 5е-задатчика — адаптивным: dp = d + р. Тогда при интегрально-релейном КО-регуляторе qfi = kisgn^, Ari = const, уравнение изменения операторной ошибки ^ (7.2) примет вид i = 2{d-q(i)^ + bii-kisgn^ + a + bT}, b = b-2qd. (7.3) Уравнение (7.3), дополненное уравнением изменения основной пе­ ременной ii = -{d + p)xi+^xi, (7.4) и уравнение ОК-регулятора т] = R^y, (7.5) где ОК-ошибка регулирования i/ = df,-d = p, (7.6) я R,, — оператор ОК-регулятора, описывают в множестве Gg замкну­ тую систему регулирования с четырьмя типами обратной связи. По­ скольку i> = ^ = - * i s g n ^ , (7.7) то нужно позаботиться о надлежащем выборе оператора Д,,, гаран­ тирующего стабилизацию ошибки i/ в нуле. Ргьссмотрим некоторые варианты. 7.3. Статический ОК-регулятор Пусть оператор R,j в (7.5) является простейшим линейным операто­ ром, т.е. т] = k^v- Тогда надлежит исследовать на устойчивость следу­ ющую систему уравнений, для удобства обозначаемую символом Е*^: i = 2(d- qn)i + bn-ki sgn^ -|- kibu + a, i> = - * i s g n ^ . (7.8) (7.9)
230 Глава 7. Теория операторно-координатной обратной связи Поскольку и = р, р= —9А«, то после введения обозначения 6* = (1 - 9*2)6 - 2qd, эту систему можно переписать в более удобном виде ^ = 2(d - qfi)^ + ЬУ - ki sgn^ + а, i>= -kisgn^. Уравнения, подобные уравнению (7.8) Е'-системы, подробно иссле­ довались в главах 4, б, поэтому можно утверждать, что при выполне­ нии неравенства fci > а° в точке ^ = О возникает скользящий режим. Поскольку при этом, кроме того, в определенном смысле ^ = О, то эквивалентное значение разрывного сигнала определяется следующим выражением: *isgneq^ = 6*/i + a. После подстановки этого выражения в уравнение (7.9) Е'^-системы находим уравнение изменения 0-ошибки i/ в виде i> = —b*fi — a. В силу того, что и = р= —qf^, окончательно имеем уравнение для ошибки i/: й = —и-а. <7.10) Я Поскольку b*/q < О, то уравнение (7.10) асимптотически устойчиво и имеет положение равновесия в точке j/<« = | ^ , b' = (l-qk2)b-2qd. Следовательно, • статическая ОК-связь не устраняет динамический статизм, а лишь несколько уменьшает его величину по сравнению с рассмотрен­ ными выше системами управления. Действительно, например, в системе со статической 0-связью вели­ чина статизма давалась выражением Роо = qa/b, 6 = 6 — 2qd, но так как 6* > 6, то очевидно имеем требуемое I/QO < Роо • Увеличением ^2 —> оо можно устранить статизм I/QO, НО при этом будет нанесен ущерб прочности системы. Действительно, в этом слу­ чае вторая компонента управления линейно связана с основным упра^ влением V = r]Xi = k2i^xi = —qk-iliXi = —qki^ и полное управление и' = и -\- v также пропорционгшьно основному управлению u' = {\-qk2)u. (7.11)
7.4. Интегральный ОК-регулятор 231 Последнее как раз и означает, что действие статического ОК-регулятора эквивалентно увеличению в (1 — 9^2) раз коэффициентов пе­ редачи КО-регулятора, что, как отмечалось ранее, понижает проч­ ность системы управления. Формула (7.11) также проясняет эффект от использования статического ОК-регулятора. Описанную систему 900 1 Рис. 7.5 иллюстрирует рис. 7.5, на котором показан ход проекций фазовых траекторий системы на множестве Gg после возникновения скользя­ щего режима. 7.4. Интегральный ОК-регулятор Из классической теории регулирования известно, что статизм устра­ няется применением интегральной обратной связи, поэтому рассмо­ трим ОК-регулятор следующего вида: Г) = —k2U, ^2 = const. (7.12) Уравнение (7.12) вместе с уравнениями КО- и 0-регуляторов qfi = ki sgn^, p=-qn, ki = const, (713) 9 = const, (7.14) уравнениями бинарных элементов и'= u-\-v =: цх1-\-Г1Х1 = {ц + г))х1, (7.15) а также уравнениями движения объекта в КО-пространстве (xi,^) xi = -{d-{-p)xi+^xi, i = 2(d + p)(, + bn + 2dp-irp + br) + a, (7.16) а G Л, 6 € 5 , (7.17) задает поведение замкнутой системы управления с четырьмя типами обратной связи на множестве Gs.
Глава 7. Теория операторно-координатной обратной связи 232 Как и ранее, полагаем v = dp — d = p, ^xi = a, а =: xi + dxi, (7.18) = xi + d+pxi. (7.19) Структурная схема исследуемой бинарной системы приведена на рис. 7.6. (выделен синтезированный нелинейный динамический ре­ гулятор второго порядка, полный порядок замкнутой системы ра- ^ • г— 1 S+ 0 1 ня 1Г 1 ор л 9 1 , 1 ~ . М—J-1 , _п -ч 1—1 ?п •'» к. - окS КО- ч* и /^ ч, =¥^=i и' у • S+ C 1 ^1 Ь Мое л , ЬеВ Рис. 7.6 вен четырем). Задача теперь состоит в таком выборе параметров системы, при котором гарантируется стабилизация переменной х\ в нуле при асимптотически исчезающей зависимости переходного про­ цесса от неопределенных (для простоты — постоянных) параметров а е Л, 6 е В. Для анализа поведения синтезированной бинарной системы обра­ тимся к уравнениям изменения операторных переменных (^, /i, rj). После подстановки соотношений (7.17), (7.14) в (7.12) и (7.13), (7.14) в (7.17) получим в итоге совокупность дифференцигшьных уравнений, описывающих так нгкзываемую Е^-систему: i = 2{d- qy.)(, -I- 6/i - fci sgn ^ + Ь»7 -I- а, qii = kisgn(„ •q = qk2H. 6 = 6 - 2qd, (7.20) Довольно ясно, что положение равновесия Е;-системы находится в точке (^оо./^оо,»?»)) = (О, О,-а/6).
7.4. Интегральный ОК-регулятор 233 Убедимся, что в малой окрестности положения равновесия за ко­ нечное время в точке £ = О возникает скользящий режим. Для этого достаточно умножить почленно первое уравнение Ef-системы на £ и получить выражение ^i = -h\^\ + 2(d- qti)e + bfii + brji + ai, из анализа которого прямо следует, что при выполнении условия кг >а° существуют такие константы а, /? > О, что в окрестности выполнено неравенство которое эквивалентно дифференциальному неравенству ^ < -asgn£. Из приведенных неравенств следуют утверждение о возникновении скользящего режима в точке £ = О за конечное время и сходимость в Gi к нулю основной переменной xi, так как из (7.16) имеем уравнение XI = -(d + р)х1. Однако этого мало, поэтому продолжим исследование. В скользящем режиме, как обычно, из равенств £ = £ = О опреде­ ляем эквивгшентное значение разрывного сигнала в виде ^isgneq£ = b/i + b»?+a. После подстановки найденного эквивалентного управления в уравне­ ния (7.20) Е^-системы получаем следующую совокупность дифферен­ циальных уравнений Е^-системы: Положение равновесия Е^-системы находится в точке (О, —а/Ь), которая, естественно, совпадает с точкой (//со > 'Поо)- Устойчивость по­ ложения равновесия определяется асимптотическими свойствами ди­ намической системы fi.= 'Ц+ Ч -t), Ч T) = qk2H- (7.22)
234 Глава 7. Теория операторно-коордииатной обратной связи Система (7.22) асимптотически устойчива тогда и только тогда, когда гурвицев ее характеристический полином <p{s) = det {sE -А) = det s - Ь/q -b/q -qk2 s = s^ s + kib. Последнее имеет место при выполнении неравенств b/q < О, Лз > 0. Заметим, что степень устойчивости системы (7.22) увеличивгьется при q —¥ О, т.е. назнач£1ется по произволу без изменения коэффициентов передачи главного К-контура регулирования. Кроме того, из (7.14) и (7.18) следует равенство v = —qn, и поэтому j / —> О, когда /i —^ 0. Таким образом, интегральный ОК-регулятор решает поставленную задачу об асимптотическом устранении с произвольным темпом ди­ намического статизма. Выбирая надлежащим образом свободные параметры дифферен­ циального уравнения i/ — и b/q + k2b = О, определяющего изменение 0-ошибки 1/, можно добиться колебательных (рис. 7.7а) или аперио­ дических (рис. 7.76) переходных процессов. В соответствии с этим определяется и характер переходных процессов в исходном коорди­ натном (а;1,а;2)-пространстве (рис. 7.8). Рис. 7.7
7.5. Основные свойства и особенности бинарных систем 235 7.5. Основные свойства и особенности бинарных систем стабилизации с различными типами обратной связи Перечислим основные свойства и особенности бинарных систем ста­ билизации с различными типами обратной связи. О т л и ч и е о т и д е н т и ф и к а ц и о н н о г о п о д х о д а . В рассмо­ тренной бинарной системе нет даже косвенного эффекта идентифи­ кации. Отсутствие идентификации следует из формулы и принципиально отличг1ет предложенную схему управления от адап­ тивного подхода. Э ф ф е к т , лежащий в основе компенсации неопреде­ л е н н о с т и . По формуле (7.15) сигнал управления и' =:u + v = (fi-hrj)xi= -Н)' 11 + -\цх1. (7.23) с другой стороны, в скользящем режиме ^ = О, что эквивалентно по формуле (7.19) равенству <Гр = х1 + dxi + pxi = 0. (7.24) Но ^ = —qfi (см. (7.14)), и поэтому из (7.24) получаем следующее соотношение: XI + dxi <т fiXi = = -. Я Ч Подставляя последнее соотношение в (7.23), находим "-(-д)?По доказанному выше, »7 -> т/оо = -а/Ь, /i -> О, а значит и отношение т;//* —> оо. Иными словами, • интегральный ОК-регулятор обеспечивает эффект неограничен­ ного нарастания коэффициента воздействия по ошибке регулиро­ вания (Т = i i -I- dx\, т.е. ( - ^ ) ^ -> 00, t -> 00. Последнее полностью проясняет эффект компенсации факторов не­ определенности в привычных для теории регулирования терминах.
236 Глава 7. Теория операторно-координатной обратной связи О п р о ч н о с т и б и н а р н о й с и с т е м ы . Синтезированная бинар­ ная система (в силу использования конечных коэффициентов пере­ дачи) прочна, так как динамические или функциональные неидеаль­ ности приводят лишь к отклонению переменной ^ от нуля, т.е. |^| < Д, Д = const < S. Последнее, очевидно, не нарушает асимптотических свойств системы в исходных переменных (хг.хг)О стабилизации объекта с переменными параметра­ м и . Изменение во времени параметра Ь ^ В принципиально не ме­ няет описанной выше картины, так как уравнения движения при этом остаются прежними. Следует, однако, отметить, что при доказатель­ ствах устойчивости предпочтительнее использовать второй метод Ля­ пунова, а не операторные методы и преобразование Лапласа, как ра­ нее. Если же меняется параметр а £ А, то все уравнения движения также сохраняются, однако меняется их асимптотика. Так, например, Ef-система (7.21) qft = bfi + Ьт] + а, т) = qhfJt из асимптотически устойчивой превращается в диссипативную, т.е. за конечное время ее решение погружается в инвариантный шар /^•^ + (Ьт) -f- а)^ < const. Поскольку I/ = р = —qfi, отсюда следует диссипативность и по i/, т.е. |f I < const. Это означает, что устранение динамического статизма не гарантируется. Но этого и следовало ожидать, так как интегральный закон аннулирует только постоянные возмущения, для аннулирования произвольного волнового возмущения Ка = О, как известно, в регуля­ торе следует применять оператор К~^ — обратный к аннулирующему оператору К. О п о р я д к е з а м к н у т о й с и с т е м ы у п р а в л е н и я . Из струк­ турной схемы замкнутой системы, приведенной на рис. 7.6, видно, что исходный порядок системы равен четырем. После возникнове­ ния скользящего режима в 0-регуляторе он понижается на единицу и описывается следующими уравнениями: qii = bfi + btj + a, Ti = qk2fi ii = -{d-qfi)xi. Если степень устойчивости Е^-системы установить много больше чи­ сла d, а это всегда возможно выбором параметров регулятора, то ее движения можно считать быстрыми по отношению к основному дви­ жению XI = -dxi (7.25)
7.6. Разрывная ОК-связь 237 и, следовательно, фактически порядок замкнутой системы равен еди­ нице. Иными словами, сложная неопределенная нелинейная система в итоге ведет себя как скалярная система (7.25). Подчеркнем, однако, что это драматическое понижение порядка справедливо только в асимптотике. Если же принять разрывную ОКсвязь, то того же эффекта можно добиться финитно, т.е. за конечное время. 7.6. Разрывная ОК-связь Из предыдущего рассмотрения ясно, что интегральный ОК-регулятор устраняет динамический статизм лишь в асимптотике и не га­ рантирует этого при переменных параметрах а £ А, Ь £ В. Поэтому рг1ссматриваемая в данном пункте задача такова: • предложить эффективные методы финитного устранения динами­ ческого статизма, работоспособные и при переменных параметрах объекта. Из классической теории регулирования известно, что при отсут­ ствии информации о характере изменения возмущения для этой цели могут применяться: большой коэффициент усиления, разрывная (ре­ лейная или СПС) обратная связь. Увеличение коэффициента усиления понижает прочность системы управления, поэтому исследуем возможности разрывной ОК-обратной связи при решении сформулированной задачи. 7.6.1. И н т е г р а л ь н о - р е л е й н ы й О К - р е г у л я т о р В этом случае уравнение ОК-регулятора имеет вид т] — —ki sgn I/, (7.26) чему соответствует структурная схема на рис. 7.9, проясняющая на- sgn Рис. 7.9 звание регулятора. Уравнение (7.26) вместе с уравнением изменения 0-переменной ^ ^ = 2<fp^ -I- 6/i - Ai sgn^ -(- 6г7 -I- а (7.27) и уравнением КО-регулятора (7.28)
Глава 7. Теория операторно-координатиои обратной связи 238 определяют, с учетом равенства I/ = (7.29) -gfi, исследуемую замкнутую систему дифференциальных уравнений. Если уравнения (7.2б)-(7.29) дополнить уравнением изменения основной пе­ ременной xi = -{d + p)xi+ixi, (7.30) в котором использованы переменные ^Xi = (Т, <Т = Xi + dXi, <Тр=: <Т +pXi = Xi+dpXl, то получаем уравнения движения замкнутой системы бинарного упра­ вления Ед на множестве Gs- Структурная схема исследуемой бинарь ной системы управления Ед приведена на рис. 7.10. В предваритеЛь- ГР>:^? -1 s+d •Я— _}^Тгг -q £ sgn »+с *<Й **+» 1 aeA.bsB Рис. 7.10 ном порядке отметим, что в этой системе есть два разрывных эле­ мента в КО- и в ОК-регуляторе. Поэтому возможно возникновение скользящего режима не только в 0-контуре, как ранее, но и в ОКконтуре. Именно этот план компенсации возмущения и принят при дальнейшем анализе. Рассматривая уравнения (7.2б)-(7.29), убеждаемся, что положение равновесия исследуемой системы находится в точке ^оо = 0 , fiao = о, Ьг)оо = -а.
7.6. Разрывная ОК-связь 239 Поэтому, анализируя уравнение i = 2dp^+ Ь(л - ki 8gn ^ + Ьт] + а, b = b-2qd, (7.31) убеждаемся, как и во всех аналогичных случаях ранее, что при выпол­ нении условия fci > а" в точке ^ = О существует скользящий режим со следующим эквивалентным значением разрывного сигнала: *'isgneq^ = b/i-|-6r; + a. После подстановки найденного эквивалентного значения в уравне­ ние КО-регулятора (7.28) получаем 2д-систему уравнений, подлежа­ щую дальнейшему анализу: ri = -k2agnfi. Для анализа этой Ед-системы удобно положить 6 = const и сделать замену переменного по формуле е = Ьт) + а, тогда ее уравнения движения примут вид g/i = 6/i-|-e, ё = -k2Sgnfi + a, и положение равновесия переместится в нуль: (/i = 0,e = 0). Если предположить, что ЛгЬ > sup |d|, t>o то качественные поведения Ед-системы и системы, описываемой урав­ нениями 9A = 6/i + e, (7 33) ё = —k2bsgnfi, совпадают, поэтому далее имеем дело с более простыми уравнениями (7.33), считая впредь, что они и задают Ед-систему. Напомним, что Ед — релейная система. Подобные системы уже подробно рассматривались нами ранее, поэтому просто воспользуемся результатами проведенного анализа в первой части монографии (см. главу 2). В результате сшивания по оси /i = О фазовых траекторий, отвечающих решениям систем qfi = bfi + e, с = -k2b, qfi = bfi + e, ё = +k2b,
240 Глава 7. Теория операторио-координатнои обратной связи получг1ем фазовый портрет £д-системы (рис. 7.11). Из рис. 7.Не видна тенденция "скручиваемости" траекторий к нулю. Для ана­ лиза асимптотики этого движения воспользуемся вторым методом Рис. 7.11 Ляпунова. Заметим, что достаточно доказать факт /л —> О, так как и — —qfi, а, следовательно, одновременно i/ —^ 0. Возьмем пробную функцию v=\n\-\- 2k2bq' ее производнс1я в силу Ед-системы (7.33) имеет вид е . f Ъ е\ е v = nsgn ti-if т - т е = -/i-f- - I sgn^i sgn/i = «2P \q qJ q Поскольку |/j| = f — e^/2k2bq, то последовательно имеем V := — V — е н -V. < q 2k2bq^ ~ q Из этого неравенства следует экспоненциальная оценка v{t) < i;(0) exp j - t . Напомним, что g < О, и, следовательно, • интегрально-релейный ОК-регулятор способен компенсировать не­ известное и переменное возмущения а € Л, но делает это только асимптотически. Для достижения финитной компенсации требуются более "хитрые" регуляторы.
7.6. Разрывная ОК-связь 241 7.6.2. Скользящие рехсимы 2-го порядка в ОК-контуре Рассмотрим здесь тот случай финитной стабилизации ошибки ОКконтура и, который естественно возникает при использовании раз­ рывной ОК-связи следующего вида: Г] = -к2sgn iv+ х/[Нsgnf j • (7.34) Опуская, ввиду аналогичности, рассуждения, устанавливающие финитность возникновения скользящего режима в точке ^ = О, перехо­ дим непосредственно к анализу уравнений скольжения в (/i,e)-npocTранстве или, иначе, уравнений Е^рсистемы. При 6 = const имеем уравнения ди = Ьи + е, (7.35) -k2bsgn ^/i-b v / R s g n f^) При получении этих уравнений учтено, что i/ = — g/i. Уравнения, подобные уравнениям Е^рсистемы, подробно изуча­ лись в оптимально-релейных системах, сходные уравнения рассматри­ вались и в главе 5 при анализе скользящих режимов высших порядков. Сшивание фс1зовых траекторий Ед- (рис. 7.12а) и Еь- (рис. 7.126) си­ стем в пространстве (/i,/i) по линии ргизрыва ^ = /i + VAH sgn р = О дает исходный фгйовый портрет Е^рсистемы (рис. 7.13). (7.36) Из этих \ V Рис. 7.12 рисунков можно увидеть, что существует отрезок ММ' "параболы" ^ = /i + \ / Ы sgn /i = О, в окрестности которого фазовые траекто­ рии направлены встречно, т.е. на этом отрезке возникает скользящий режим с уравнением движения /i = — \ / | Й ^g" ^^•
Глава 7. Теория операторно-координатной обратной связи 242 Точное аналитическое решение этого уравнения имеет простой вид \/fi{i) = y/i^iO) — t/2, из которого и следует финитность достижения нуля при t = 2 ^fi{0). Рис. 7.13 Структурная схема исследуемой бинарной системы представлена на рис. 7.14, и имеет довольно сложный вид. Однако, финитную стабилизацию ОК-ошибки и можно обеспечить и более простым ОКрегулятором, реализующим режим переключений. Рассмотрим этот регулятор подробнее. Vlqor I— S+ d > М ^ Xl -ч Ф С sgn Xl »+с s'+a I Рис. 7.14 обЛ,Ье5 зЫ
7.6. Разрывная ОК-свяэь 243 Уравнение ОК-регулятора имеет вид I -*2 Sgn «^, i/i'>0, uu< 0, (7.37) где ^2 и *2 — положительные константы. Вновь опускаем стандарт­ ные рассуждения и переходим при Ь = const к анализу Е^рсистемы ё= (7.38) -k2{ti,ii)b. Фазовый портрет EJj-системы (7.38) образуется "склеиванием" по координатным осям фазовых портретов Е"- и Е^-систем, каждая из которых действует в "своей" части плоскости (рис. 7.15), и изображен на рис. 7.16. Как установлено ранее, при кук!^ > 1 "скручивание" траекторий в нуль происходит за конечное время, что и доказывает финитность стабилизации ошибки i/. — *- — г :=:::N^ Рис. 7.15 Рис. 7.16
Глава 7. Теория операторно-координатной обратной связи 244 Заметим теперь, что если определить два числа а и /? следующими соотношениями: р + а = к!2, р-а = Щ, то использованное выше уравнение ОК-регулятора можно записать в виде ^ = —а sgn I/ — /? sgn и. Последнее позволяет изобразить структурную схему в виде, пред­ ставленном на рис. 7.17. Ее сравнение со схемой на рис. 7.14 пока­ зывает, что при том же качестве регулирования достигнуто замет­ ное упрощение структуры нелинейного регулятора. В рассмотрен- " -1 1 -1 •-• s+ d " ^ I 1 Г ^C=- р "i^ 3> -Ч > sgn ^1 s+c 1 a e A . ЬбВ Рис. 7.17 ных ОК-регуляторах, обеспечивающих финитное устранение динами­ ческого статизма, предполагалось использование производной v или, что в данном случае то же самое, производной /i. По условию / i = -ki sgni и является разрывной, поэтому, по сути дела, речь шла об исполь­ зовании не /i, а некоторой совпадающей с ней, но дифференцируемой функции /ieq. Для получения функции /ieq достаточно использовать ту
7.6. Разрывная ОК-связь 245 или иную операцию усреднения, например, в виде скользящего сред­ него (рис. 7.18а), либо инерционного звена с достаточно малыми по­ стоянными времени г > О (рис. 7.186). Если, однако, в ОК-контуре М'ч 1 TS+1 • ^ Aeq 1 TS + 1 Рис. 7.18 применить скользящий режим 2-го порядка (описанный подробно в главе 5), не использующий информацию о производной /ieg, то можно избавиться и от решения связанных с этим проблем. Подробности опускаем. Проведенное исследование позволяет сделать следующий принци­ пиальный вывод: • при использовании надлежащим образом организованной разрыв­ ной ОК-связи, в совокупности с тремя другими типами обратной связи, возможно добиться финитной независимости движения в па­ раметрически неопределенной системе без скользящего режима в главном контуре регулирования и при конечных коэффициентах передачи в каждом контуре обратной связи. Типичный ход проекций фазовых траекторий таким образом син­ тезированной бинарной системы стабилизации на множестве Gg дает рис. 7.19. При этом закономерен вопрос о физической основе указан- Рис. 7.19 ного эффекта компенсации возмущения. Важно также выработать определенные правила действия обратных связей вне множества Gs, что позволит говорить о решении задачи глобальной стабилизации. Обо всем этом пойдет речь в следующей главе.
Глава 8 Ограничения, физические основы компенсации возмущений и стабилизация вынужденного движения в бинарных системах До сих пор при синтезе систем стабилизации рассматривалось дви­ жение только на множестве G* = { а; | |<т| < Ji^i)} (рис. 8.1), причем число S > О считалось столь малым, что это позволяло обойтись при анализе уравнениями первого приближения. В этой связи уместен а=0 Рис. 8.1 первый вопрос: • Как правильно модифицировать алгоритм бинарного управления, с тем чтобы он был пригоден к использованию при любых началь­ ных условиях? (Разумеется, все его стабилизирующие свойства должны сохраняться.) Важным тезисом, бывшим одним из основных при развитии тео­ рии бинарного управления, является тезис об ограниченности коэф­ фициентов передачи и непрерывности сигналов управления и прежде всего в главном К-контуре регулирования. Поэтому возникает вто­ рой вопрос: • Как эти фундаментальные требования отразить в гигоритме би­ нарного управления и какими побочными эффектами это сопрово­ ждается? Следующий, третий вопрос, на который далее дается ответ, свя­ зан с выяснением, • какова физическая основа компенсирующего неопределенность эф­ фекта в бинарных системах.
8.1. Ограничения операторной перемениой 247 Известно, что в линейных системах такой основой служит беспре­ дельное увеличение коэффициента обратной связи, в разрывных си­ стемах (СПС, релейные системы) — скользящий режим. Но в бинар­ ных системах может и не быть скодьзящего режима, а коэффициенты передачи конечны, поэтому и возникает сформулированный выше тре­ тий вопрос. Наконец, следует прояснить четвертый вопрос: • о тех изменениях, которые нужно внести в бинарную обратную связь, с тем чтобы распространить ее стабилизирующие свойства на задачи управления вынужденным движением при отсутствии детальной информации о координатном возмущении, т.е. имеется в виду рассмотреть проблему стабилизации следующего объекта: X2 = axi + bu + f, аеА, ЬеВ, feF. 8.1. Ограничения операторной переменной Начнем рассмотрение со второго вопроса. В синтезированных бинарных системах сигнал управления опреде­ ляется выражениями и = цхх либо и' = {fi + Tf)xi. Очевидно, что fi или (/i -I- Г]) можно интерпретировать как коэффициент передачи Крегулятора по переменной xi. Поэтому по соображениям прочности 0-переменные /лиг) должны быть ограничены, т.е. при всех t > О \n(t)\ < const, |r;(t)| < const. Практически удобно иметь дело с ограничениями вида И<1, Ы<1, фактически же fi{t) и T){t) — выходные переменные некоторой динами­ ческой системы (КО- и ОК-регулятора соответственно), и проблема ограничения такой переменной вовсе не тривиальна и требует вни­ мательного анализа. Кстати, не годится для этой цели, казалось бы, очевидный способ ограничения с использованием сатуратора. Действительно, соответствующая этому предложению возможная структурная схема представлена на рис. 8.2. Уравнения системы, изо1 м sat — 4 М S 0 -1 Рис. 8.2
248 Глава 8. Ограничения, физические основы компенсации браженной на рис. 8.2, имеют вид /i = -fcisgn^, /I = sat(/i) ~W. (8.1) М<1. Теперь в уравнении изменения 0-переменной ^ должна фигурировать переменная /I, а не /х, как ранее, так как и = JTx, и поэтому (8.2) ^ = 2rf^ + 6/H-a. В результате дифференцирования ц, из (8.1) видно, что fi = fi только при \ц\ < 1 и / 1 = 0 в остальных случаях. Это качественно меняет задачу стабилизации объекта (8.2) управлением /I и ведет к негативным последствиям, так как при | /х | > 1 этот объект неупра­ вляем. Поэтому следует искать более "хитрые" решения задачи об ограничении операторной переменной fi. Рассмотрим ряд способов ограничения 0-переменной //, сохраня­ ющие управляемость объекта ^ — 2d^ + bfi + а. С п о с о б I . Положим -{ -ШЦ, | / j | > 1, -fcsgn^, |я| < 1, (8.3) где ш,к — положительные константы. Если ^ > 0 и | / / | < 1 , т о / < = —к и fi линейно убывает до значения /х = — 1; при переходе через ц = —\ уравнение изменения /i меняется на /J = —шц и переменнгш fi возра­ стает и трансверсально пересекает прямую /i = —1 (рис. 8.3). Таким <р 1 - 1 0 Рис. 8.3 ] fi Рис. 8.4 образом, на прямых \fi\ ~ 1 возникает скользящий режим, что и га­ рантирует соблюдение ограничения \fi\< 1, быть может, с некоторого момента времени. Достоинство этого способа заключается в том, что управляемость объекта не теряется при выходе на ограничение, так как при изме­ нении знака ^ переменная fi немедленно "сходит" с него, а это то, что нужно. Заметим, что закон (8.3) можно записать в виде одной формулы, если ввести функцию ^(p) = ( l - | s a t ( M ) | ) / ( l - H ) , (8.4) (ее график дан на рис. 8.4) и бинарную операцию /?(у, О — v(/^)sgn ^.
8.1. Ограничения операторной переменной 249 В новых обозначениях закон (8.3) эквивгигентен следующему, более простому,закону: ii = -k0{<p,i)(8.5) С п о с о б I I . Заметим, что функцию (р из (8.4) можно представить разностью ip{^i) = sg{\-\-fi)-sg{^i-l), (8.6) где sg(^) — функция знака (ее график приведен на рис. 8.5а). Тогда sg (\+ц) sg(#) sg(i -И) 1 -1 а 0 о б 1 А в Рис. 8.5 в результате вычитания графиков на рис. 8.55и 8.5в получаем требу­ емый график рис. 8.4. После подстановки (8.6) в (8.5) получаем /i =-A;sg ( l 4 - / i ) s g n ^ + A s g ( / / - l ) s g n ^ , fc = const > 0. (8.7) Учитывг1Я особенность знакового умножения, формулу (8.7) можно регшизовать без бинарной операции путем использования двух кана­ лов распространения сигнала (рис. 8.6). Эта схема работает следу­ ющим образом. Если ^ > О, т о —sgn ^ = —1 и из двух диодов D i , Рис. 8.6
Глава 8. Ограничения, физические основы компенсации 250 Di пропускает сигнал только D^- Если при этом /i + 1 > О, то ключ sw2 замкнут и /i = —к, что и требуется. Это происходит, пока ц не достигнет значения /i = — 1, когда sw2 размыкг^ется, и тогда /i = — 1, пока ^ > О, либо пока ^ не сменит знак. В этом случае проводящим становится D\, а не D j . работает верхняя цепь, и если 1 — /i > О, то ключ swl замкнут и fi = к, как и должно быть. Как только станет /i = 1, если только ^ не сменит знак, swl разомкнётся, фиксируя fi = 1. Достоинство этой схемы в том, что в ней не возникает скользящего режима на |/j| = 1. С п о с о б III. Пожалуй, наиболее компактная запись интеграто­ ра-ограничителя дается следующей формулой с простейшей бинарной операцией: /i = - f c s g n ( ^ - | - / i | ^ | ) , Jk = c o n s t > 0 . (8.8) Этому выражению отвечает структурная схема на рис. 8.7. Опишем м 1 к S ff. 9Г -1 ^ mod а. 'Вя* 1^1 Рис. 8.7 подробно принцип работы этого устройства. Пока \/л\ < 1, выполня­ ется условие sgn (^-I-/i 1^1) = sgn^. Пока |/i| > 1, выполняется усло­ вие sgn(^ -f fi\^\) = sgn/i. Таким образом, в нижней зоне |^i| < 1 и fi = —ksgn^, а вне ее /i = —к sgn fi. Последнее обеспечивает соблю­ дение ограничения /i < 1 в скользящем режиме на границах |/х| = 1, а также немедленный сход с границ \fi\ = 1 при изменении знака ^. А это как раз то, что и нужно для управляемости. Описанный выше оператор с управляемым ограничением выхода является, таким образом, сложным нелинейным динамическим зве­ ном. Унифицированное обозначение таких звеньев дано на рис. 8.8. И -1 7^ Рис. 8.8
8.1. Ограничения операторной переменной 251 Отметим, что при использовании инерционно-релейного КО-регулятора qji = Ьц — к sgn ^ ограничение |/i| < const выполнено автома­ тически. Если же, однако, используется обычное инерционное звено qii = bn — к^, то ограничитель выхода необходим. В завершение этого раздела приведем итоговую структуру бинар­ ной системы (рис. 8.9, 8.10) со всеми типами обратной связи и с огра­ ничениями. Заметим, что итоговый регулятор Л„ довольно сложен и отгадать его непросто. ^ 4т^=^ i +d ^ Р IL |]^^^ч|н|->[^ ТТ •ч С с «<Й sgn S+C s'+« if а 6 л, беВ Рис. 8.9 , ^ , ;? Д-И Х\ S+C ь и 1ГаеЛ, б€В Рис. 8.10
252 Глава 8. Ограничения, физические основы компенсации 8.2. О глобальном поведении бинарной системы В данном разделе ответим, наконец, на первый из поставленных в на­ чале этой главы вопросов, а именно на вопрос об уравнениях движе­ ния и свойствах синтезированной бинарной системы при произволь­ ных начальных условиях по х, т.е. в том числе и не принадлежащих \\ \ Рис. 8.11 множеству Gs (рис. 8.11). Рассмотрим для определенности бинарную систему с К- и КО-связями вида и = кцХ1, /i = - A ; i s g n [ ^ - | - / z | ^ | ] . (8.9) Если использованы, кроме того, другие типы обратной связи, то со­ ответствующее исследование даже проще предлагаемого. Из (8.9) следует, что переменные (л и и ограничены: Ы<1> M<fc|a;i|. Более того, если действие уравнений (8.9) распространить за пределы множества Gs, а для этого достаточно вместо стандартного положить тогда при нахождении фазовой точки вне Gs переменная fx через про­ межуток времени, меньший 2/ki, принимает следующее значение: /i = -sgn (axi). (8.10) После подстановки (8.10) в первое из соотношений (8.9) находим, что управление принимает форму и = —k\xi\sgn(T, совпадающую с обрат­ ной связью СПС. А раз так, то и фазовые траектории те же самые, что в СПС.
8.2. О глобальном поведении бинарной системы 253 Таким образом, если в СПС параметр к выбран так, что имеет место попадание на линию разрыва <г = О, то в бинарной системе это также имеет место, т.е. множество Gs является притягивающим множеством. Необходимым и достаточным условием попадания явля­ ется отсутствие вещественных положительных нулей у характеристи­ ческого полинома системы XI = Х2, Х2 = axi — bkxi при любых фиксированных а Е А, Ь ^ В. Последнее, очевидно, спра­ ведливо, когда кЬ- > а°. (8.11) Таким образом, при выполнении условия (8.11) множество Gg при­ тягивающее. Если побеспокоиться о том, чтобы оно было также ин­ вариантным (т.е. все начинающиеся в нем движения не должны поки­ дать его в дальнейшем), то Gs было бы аттрактором и весь ан£1лиз из предшествующих глав без изъятий годился бы для исследования та­ кой ситуации. Но в рассматриваемой бинарной системе (К-|-КО-связи) множество Gs является не аттрактором, а только условно инвариант­ ным множеством. Именно, если внутри Gs можно указать множество, например, той же конфигурации Gs' {О < S' < 5) такое, что движения, начинающиеся в Gs', не покидают Gs, то последнее — условно инва- Рис. 8.12 риантное множество. Если к тому же оно притягивающее, то говорим об условном аттракторе (рис. 8.12). На рис. 8.12а множество Gs — аттрактор, а на рис. 8.125— условный О^'-аттрактор. Поскольку прямая «г = О также является притягивающей при вы­ полнении условия (8.11), то именно ее удобно взять в качестве Gs'. Для получения соотношений между коэффициентами системы, гаран­ тирующими (Т-условную инвариантность множества Gs, рассмотрим
254 Глава 8. Ограничения, физические основы компенсации следующее известное по предыдущим главам уравнение движения от­ носительно переменной ^ = <T/XI : ^ = 2d^ + kbfi + a,, a,=a-d^, Jfc = const, (8.12) и уравнение КО-регулятора /i = -Arisgn({-|-/i|^|), ^1= const. Ясно, что множество Gg является <т-условно инвариантным, если вся­ кое движение, стартовавшее с линии а = 0 (т.е. при ^ = 0), не достиг­ нет границы Gs (т.е. |^| = J). Из (8.12) имеем в Gf оценку \i\<2dS + a° + kb+, a° = a°-d\ поэтому за время t переменная ^ "нарастет" не более чем на величину \^\<(2dS + a° + kb+)t. Из требуемого условия |^| < <5 получаем следующую оценку на время "нарастания": ' ^ 2dJT^TIF- (8-^3) Но рост гарантированно прекратится тогда, когда переменная /i до­ стигает крайнего значения fi = —sgn^ прежде, чем переменная |^| достигнет значения S и, кроме того, будет выполнено неравенство 2dS - kb- +а°<0, а° = а°- d^. (8.14) Максимальное время, необходимое для изменения переменной fi от одного крайнего значения до другого, меньше 2/ki. Поэтому из последнего неравенства и (8.13) получаем следуюпдую окончательную оценку для расчета параметра ki: ki>^{2dS + a° + kb+), (8.15) где параметр к определяется из (8.14) неравенством , > ! ^ . ,8.16) Соотношения (8.15), (8.16) полностью определяют параметры К- и КО-связей, так как (8.16) гарантирует притяжение для прямой <г = 0. Заметим также, что при использовании 0-связи нижнюю оценку ко­ эффициента ki можно уменьшить вдвое.
8.2. Физические основы компенсащш неопределенности 255 8.3. Физические основы компенсации неопределенности Перейдем теперь к ответу на третий вопрос о физических основах компенсации неопределенности. Прежде всего отметим тот очевидный факт, что всякое возмуще­ ние можно трактовать как некую силу, влияние которой компенсиру­ ется только другой, эквивалентной ей силой. Например, при прямой компенсации возмущения / в управлении & = da + Ьи-^ f управление формируется в виде суммы где компонента uj = —f/b является компенсирующей силой, а компо­ нента Ug — стабилизирующей. При неизвестном возмущении / можно использовать большой ко­ эффициент усиления в обратной связи и = —кег, тогда в замкнутой системе, описываемой уравнением г=-(''"^)"-'р компенсация достигается при к -^ оо, когда приведенное возмущение (f/k) -^ 0. В этом случае компенсирующая сила образуется в резуль­ тате умножения большого к на малый сигнал (т. Релейное управление и = —«" sgn or, и° = const также "силовым" способом подавляет действие возмущения / : & = d(r — и°Ь sgn <т + f, которое теперь, однако, должно быть равномерно ограничено: 1/1 < «°. При этом в нуле переменной <т существует скользящий режим и сред­ нее значение разрывного сигнала с точностью до знака совпадает с компонентой u/ в методе прямой компенсации и° sgn^ (т = f/b. Таким образом, во всех указанных случаях • идея силовой компенсации возмущения реализуется с помощью от­ рицательной обратной связи.
256 Глава 8. Ограничения, физические основы компенсации В бинарных системах (и в СПС, конечно, тоже) компенсация до­ стигается иными средствами. Действительно, в этом случгш и = k^xi, и произведение к/л = Jt^, играет роль коэффициента передачи обратной связи. Но при использовании релейного КО-регулятора /^ = - s g n ^ или интегрально-релейного КО-регулятора /i = -kisgn {сг + ц\а\) переменная /л меняется от —1 до -1-1 и, значит, коэффициент обрат­ ной связи главного контура к^ также меняет знак. Последнее озна­ чает, что в главном контуре используется знакопеременнгш обратная связь и поведение системы описывается Е"'"-уравнениями: XI = Х2, Х2 = axi + kbxi, или S -уравнениями: Xi = Х 2 , Х2 = axi — kbxi. Поскольку кЬ > а°, то Е"*"-система всегда неустойчива, и это прин­ ципиальный момент. Именно: • использование неустойчивых структур позволяет в системе с огра­ ниченными параметрами за конечное время увеличить норму фа­ зового вектора до величины, достаточной для подавления возму­ щения. Как мы теперь знаем, использование для этого разрывной обратной связи вовсе не является неотвратимым, годятся любые, необязательно линейные, законы управления, меняющие знак обратной, связи. 8.4. О компенсации координатного возмущения Рассмотрим теперь способ решения четвертой задачи, поставленной в начале главы, — задачи об алгоритмах стабилизации вынужденного движения. До сих пор, по уговору, предполагалось, что /(<) = 0. Пусть теперь это не так, а именно, в уравнении изменения ошибки КО-контура а имеется дополнительный аддитивный член, т.е. & = d(r + bu + a'xi + f, a'=a-d^, b Е В, а е А.
8.4. О компенсяции координатного возмущения 257 Наличие слагаемого f(t) в правой части качественно меняет ситу­ ацию. Поскольку возмущение f{t) предполагается известным с точ­ ностью до включения /е^={/11/1</м}, где, кроме того, неизвестен и параметр 6 € S , то оно не может быть включено в параметрическое возмущение или устранено с помощью известных методов компенсации: прямым или косвенным измерением. Поэтому актуален вопрос об изменениях, которые следует внести в конструкцию бинарных систем управления, с тем чтобы наделить их свойством стабилизируемости при координатном возмущении. Заметим, что при неизвестном b Е В проблема остается нерешен­ ной даже при известном f{t), поскольку стандартные методы стабили­ зации в такой ситуации неприменимы. Если известна волновая модель возмущения / , т.е. известен аннулирующий его оператор Kf: Kjf = О, то заменой управления u=KJ^v задача стабилизации вынужденного движения сводится к стабилиза­ ции свободных колебаний, так как & = dtT + bKJ^ V + a*xi -f- / , и после введения новых переменных ^ = Kf (Г, XI = К/ XI получаем стандартную задачу стабилизации а = da + bv + a*xi, В этих выкладках для простоты и без потери общности полагалось, что b = const. Таким образом, • наиболее общая и трудная ситуация возникает тогда, когда о воз­ мущении /(<) известен только факт включения f £ F,& параметры объекта неизвестны, т.е. а Е А, b € В. Именно этой ситуацией далее и займемся. Пусть координатное возмущение удовлетворяет МС-условию. То­ гда с помощью стандартной замены переменного сводим исходную задачу стабилизации объекта Р: XI = 12. Х2 = axi +bu + f
258 Глава 8. Ограничения, физические основы компенсации к задаче стабилизации скалярного объекта Ро: & = d<r+ Ьи + a,xi + f, а, = а — d^. Как обычно, при управлении вынужденным движением выберем управление в виде суммы ti = u , + U/, (8.17) где компонента Ux стабилизирует свободные колебания объекта Pi: а = diT + bux + a,xi, а компонента и/ стабилизирует вынужденные колебания объекта Pj: а = buj + / . Как и ранее, предполагается, что а G Л, 6 6 5, / € F. При использовании разрывных управлений из стабилизации Рх и Рг-объектов следует стабилизация Р<,-объекта, В самом деле, разрыв­ ные стабилизирующие управления «,, u/, очевидно, удовлетворяют условиям cr(d<T-|-bux + a.xi) < 0 , (8.18) <r{buj + / ) < 0. (8.19) Поскольку это так, то и их сумма удовлетворяет аналогичному усло­ вию (T{da + 6(«, -I- U/) -I- а . ц -f- / ) < О, которое эквивалентно неравенству <Tff<0, влекущему за собой стабилизацию Р,-объекта в нуле. Законы управления, разрешающие неравенства (8.18), (8.19) при любых а ^ А, Ь ^ В тл f ^ F, очевидно, имеют вид ы, = -*|ari|sgn<7-, u/ = -//MSgn<T, где константы к, I удовлетворяют соотношениям kb->a° = a° + d^, ,ь- > 1. (8.20) (8.21) , ^ («•^^' Алгоритмы управления (8.20), (8.21) стандартны для теории СПС. При переходе от разрывных алгоритмов стабилизации к непрерыв­ ным можно поступить следующим образом. Используя стандартные обозначения fi = -sgn (xia) = -sgn i, ^ = (г/ii, (8.23)
8.4. О компенсации координатного возмущения 259 алгоритмы стабилизации управления (8.20), (8.21) можно записать в виде « = «с + «/ = (Jtxx + //м sgn xi)/i. (8.24) Возьмем теперь формулу (8.24) при синтезе непрерывного закона за основу, но вместо релейного КО-регулятора применим, к примеру, интегрально-релейный КО-регулятор /i = -*?8gn(^ + /iK|), (8.25) где к\, как будет видно далее, уже не коэффициент, а некоторая функ­ ция, зависящая от фазового вектора и мажоранты возмущения. Для нахождения этой функции к\, гарантирующей «т-условную ин­ вариантность множества Gt, т.е. выполнение неравенства |^| < 6, если ^(0) = О, воспользуемся уравнением изменения 0-переменной ^ в множестве Gt. Это уравнение выводится стандартным образом и имеет следующий вид: Xi Xi Поскольку, согласно (8.24), то искомое уравнение окончательно можно записать в виде i=2d^ + b(h + ^P^\n + a,-{-^-^. \ Fi| / (8.26) Xi Из (8.24) имеем 1/^1 < 1, следовательно, для правой части уравнения (8.26) в Gt верна оценка l^|<2.,+**(. + iZ«) + .; +/м^ За время t переменная ^ возрастает с нуля (^(0) = 0) не более чем на величину |^тах| {х\ можно считать постоянной, так как движение происходит в Gf, а J и f малы), где |чтах| — 2(fJ-|-6+Jfc + a2 + ^^f^i/Af t. Fil (8.27) Полученная величина не превысит допустимый предел &, если за время t, согласно (8.22), 0-переменная ц гарантированно примет зна­ чение // = —sgn^. Но это может быть только тогда, когда t > 2/к°. (8.28)
Глава 8. Ограничения, физические основы компенсации 260 Из соотношений (8.27), (8.28) и неравенства |^тах| < ^ получаем оценку снизу для функции к\: kl> (8.29) Из полученной оценки следует, что функция к° отличается от кон­ станты ki, действующей при управлении свободным движением, на слагаемое 2(6+/ + 1) JM 6\хг\ обусловленное наличием внешней силы / . При отсутствии этой силы (/м = 0) данная оценка совпадает с ранее установленной. Второй вывод из (8.29) тот, что в окрестности нуля переменной Рх функция к\ неограниченно возрастает, что неприемлемо. Для огра­ ничения этой функции вместо (8.29) следует использовать оценку *?>*! + ^^fM = кг + k'jM, (8.30) где Д — положительная константа, определяющая размер шара диссипативности Br{0)={x\xl + xl<r^{A)). Последнее замечание о диссипативности системы обусловлено тем, что при ограниченной функции к^ из (8.30) при малых xi (\xi\ < Д) проекции фазовых траекторий системы на множество Gs могут по­ кинуть это множество, чего не может быть для функции к^ из (8.29). Поэтому условие (8.30) гарантирует стабилизацию всех решений (ра­ зумеется, при выполнении условий притяжения для G;) в окрестности нуля, погруженной в шар Вг(0) (рис. 8.13). Отметим, что при Д -> О Рис. 8.13
8.4. О компенсации координатного возмущения 261 шар вырождается в точку О, как это и должно быть. Шар диссипативности jBr(O) можно уменьшить, а значит, поднять точность стабилиза­ ции, введением надлежащих О- и ОК-связей. Подробное обоснование этого утверждения здесь не приводится. Структурная схема синтезированной бинарной системы стгкбилизации вынужденного движения для случая, когда возмущение измеря­ ется, приведена на рис. 8.14. Завершг1я обсуждение данной темы, от- Г -1 1—1 "' h ,—, L^5^ ki 1 s 1 1—|яЛ-| 1 1 1?'<==| sgn ( *п abs ч J 1'• •! -laivr- г 1/ у ^\ 1 Ь s*+« t ^ оеЛ, 6eJ3 Рис. 8.14 метим, что задачу стабилизации вынужденного движения можно ре­ шать и при отсутствии информации о мажоранте координатного воз­ мущения ftf и даже при нарушении МС-условия. В этом случае ком­ пенсация достигается сочетанием использования косвенной оценки возмущения через внутренние переменные объекта и знакоперемен­ ной обратной связи.
Глава 9 Дифференцирование сигналов Под дифференцированием в теории управления обычно понимается обработка сигнала с целью получения оценок его производных. Основ­ ными препятствиями на пути идеального дифференцирования явля­ ются физическая неосуществимость идеального дифференциатора и неустранимое противоречие между точностью операции дифференци­ рования и операцией фильтрации помех. Теория дифференцирования является разделом общей теории фильтрации, однако имеет весьма существенную особенность, которая состоит в отсутствии модели об­ рабатываемого сигнала или точной информации о ее параметрах, что характерно для теории фильтрации. Поэтому дифференцирование до сих пор является одной из наиболее трудных задач теории управления. Априорная неопределенность в постановке задачи дифференцирова­ ния предопределяет поиск наиболее совершенных дифференциаторов в классе нелинейных динамических систем. Цель настоящей главы состоит в демонстрации возможностей но­ вых видов нелинейных обратных связей в задаче дифференцирования. 9.1. Постановка задачи дифференцирования При решении многих задач естествознания часто требуется распола­ гать оценками производных функций. Далее для удобства, предпо­ ложим, что эти функции являются функциями времени, и будем по традиции называть их сигналами. Проблема дифференцирования возникает и в теории.управления в связи, например, с восстановлением по выходу системы ее полного фазового вектора. В тех случаях, когда эта проблема разрешима, с по­ мощью преобразования переменных можно получить фазовый вектор в произвольных координатах. Задача дифференцирования сигнала относится к числу некорректно поставленных задач, и это связано, в частности, с тем, что из равенства 9i(t)=Mt} вовсе не следует, что dgdt) _ dg2(t) (91)
9.1. Постановка задачи дифференцирования 263 Более того, указанные производные могут даже не существовать. Поэтому прежде всего следует позаботиться о такой предварительной обработке сигнала, когда естественное следствие (9.1)-+(9.2) имеет место. Это достигается использованием фильтра Fin предваритель­ ной обработки сигнала (рис 9.1) и его преобразованием в гладкий сигнал д. Задача дифференцирования некорректно поставлена еще и Я 9 Рис. 9.1 потому, что результат дифференцирования двух сколь угодно близ­ ких сигналов может отличаться на произвольную величину. Действительно, рассмотрим два сигнала дп (t) = с = const, g2{t) = gi{t) + esmwt, (9.3) где e — сколь угодно малая константа, w — частота помехи (рис. 9.2). Дифференцируя функции из (9.3), имеем д\ = О,flf2= ewcoswf. Гра­ фики производных даны на рис. 9.3. Видно, что опшбка дифференци­ рования t может превзойти любое наперед заданное число. Поэтому о "чи­ стом" дифференцировании говорить не приходится, можно вести речь только об оценках производной д, измеряя ее близость к истинной производной в той или иной метрике. Часто удобно различать в hit) Я^Л) 5ШШК Рис. 9.2 Л Рис. 9.3 2е
Глава 9. Дифференцирование сигналов 264 структуре дифференциатора часть, которая отвечает за собственно дифференцирование сигнала, от части, предназначенной для форми­ рования оценки производной. Последняя операция реализуется с по­ мощью некоторого фильтра Fouti и указанное разделение функций ил­ люстрирует рис. 9.4. Таким образом, не только дифференцируемый '^out Рис. 9.4 сигнал, но и полученная производная должны, вообще говоря, подвер­ гаться дополнительной обработке, с тем чтобы сделать задачу разре­ шимой, а оценку производной приемлемой, т.е. фактически подлежат синтезу операторы фильтров Fim^out и оператор дифференциатора D (рис. 9.5). Выбор фильтров зависит от многих обстоятельств, не rout Рис. 9.5 связанных напрямую с операцией "чистого дифференцирования" (на­ пример, от спектрального состава помехи, от наличия амплитудных ограничений и т.п.). Именно это делает декомпозицию оператора при­ ближенного дифференцирования на рис. 9.5 полезной. Далее, полагаем, что сигнал g{t) "хорош" и поэтому можно поло­ жить Fin = 19.1.1. Фильтрация Фильтрация — операция выделения полезного сигнала из смеси сиг­ налов. Поскольку такое выделение неоднозначно, то для сравнения вариантов разделения вводят показатель качества или критерий филь­ трации. Экстремизация этого критерия дает оптимальный фильтр. Для успешного разделения необходима априорная информация о полезном сигнале и помехе. Часто такой информацией служат дина­ мические системы, порождающие эти сигналы, иначе говоря, волно­ вые модели сигнала и помехи. В подобных случаях проблема филь­ трации может быть сведена к некоторой задаче дифференцирования. В то же время проблему дифференцирования всегда можно тракто­ вать как проблему фильтрации, т.е. между этими проблемами много общего, но они не тождественны.
9.1. Постановка задачи диффереицировгшия 265 Дело даже не столько в том, что задача фильтрации обычно рас­ сматривается в стохастической постановке, а задача дифференциро­ вания — в детерминированной. Основное различие сводится к тому, что обычно для решения задачи дифференцирования требуется мень­ ший объем априорной информации, нежели объем, необходимый для решения задачи фильтрации. 9.1.2. R C - ц е п о ч к а В приложениях и по сей день для приближенного дифференцирования используются простейшие дифференциаторы, реализуемые на пассив­ ных электроцепях. Наиболее известным дифференциатором этого типа является ЛС-цепочка (рис. 9.6). Здесь д — входное напряже- г-И^ О 9 -' i ] \\R Рис. 9.6 ние, у — выходное напряжение, i — сила тока, R и с — параметры цепочки, сопротивление и емкость соответственно. По закону Ома -Ri + 'fidt, y = Ri. Дифференцируя это выражение и исключая силу тока i, получаем дифференциальное уравнение if + {l/T)y = g, (9.4) где Г = КС — постоянная времени дифференцирования. Общее ре­ шение уравнения (9.4) имеет вид У= е-^/^у{0)+Тд{1-е-*/^). ^ V ' свободное движение ^ > '^ вынужденное движение Исследуем дифференцирующие свойства ДС-цепочки, рассматри­ вая лишь вынужденную компоненту (у(0) = 0) решения (выхода), так как свободное движение экспоненциально затухает. Пусть сначала д = const.
Глава 9. Дифференцирование сигналов 266 В этом случае из уравнения у = Ту(1-е-'/^) видно, что у -^Тд при f -> оо, причем с уменьшением Т "темп" сходи­ мости возрастает, но одновременно уменьшается коэффициент перед производной (рис. 9.7, где 7i > Тг). Таким образом, ДС-цепочка осу- Рис. 9.7 ществляет дифференцирование с точностью до переходного процесса, который, однако, неустраним. Пусть теперь g{t) — гармонический сигнал, т.е. </(<) = е^"', где О, — частота, j — мнимая единица. Тогда вынужденное решение уравнения у - К 1 / Г ) у = ;Пе>"* (9.5) ищем в виде y = ^gj(nt+v)_ (9.6) где А — амплитуда, а у> — фаза выходного сигнала ДС-цепочки. Под­ ставляя (9.6) в (9.5), получаем соотношение (jfi + l / r ) A e ^ * ' = j n . Из этого равенства находим выражение для амплитуды и фазы: А= , „ у>= ^ - a r c t g ( T n ) . Поскольку "чистая" производная дается выражением то величины П—Л, itl2—ip уместно назвать искажениями по амплитуде и фазе соответственно.
9.1. Постановка задачи дифференцирования 267 Зависимости ошибок дифференцирования от постоянной времени Т для случая, когда Q > 1, приведены на рис. 9.8. Из графиков видно, что с увеличением постоянной времени уменьшаются амплитудные, но нарастают фазовые искажения при дифференцировании гармониче­ ского сигнала. Следовательно, проблема выбора постоянной времени не так проста, как это может показаться. Q Q-A П-1 ^Т Рис. 9.8 *У О А 0 t •А а Рис. 9.9 На рис. 9.9 штриховой линией изображена "чистая" производная П cos (Qf), а сплошной линией — "реальная" производная на выходе ЛС-цепочки. Полезно также иметь представление о том, как меняются погреш­ ности дифференцирования при изменении частоты обрабатываемого сигнала. Соответствуюпще графики при Т < 1 даны на рис. 9.10. Видно, что разные частоты обрабатываются с разными погрешно­ стями, и что самые лучшие характеристики ЛС-цепочка имеет при Q-A Рис. 9.10
Глава 9. Дифференцирование сигналов 268 П -> О, т.е. при дифференцировании постоянного сигнала. При нали­ чии помехи, т.е. когда дифференцируется сигнал g{t) = е^^* + ее-''^*, где частота помехи w 3> П, а амплитуда е <^\, выход ЛС-цепочки при у(0) = О можно представить в виде суммы у — I/n(0 + !/w(Oi где первая компонента — оценка производной полезного сигнала, а уо, — оценка производной помехи. Поскольку для компоненты УшЩ справедливы приводившиеся выше формулы (9.5), (9.6) и связанные с ними, то вно­ симый ею дополнительный вклад в погрешность дифференцирования определяется ее амплитудой А^ и фазой ^ш'Аш — Тш х/1 + (Та;)2' у>„ = a r c t g ( - T a ) ) . Из выражений для амплитуды и фазы следует, что для устранения вредного влияния помехи следует увеличивать постоянную времени ДС-цепочки, но тогда возрастают фазовые искажения в полезной со­ ставляющей. Поэтому здесь возможен компромисс. Лучший выход, однако, может состоять в поиске таких схем дифференцирования, в которых имеется несколько свободных параметров, позволяющих не­ зависимо решать задачу "фильтрации" помехи и уменьшения ампли­ тудных и фазовых искажений. Перейдем к рассмотрению подобных схем дифференцирования, но прежде заметим, что передаточная функция ЛС-цепочки имеет вид s+l/T' который нетрудно установить по ее дифференциальному уравнению 1 Такой передаточной функции соответствует упрощенная струк­ турная схема на рис. 9.11, которую можно развернуть в виде системы, представленной на рис. 9.12, где z — выход следящей системы, е — ее е 1 S + 1/T 1 ST Рис. 9.11 Рис. 9.12 У ошибка, в схемах всего один настраиваемый параметр Т, что и пре­ допределяет их возможности. Если вместо тождественного преобра­ зования в прямом канале использовать иные законы обратной связи, то можно рассчитывать на получение лучших дифференциаторов.
9.1. UocTSLHOBKa задачи дифференцирования 269 9.1.3. Дискретно-разностные аппроксимации К улучшенным методам дифференцирования относятся методы, осно­ ванные на использовании дискретных разностей различных порядков дифференцируемой функции. Например, оценкой производной функ­ ции g{t) может служить разность Ь"'"-',"-"'^^, (9.7) где h = const > 0. Заметим, что для линейных функций эта оценка (9.7) производной совпадает с ее точным значением. В общем случае имеет место равенство g{t) = g{t -h)+ g{t) h + g{t + dh) —, где d — некоторое число из интервала [0,1], и, следовательно, оценка (9.7) имеет погрешность порядка О(Л^). Использование дискретных значений в (г + 1)-й точке для форми­ рования оценки г к=0 при надлежащем выборе параметров а* позволяет повысить точность аппроксимации до 0{h^). Кажется, что устремлением Л —> О задача дифференцирования исчерпывается. Однако это не так и при наличии помехи возникают проблемы, родственные описанным в предыдущем пункте. Именно, пусть вместо g{t) дифференцируется по схеме (9.7) сигнал де = g(t) + е sin uit, тогда оценка его производной д^ дг1ется выражением ^ 9e{t)-9^t-h) д^ = 7 ^^ = g(t)-g{t + h) , 7 + '• +— [sin ut — sin u{t — h)]. h (9.8) Ho sin w(t — h) = sin ut cos wh — cos uit sin uh, и при u)h <^ 1 cos wA S 1 — uh, sin uh 5^ uh, поэтому справедливо приближенное равенство sin u{t — Л) S sin ut — иh{sin ut + cos ut). Следовательно, помеха вносит в оценку (9.8) дополнительную и, вообще говоря, сколь угодно большую погрешность д^ °i д — ей {sin ut + cos ut), неустранимую при уменьшении Л —> 0.
Глава 9. Дифференцирование сигналов 270 В некоторых ситуациях качество такого дифференцирования мо­ жет быть повышено использованием идеи фильтрации, которая в раз­ ностных схемах эквивалентна операции усреднения. Именно, пусть дифференцируемый сигнал д( есть аддитивная смесь полезного сиг­ нала д и случайной помехи ^ с нулевым средним, т.е. М ( = 0. Для измерения производной используем N параллельно работающих диф­ ференциаторов D* (рис. 9.13) вида ^g(t)-g{t-h) ^ ^<{t)-C{t-h) 5€(<) (9.9) На рисунке индексом i помечен выход i-ro дифференциатора D'; на­ личие индекса у помехи означает, что на входе каждого D' действует "своя" реализация случайного процесса ^. Для получения искомой оценки используем следующую простей­ шую операцию усреднения: 1 ^ ^«(<)=ЛгЕ ^До­ лг ^ (9.10) 1=1 Тогда из (9.9) и (9.10) получаем N ^«=Ьг^Ед^'» 1=1 Последнее слагаемое при N -^ сх> стремится к нулю при сделанных выше предположениях. При этом, разумеется, для уменьшения регу- D' N т "W—I "оП^ I—r~^N~LiJ Рис. 9.13 лярной погрешности (которая, напомним, порядка 0(Л^)) требуется уменьшать Л, что ведет к увеличению числа N, а значит, и сложности дифференциатора.
9.2. Следящие дифференцирующие системы 271 Кроме того, нетрудно заметить, что структурная схема диффе­ ренциатора первой разности ~^_9it)-9(t-h) ^~ h имеет вид, показанный на рис. 9.14, и содержит звено запаздывания, реализация которого — также непростое дело. Передаточная функ­ ция дифференциатора (9.10) находится из рис. 9.14 и дается выраже-»• -гЬ» D Рис. 9.14 нием Wois) = Л/(1 — е~ ) . При малых значениях |Лв| справедливо разложение l - e " * ' = As— (Л'/2) в^-|-0(|Лв|^), поэтому WD(S) можно приближенно аппроксимировать выражением WD{S) Л 2 Л Л \ 8 (h/2)8- Иными словами, если обозначить Т = Л/2, то передаточная функ­ ция такого дифференциатора близка к передаточной функции RCцепочки Wj){s) ^ s/{Ts+l), следовательно, их свойства также близки. Поэтому не будем повторяться и перейдем к "следящим" дифферен­ циаторам. 9.2. Следящие дифференцирующие системы Структурный принцип построения дифференциаторов рассматривае­ мого типа отражает рис. 9.15, на котором Fout — выходной фильтр, а Ry — регулятор, стабилизирукшщй в нуле ошибку слежения е = g — z. ^ е у Ry Z 1 Рис. 9.15 I'out
Глава 9. Диффереицирование сигналов 272 В случае, когда сигналы g{t) и z{t) гладкие, из равенств е = О, i = у немедленно получаем требуемое у = д. Если же z(t) не имеет обыч­ ной производной, то с помощью фильтра Fout можно сформировать требуемую оценку производной 9 = FoutyТаким образом, задача дифференцирования может быть сформу­ лирована как задача слежения и возникающие при этом варианты определяются выбором пары {Ry,Foxit}- Рак:смотрим некоторые из них. 9.2.1. Линейный дифференциатор Простейшим следящим дифференциатором можно считать линейный дифференциатор, для которого {Ry, Fout} = {к, 1}, к = const > 0. Его структурнг1Я схема дифференциатора представлена на рис. 9.16. ^ Рис. 9.16 Уравнения дифференциатора имеют вид e = g-z, z = y, д = у = ке. (9.11) Проанализируем его работу. Уравнение движения относительно ошибки слежения из (9.11) имеет вид ё = -ке + д, t>0, и, следовательно, полная ошибка складывается из двух компонент: свободного ес(<) = е(0) е~** и вынужденного с et{t) =.€-"' I e>'-g{T)dT (9.12) движений. Исследуем только et{t), так как только эта компонента со­ держит информацию о производной, тогда как edt) экспоненциально стремится к нулю при < —> оо и от ^ не зависит.
9.2. Следящие дифференцирующие системы 273 Пусть д — const, тогда (9.12) легко интегрируется и e,(0 = f ( l - e - * ' ) . Поскольку у = ке, то для оценки производной имеем формулу Ьл(1-е-*0. Временные графики оценок при различных к {ki > /fj) приведены на рис. 9.17. Из графиков видно, что увеличение коэффициента усиления Рис. 9.17 в обратной связи улучшает дифференцирующие свойства этой схемы. При этом, однако, нужно всегда помнить о том, что мы имеем дело с глубокой обратной связью. А именно, нужно при к —¥ оо учиты­ вать влияние ограничений и сингулярных возмущений на прочность системы. Если д ф const, то для уменьшения ошибки слежения также нужно устремлять fe -> оо. Для анализа последствий, наступающих при сингулярном возму­ щении, положим, что в схеме на рис. 9.16 вместо чистого интегриро­ вания осуществляется интегрирование с малой временной задержкой г = const > О, т.е. исследуемая ситуация иллюстрируется рис. 9.18. 9 , е '\ к '!/ Z S Рис. 9.18 На этом рисунке уравнение в ошибках иное и дается следующей фор­ мулой: 'e{t) = -kt{t-T)^g. (9.13)
Глава 9. Диффереицирование сигналов 274 Теперь вопрос о том, принимать или не принимать во внимание свободную компоненту решения уравнения (9.13), зависит от устой­ чивости квазиполинома <р(8) = 8 + ке^^'. Но при ik ->• оо его нули стремятся к нулям уравнения е"'"' = О, кото­ рое имеет нули в бесконечности правой комплексной полуплоскости переменной s (Res > 0). Таким образом, исследуемый полином не­ устойчив, а поэтому неустойчива рассматриваемая дифференцирую­ щая система. Следовательно, устойчивость системы при сингулярном возмущении ограничивает коэффициент обратной связи критическим значением к < ксгНаличие критического коэффициента усиления определяет и пре­ дельно достижимые фазовые искажения при обработке синусоидаль­ ного сигнала. В самом деле, передаточная функция линейного диф­ ференциатора ^-W = Jjrrv (^•^^^ и, следовательно, минимально достижимая постоянная времени диф­ ференциатора Т = 1/Агсг, что, как уже указывалось при анализе RCцепочек, и определяет фазовые искажения. Отметим справедливость сделанных ранее замечаний о свойствах дифференциаторов с переда­ точными функциями вида (9.14) и в этом случае. Исследуем теперь влияние амплитудного ограничения на' выходе дифференциатора, представленного на рис. 9.19. Уравнения этого е 9 ' г к У sat 2 1 1 Рис. 9.19 дифференциатора отличаются от уравнений рассмотренного диффе­ ренциатора только уравнением выхода J = sat (у), где sat() — функция насыщения. Из схемы на рис. 9.19 видно, что д = sat (ке), но при к -> оо sat {ке) = sati/fc (е) -> sgne.
9.2. Следящие дифференцирующие системы 275 Таким образом, в пределе, при к -¥ оо, наличие ограничения при­ водит к разрывному сигналу (рис. 9.20). Поэтому для получения приeatj^^ (е) sat^^ (е) fc — 00 Рис. 9.20 емлемой оценки неизбежно использование выходного фильтра Fout< надлежащим образом "усредняющего" разрывной сигнал sgny и не­ избежно вносящего дополнительные фазовые искажения (рис. 9.21). е 9 ' 1 У 00 -1 Fout 1 1 Рис. 9.21 е к sat 1 1 Рис. 9.22 Далее методы усреднения исследуются подробно, здесь же огра­ ничимся замечанием, что к исходным проблемам приводит наличие амплитудного ограничения в замкнутом контуре (рис. 9.22), когда предельный переход А; —^ оо приводит к релейному дифференциатору. К анализу свойств релейного дифференциатора теперь и переходим.
Глава 9. Дифференцирование сигналов 276 9.2.2. Релейный дифференциатор Структура релейного дифференциатора, характеризующегося парой {Ry, Fout] = I * sgn e, — 7 j \ изображена на рис. 9.23. За оценку сигнала примем выход системы, т.е. положим д = X. Для анализа процессов в замкнутом контуре к е ^ .й J ' '\ 9 Z 1 X Ts+1 -к 1 !t рис. 9.23 запишем уравнение движения относительно ошибки с: ё = -ksgn е + д, (9.15) которое легко получается из уравнений дифференциатора e—g — z, j/ = fcsgne, i = I/, Тх + х = у, А: = const > О, Т = const > 0. (9.16) Видим, что если к > |^|, то за конечное время процесс стабили­ зируется в нуле е = О, где возникает скользящий режим (рис. 9.24). Рис. 9.24 в скользящем режиме среднее значение разрывного сигнала находится из равенств е = О, ё = О и дается выражением Arsgngq е = д. Для выде­ ления этого среднего и нужен выходной фильтр.
9.2. Следящие дифференцирующие системы 277 Действительно, из (9.16) и (9.15) имеем уравнение фильтра Тх + х = д-ё, вынужденнее компонента решения которого дается хорошо известной формулой t x,(t) = ^е-Ч^ J e^'^{9(r) - ё{г)) dr. (9.17) о Пусть существует и равномерно ограничена вторе1Я производная сигнала д, т.е. 1 у I < М, М = const > О, (9.18) а скользящий режим возник при / = О, тогда справедлива следующая цепочка равенств: / е^/'Гё(г) dT = j е^/^ rfe(r) = о * = е(г)е^/^ t (9.19) /e(r)e-/^d(r/r)=0. о о Следовательно, (9.17) можно упростить до выражения с (9.20) для дальнейшего преобразования которого вновь воспользуемся инте­ грированием по частям. В результате имеем je^l'^ad{rlT)=iade^l'^=ge^l'^ о о (9.21) - / e'lTg dT = g е^/^ - д(0) - / е^/^ д dr. Последнее слагаемое в этой формуле оценивается с учетом (9.18) сле­ дующим образом: j e'/'^gdr <Je^''^\g\dT< (9.22) < M / e ^ / ^ d r = TM(e*/^-l). о После подстановки (9.21) в (9.20) находим, что Xfit) = g{t) - д{0) е - ' / ^ - е"^ J е^'^д dr = g{t) + e{t). (9.23)
Глава 9. Дифференцироваиие сигналов 278 Для погрешности дифференцирования £{t) из (9.22) и неравенства 1^(0) I < к имеем оценку \е{1)\<ТМ + (к + ТМ)е-*'^. (9.24) Таким образом, окончательно получаем \x{(t)-g(t)\<TM + (k + TM)e-*'^. (9.25) Для уменьшения регулярной {ТМ} и асимптотически исчезающей { (fc + ТМ) е~*1^ } компонент погрешности дифференцирования, как видно из (9.25), следует уменьшать постоянную времени Т фильтра, и в пределе при Т = О получим абсолютно точное дифференцирование. Но это физически недостижимо, и причина в том, что переключения всегда неидеальны и выбор параметра Т должен быть согласован с этими неидеальностями. Пусть, например, имеется пространственная задержка Д = const в переключениях (рис. 9.25). Тогда для описания дифференциатора с \Ъ Т$+1 Рис. 9.25 неидеальными переключениями справедливы все уравнения релейного дифференциатора со схемы на рис. 9.23 при замене в них идеального реле на реле с гистерезисом sgпд е, в частности, имеем следующее уравнение в ошибках: ё= -ksga^e-irg. В окрестности |е| < А возникает реальный скользящий режим (рис. 9.26). Справедлива также оценка для погрешности (9.24), вно- Реальнын скользящий режим Рис. 9.26
9.2. Следящие дифференцирующие системы 279 симая динамикой фильтра, однако теперь \e{t)\ < А и оценка (9.22) не имеет места. Используя выражение из (9.22), находим оценку, при­ годную для этого случая. Имеем 1/' ,т/Т г(<) dT < I e(t) еЧ'^ - е(0) | + 0 | e{t) \ {е"'^ - 1) < 2Д (е""^ - 1). После подстановки найденной оценки, (9.23) и (9.24) в (9.17), устана­ вливаем справедливость оценки погрешности дифференцирования: 2А / \xf{t)-g{t)\<TM^--+(k + TM^ 2А )е'/^ — (9.26) Теперь видно, что при Т -> О погрешность не уменьшается, как ожи­ далось, а напротив, увеличивается. Точность дифференцирования действительно будет повышаться, если имеет место условие •• Д п hm -= = 0. т->о Т С физической точки зрения последнее соотношение означает (9.26), что высокочастотная составляющая сигнала y(t) действительно от­ фильтрована и выделена только полезная составляющая д. Проведен­ ное исследование показало, что • в релейном дифференциаторе невозможно выбором единственного параметра Т одновременно уменьшить погрешности, вносимые ди­ намикой фильтра {ТМ) и неидеальностями переключений ( А / Т ) . Ангшогичный результат имеет место и тогда, когда вместо инерь ционного фильтра на рис. 9.23 используется фильтр "скользящего" среднего, представленный на рис. 9.27. Кроме того, под ограничение е к !/ -к г X Ts 1 ! Рис. 9.27 1^1 < А; не попадают экспоненциальные, полиномиальные или высоко­ частотные гармонические сигналы. Поэтому представляет интерес исследовать возможности, возникающие при использовании регуля­ тора переменной структуры в замкнутом контуре дифференциатора.
Глава 9. Дифференцирование сигналов 280 9.2.3. Дифференциатор переменной структуры Структурную схему дифференциатора переменной структуры, кото­ рому соответствует пара изобразим в стандартном для теории СПС виде (рис. 9.28). Уравнения •Ф ¥ Ts+l Рис. 9.28 дифференциатора переменной структуры (далее называемого СПСдифференциатором) имеют вид e=a-z, Z = у, // \ = i^ f _^^_ кг, y=i>(z,e) Тх -{• X = у, ez ^ ^<^ к,Т = const > 0; выход X принимается за оценку производной д. Поскольку данную ^-ячейку можно описать формулой у = ipiz, e) = k\z\sgne, то уравнение движения замкнутого контура дифференциатора имеет следующий вид: ё = -*г I г I sgn е -I- ^. Если знаки д{0) и z(0) совпадают и сигнал g{t) принадлежит классу сигналов Г, т.е. 9{t)£T= {д\ \д\ < 7 | д | , \9\<М, М , 7 = const > О } , то при выполнении условия к > у сигнал нарастая (убывая) по экспоненте, за конечное время "догонит" сигнал g{t), и в нуле z = О возникнет скользящий режим (рис. 9.29).
9.2. Следящие дифференцирующие системы 281 В скользящем режиме е = О, т.е. z = д, среднее значение сигнала у определяется выражением и, следовательно, на выходе инерционного фильтра имеем оценку про­ изводной Xf (<), подобную установленной в предыдущем пункте. Именно .гШ г(0) '9Н) ^^PN r*;J 5(0) СКОЛЬЗЯЩИЙ режим \ 0 Рис. 9.29 при аналогичном предположении |^| < М и при идегшьных переключе­ ниях справедлива оценка I =^f (О - т \<ТМ+{у\ д{0) \ + ТМ) е-*/^. При наличии пространственной задержки Д > О в переключениях имеем реальный скользящий режим (рис. 9.30). Точность дифференzit) / . 9(t) 9(0) г(0) '" Реальный скользящий режим 0 ( Рис. 9.30 цирования в реальном скользящем режиме характеризуется оценкой 2А ,-tlT (7И0)| + Г М + ^ )
Глава 9. Дифференцирование сигналов 282 Несмотря на то что класс допустимых сигналов теперь включает экспоненты, принципиальных изменений не произошло. • По-прежнему трудно разрешим компромисс между инерционно­ стью фильтра и его фильтрующими свойствами в режиме реаль­ ного скольжения. Кроме того, при несовпадающих знаках д{0) и z(0) дифференциатор неработоспособен. Вследствие этого использование его для дифференцирования синусо­ идальных сигналов неэффективно. Для преодоления указанных трудностей можно в замкнутом кон­ туре управления применить сочетание релейного (линейного) и СПСрегуляторов. Структурная схема системы приведена на рис. 9.31. В э. Ф- -^ \|/ •^ Ts+1 Рис. 9.31 этом случг^е уравнение замкнутого контура имеет вид e = -{k3\z\ + k2)sgn e-kie+g и класс дифференцируемых сигналов удовлетворяет условию \д\ < к2 + кз\д\, ^ ь ^ г . ^ з = const > 0. Все остальные события разворачиваются описанным выше образом. Указанные трудности преодолеваются, однако проблема точности дифференцирования остается и для ее разрешения нужны иные схемы. Другие подходы требуются и для реализации повторного дифферен­ цирования, так как производная х разрывна и возникает необходи­ мость в дополнительном фильтре либо ином принципе построения дифференциатора.
9.3. Следящий асимптотический бинарный дифференциатор 283 9.3. Следящий асимптотический бинарный дифференциатор Структура бинарного дифференциатора изображена на рис. 9.32, где не определен пока вид КО-регулятора Д^. Регулятор R^ должен вы­ бираться так, чтобы при гладкости выходного сигнала у, что устра­ няет необходимость использования выходного фильтра Fout и создает 9 Г^ "' Т М •49 • Kj 1 S Рис. 9.32 предпосылки для повторного дифференцирования, обеспечить, кроме того, прочность системы дифференцирования. Уравнения бинарного дифференциатора таковы: е = д- Z, ц = R^e, у = kafiz, z = у. (9.27) Пусть сигнал д удовлетворяет условию д ^Т, где Г = { « / I |д|<7|</1. 7 = const>0}. При дальнейшем исследовании удобно использовать 0-переменные i = е/</, а = д/д. (9.28) Теперь стабилизацию ошибки е в нуле можно заменить стабилизацией функции ^ в нуле, при этом а будет выступать в роли равномерно ограниченного возмущения (|а| < 7)- При получении уравнения дви­ жения замкнутого контура относительно 0-ошибки ^ сначаша имеем из (9.27) и (9.28) ^_ё ёд _д-у сЗ - ( \ t)^ ^3/iz _ = (i-0^-*3/i(i-0 или после замены д/д из (9.28) получаем искомое уравнение ^=(l-0(a-*3^i), |а|<7- (9.29)
284 .. Глава 9. Диффереицироваине сигналов Если а — неизвестная функция, то стабилизацию в малом ошибки ^ в нуле гарантирует при кз> f разрывной закон fi = sgn^. (9.30) При идеальных переключениях этот закон приводит к дифферен­ циатору переменной структуры, так как в этом случае е /* = 8gn - = sgn е sgn д — sgn е sgn z 9 и далее у = кзг(л = fcaklsgne, а это и есть выход СПС дифференциатора. При неидеальных переключениях, например, при пространствен­ ной задержке Д, имеем |^| < Д и, значит, |е| < А\д\, а не |е| < Д, как в СПС-дифференциаторе. Последнее означает, что • при дифференцировании малых сигналов рассматриваемый бинар­ ный дифференциатор предпочтительнее СПС-дифференциатора. Тем не менее релейный КО-регулятор ведет к разрывному выходному сигналу у и, как следствие, к необходимости использования выходного сглаживающего фильтра. Это не соответствует заявленным целям. Поэтому рассмотрим теперь интегрально-релейный КО-закон /i = fc2Sgn[€-|-/i|^|], (9.31) который вместе с уравнением (9.29) задает подлежащую анализу за­ мкнутую систему. Поскольку рассматривается стабилизация в мелом (|^|<^,<5<?С1), то заменой переменного получаем эквивалентную задачу стабилизации Ef-системы ф = а — кзц, L г . .1 (9-32) ft =-k2Sgn [ v + /^lvljНо это стандартная система, подробное исследование которой про­ водилось в КО'Теории (глава 4). Опираясь на установленные в КОтеории результаты, заключаем, что Е^-система при d = const диссипативна (рис. 9.33) и, следовательно, такой дифференциатор не дает асимптотически точного дифференцирования. Указанную трудность можно преодолеть двумя путями.
9.3. Следящий асимптотический бинарный дифференциатор 285 Первый путь состоит в использовании линейного интегрально-ре­ лейного КО-регулятора >^1=Ы, /i2 = *2Sgn [^ + А*2|^|]. (9.33) Теперь, по описанной выше схеме, получаем уравнения замкнутой Е^системы ф= а-кзк1(р-кз^12, fi = k2SgTL[ip + li2\'P\]- (9.34) (9.35) Дифференцируя по t уравнение (9.34) и подставляя в результат ыг из (9.35), получаем при |;i| < 1 уравнение (р + кзк1ф + кзк2sgn <р = а. (9.36) При кз к2 > sup \а\ это уравнение имеет нуль г1симптотически устойчивым положением равновесия. Следовательно, 0-переменная ^ —> О при < —> оо и, значит, исходная ошибка слежения е убывает. Рис. 9.33 По доказанному выше е -»^ О при t -)• оо, значит, z -^ д при t -»^ оо, а поэтому в силу гладкости z -^ д. Но Z =z и = у + kie, откуда и следует требуемое g(t) - y{t) - ^ 0 , f -> оо. На рис. 9.34 изображена структурная схема бинарного дифференциа­ тора с линейным интегрально-релейным законом стабилизации. Второй путь достижения асимптотической точности дифференци­ рования основан на использовании инерционно-релейного КО-регуля­ тора (здесь уже проведена замена ^(^)) ii-\-k2fi = Аг2 sgn V- (9.37)
Глава 9. Дифференцирование 286 сигн&лов Это уравнение вместе с уравнением 0-объекта ф = а — кзц определяют замкнутую ^'^-скстещ. Структурная схема бинарного дифференциатора с инерционно-ре­ лейным регулятором приведена на рис. 9.35. Для анализа устойчиво- К И 9 -».* о 1^ =п :;т М2 -й- к -® Рис. 9.34 9 "ЕЯ • »з " 1 S Рис. 9.35 СТИ замкнутого контура S3-системы продифференцируем по t уравне­ ние ^ = a—kafi, подставим в него /i из (9.37), а в полученном уравнении
9.4. Финитный бинарный дифференциатор 287 заменим /i выражением (а — 0/*з- В результате долучим уравнение V? + *2^ + *з*2 sgnip = a + к^а. (9.38) Это уравнение нетрудно сделать асимптотически устойчивым в нуле, для чего достаточно обеспечить выполнение условия Лз*2 > sup|d + fc2a|. t>o Таким образом, <р -^ О при t -^ оо и, значит, данная система также обеспечивает асимптотически точное дифференцирование y{t)-g(t)^0, t-^oo. Перейдем теперь к описанию финитного бинарного дифференциа­ тора. 9.4. Финитный бинарный дифференциатор Обобщенная структурная схема финитного регулятора ничем не от­ личается от стандартной схемы бинарного дифференциатора. Спе­ цифика его в том, что используется К-регулятор стабилизирующий бинарный КО-регулятор R^, гарантирующий возникновение скользя­ щего режима 2-го порядка (рис. 9.3ва), т.е. такого режима, когда не только е, но и ё непрерывна, а претерпевает разрывы только ё. С начала такого скольжения, конечно, тождественно выполнены равен­ ства е = О, ё = О, и с этого момента времени y{t) = g{t) (рис. 9.366). В качестве такого алгоритма стабилизации может быть использован любой алгоритм, описанный в главе 5: алгоритм конечного скручивания, оптимальный по времени или дрейфа. За подробностями отсылаем читателя к ука­ занной главе. е 9 Регулятор финитного схолыкени! Ии г 'Ш ft кз У 1 S Рис. 9.36
Глава 9. Дифференцирование сигналов 288 Здесь же в качестве примера опишем принцип построения алго­ ритма конечного скручивания. Как установлено выше, задача стаби­ лизации замкнутого контура может быть сведена к задаче стабилиза­ ции в нуле скалярного объекта ^ = а — кзц, (9.39) |<i| < 7. 7 = const. Положим для простоты а = const, и пусть известны знаки переменной V? и ее производной ^. Тогда алгоритм /i = —kisgn(р— кзsgn^, ^1,^2 = const > О (9.40) финитно стабилизирует объект (9.39) в нуле. В самом деле, из (9.39) и (9.40) имеем уравнение второго порядка • ** ф + k3k2Sgn^ + k3kisgnip~0, фазовые траектории которого — пара­ болы, определяемые уравнениями ^ = ± а = ± *з (*2 + ^fi). ф= ±Р= ±кз{к2-к{), и если а > /? > О, то в режиме скручивания фазовая точка за конечное время попадает в нуль. Отметим, что в нуле возникает скользящий режим 2-го порядка. Это означает, что при наличии малой задержки г в переключении отклонение у> от нуля имеет 2-й порядок малости по г, т.е. \ip\ ~ О(г^), а не 1-й порядок {\ip\ ~ 0{т)), как при обычном скольжении. Рис. 9.37 9.5. Н е с т а н д а р т н ы е дифференцирующие системы В следящих дифференцирующих системах (рис. 9.38) выбор оператора К-связи Ry направлялся на обеспечение и поддержание равенства z = 9, (9.41) из которого при надлежащей гладкости и получалась оценка произ­ водной у = z=i д. -^ rout Рис. 9.38
9.5. Нестандартные дифференцирующие системы 289 Точное равенство (9.41) удг1ется обеспечить только с помощью глу­ бокой {к —> оо) или разрывной обратной связи. Во всех случаях оценка производной формировалась из выходного сигнала у К-регулятора Ry. При наличии аддитивной помехи в обрабатываемом сигнале и амплитудного ограничения на входе К-регулятора это снижает поме­ хозащищенность дифференциатора и, как следствие, ухудшает оценку производной. Кроме того, гарантированное качество дифференцирования в си­ стемах с разрывным К-регулятором Ry, как следует из приводив­ шихся выше оценок, заметно ухудшается с ростом амплитуды раз­ рывного (коммутируемого) сигнала. Следовательно, важно изыскать новые средства и методы построения дифференцирующих систем, в которых влияние этих факторов ослаблено. Рассмотрим два новых вида дифференцирующих систем. 9.5.1. Дифференциатор с "малой" амплитудой разрывов Принцип построения дифференциатора с малой амплитудой разрывов основан на следующей достаточно очевидной идее, которую поясним на примере релейного дифференциатора. Если выделить среднюю со­ ставляющую разрывного сигнала на входе интегратора, например, с помощью инерционного звена, а результат прибавить к выходному сигнг1лу релейного регулятора (рис. 9.39), то среднее значение разе 9 к X У й •» -к "'г 2 л 1 1 S1 TS+1 9 Рис. 9.39 рывного сигнала у в режиме стгьбилизации, когда е = О, будет равно нулю. Последнее означает, что скользящий режим в этом случае мо­ жет поддерживаться сколь угодно малой величиной коммутируемого сигнала. Формально это следует из уравнений е =д -и, и = у + х, тх + X = и, у = к sgn е. (9.42) Если в точке е = О возникнет скользящий режим, то ё = О и эквива­ лентное значение управления дается выражением «eq = 9-
Глава 9. Дифференцирование сигналов 290 Но тх + X = и И, значит, сигнал x{t) доставляет асимптотическую оценку производной д. Следовательно, среднее значение сигнала ( J/eq = «eq - г ) -> О, t-^ ОС. Для более точного исследования данного дифференциатора удобно преобразовать его структурную схему к виду, представленному на к е 9 V 1 те -к Z •\v U 1 !1 Рис. 9.40 рис. 9.40. Помимо ошибки слежения е введем ошибку дифференциро­ вания £ = д-х (9.43) и запишем уравнения движения дифференциатора в переменных (е, f). Из (9.42), (9.43) и рис. 9.40 имеем _ ц=д~х У =д . . к =д sgne, (9.44) Г 7" ё = £ — у = е — к sgn е. (9.45) Для анализа устойчивости нуля системы (9.44), (9.45) используем функцию Ляпунова вида r = ( V r ) | e | + eV2Ее производная в силу системы (9.44), (9.45) при е фй имеет вид к _ к V = - (sgn е)ё + £(л = - sgn eieт т к sgn е)+ (.. к sgn е \1 =ед .. к^ . +е 1д Из последнего выражения следует, что если \д\ < М, М = const, (9.46) то по крайней мере для начальных условий к^ (9.47)
9.5. Нестандартные дифференцирующие системы 291 через конечное время в точке е = О возникает скользящий режим. В этом случае эквивалентное значение разрывного сигнала определено равенством ksgn^qe = £, после подстановки которого в уравнение (9.44) получаем уравнение изменения ошибки дифференцирования г/Г + е = т'д. Если выполняется (9.46), то справедлива следующая оценка погреш­ ности дифференцирования: (9.48) \£(t)\<TM. Из (9.47), (9.48) устанавливаем неравенство, ограничивающее снизу величину разрывов: it > тМ. Выводы: • Амплитуда разрывов в идеале может быть сделана сколь угодно малой. • • В реальной схеме постоянного фильтра т > Тст, где Тсг определя­ ется неидеальностями переключений, поэтому амплитуда разры­ вов не может быть меньше fccr > ТстМ. В рассмотренном дифференциаторе класс допустимых сигналов расширен до сигналов с ограниченной д. 9.5.2. Нестандартный бинарный дифференциатор Если предыдущий нестандартный дифференциатор основывался на следящей системе, то рассматривг^емый ниже дифференциатор бази­ руется на принципиально иной идее. Суть ее проясняет рис. 9.41. Из ^ - с', '\ 9' щ 1 У S Рис. 9.41 рисунка видно, что в качестве оценки производной сигнала g{t) пред­ лагается использовать ошибку "слежения" е = д - Z.
292 Глава 9. Дифференцирование сигналов Смысл этой идеи можно пояснить следующим образом. В стан­ дартной следящей системе е = О и выход регулятора Ну совпадает с производной д. Если к сигналу g(t) добавляется помеха qsinut, то на выходе регулятора имеем сигнал д + qujcosut, причем возможно, что gw 3> 1. Поскольку на выходе регулятора всегда имеются ампли­ тудные ограничения, то они будут постоянно нарушаться и оценка производной искажается. Поэтому возникает идея о "снятии" произ­ водной до регулятора, так как в этом случае можно рассчитывать на уменьшение негативного влияния амплитудных ограничений. Проведем предварительный анализ схемы на рис. 9.41. Ее описы­ вает операторное соотношение Ли е = д- z = д -е, S где S — символ операции дифференцирования. Следовательно, Для того чтобы дифференциатор давал сколь угодно малые фазовые и амплитудные искажения, необходимо выполнение равенства при назначенной по произволу постоянной времени г = const > 0. Из сравнения (9.49) и (9.50) находим требуемое для этого выражение для оператора Ry = {T-l)s+l. (9.51) Из формулы (9.51) видно, что для решения этой задачи (т.е. задачи дифференцирования) линейными средствами требуется оператор "чи­ стой" производной. Получается порочный круг, разорвать который можно только использованием эффектов, наблюдаемых в нелинейных системах. Здесь уместно напомнить, что в главе б (0-теория). уже возни­ кала сходная ситуация, когда в результате использования трех типов обратной связи (К-, КО- и 0-связей) удавалось получать оператор вида (9.51), т.е. оператор, преобразующий ошибку регулирования xi во взвешенную сумму ошибки и ее производной: и = {-к/5) а - i-k/S) ( i i + dxi) Но u = fixi, и из сравнения этих выражений находим, что действие fx эквивалентно действию оператора Ru = i~kfS)(s + d).
9.5. Нестандартные дифференцирующие системы 293 Воспользуемся рекомендациями КО- и 0-теорий. В результате по­ лучим структурную схему, изображенную на рис. 9.42. В этой схеме f Se ^' 6h \9 1> 1 ^ ' tiy ^ * ' 1 ' К, • ,^ * Ф= м 1 ^ 3 \ Нд ) ^ е By • ' Z ) N. 9 у 1 .1 Рис. 9.42 следует задать операторы КО- и 0-регуляторов Д^ и Rf,, соответ­ ственно, бинарную операцию By и задатчик Se • Штриховкой выделен регулятор Ry. Если интересоваться лишь принципиальными возможностями ис­ следуемой схемы, то естественно воспользоваться результатами Отеории и выбрать операторы R^, Rp, Se и бинарную операцию By в виде R^, : fi = ksgn (ге, «г = е* — е, Rp : р = q(i, Se : Те' + СрС' = е, к = const > О, q = const > О, с^ = с -|- ^, с = const > О, By : J/ = ВуС = fie. Указанный выбор продиктован следующими соображениями. Если ошибка (т = О, то е = е* и из уравнения задатчика Se получаем Те + СрС = е. Но Ср = с + qfi, поэтому последнее уравнение может быть переписано в виде Те + {с — 1)е = —q/ie.
Глава 9. Дифференцирование сигналов 294 Это означает, что "действие" операторной переменной ft по эффекту эквивалентно "действию" оператора _ Г. + (с-1) Сравнивая это выражение с требуемым Ry = {T-l)s+l, получаем соотношения для расчета параметров схемы 1-г=-, l = i ^ , (9.52) Ч Я которые нетрудно удовлетворить. В итоге получаем требуемое урав­ нение тё + е= д. В соответствии с этим выбором структурная схема дифференциатора конкретизируется и принимает вид, показанный на рис. 9.43. к 1 ••V J Ts+cp -к е sgn Р к j^ 9 Ч е « •ч V г 1 S 1Г Ч|—1 9 у Рис. 9.43 Перейдем к анализу дифференцирующей системы. Указанные по­ следствия наступают только в том случае, если с некоторого момента времени <т = 0. Для получения условий, гарантирующих этот факт, запишем уравнение изменения ошибки сг. Поскольку (Т = е* — е, то имеем сначала (T = e ' - e L = —z~ g + fie.
9.5. Нестандартные дифференцирующие системы 295 Но е, = ст + е, поэтому = 1-е ^ е с + g/i Д g \ (9.53) ^ <т , + ^е(^1 ^ j . Из соотношений (9.52) следуют равенства 1—с 1 Г ~1-г' с 1—9 Г~д(1-г)' , 9 Т~ 1" 1-т' 1 g Т~ 1-т' поэтому (9.53) можно переписать в виде е сг = :;1-г {l-q + q(i)(T g JZ ( l - r ); . г 9И^-. " '^ 1-т- Поскольку ^1 = к sgn ((те), то окончательно получаем уравнение Заметим теперь, что ничто не препятствует выбору параметра q достаточно малым, например таким что q{k+1)<1. (9.55) Тогда коэффициент (напомним, что \ft\ < к) 1-q + qfi >0. q{l - т) Для того чтобы в точке <т = 0 существовал скользящий режим, следует позаботиться, как это следует из (9.54), о выполнении неравенства <^{е - 9 + тд - A;r|e|sgn (т) < 0. По крайней мере в малой окрестности точки <т = О это условие выпол­ нено, если \д\ < k, (9.56) поскольку при этом е = д. Таким образом, если выполнены соотношения (9.55), (9.56), то при начальных условиях из некоторой окрестности <г = О через конеч­ ное время возникает скользящий режим, поддерживающий требуемое равенство <т = 0. Вследствие этого наступают описанные ранее бла­ гоприятные последствия, а именно:
Глава 9. Дифференцирование сигналов 296 • использование разрывной стг1билизирующей обратной связи не вле­ чет необходимости использования в данном случае "сглаживаю­ щего" выходного фильтра, что является обязательным в других разрывных дифференцирующих системах, однако для получения старших производных такие "сглаживающие" фильтры могут по­ требоваться. • ограничения на класс дифференцируемых сигналов l^fl < const, |<;| < const могут быть ослаблены до < const, если воспользоваться сочетанием идеи, положенных в основу по­ строения рассмотренных нестандартных дифференцирующих си­ стем (рис. 9.44). Прием позволяет уменьшить амплитуду коммутируемого сигнала. Подробности опускаем. 1 Ts + Cr ^-^^на sgn /Л Ч <J ^ ^ xs Рис. 9.44 В завершение темы приведем результаты дискретного моделиро­ вания нестандартного бинарного дифференциатора.
9.5. Нестандартные дифференцирующие системы 297 9.5.3. Результаты дискретного моделирования нестандартного бинарного дифференциатора Дифференцируемый сигнгиг g{t) = sin t + e sin (10001) содержит полез­ ный сигнал sin t и помеху esin (1000 <). Параметры в схеме дифферен­ циатора, изображенного на рис. 9.43, выбраны следующим образом: Т=1/20, 9 = 1/19,8, с = 0,95, к=1. При этих значения т = 0,01. Разностная схема построена методом Эйлера с шагом h = 0,001. Результаты моделирования приведены на рисунках. На рис. 9.45 приведены графики оценок первой производной при наличии шума, полученных в рамках классической схемы при помощи линейного дифференциатора с передаточной функцией W(s) = - TS+1 На рис. 9.45а,в представлены результаты дифференцирования сигнала с уровнем помехи е -^ 10~^, а на рис. 9.456,г даны графики, полу- 1 Мш11, 1 0 Щт 4J -1 Рис. 9.45 ченные в результате дифференцирования того же сигнала с уровнем помехи е ~ 10"^.
298 Глава 9. Дифференцирование сигналов На рис. 9.46 приведены результаты дифференцирования в рам­ ках неклассической схемы дифференцирования при помощи нестан­ дартного бинарного дифференциатора. Представлены графики оце- i 1 0 \ \ -1 л t f • '!} 8 t / б о Рис. 9.46 -1 Рис. 9.47 нок второй, третьей, четвертой и пятой производных соответственно, при последовательном дифференцировании без помехи (е = 0). На рис. 9.47 приведены графики оценок первой производной при наличии шума, полученные при последовательном дифференцирова­ нии нестандартным бинарным дифференциатором с уровнем помехи
9.5. Нестандартные дифференцирующие системы 299 е ~ 10"^. Графики оценок первой производной при наличии шума, по­ лученные при последовательном дифференцировании нестандартным бинарным дифференциатором с уровнем помехи е ~ 10"^, приведены на рис. 9.48. Рис. 9.48 На рисунках 9.45-9.48 квадратами обозначены производные, а тре­ угольниками — оценки производных.
Глава 10 Субоптимальная стабилизация неопределенного объекта Рассмотрим случаи, когда задача оптимальной стабилизации неопре­ деленного объекта решается точно или приближенно. Подход к реше­ нию базируется на сочетании идей оптимальной стабилизации, асим­ птотической инвариантности и теории бинарного управления. Инва­ риантность поля экстремгшей к факторам неопределенности служит несущим элементом развиваемой конструкции. При этом от факторов неопределенности зависит лишь оптимальная обратная связь. Для ее приближенной реализации используются новые типы обратной связи и методы бинарного управления. Проводится сравнение предлагаемого подхода с известными методами: усреднения, гарантированного ре­ зультата, глубокой обратной связи и т.п. 10.1. Постановка задачи оптимальной стабилизации Оформление оптимальной стабилизации в самостоятельное направле­ ние теории оптимального управления в детерминированной поста­ новке уходит своими корнями к трудам А.А. Летова, Р. Беллмана, А.А. Красовского и в стохастической постановке — к трудам Р. Калмана. В результате многолетних усилий была создана теория АКОР (аналитического конструирования оптимальных регуляторов). Центральное место в теории АКОР занимает проблема синтеза оптимальной обратной связи, стабилизирующей детерминированный или стохастический объект в условиях, когда имеется полигл инфорь мация о его поведении и ха'рактеристиках внешних сил. В реальных условиях информация об объекте и действующих на него возмуще­ ниях всегда неполна, а так как оптимальное решение, как правило, весьма чувствительно к вариациям условий задачи, то рекомендации этой теории могут быть юяты только за основу и редко используются на практике. Возможности теории АКОР несколько расширяются при сочета­ нии ее методов с методами адаптивного управления. Внутренние ограничения теории адаптивного управления не могли привести к универсальным методам оптимальной стабилизации при неопределен­ ности, и потому рассматриваемая проблема сохраняет актугшьность. Требуется новый взгляд на проблему оптимального управления при неопределенности. В частности, представляет интерес выделение тех
10.1. Постановка задачи оптимальной стабилизации 301 ситуаций, в которых возможно получить оптимальное или сколь угод­ но близкое к оптимальному (субоптимгшьное) решение задачи ста­ билизации при значительной неопределенности в описании объекта управления или внешних сил. Здесь и далее под значительной не­ определенностью понимается наличие информации лишь о мажоран­ тах функций, описывающих возмущения, и, быть может, о каналах их воздействия на объект. В этом разделе ограничимся рассмотрением задач оптимальной стабилизации в следующей постановке: для конечномерного объекта х = f{t,x,u,a), t>to, содержащего компактную неопределенность а£А, требуется синтезировать реализуемую оптимальную обратную связь по состоянию, переводящую объект из любого начального положения хо в наперед заданное состояние хх к моменту времени ti > <о, удер­ живающую объект в положении xi при всех < > <i и минимизирующую функционал -J. J{a)= I F{t,x,u,a)dt. Здесь X G R " — фазовый вектор, u G R — управление. Функции / , F таковы, что гарантируется существование оптимальной обратной связи для каждого а Е А. Суть рассматриваемой проблемы заключа­ ется в том, что возмущение а точно не известно и не может быть иден­ тифицировано. Необходимо описать класс объектов и функционалов, для которых сформулированная постановка задачи оптимальной ста­ билизации допускает физически осмысленное решение. Положитель­ ный ответ на этот круг вопросов и составляет главное содержание раздела. Кратко суть предлагаемого подхода можно пояснить следующим образом. Пусть возмущение а известно. Тогда функция Uopt(<, X, а) = argmin J(a) и определяет оптимальную обратную связь, и уравнение поля экстрема­ лей принимает вид iopt = /opt(<,a;opt) = f{t, lopt, u{t,Xopt,a), a). Первая очевидная возможность реализации оптимальной системы имеет место тогда, когда Uopt не зависит от возмущения а. Вторая возможность менее тривигшьна и возникает тогда, когда поле экс­ тремалей не зависит от возмущения а. В этом случае, конечно, Uopt зависит от возмущения и не может быть реализовано точно. Исполь-
302 Глава 10. Субоптимальная стябнлизация зование новых типов обратной связи и методов теории бинарного управления дает возможность сколь угодно точного приближения к оптимальному закону управления. Общему рассмотрению проблемы предпошлем иллюстративный пример, демонстрирующий особенности развиваемого подхода. 10.2. Пример задачи оптимальной стабилизации при неопределенности Рассмотрим для простоты скалярный объект X = ах + и, t >0, с неизвестным параметром а, удовлетворяющим ограничению где А — известная константа. Оптимальная обратная связь должна переводить объект из произвольного состояния го G R- в нуль за бесконечное время, доставляя минимум квадратичному функционалу "полной энергии" 00 J{a)=l(^x'+^x'^dt. Здесь 7 — известный положительный параметр. Следуя традиции, при расчете «opt используем функцию Беллмана оо v{t) = f (х^ + \хЛ dr, t>0. в соответствии с принципом оптимальности функция v(t) удовле­ творяет дифференциальному уравнению Беллмана "1?Ч^''''"'^^'} = °Полагая v = кх^/2, находим выражение для оптимального управления в следующем виде: «opt = —ах —X. Подстановка последнего в уравнение Беллмана позволяет определить параметр функции Беллмана Л = 2/7, и вместе с ним — окончательный вид оптимальной обратной связи «opt = - ( 7 + а)а;.
10.3. Оптимальная стабилизация "в среднем" 303 Поле экстремалей в этой задаче порождается дифференциальным уравнением, не зависящим от параметра а: iopt + 7^opt = О, а минимальное значение функционала J(a) также не зависит от а и определяется равенством 1 - f° "Opt — 7 Реализация найденной обратной связи, разумеется, невозможна, поэтому следует изыскать способы ее приближенной реализации. Рги:смотрим те из них, которые основаны на устранении неопределен­ ности в рассматриваемой задаче еще на начальной стадии. Первая возможность, которую мы рассмотрим, связана с идеей усреднения и предполагает наличие информации о плотности распределения пара­ метра а. 10.3. Оптимальная стабилизация "в среднем" Пусть для определенности плотность распределения параметра а рав­ номерна на отрезке [—А, Л ] , т.е. р(.) = 5^. Тогда минимизации подлежит среднее значение функционала А J{A)= j p{a)J{a)da, -А и в соответствии с этим нужно рассматривать усредненную функцию Беллмана А v= I v{t)p{a)i }da, -А если, конечно, для синтеза обратной связи используется принцип опти­ мальности Беллмана. В таком случае уравнение оптимальности имеет вид mm U {^-^-И-"- Если положить V = кх'^/2 и провести усреднение, то уравнение опти­ мальности примет вид ^2^2 mm „2
304 Глава 10. Субоптимальная стабилизация Все величины в предыдущем уравнении известны, т.е. ситуация полностью определена, и, следовательно, его можно решить. Сначала находим, что •fk 2 Далее подставляем найденное выражение в уравнение оптимальности и определяем параметр усредненной функции Беллмана Тогда окончательный вид оптимальной обратной связи определяется выражением •X, поле экстремгией подчинено дифференциальному уравнению а минимальное значение усредненного функционала задается форму­ лой 7 - /iT^^o Итак, в методе усреднения оптимальная обратная связь детерми­ нирована, поле экстремалей зависит от_неопределенного параметра, а оптимальное значение функционала Jopt превосходит минимально возможное значение Jopt, так как AJ — Jopt — Jopt = Это неравенство и определяет потери в оптимальности при стабили­ зации "в среднем". 10.4. Минимаксная оптимальная стабилизация Если информация о плотности распределения отсутствует, то сведе­ ние рассматриваемой задачи с неопределенностью к задаче без не­ определенности возможно с помощью идеи гарантированного резуль­ тата, когда минимизации подлежит "наихудшее" значение функционг1ла. Формально эта процедура сводится к известной проблеме минимакса и поиску седловой точки. Сохраним приверженность прин­ ципу оптимальности Беллмана и для определения функции Беллмана
10.4. Минимаксная оптимальная стабилизация 305 V = кх^/2 воспользуемся уравнением дифференциального минимакса min max < кх(ах + tx) Н—^(ах + и)^ + х^ > = 0. Непосредственный анализ выражения в скобках позволяет устанавить, что его максимум по а £ А достигается при + их (?"'+"0- а* = Asgn I —^х Поэтому выбор оптимальной обратной связи надлежит проводить те­ перь на основе минимизации полностью определенной функции, т.е. vin<ll mm + -jjx^+A кх^+ ^2- + — + кхи> = 0. Отсюда находим оптимальную обратную связь в виде «opt = fk ^Х, где коэффициент функции Беллмана , 2 /, А2 т.е. оптимальная по принципу минимакса обратная связь линейна и дается выражением «opt = -Vl^ + А'^х. Поле экстремалей описывается дифференциальным уравнением iopt + {уу"^ + А^ - aj lopt = О, а минимаксное значение функционала дается выражением Абсолютные потери в оптимальности при таком подходе к синтезу обратной связи определяются равенством ^J - Jopt - ^ p t - W1 + ^ —.
Глава 10. Субоптим&льиая стабилизация 306 10.5. Стабилизация с использованием эталонной модели и глубокой обратной связи по ошибке Хорошо известно, что глубокая обратная связь является эффектив­ ным средством подавления возмущений. Прямое ее использование в рассматриваемой задаче, однако, ничего не дает. Поэтому прежде всего обратим внимание на то, что поле экстремалей не зависит от фактора неопределенности и, следовательно, соответствующее диф­ ференциальное уравнение можно принять за уравнение эталонной мо­ дели. Тогда глубокая обратная связь может быть введена по сигналу ошибки е = X — Xopt и использована для ее обнуления, в соответствии со схемой рис. 10.1. Пусть, например, глубокая обратная связь линейна и реализуется увеXopt Модель flJ X Глубокая ОС Рис. 10.1 личением коэффициента усиления к > О до бесконечности, т.е. и = —ке, Л —> 00 . Тогда уравнение системы в отклонениях имеет вид е = -(7 + *;)е + {а + 'у)х. При Л -> 00 ошибка уменьшается до нуля и поведение замкнутой си­ стемы ничем не отличается от оптимального. Формально найденное решение полностью исчерпывает рассматри­ ваемую проблему, так как потери в оптимальности равны нулю. Но если интересоваться решением, имеющим прагматический смысл, то приходится учитывать наличие физических ограничений и исследо­ вать грубость такой оптимальной системы по отношению к регуляр­ ным и сингулярным возмущениям. Хорошо известно, что системы с большим коэффициентом усиле­ ния в обратной связи негрубы по отношению к сингулярным возму­ щениям, и потому запрещено использовать коэффициенты усиления, превосходящие некоторое критическое значение ксг- Но если к < к^,
10.5. Стабилизация с использованием эталонной модели 307 то ошибка е ^ О и возникают потери в оптимальности, для оценки которых запишем уравнение в отклонениях ё = —к^е + а.уХ, где Ц = Л + 7i а-у = о + 7- Поскольку е(0) = О, то для всех t > О верна оценка |е|<^|а:|, Ау=А + г Из этого соотношения и следующего очевидного неравенства к1 < kopt| + |e| при достаточно большом значении к (т.е. к > А) следует необходимая для дальнейшего оценка \x\<m\xopt\, к. "^=•f:ГJ^• Интегрант функционала задачи J - ке)^ F = x^+ •^{ах 7' оценивается неравенством F<Mx\ М=1 + 1 Г л + ^ ) . Поскольку на экстремали интегрант определен равенством то при t > О имеет место неравенство _ ^ гг?М _ Р < —2—^орь и потому абсолютные потери в оптимальности удовлетворяют нера­ венству Разумеется, эта оценка завышена. Для получения более "деликат­ ного" результата следует ввести в рассмотрение функцию ^{i) как решение дифференциального уравнения i = -{k^-\-a)(, + k(^-\-a^, отвечающее тривиальному начальному условию ^(0) = 0.
308 Глава 10. Субоптимальная стабилизация Теперь ошибка е определяется равенством е = ^ж, а интегрант функционала удовлетворяет оценке где М( = max 1 + —(а - Ц)^ Если т ? = m a x [ l / ( l — ^ ) ^ ] , то окончательная оценка абсолютных потерь имеет установленный выше вид, но с более "точными" кон­ стантами: AJ^-^ ''opt = ~ •'optJ^J-J...<r^-l]<. li Эта оценка примечательна тем, что при Аг —> оо она убывает до нуля. Заметим, что это свойство не выполнено для предыдущей оценки. Таким образом, увеличение коэффициента усиления в обратной связи повышает качество системы управления, но только до опреде­ ленного предела, зависящего от критического коэффициента усиления кет- При этом, конечно, по-прежнему актуален вопрос о существова­ нии иных методов, уменьшающих потери в оптимальности или устра­ няющих их вовсе. Если а = const, то некоторые надежды можно связать с идеями идентификации и адаптации. Процесс идентифи­ кации параметра вызывг1ет потери в оптимальности, сопоставимые с потерями предыдущих методов, и, следовательно, не приводит к качественно новому результату. Ограничивает возможности этого подхода и тот факт, что параметр а должен быть фиксирован. 10.6. Стабилизация методами теории бинарного управления Для методов теории бинарного управления характерно принципиаль­ но отличное, например, от метода большого коэффициента усиления использование независимости поля экстремалей задачи от фактора не­ определенности. Если при стандартной обратной связи сначала определяется за­ кон управления и затем выясняется влияние его параметров на каче­ ство решения задачи, то при бинарном управлении форма обратной связи не фиксируется, а определяется автоматически с помощью но­ вого типа обратной связи по ошибке. Задачей нового контура обратной связи является обеспечение сов­ падения качественного поведения объекта управления и некоторого динамического звена (задатчика динамических свойств), определяю­ щего такое поведение. Обратная связь при этом, конечно, нелинейна.
JO.б. Методы теории бинарного управления 309 Схема системы управления, в которой реализуется эта идея, по­ казана в обобщенном виде на рис. 10.2, на котором Р — объект, Sy и Sx — основной и вспомогательный задатчики с выходными зада<т I* с / 'W Ох • Сд 1 1 ^ Sy ^\(t'V i r ' X Сц и 1 у р 1 • ^ Рис. 10.2 ющими воздействиями у^ и х'^ соответственно, Си и С,^ — операторы основной и бинарной обратной связи, х и а — ошибки регулирова­ ния основного и координатно-операторного контура обратной связи, и W. fj, — координатный и операторный сигналы управления. В этой структуре выбору подлежат оператор Сft и бинарная операция в Си, при которых обнуляется ошибка координатно-операторного контура обратной связи и. Конкретно для рассматриваемой задачи эта схема принимает вид, представленный на рис. 10.3. Структура системы управления на этом рисунке для удобства и простоты отражает тот выбор оператора Сц Xopt ^) - ^ Сд 1 м i^ -Y - J 1—. g Рис. 10.3 -^ > — 1
310 Глава 10. Субоптимальная стабилизация и бинарной операции, при котором и = цх. В такой бинарной системе управления выбору подлежит только оператор С^ из условий оптимальности всей системы, что имело бы место тогда, когда ошибка о- = 0. Уравнение движения относительно этой ошибки имеет вид & = —уа — а-уХ — fix, (т(0) = О, и проблема состоит в "правильном" задании алгоритма изменения операторной переменной /i. Рассмотрим имеющиеся для этого воз­ можности. 10.6.1. Система переменной структуры В классической теории систем переменной структуры используется разрывная обратная связь, обеспечивающая скользящий режим на по­ верхности разрыва. В нашем случае эта идея приводит к использова­ нию релейной координатно-операторной обратной связи fi = ksgn {(тх), к = const > 0. В результате при выполнении неравенства к> А^ в замкнутой системе управления, описываемой уравнением & = —JO- — а.уХ — к\х\ sgn <т, на "поверхности" разрыва <г = О возникает скользящий режим, и с начального момента (так как <г(0) = 0) уравнения движения системы управления неотличимы от уравнения движения оптимальной системы при любом а. Но следует ли отсюда, что свойства такой системы управления инвариантны и по отношению к параметру а? Для измерения качества системы управления естественно исполь­ зовать функционгш задачи . = /(,4ii>).,. Если действовать формально и не обращать внимания на разрывность X, то для подсчета функционала J в интегрант вместо X = ах + k\x\sgn сг следует подставить Х = ах+ k\x\sgn (Teq.
10.6. Методы теории бинарного управления 311 Но A:|x|sgno-eq = —а^х, поэтому X = —fx, а значит, оптимальное значение функционала, найденное таким образом, инвариантно к па^ раметру а. Если же действовать более аккуратно, то можно заметить, что х = a^a;^ + 2aifcx|r|sgn(req + fc^a;^ = (Аг^-а^ -2а'у)х^, и если а = const, то оптимальное значение функционала зависит от параметра а и дается выражением 1 ЛГИ = \ 1 + \{к^ Т ,2 - а2 - 2ау) Следовательно, при использовании методов клги;сической теории систем переменной структуры в рассматриваемой задаче минимум функционала не фиксирован и определяется конкретным значением параметра а. В этом смысле рассматриваемая задача оптимального управления методами СПС не решается. Причина состоит в том, что интегрант функционала нелинеен по разрывному управлению. В связи с этим представляют интерес методы оптимальной стабилиза­ ции, обеспечивающие движение по экстремали непрерывным управле­ нием. 10.6.2. Бинарная стабилизация с интегральной КО-связью Движение, сколь угодно близкое к оптимальному, можно обеспечить непрерывным бинарным управлением с интегральной КО-связью /i = asgn I К + у к | | »;|. где а = const > О — достаточно большое число, к > А^, как и ранее. Для того чтобы убедиться в этом, проведем замену переменного (Г = ^ж и тогда получим уравнение движения ^ =-(l+OK+A*). П о с к о л ь к у / i —> /ieq = /' = asgn е.^к, ^ SgH^q ^ ПрИ О —»^ ОО И ПрОЦеСС ^(t) СТ£1бИЛИЗИ- руется в нуле, то нетрудно понять, что при конечном, но достаточно большом а процесс ^(t) будет стабилизирован в некоторой окрестно­ сти нуля 1^1 < Si с константой Si = Si{a) такой, что Si(a) —¥ О при а —> оо. Пусть Г) = ц — /jeq. Тогда из предыдущего следует, что \г}\ < «52,
312 HasLBa 10. Субоптимальная стабилизация где константа ^2 = <^2(л) и 62(0) —> О при а —> оо. В этих обозначениях для интегранта функционала задачи F справедлива оценка •'^--'bmw-^^"- .2 и, следовательно, для оптимального значения функционгиа J^^ спра­ ведливо неравенство °Р*- 27^(1-(Ji)2 7' из которого следует, что J^^ —> XQ/T при а -> оо, и теперь уместно го­ ворить о субоптимальной стабилизации в классе бинарных обратных связей. Поскольку бинарные системы грубы по отношению к регу­ лярным и сингулярным возмущениям, то построенная субоптималь­ ная система управления также груба, и этим она выгодно отличг1ется от систем стабилизации с большим коэффициентом усиления. 10.6.3. Стабилизация с использованием скользящего реясима 2-го порядка При субоптимальной бинарной стабилизации x{t) ^ Xopt(t)- Однако точное равенство х(<) = Xopt{t) все же можно обеспечить непрерыв­ ным управлением с конечного момента времени <,, если прибегнуть к скользящему режиму 2-го порядка. Вновь рассмотрим бинарную систему управления в координатах i^,fi) : ^ = - ( i + O K + /i)Тогда при О < р < 1/2 и достаточно больших константах а и А алго­ ритм управления вида fi = fii + fi2, где обеспечивает стабилизацию ^ в нуле за конечное время t,, которое может быть сделано сколь угодно мгшым, если ^(0) = 0. Потери на поиск при этом определяются равенством t. ^J^ = •/o1>t - -^opt = jiF - Fopt) dt, 0 И, следовательно, скользящие режимы 2-го порядка также открывают возможность субоптимального управления неопределенным объектом.
10.6. Методы теории бинарного управления 313 Если ввести индекс субоптимальности (относительные потери в опти­ мальности) по формуле AJ 1= ^opt ТО МОЖНО наглядно продемонстрировать достоинства того или иного из рассмотренных методов стабилизации (рис. 10.4). На этом рисунке Рис. 10.4 jS < /В rpg^j^ j^aK при одних и тех же значениях коэффициентов а и к потери в оптимальности меньше для скользящего режима 2-го по­ рядка. Знаком "~" обозначена степень роста индекса субоптималь­ ности при увеличении "степени" неопределенности. Перейдем теперь к рассмотрению общей теории, следуя при этом работам [29, 30, 43]. 10.7. Сведение проблемы субоптимальной стабилизации к проблеме асимптотической и н в а р и а н т н о с т и Обобщением изложенных выше результатов служит подход к суб­ оптимальной стабилизации, основанный на сведении исходной задачи к проблеме асимптотической инвариантности. Теория асимптотиче­ ской инвариантности является универсальным инструментом решения различных задач управления в условиях неопределенности, и такой пе­ реход позволяет расширить область применимости уже рассмотрен­ ных идей и подходов.
314 Глава 10. Субоптимальная стабилизация 10.7.1. Основные понятия т е о р и и асимптотической инвариантности Пусть А — компактное множество и пара функций {х, Uopt} Для каж­ дого элемента а Е А минимизирует функционал в форме Лагранжа J{u,a)= 1 L{t,x,u,a)dt + l{xo,xi) to при ограничениях X = f{t, X, и, а), x{to) = хо, x{ti) = xi, UEU. Пусть, кроме того, оптимальное значение функционала не зависит от элемента а € А, т.е. J{uopt, а) = J(«opt) для любого а е А. Здесь и далее х £ R", и — скалярное управление. Предполагается, что функции / , i , / и классы А и U таковы, что решение задачи оптимизации существует. Из сделанного предположения следует, что оптимальное управление зависит от а, т.е. «opt = Uopt(t,x,a), и его реализация, если возмущение а неизвестно, невозможна. Поэтому уме­ стен вопрос о приближении оптимального управления «opt в классе допустимых обратных связей. Для оценки качества такого прибли­ жения используем индекс субоптимальности (относительные потери в оптимальности) , , _ 7(ц,а)-J(«opt) '^"•''^- /(«opt) • Понятие о качестве приближения вводится следующим определением: если для любого е > О существует такая допустимая обратная связь и £ и, что sup/(и, а) < е, то замкнутая система субоптимальна в аел классе управлений U. Понятие субоптимальной системы стабилизации можно связать с понятием асимптотической инвариантности. Пусть е и 7 — произвольные положительные числа. Для некоторой функции h{t, х) введем обозначения: Ли,а = h(t, x{t;to,Хо,и, а)), а^ = hu,ai — Лц.а,- Динамическую систему х = f{t,x,u,a) назовем (е,7)-экспоненциально Л-инвариантной относительно возмущений а G Л в клг1ссе управлений и, если найдется обратная связь и £11 я положительная при всех х фО функция р(х) (р(0) = 0) такие, что при любых элементах ai, 02 € А тл каждого Хо ё R" К|<£р(а;о)е-1'('-'°>, t>tQ.
10.7. Асимптотическая инвариантность 315 Связь между субоптимальностью и экспоненцигиьной инвариант­ ностью рги:крывает следующее утверждение. Утверждение 1. Пусть при некоторых положительных числах у, Я11 Я2, Яз я произвольном £ > О выполнены предположения: 1) динамическая система х = f{t,x,u,a) является (ед1,7)-экспонеяцяально L-инвариантной относительно возмущений а Е А в классе управлений и; 2) при любом управлении и &U существует элемент а, Е А такой, что 1{и,а*) <eq2\ 3) при любых и ЕЫ, а Е А \l{xo,x{ti;tQ,xo,u,a)) - l{xo,x(ti;to,xo,u,a»)) \ < едз- Тогда динамическая система х = f(t, х,и,а) субоптимальна в классе U относительно лагранжиана L и существует такая реализуемая обрат­ ная связь «,, что В приведенном утверждении указаны условия, при которых проб­ лема субоптимизации сводится к проблеме экспоненциальной инвари­ антности. Для последней р£1зработаны конструктивные методы син­ теза обратной связи, благодаря чему ее решение существенно упроща­ ется. В теории асимптотической инвариантности используются уни­ версальные достаточные условия экспоненциальной инвариантности, являющиеся единой основой для получения законов управления, ре­ шающих конкретно поставленную задачу. Эти достаточные условия могут быть сформулированы в виде следующего утверждения. Утверзкдение 2. Положим г){1) = £р(хо) е"''^'"*"^ (7 > 0), и пусть существуют такие константа g > О я непрерывная положительная функция v{t) = v{t^Xu) > О, что: Л) v{t) дифференцируема по t, когда v{t) > т}{1); 2) v{to) < r)(to); 3) при некотором и ЕИ выполнено условие « Я - 7 f |«(t)>f,(t) < 0 ; 4) |<г„(<)| < qv{t,x{t)) Тогда равномерно при всех t >to, а Е А. notnaEA к„(<)|<£9РЫе-^('-*°), т.е. пря h = L имеет место (£,у)-экспоненциальная ность. L-инвариант-
316 Глава 10. Субоптимальная стабилизация Покажем, как сформулированные выше достаточные условия экс­ поненциальной инвариантности используются в конкретных ситуа­ циях, на примере субоптимальной линейно-квадратичной стабилиза­ ции неопределенной системы. •10.7.2. Субоптимальная линейно-квадратичная стабилизация Для линейного объекта и квадратичного функционала предложенную выше схему синтеза субоптимального управления можно довести до конца. Действительно, рассмотрим в R ° при t > О линейный стацио­ нарный управляемый объект х = Ах + Ь{и + а), ж(0) = хо, где а € Л — неизвестное возмущение, такое что |a|<ai|a!|, |d|<a2|j;|. Здесь константы ai, 02 известны. Требуется построить реализуемую обратную связь, минимизирующую функционал "полной" энергии оо J=IL{t)dt, L = x'^Px + x'^Qx, Р>0, Q>0. о Используя обозначения, P = P + {A-bd'^)^Q{A-bd^), Q^b^Qb, d=^^^, v = u + d'^x + a, Ad = A-bd'^, d G R". функционал и уравнение связи преобразуем к виду со 7 = f{x'^Px + Qv^)dt, о X = AdX + bv. Оптимальное решение преобразованной задачи известно и дается выражением '^opt = —^ X, где к = Q ^b^R, а, R — решение уравнения Риккати Р - RbQ-4R + RAd + а^Я = 0. При этом поле экстремалей задачи описывгьется уравнением X= {Ad-bk)x,
10.7. Асимптотическая инвариантность 317 а оптимальное значение функционала находится по формуле •^jpt = XQ RXQ. Для того чтобы получить оптимальную систему стабилизации, не­ обходимо реализовать обратную связь «opt = -кх - а, к = k + d^, что, разумеется, невозможно. Вместо этой нереализуемой обратной связи используем обратную связь вида и = —кх + Uj, где для генерации компоненты щ воспользуемся методами бинарного управления и изложенными выше принципами субоптимального упра­ вления и экспоненциальной инвариантности. Пусть в схеме на рис. 10.2 динамический задатчик Sx определен уравнением поля экстремалей задачи х^=АкХ^, х'^(0) = аго, Ак=А-Ьк. Известно, что спектр ar{Ait) матрицы Л* расположен в левой от­ крытой комплексной полуплоскости, т.е. существует число 7о > О такое, что для любого А £ (т{Ак) выполнено условие ReA < —уо- Сле­ довательно, при некотором N > 1 В качестве Ли,а возьмем функцию L = x'^Px + Q{uc + af. При помощи достаточных условий экспоненциальной инвариант­ ности, сформулированных в предыдущем разделе, находим, что упра­ вляемая система будет экспоненциально L-инвариантна в рассматри­ ваемом классе обратных связей, если существует обратная связь Ug такая, что lim L{t)-x'^it){P + k'^Qk)x(t) = 0. t-foo Положим щ = -ко\\х\\ц, /i = - a s g n [ ( r + /i|(r|], где fco и а — положительные параметры, а функция сг является реше­ нием системы дифференциальных уравнений & + l<T = a-ko\\x\\ft /i =-asgn[(T4-/i|<T|], |/<(<о)| < 1- Здесь I — произвольно назначаемое положительное число. Очевидно, что функция (т{1) нам также неизвестна, но если пока отвлечься от
318 Глава 10. Субоптимлдьиая стабилизация этого обстоятельства, то ясно, что надлежащим выбором ко, а не­ сложно обеспечить выполнение следующих неравенств: к1 < s|ko||e-^S t > О, \&\ < e?i||xo||e-^'. t > Г, Var <r < е||го||, sup \&\ < дгН^оН, о [0,0 при некоторых положительных константах е, qi, дг и 7Из этих неравенств и уравнения X = АкХ + Ь{& + 1<г) следует асимптотическая инвариантность системы, а вместе с ней и ее субоптимальность. Таким образом, все свелось к оценке функции (т(<), и для этого годится асимптотический наблюдатель вида ? = с^х — ^, i = c'^AkX + l(c'^x-0, где с^б = 1. Нетрудно установить, что ошибка оценивания е = <т — ? удовлетворяет уравнению ё + 1е = О и, следовательно, функция ? экс­ поненциально (с произвольно назначаемым показателем /) сходится к функции <т. Отсюда следует, что свойство субоптимальности сохрг1нится, если вместо сг в обратной связи использовать ее оценку а, т.е. и = -кх - A!o||a;||/i, it = -asgn[a + fi\a\], |;i(0)| < 1. Таким образом, использование методов асимптотической инвари­ антности для оптимальной стабилизации при неопределенности по­ зволяет синтезировать обратные связи, робастно стабилизирующие неопределенные объекты с качеством, сколь угодно близким к опти­ мальному. Решение задач оптимального управления в рамках теории асимптотической инвариантности (ввиду универсальности последней) позволяет рги:ширить классы неопределенных объектов, подлежащих оптимизации. В общем случае, задача оптимальной стабилизации в условиях не­ определенности не решается классическими методами, но их сочета­ ние с теорией новых типов обратной связи и идеей асимптотической инвариантности позволяет решать задачу для достаточно широкого класса неопределенных объектов. Этот факт и подтверждается в на­ стоящей главе. Развитие и обобщение этих положений дг^тся в рабо­ тах, ссылки на которые даны на стр. 133.
Заключение Обратная связь "пронизывает" окружающую нас действительность: она служит ключевым элементом биологической эволюции и естествен­ ного отбора; она обеспечивает регуляторный механизм в равновесных системах, в частности в природных экосистемах, и является необхо­ димым элементом работоспособных экономических конструкций; на­ конец, она составляет основу саморегулирующихся и самоподдержи­ вающихся биосистем. Этот список легко продолжить. Но до сих пор мы очень мало знгюм о механизме обратной связи, так как фактиче­ ски он никогда не являлся самостоятельным объектом исследования. И на то есть причины. Действительно, идея обратной связи почти очевидна, легко воспри­ нимается и в простых ситуациях ее применение не вызывает проблем. Однако синтез обратной связи в нестандартной ситуации, как пра­ вило, дается нелегко и требует нешаблонных решений. Это обусло­ влено отсутствием теории, объясняющей механизмы формирования обратной связи. Как правило, эти механизмы ускользают от исследо­ вателя, поскольку они довольно сложны. Здесь ситуация аналогична ситуации с другими законами естествознания. 6 свое время физик Ри­ чард Фейнман сказал о законе тяготения: "Закон действует сложно, но его коренная идея проста. Это обстоятельство роднит все н£Ш1и законы" [89]. Справедливости ради следует заметить, что регулярные попытки изучения обратной связи предпринимаются и в теории автоматиче­ ского управления, и в бионике, и в экономических теориях. Однако в этих дисциплинах почти всегда упор делается на использование обрат­ ной связи, а не на механизм ее формирования. Это естественно, ибо, по мнению Энона, предметная наука вырабатывает правила решения задачи, но не способы выбора этих правил. Отсутствие правил второго уровня принуждает нас к необходимо­ сти угадывания закона обратной связи всякий раз, когда мы имеем дело с нестандартной задачей, но новые идеи и принципы придумы­ вать очень трудно, ибо для этого требуется богатое воображение. Недаром в истории теории управления зафиксировано совсем немного подобных откровений. В результате теория управления содержит, по
320 Заключение сути дела, протоколы решения стандартных задач, тогда как жела­ тельно иметь правила синтеза, распространяемые на новые ситуации. В монографии впервые предпринята попытка развития гипотезы о структуре механизма формирования обратной связи. Эта гипотеза базируется на "иерархии" сложности обратной связи. Подобное пред­ ставление о структуре обратной связи кажется вполне естественным, ибо позволяет свести проблему синтеза сложного нелинейного регуля­ тора к решению последовательности однотипных и хорошо изученных задач. Иначе говоря, видимая сложность проблемы рекуррентно по­ рождается невидимой внутренней простотой. Для реализации принципа иерархии потребовалось введение нового для теории управления понятия сигнала-оператора. Этот термин от­ ражает двойственную природу сигналов в нелинейных динамических системах. В сочетании с принципом обратной связи сигнал-оператор предоставляет необходимые возможности для перехода от непосред­ ственного решения задачи к нахождению сначала г1Лгоритма решения задачи, а если потребуется, то и к гшгоритму, определяющему ал­ горитм решения задачи, и т.д. Получаемая таким образом "иерар­ хическая структура" обратной связи примечательна еще и тем, что на каждом иерархическом уровне управляющие механизмы просты, однотипны и могут быть получены стандартными для классической теории регулирования способами. Обратим внимание читателя на то, что идея о двойственной при­ роде переменных величин обычна для естествознания и весьма плодо­ творна. Так, например, Макс Борн ввел понятие оператора физиче­ ской величины, которое оказалось очень продуктивным в квантовой механике, имеющей дело с объектами дуальными в первооснове, а по­ нятие оператора-времени, введенное Ильей Пригожиным, оказалось очень полезным в физике необратимых процессов. Авторы уверены, что появление принципа бинарности и новых ти­ пов обратных связей довольно естественно для современного этапа развития общей теории обратной связи. Для обоснования этого те­ зиса авторы подробно рассмотрели эволюцию важнейших принципов и методов теории регулирования по мере роста факторов неопреде­ ленности в задачах управления, что представляет самостоятельный интерес и может служить кратким введением в классическую теорию обратной связи. Заметим также, что с математической точки зрения предложен­ ный подход можно рассматривать как способ синтеза нелинейных ди­ намических систем с заранее предписанными свойствами их решений, такими, например, как устойчивость, малая чувствительность по от­ ношению к вариациям параметров задачи и т.п. Разумеется, приме-
Заключение 321 нение предложенного принципа не ограничивается задачами стабили­ зации, фильтрации или оптимизации. Уже сегодня известны и другие его применения, в частности для: • разделения близких сигналов неизвестной частоты за конечное время, тогда как линейные схемы разделения требуют, вообще го­ воря, бесконечно большого времени; • робастного решения обратных задач динамики, имеющих отноше­ ние к проблемам синтеза эталонных траекторий и динамической обработке результатов измерений; • решения задач стабилизации при неопределенности и поиска седловых положений равновесия. Суммируя, можно сказать, что в монографии предложен иерар­ хический принцип формирования обратной связи, основанный на ду­ альной природе переменных нелинейной системы и наделяющий си­ стему автоматического управления элементами совершенного поведе­ ния в сложных неопределенных условиях. Возможно, существуют и другие механизмы синтеза сложной обратной связи, но достоинство предложенного механизма состоит в том, что он методически прост, позволяет обойтись без использования больших коэффициентов уси­ ления или разрывных элементов управления. Напротив, нужное пове­ дение системы автоматического управления достигается при ограни­ ченных коэффициентах передачи и гладких сигналах управления, что особенно важно, ибо в природных системах управления совершенство регуляторных механизмов достигается именно при этих условиях.
Список литературы 1. Айзерман М.А. Теория автоматического регулирования. М.: Наука, 1966. 452 с. 2. Андреев Ю.Н. Управление конечномерными линейными объектами. М.: Наука, 1976. 424 с. 3. Атанс М., Фалб П. Оптимг1Льное управление. М.: Машиностроение, 1968. 4. Беллман Р. Динамическое программирование. М.: Иностр. лит., 1960. 400 с. 5. Беллман Р., Калаба Р. Динамическое программироване и современная теория управления. М.: Наука, 1969. 118 с. 6. Бесекерский В.А., Попов Е.П. Теория систем автоматического регу­ лирования. М.: Наука, 1972. 767 с. 7. Божуков В.М., Кухтенко В.И., Левитин В.Ф., Шумилов Б.Ф. Ре­ лейные системы автоматического упргшления для объектов с боль­ шими диапг1зонами изменения динамических харгистеристик // Изв. АН СССР. Техническая кибернетика. 1966. ]У«6. С. 154-163. 8. Болтянский В.Г. Математические методы оптимального управления. М.: Наука, 1969. 408 с. 9. Бромберг П. В. Матричные методы в теории релейного и импульсного регулировгшия. М.: Наука, 1967. 323 с. 10. Бутковский А.Г. Теория оптимгшьного управления системами с рас­ пределенными параметрами. М.: Наука, 1965. 474 с. 11. Воронов А.А. Основы теории автоматического упрглления: 4.1. Ли­ нейные системы регулирования одной величины. М.;Л.: Энергия, 1965. 396 с. 12. Воронов А.А. Основы теории автоматического управления: Ч.П. Спе­ циальные линейные и нелинейные системы гштоматического регулиро­ вгшия одной величины. М.;Л.: Энергия, 1966. 372 с. 13. Вышнеградский И.А. О регуляторах прямого действия. 1876. 14. Гелиг А.Х., Леонов Г.А., Якубович В.А. Устойчивость нелинейных си­ стем с неединственным состоянием ргшновесия. М.: Наука, 1978. 400 с. 15. Емельянов СВ. Системы гштоматического управления с переменной структурой. М.: Наука, 1967. 336 с. 16. Теория систем с переменной структурой /Под ред. С В . Емельянова. М.: Наука, 1970. 592 с. 17. Емельянов СВ. Бинарные системы автоматического управления. М.: МНИИПУ, 1984. 313 с.
Список литературы 323 18. Емельянов СВ., Коровин СК. Применение пришдша регулирования по отклонению для расширения множества типов обратных связей //ДАН СССР. Т. 258. 1981. Л"«5. С. 1070-1074. 19. Емельянов СВ., Коровин С.К. Расширение множества типов обрат­ ных связей и их применение при построении замкнутых динамических систем //Изв. АН СССР. Техническая кибернетика. 1981. №5. С. 173183. 20. Емельянов СВ., Коровин С.К. Теория нелинейной обратной связи при неопределенности //Университеты России. МГУ. Т.1. Математиче­ ское моделирование. 1993. С. 214-278. 21. Емельянов СВ., Коровин С.К. Новые типы обратных связей. Синтез нелинейного управления в условиях неопределенности //Юбилейный сб. трудов OHB'niA РАН. Т.1. 1993. С. 115-137. 22. Емельянов СВ., Коровин СК., Левантовский Л.В. Скользящие ре­ жимы высших порядков в бинарных системах упргшления //ДАН СССР. Т. 287. 1986. №б. С. 1338-1342. 23. Емельянов СВ., Коровин С.К., Левантовский Л.В. Скользяище ре­ жимы второго порядка при управлении неопределенными системами //Изв. АН СССР. Техническая кибернетика. 1986. №1. С. 112-118. 24. Емельянов СВ., Коровин С.К., Левантовский Л.В. Новый класс алго­ ритмов скольжения второго порядка //Математическое моделирова­ ние. Т.2. 1990. JV»3. С. 89-100. 25. Емельянов СВ., Коровин С.К., Левант А. Скользящие режимы выс­ ших порядков в управляемых системах // Дифферетщальные ургшнения. Т. 29. 1993. JV«11. С. 1877-1899. 26. Емельянов СВ., Коровин СК., Мамедов И.Г. Метод квазирасщеплених и его применение для синтеза систем автоматического управления // ДАН СССР. Т. 286. 1986. №2. С. 311-315. 27. Емельянов СВ., Коровин СК., Мамедов И.Г. Структурные преобразовгшия и 1ф0стр£шственная декомпозищтя дискретных регулируемых систем — метод квазирасщепления // Техническая кибернетика. 1986. JV«6. С. 118-128. 28. Емельянов СВ., Коровин СК., Мамедов И.Г., Нерсисян А.Л. Бинар­ ные алгоритмы управления одним классом неопределенных динамиче­ ских систем с запаздыванием //Дифференциальные ургшнения. Т. 25. 1989. JV«10. С. 1670-1679. 29. Емельянов СВ., Коровин С.К., Мамедов И.Г., Носов А.П. Асимпто­ тическая инвариантность в задачах управления неопределенными объ­ ектами //ДАН СССР. Т. 311. 1990. JV«1. С. 44-49. 30. Емельянов СВ., Коровин С.К., Мамедов И.Г., Носов А.П. Асимптоти­ ческая инвариантность и робастнгш стабилизгщия эредитарных систем непрерывным управлением //ДАН СССР. Т. 311. 1990. JY«2. С. 296-300. 31. Емельянов СВ., Коровин СК., Мамедов И.Г., Носов А.П. Асимпто­ тическая инвариантность систем управления с запаздыванием // Диф­ ференциальные уравнения. Т. 27. 1991. №3. С. 415-427.
324 Список литературы 32. Емельянов СВ., Коровин С.К., Нерсисян А.Л. Об асимптотических свойствах наблюдателей состояния для неоределенных систем с выде­ ленной стационарной линейной частью / / Д А Н СССР. Т. 311. 1990. JY«4. С. 807-811. 33. Емельянов СВ., Коровин С.К., Нерсисян А.Л. Стабилизация неопре­ деленных нейтргшьных объектов регулятором переменной структуры / / Д А Н СССР. Т. 312. 1990. Х'-А. С. 801-806. 34. Емельянов СВ., Коровин С.К., Нерсисян А.Л., Нисензон Ю.Е. Ста­ билизация неопределенных систем по выходу разрывным управлением / / Д А Н СССР. Т. 311. 1990. №3. С. 544-549. 35. Емельянов СВ., Коровин СК., Нерсисян А.Л., Нисензон Ю.Е. Ста­ билизация многомерных неопределенных объектов по выходу // ДАН СССР. Т. 311. 1990. №5. С. 1062-1067. Емельянов СВ., Коровин СК, Нерсисян А.Л., Нисензон Ю.Е. Асим­ птотические наблюдатели для класса нелинейных динамических объ­ ектов / / Д А Н СССР. Т. 313. 1990. №5. С. 1052-1056. 36. 37. Емельянов СВ., Коровин С.К., Сизиков В.И. О синтезе нелинейного управления свободным движением нестационарных систем //ДАН СССР. Т. 265. 1982. JV'2. С. 297-301. 38. Емельянов СВ., Коровин СК., Сизиков В.И. Принципы построения и общие методы синтеза бинарных систем управления неопределенными нелинейными объектами / / Д А Н СССР. Т. 281. 1985. JV^4. С. 810-814. 39. Емельянов СВ., Коровин СК., Уланов Б.В. О синтезе систем управле­ ния с применением координатно-параметрической и параметрической обратных связей / / Д А Н СССР. Т. 266. 1982. K'-S. С. 1077-1081. Емельянов СВ., Коровин С.К., Уланов Б.В. Управление нестаци­ онарными динамическими системами с применением координатнопараметрической обратной связи //Техническая кибернетика. 1982. №6. С. 201-212. 40. 41. Емельянов СВ., Коровин С.К., Уланов Б.В. Управление линейными стационарными объектами при внешних воздействиях с применением обратных связей различных типов //Техническая кибернетика. 1984. JV«1. С. 174-182. 42. Емельянов СВ., Коровин С.К., Уланов Б.В. Об управлении нестацио­ нарными динамическими системами // Дифференциацльныё уравнения. Т. 20. 1984. №10. С. 1683-1691. 43. Коровин СК., Мамедов И.Г., Носов А.П. Субоптимальность асимпто­ тически инвариантных систем управления // Дифференциальные урав­ нения. Т. 28. 1992. J<ni. С. 1932-1945. Коровин С.К., Мамедов И.Г., Носов А.П. Стгьбилизгщия неопределен­ ных систем на кольцах // Университеты России. МГУ. Т.1. Математи­ ческое моделировгшие. 1993. С. 279-295. 44. 45. Коровин СК., Нерсисян А.Л., Нисензон Ю.Е. Управление по выходу линейными неопределенными объектами // Техническая кибернетика. 1990. №1. С. 67-73. 46. Красовский А.А. Динамика непрерывных самонастргшвающихся си­ стем. М.: Физматгиз, 1963. 468 с.
Список литературы 325 47. Красовский А.А. Система гштоматического управления полетом и их аналитическое конструирование. М.: Наука, 1973. 568 с. 48. Красовский А.А., Буков В.П., Шендрик B.C. Универсальные алго­ ритмы оптимгишного управления непрерывными процессами. М.: Нау­ ка, 1977. 271 с. 49. Красовский А.А., Поспелов Г.С. Основы автоматики и технической кибернетики. М.- Л.: Госэнергоиздат, 1962. 600 с. 50. Красовский Н.Н. Теория оптимальных управляемых систем // Механи­ ка в СССР за 50 лет. T.I. М.: Наука, 1968. С. 179-244. 51. Красовский Н.Н. Управление динамической системой: задача о мини­ муме гарантированного результата. М.: Наука, 1985. 518 с. 52. Кулебакин В. С. Теория инвариантности автоматически регулируемых и управляемых систем //Труды I конгресса ИФАК по автоматиче­ скому управлению. Т.1. М.: Изд-во АН СССР, 1960. С. 247-255. 53. Летов A.M. Аналитическое конструирование регуляторов //Автома­ тика и телемеханика. 1960. №4. С. 436-441; N«5. С. 561-568; №б. С. 6 6 1 665; 1961. №4. С. 425-435; 1962. ]УП1. С. 1405-1413. 54. Ли Р. Оптимальные оценки, определение характеристик и управление. М.: Наука, 1966. 176 с. 55. Ли Я., Вандервельде У. Теория нелинейных самонастраивающихся си­ стем //Самонастраивающиеся автоматические системы. М.: Наука, 1964. 56. Ляпунов A.M. Общая задача об устойчивости движения. М.- Л.: Гостехиздат, 1950. 472 с. 57. Мееров М.В. Синтез структур систем гштоматического регулирования высокой точности. М.: Наука, 1967. 423 с. 58. Михайлов А.В. Метод гармонического гшализа в теории регулирова­ ния // Автоматика и телемеханика. 1938. №3. 59. Моисеев Н.Н. Численные методы в теории oптимгLIIЬныx систем. М.: Наука, 1971. 424 с. 60. Павлов А.А. Синтез релейных систем, оптимгип>ных по быстродей­ ствию. М.: Наука, 1966. 392 с. 61. Петров Б.Н. О применении условий инваригштности//Труды П Все­ союзного совещ. по теории автоматического регулирования. Т.2. М.;Л.: Изд-во АН СССР, 1955. С. 241-246. 62. Петров Б.Н, Рутковский В.Р., Крутова И.Н., Земляков С.Д. Прин­ ципы построения и проектирования самонастргшвающихся систем упргшления. М.: Мгшшностроение, 1972. 260 с. 63. Понтрягин Л.С, Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическгш теория оптимальных процессов. М.: Наука, 1969. 384 с. 64. Основы гштоматического управления /Под ред. B.C. Пугачева М.: На­ ука, 1968. 680 с. 65. Самарский А.А. Теория ргеностных схем. М.: Наука, 1977. 656 с.
326 Список литературы 66. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. М.: Наука, 1979. 285 с. 67. Уланов Г.М. Статистические и информационные во1фосы управления по возмущению. М.: Энергия, 1970. 256 с. 68. Уткин В.И. Скользящие режимы в задачах оптимизгщии и упргшления. М.: Наука, 1981. 368 с. 69. Фельдбаум А.А. Проблемы самонгюгргшвающихся систем //Самона­ страивающиеся системы. М.: Наука, 1963. С. 5-22. 70. Фельдбаум А.А. Основы теории оптимальных автоматических систем. М.: Наука, 1966. 623 с. 71. Филиппов А.Ф. Дифференциг1льные ургшнения с разрывной правой ча­ стью //Математический сборник. Т. 5. 1960. ^ * 1 . С. 99-128. 72. Филиппов А.Ф. Дифференщсгкльные ургшнения с рг^зрывной пргшой ча­ стью. М.: Наука, 1985. 224 с. 73. Фомин В.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамическими объектами. М.: Наука, 1981. 448 с. 74. Цыпкин Я.З. Адаптация и обучение в гштоматических системах. М.: Наука, 1968. 399 с. 75. Цыпкин Я.З. Релейные автоматические системы. М.: Наука, 1974. 575 с. 76. Чаки Ф. Современная теория управления. Нелинейные, оптимгъльные и адаптивные системы. М.: Мир, 1975. 424 С. 77. Black Н. Stabilized feedback amplifiers //Bell Syst. Tech. J. 1934. V. 13. P. 1-18. 78. Bode H. Network Analysis and Feedback Amplifier Design. New York: Van Nostrand, 1945. 79. Emelyanov S. V., Korovin S.K. Development of feedback types and their ap­ plication to design of closed-loop dynamic systems // Problems of Control and Inform. Theory. Himgarian Acad, of Sci. V. 10. 1981. №3. P. 161-174. 80. Emelyanov S. V., Korovin S.K., Levantovskiy L. V. A Drift Algorithm in Control of Uncertain Processes // Problems of Control emd Inform. Theory. Hungarian Acad, of Sci. V. 15. 1986. JV«6. P. 425-438. 81. Emelyanov S. V., Korovin S.K., Mamedov I.G. Structured Transformations and Spatied Decomposition of Control Systems: The Queisi-Decoupling Method //Problems of Control and Inform. Theory. Hungarian Acad, of Sci. V. 16. 1987. JV*3. P. 155-168. 82. Emelyanov S.V., Korovin S.K., Mamedov I.G., Nersisyan A.L. Stabiliza­ tion of Uncertain Dynamic Delayed Processes by Binary Control Systems //Problems of Control and Inform. Theory. YixaigansD. Acad, of Sci. V. 18. 1989. №3. P. 135-149. 83. Emelyanov S.V., Korovin S.K., Mamedov I., Nosov A.P. Asymptotic Invariance eind Stabilization of Uncertain Delay Systems //Dynamic and Control. V. 4. 1994. Boston: Kluwer Academic Publ. P. 39-58.
Список литературы 327 84. Emelyanov S. v., Korovin S.K., Nersisian A.L., Nisenzon Y.Y. Discontin­ uous Output Stabilizing em Uncertain MIMO plemt // Int. J.Control. V. 55. 1992. №1. P. 83-107. 85. Emelyanov S.V., Korovin S.K., Sizikov V.I. Use of Coordinate - Para­ metric FeedbiwJj in Design of Control Systems // Problems of Control and Inform. Theory. Hungarian Acad, of Sci. V. 10. 1981. №4. P. 237-251. 86. Emelyanov S.V., Korovin S.K., Sizikov V.I. Control of Non-Stationary Plants with Coordinate-Parametric and Рги-ametric Feedbacks // Problems of Control and Inform. Theory. Hungarian Acad, of Sci. V. 11. 1982. JV«4. P. 259-269. 87. Emelyanov S. V., Korovin S.K., Ulanov B. V. Control of Nonstationeiry Dy­ namic Systems with Que^icontinuous Generation of the Control Sign£il // Problems of Control and Inform. Theory. Hungamzai Accid. of Sci. V. 12. 1983. JV«1. P. 11-32. 88. Emelyanov S.V., Korovin S.K., Ulanov B.V. Control of Dynamic Systems in Feice of Exogenous Signals with Feedbacks of Various Types // Problems of Control and Inform. Theory. Hungcirian Acad, of Sci. V. 14. 1985. № l . P. 3-16. 89. Feynman R.P., Hibbs A. Quemtum Mechanics and Path Integral. New York: Mc Graw-Hill Book Сотргагу, 1965. 90. Flugge-Lotz I. Discontinious Automatic Control. Princeton, New Jersey: Princeton Univ. Press, 1953. 91. Hazen H.L. Theory of servomechanisms / / J . FVanklin Inst. 1934. V. 218. P. 279-331. 92. Kalman R.E., Falb P.L., Arbih M.A. Topics in Mathematical System Theory. New York: Mc Graw-Hill Book Company, 1969; Перевод: Калман P., Фалб П., Арбиб М. Очерки по математической теории систем. М.: Мир, 1971. 400 с. 93. Korovin S.K., Nosov А.P. Synthesis of Robust Feedback Systems by the Methods of Asymptotic Invcuiance and it's Application of Uncertain Delay Plants //Trans. First Asian Control Conf. (ASCC), July 27-30 1994. Japan. Tokyo, N FE-14-4. 94. Lee E.B., Markus L. Foundation of OptimeJ Control Theory. New York: Wiley, 1967; Перевод: Ли Э.Б., Маркус Л. Основы теории оптимального управления. М.: Наука, 1972. 576 с. 95. Maxwell D. On Governors. London: Royal Soci., 1868. 96. NyqwistH. 97. Routh E.S. A treatise on the stability of a given state of motion. London: Mc-MiUan&C, 1877. 98. Stodola A. Dampf-und Geisturbinen. Berlin, 1922. Regeneration theory //Bell Syst. Tech. J. 1932. V. 11. P. 126.
Предметный указатель Автоколебание 131 Алгоритм — адаптации 105 — Евклида 59 — скольжения 2-го порядка 193 — стабилизации 265 -вынужденного движения 256 — управления 84 бинарного 171 Амплитуда 268 Асимптота 124, 173 Астатизм —бесконечного порядка 111 — ( т + 1)-го порядка 111 Аттрактор 157, 253 — условный 253 Возмущение —волновое 236 —-внешнее 22 —исчезающее 56 —координатное 22, 28 — "малое" 29 — операторное 22 — приведенное к управляющему входу 64 — регулярное 123 — сингулярное 84, 273 — функциональное 130 Возмущения —косвенное измерение 35 Гаргштированный результ 304 Граммиёш управляемости 198 Граница — области 67 — устойчивости апериодической 97 колебательной 97 Грубость 58 Движение — вынужденное 26 —в скользящем режиме 187 -—в реальном скользящем режиме 185 —разнотемповое 88 —свободное 26 —собственное 26 Демпфирование 176 Динамика 27 — "быстрая" 38 — системы 27 разрывной 67 Диссипативность 130 — замкнутой системы 104 Дифференциатор 262 — бинарный 283 — линейный 272 — нестандартный 291 бинарный 283, 291 —переменной структуры 280 —релейный 276 — следящий 271 — с "мг1Лой" амплитудой 289 — финитный 287 Задача — дифференцирования 265 — некорректно поставленная 262 — о понижении размерности системы 151 — регулирования 22 —стабилизации 22 — упргшления 24 при неопределенности 145 — фильтрации 150 Задатчик 24 Задающее воздействие 22 Закон регулирования — О 210
Предметный указатель — П 172 — ПИ 115, 172—174 — ПИД 172 —пропорционально-интегрально-ре­ лейный 206 Звено —-динамическое 44 — запаздывания 271 —инерционное 215 Иерархия — глубоких обратных связей 88 — коэффициентов усиления 88 Инвариантность 42 — гигимптотическая 314 — системы автоматического упра­ вления 39 Индекс субоптимг1льности, 314 Искажения — амплитудные 267 — фскзовые 267 Колебание —амплитудное 267 — вынужденное 258 —собственное 30 Компенсация —возмущения —координатного 102 — косвеннг1я 102 —операторного 104 —компенсирующей! сила 255 Компонента — вторгм 101 —компенсирующей! 32, 35 —первая 101 —программн<1Я 32, 35 Координата —регулируемая 17 Координата-оператор 163 Коэффициент —критический 274 — передачи 104 — усиления 37 — — бесконечный 37 большой 213 329 Критерий —локализации нулей 96 — устойчивости 96 интервгшьной 98 — фильтрации 264 — Харитонова 96 Линия переключения 124 Метод —включения 98 — встроенной модели 51 — замороженных коэффициентов 125 —настраивг1емого объекта 103 — фазовой плоскости 75 Многообразие — гладкое 179 —интегральное 182 —скольжения 193 —идеального скольжения 188 — п о р я д к а г 191 Множество —инвариантное 253 -условно 253 (т-условно 253 —притягивающее 253 Модель 106 —волновая 49 — Кулебгисина 49 — встроенная 49 — математическая 17 — операторная 138 линейнг1Я 136 Наблюдатель состояния 165 Неидеальность переключений 184 Неопределенность структурировгшная 108 Облсксть скольжения 180 Обратнг1я связь 22, 56 — глубокгкя 56, 306 — динамическая 218 — знакопеременная 256 — индуцированНс1я 92 —интегральная 54
330 —координатная 140 —координатно-операториги! 141 — местная 37 —настраиваемая 103 —нелинейная 197 — операторная 141, 208 — операторно-координатная 141, 227 — оптимальная 301 — отрицательная 255 —по выходу 205 —по состоянию 155 —рг1зрывная 118 —релейная 67, 70 координатно-операторнг1Я 310 — статическая 113 —стабилизирующая 255 Объект — интервальный 94 — К 139 — КО 139 —конечномерный 18 —линейный 18 нестационарный 18 — медигшный 95 — минимально фёкзовый 51 — неопределенный 100 — неустойчивый 29, 30 — обобщенный 101 — О 139 — ОК 139 — с самовыравниванием 76 — с переменными параметрами 215 — скалярный 18 — стгщионарный 18 — упрг1вления 17 — устойчивый 27 Объекта —вход 17 — выход 17 —нули 18 —полюса 18 —порядок 19 Ограничения — амплитудные 275 Оператор Предметный указатель — аннулирующий 49 —вольтерровский 46 — дифференциальный 39 —линейный 17 —локального проектирования 181 —нереализуемый 52 —обратной связи 25 —объекта 18 — физически реализуемый 18 Оператора —квазистационарное изменение 103 — Нскстройка 101 Операция — бинарная 153, 164 — дифференцирования 47 Ощибка — регулирования 24 — слежения 109 — стабилизсщии 28 — статическая 28, 114 — О 212 статическсл 212 — установившаяся 114 Параметр 164 Переменная — операторная 162, 163 Поверхность — разрыва 108 — скольжения 183 Показатель качества 264 Полином — знаменателя передаточной функции 18 — аннулирующий, 49 —гурвицев, 54 — устойчивый 54 —характеристический 40 — числителя передаточной функции 18 Полинома — степень, 44 — устойчивость 54 Политоп 96 Полиэдр 94 Положение
Предметный указатель —покоя 27 —равновесия 114 Помеха —постоянная 31 — случайная 270 Порядок —объекта 18 — относительный 74 —первый 188 —по параметру Д 188 — полинома 78 — скольжения 179 — ургшнения 19 Преобразование —координат 159 — Лапласа 18 одностороннее 18 —невырожденное 21 Принцип —встроенной модели 48 —генерации 137, 148 — двухканальности 40, 48 —кги:кадного регулирования 88 — К—^изображения 48 — комбинированного упргшления, 111 — компенсации, 34 — максимума134 — обратной связи 102 — оптимальности 302 —переменности структуры 108, 120 —причинности 18 —регулирования по возмущению 32 —регулирования по нагрузке 29, 56 —регулирования по ошибке 56 — скаляризахщи 157 Пространство — КО 163 —состояний 19 —г фазовое 63 Процесс переходный 27 — апериодический 174 — колебательный 174 — монотонный 196 Регулирующий орган 140 331 Регулятор — динамический 232 —линейный 68, 116 —нелинейный 67 —-переменной структуры 108 — статический 229, 231 — универсальный 107 Режим — переключений 117 —скользящий 191 идеальный 190 реальный 129, 183 Решение —вынужденное 26 — оптимальное (субоптимальное) 301 —переходное 27 — ургшнения 26 — установившееся 27 — частное 26 Связь — КО 215 динамическая 215 —компенсирующая 38 — корректирующгкя 43 — О 208 отрицательная статическая 211 — ОК 227 — обратная 20, 55 —по возмущению 128 — по заданию 26 —прямая 25 Сигнал 262 — К 138 —координата 138 — О, 138 — оператор 138 Система — адаптивная, 103 — астатическая 109 —грубая 57 — декомпозированная 45 — динамическая 24 разрывнгш 67, 179 — диссипативная 102
332 — инвариантная 40 —интервгшьная 98 —каскадная 68 — Ксъскадного регулирования 91 —координат (декартова) 19 —линейная 18 — многомерная 120 — неопределеннгья 98 —переменной структуры 110 —пониженной размерности 148 —предельнее 58 —прочная 84, 283 —разрывная 68 — релейная 68 — статическая 109 — следящсья 69 — составная 21 — субоптимальная 314 — управления 25 автоматического 25 с глубокой обратной связью 62 замкнутая 57, 60 6инарнс1я с 0-связью 212 прямого цифрового 134 — управляемая 198 — уравнений 229 Системы — гшализ 40 —синтез 31 Скользящий режим 82, 117, 179, 310 — 2-го порядка 189, 191 — в точке 71 —высшего порядка 179 — идеальный 190 стандартный188 —на отрезке 81 — на прямой 120 — реальный 132, 184 Стабилизатор универсальный 105 Стабилизация —адаптивная 102 —глубокой обратной связью 55, 311 —интервальнгш 94 —линейная 195 — неопределенного объекта 84 Предметный указатель — оптимальнг1Я 300 — по выходу 192 — разрывным управлением 258 — субоптимгишная 312 — финитная 177, 199, 241 Статизм 207 — динамический 173, 212 Статика 27 Структура — структурная композиция 93 — треугольнгш 93 Схема —структурная 23 Теория — систем переменной структуры 117 — адаптивной стабилизации 102 — управления 24 адаптивного 102 Тип обратной связи —координатная 143 — координатно-операторная 143 — операторная 144 — операторно-координатная 144 Точка — изображающая 82 — фазовая 19 Трансверсальность 180 Управление 17 — бинарное 209 —гладкое 66 — дополнительное 210 — допустимое 136 —комбинированное 111 —непрерывное 192 — программное 28 — разрывное 66 —релейное 255 —робастное 108 — эквивалентное 233 Уравнение — Беллмана 302 — выхода 20 — движения аффинное по управлению 211
Предметный указатель системы с глубокой обратной связью 183 — дифференциального минимакса 305 — дифференцисШЬНое с разрывной правой частью 108 — наблюдателя относительно ошибок 165 — неоднородное 26 — объекта в отклонениях 64 — однородное 26 — первого приближения 246 — состояния 20 — скольжения 83, 180 регшьного 184 — харгжтеристическое 30 — эталонной модели 306 Усилитель — интегрирующий 140 — статический 140 Условие — инвариантности 51 — квазистационарности 106 — компенсации, 32, 35 — МС (Matching Condition), 86, 182 — необходимое и достаточное по­ падания 125, 253 — неопределенности 56 — несмещенности 44 — согласованности 86, 100 — существования скользящего режима 125 — устойчивости 58 — Харитонова 96 Устойчивость — замкнутой системы 61 — асимптотическая 34 — интервальная 96 — нулей оператора 52 —положения равновесия 216 — свободного движения 31 — системы 63 — степень устойчивости 173 — экспоненциальная 48 333 Ф а з а 268 — фазовг1я плоскость 77 — фг^зовый портрет 65 — фг130вое пространство 64 — фазовая точка 20 Фильтр — Винера 151 — Калмана-Бьюси 151 — предварительной обработки сиг­ нала 263 — сглаживающий 284 — стационарный 151 — формирующий 151 Фильтрация 264 Функция — Беллмана 302 — выхода 19 — дробно-рационг1льная 18 —задания 110 — комплексной переменной 18 — Ляпунова 75 — насыщения 66 — невырожденная 18 — оригинал, 18 —передаточная 18 нули передаточной функции 18 —пробная 196 — реле 66 Ш а р диссипативности 260 Экстремаль — экстремалей поле 301, 303 Элемент —билинейный 139 — бинарный 139 сепарабельный 140 — рг1зрывный 222 — сепарабельный 142 Эталонная модель 999 Ячейка — ф 122 — "квг13ирелейное" представление ^-ячейки 128
Научное издание ЕМЕЛЬЯНОВ Станислав Васильевич, КОРОВИН Сергей Константинович НОВЫЕ ТИПЫ ОБРАТНОЙ СВЯЗИ. УПРАВЛЕНИЕ ПРИ НЕОПРЕДЕЛЕННОСТИ Редактор Е.Ю. Звеэкинскад Компьютерная графика Е.Ф. Тюриной, А.С. Фурсова Компьютерная верстка А.П. Носова ИБ №41861 ЛР Х« 020297 от 27.11.91. Подписано в печать 16.06.97. Формат 60x90/16. Бумага офсетная №1. Печать офсетная. Усл. печ. л. 22. Уч.-изд. л. 24,2. Тираж 1000 экз. Заказ тип. 1923 . С-014. Издательскгъя фирма «Физико-математическая литература» РАН 117071 Москва В-71, Ленинский проспект, 15 Отпечатано в Московской типографии Х*2 РАН 121099 Москва Г-99, Шубинский пер., 6
Institute for Systems Analysis Moscow State University New Types of Feedback Control under Uncertainty EMELYANOV S.V. KOROVIN S.K. The monograph is intended for a wide circle of specialists who are interested in the problems of cybernetics, information science, automatic control and optimization. We have made an attempt to give a systematized exposition of the main ideas and principles of the theory of control systems with new types of feedback. The new theory can find divers applications, say, in solving problems of industrial automation by creating a new generation of controllers which will efficiently control technological processes under the conditions of great uncertainty and which will not require a regular adjustment of their parameters. The most important thing is that this theory contains simple recurrent laws of synthesis of a potentially arbitrarily complicated feedbewik which can cope with a nonstandard uncertainty. In this respect, the new theory is a natural development of the classical theory of automatic control and provides it with new tools which make it possible to extend the capabilities of automatic systems. Reviewers: Academician of Russian Academy of Sciences V.P. Maslov Academician of Russian Academy of Sciences Ya.Z. Tsypkin Physical and Mathematical Literature Publishing Company, Russian Academy of Sciences. Moscow, 1997, 352 p. ISBN 5-02-015149-1
336 New Types of Feedback Contents Preface Introduction 8 11 Part I The main principles of design automatic control systems C h a p t e r 1. P r i n c i p l e s of design linear a u t o m a t i c c o n t r o l s y s t e m s 1.1. Statement of a control problems and preliminzu-ies 1.2. Principle of load control 1.3. Principle of perturbation control 1.4. Principle of compensation in an indirect meeisurement of pertiu-bation 1.5. Double-channel principle 1.6. The method of /f-representation or the method of a built-in model 1.7. Deep feedback, namely, a high gedn 1.7.1. Statement of the problem, its peculicuities and the idea of its solution 1.7.2. Problems and limitations of the method of deep feedback 1.7.3. On the structural stability of systems with a deep feedback 1.7.4. The method of the state space in the analysis of systems with a deep feedback 1.7.5. Geometrical interpretation of systems with a deep feedback 1.7.6. The effect exerted by amplitude constraints on systems with a deep feedback 1.8. Literciry comments Chapter 2. Certain principles of c o n s t r u c t i n g n o n l i n e a r controllers 2.1. On-off feedback 2.1.1. Main concepts 2.1.2. Sliding mode at a point 2.1.3. Switching mode 2.1.4. On the strength of a switching mode 2.1.5. On-off stabilization of objects with self-levelling 2.1.6. On-off stabilization with a high relative order 2.1.7. Robust stabilization: discontinuity, continuity, and information concerning the state 2.1.8. Robust stabiVzation of an object with the first relative order 2.1.9. Sliding mode on an interveJ 2.1.10. Actual sliding mode on an interveJ 17 17 28 31 35 40 49 56 56 58 62 64 65 65 66 68 68 68 71 73 75 76 78 78 80 81 82
Contents 2.1.11. On-off stabilization of a generetlized object 2.2. Stabilization of an object with an indefinite operator 2.2.1. Basic principles 2.2.2. Principle of a cascade control 2.2.3. Structure of objects with caiscade control 2.2.4. Stabilization of interval objects 2.2.5. Interval stability 2.2.6. Bcksic principles of the adaptive stabilization theory . . . 2.3. Stabilization by a controller with a V2u-ying structure 2.3.1. Astatic servo system 2.3.2. Second order astatism 2.3.3. Astatism of order m 2.3.4. Astatic servo system of varying structure 2.3.5. Sliding mode on the whole straight line 2.3.6. Analysis of the strength of systems of varying structure relative to perturbation parameters 2.3.7. Systems of V£u-ying structure at the presence of an external force 2.3.8. Quasirelay representation of a ф-сеИ 2.3.9. Limitations, disadvantages, emd problems of the theory of systems of varying structure 2.4. Literciry comments 337 83 84 84 88 92 94 96 100 108 109 114 115 116 120 123 125 128 130 131 Part II. New types of feedback Chapter 3. Basic p r i n c i p l e s of t h e t h e o r y of n e w t y p e s of feed­ back 135 3.1. Preliminaries 135 3.2. Systems of basic concepts 137 3.2.1. Signal-operator 137 3.2.2. Types of dynamical objects 138 3.2.3. Bineu-y operation 139 3.2.4. Types of controlling devices 140 3.2.5. New types of feedbeick 140 3.3. Structural synthesis of Ыпгц-у systems 141 3.3.1. Stabilization of em indefinite object 141 3.3.2. Nonlinecu- feedback as a meeins of suppressing uncertainty 148 3.3.3. Filtration problem 150 Chapter 4. T h e o r y of t h e c o o r d i n a t e - o p e r a t o r feedback 4.1. Stabilization of Type 2 object with unknown parameters and ex­ ternal action 4.1.1. Scadarization principle and the equation of гт object in the space of errors 4.1.2. Some remarks concerning the statement of the problem and its genercdization 4.1.3. Coordinate-operator ph2kse sp2u;e 4.2. CO-algorithms of stabiUzation 4.2.1. Direct compensation 154 155 156 157 161 164 165
338 New Types of Feedback 4.2.2. Asymptotic evaluation or an indirect measurement of the 0-perturbation 4.2.3. Compensation of the wave O-perturbation 4.2.4. On-ofT CO-stabilization 4.2.5. Remarks concerning the strength of systems with a relay co-feedback 4.2.6. Linear CO-algorithms of stabilization 4.2.7. Integral relay CO-algorithm of stabilization Chapter 5. Higher-order sliding modes 5.1. Some preliminsu-y information from the theory of a sliding mode 5.1.1. Equations of sliding 5.1.2. On the inviuisuice of equations of sliding relative to perturbations satisfying the matching condition 5.1.3. Equations of actual sliding 5.1.4. Remarks concerning the order of sliding 5.2. Algorithms of Type 2 sliding 5.2.1. Asymptotic algorithms of Type 2 sliding 5.2.2. Discontinuous asymptotic algorithms of Type 2 sliding . . 5.2.3. Finite algorithms of Type 2 sliding: linear feedback . . . . 5.2.4. Finite algorithms of Type 2 sliding: on-off feedback . . . 5.2.5. Algorithm of torsion 5.3. Output finite stabilization 165 166 168 171 172 176 170 179 180 182 183 187 191 193 196 197 199 200 202 Chapter 6. Theory of operator feedback 206 6.1. On the purpose of the operator feedback 206 6.2. Motion equations in the coordinate-operator feedbeick 209 6.3. Static operator feedbitck 211 6.3.1. Static operator and coordinate-operator feedback 212 6.3.2. Static operator and dynamical coordinate-operator feedback215 6.3.3. Inertia coordinate-operator feedbiick 215 6.3.4. Inertia relay coordinate-operator feedback 217 6.3.5. Inertia relay coordinate-operator feedback for an unknown parameter in control 221 6.3.6. Integral-relay coordinate-operator feedback 222 Chapter 7. Theory of the operator-coordinate feedback 225 7.1. Dynamical statism and operator-coordinate feedback 225 7.2. Motion equations of an operator-coordinate object 228 7.3. Static OC-controller 229 7.4. Integral OC-controller 231 7.5. Principle properties and perculisirities of biniiry systems of stabilization with different types of feedback 235 7.6. Discontinuous OC-feedback 237 7.6.1. Integral relay OC-controller 237 7.6.2. Type 2 sliding modes in an OC-loop 241
Contento 339 Chapter 8. Limitatione, the physical foundations of the compen­ sation of perturbations, and the stabilization of forced motion in bynary systems 246 8.1. Constraint on the operator variable 247 8.2. On the global behavior of a binary system 252 8.3. Physical foundations of the compensation of uncertainty 255 8.4. On the compensation of the coordinate perturbation 256 Chapter 0. Differentiation of signals 9.1. Statement of the dufferentiation problem 9.1.1. Filtration 9.1.2. RC-chain 9.1.3. Discrete-difference approximations 9.2. Differentiating servo systems 9.2.1. Linear differentiator 9.2.2. Relay differentiator 9.2.3. Differentiator of a varying structure 9.3. Asymptotic binary servo differentiator 9.4. Finite binary differentiator 9.5. Nonstandard differentiating systems 9.5.1. Differentiator with a "small" amplitude of discontinuities 9.5.2. Nonstandard binary differentiator 9.5.3. Results of discrete simulation of a nonstandard Ыпги-у dif­ ferentiator 262 262 264 265 269 271 272 276 280 283 287 288 289 291 Chapter 10. Suboptimal stabilization of an uncertain plant 10.1. Statement of the optimal stabilization problem 10.2. Example of an optimal stabilization problem under imcertainty . 10.3. Optimal stabilization "in the mean" 10.4. Minimax optimal stabilization 10.5. Stabilization with the use of a reference model and deep feedback 10.6. Stabilization with the methods of the binary control theory . . . 10.6.1. System of a variable structure 10.6.2. Binary stabilization with the integral CO-feedback . . . . 10.6.3. Stabilization with the use of Type 2 sliding 10.7. Reduction of the problem of suboptimetl stabilization to that of asymptotic invariance 10.7.1. Basic concepts of the asymptotic invariance theory . . . . 10.7.2. Suboptimal lineskrly quadratic stabilization 300 300 302 303 304 306 308 310 311 312 Conclusion References Index 319 322 328 297 313 314 316
340 New Types of Feedback Preface In this monograph we consider one of the central problems of the automatic control theory, namely, the stabilization problem and the method of its solution in their evolution. Beginning with the simplest statement of this problem, we gradually make it more complicated analyzing in detail the possibilities of different methods of solution. The complication begins with the increase in the uncertainty factors is the statement of the problem, and the methods of solution become more complicated respectively. This approach makes it possible to consider the general trends in the development of the principles and methods of the theory of automatic control. The latter fact is obviously very important since, in the new situation, the mastering of the general mechanisms of formation of control may prove to be useful. It should be pointed out that the authors do not suppose that the proposed point of view concerning the development of the automatic control theory is the only possible approach since the problem under consideration (in fact, this is the problem of the mechanism of regeneration of feedback) is far from being trivial since different means of describing this mechanism are possible. The larger the number of these means, the better since they bring us closer to the understanding of the fundamental mechanisms of the functioning of feedbeick. This is very significant both theoretically and practically since the modern methods of stabilization are oriented, in the main, to an "intensive" solution of the problem whereas nature demonstrates remarkable examples of solving stabilization problems with the use of very limited means and under rather strained circumstances. This essential difference testifies that a genuine feedback theory has not been worked out yet, that many things are not yet clear, and that the principal discoveries in this sphere are yet to come. Investigating this complicated and delicate problem, we are far from laying claim to grasping the crux of the matter, but we are sure that the theory that we propose directly concerns the matter and seems to be quite natural. Some words are due about the structure of the monograph. As was already pointed out, we try to go from simple things to more complicated ones and begin, naturally, from linear objects and the methods of the theory of linear control system. Since we lay special stress on the principles of problem solving and on the conceptual interpretation of the results, we tried to evade mathematically strict statements and proofs. It stands to reason that all f2icts and statements presented in the book can be strictly substantiated, and many of them are well know from literature.
Preface 341_ In the monograph we compare the applications of different control methods for solving stabilization problems under varying conditions, namely, external forces, parameters, the structure and order of an object. For this purpose, are, obviously, especially useful simple models of objects, only models of this kind are considered in the monograph. However when carrying out the analysis, we use different forms of description of controlled objects, namely, structural, operator, differential, since some facts seem to be more convincing in a certain description and other facts are more convincing in a different description. It can be seen from the book that as the stabilization problem becomes more complicated, the nonlinearity plays a more important part. In addition, it becomes clear that there cannot be good stabilization without nonlinear feedback and in is precisely the nonlinear feedback that provides a control system with the ability to demonstrate the needed behavior in complicated and constantly varying external and internal conditions. It turns out that beginning with a certain level of complexity of the problem a "good" controller will necessarily be nonlinear. It is know that in the nonlinear world there are no regular ways or universal methods which are typical of local theories since the specific features of nonlinearity imposes certain constraints. For the theory developed in this monograph the structural methods of analysis and synthesis of systems turn out to be very useful, and therefore we pay so much attention to the description of these methods. The purposeful use of nonlinearities in the control makes it possible to operate with principally new "nonintensive" or "compensational" mechanisms of suppression of uncertainty factors, in particular, the techniques based on the use of positive feedback and unstable motions, which allows the system to gather momentum by itself and work until conditions are created for suppressing the interferences and uncertainty factors. It is precisely the positive feedback and the instability that play a key role in some problems. It should finally be pointed out that the stabilization problem should not be considered in the restricted sense since many important problems of the control theory can be reduced to the stabilization problem, say, the problems of differentiation and optimization. However, since this class of problems is important and rich in content, we devote special sections to their study. A c k n o w l e d g m e n t . The authors express their deepest gratitude to many people who played an important part in the appearance and development of the theory binary control: to some people for their benevolent reaction and mild criticism when we first appeared in public with our reports, to other people for their selfless and creative work on the topical problems of the theory, to our opponents for their severe, may be not always justified but, in the end, useful criticism. We express our special gratitude to Academicians A.A. Krasovskii, E.P. Popov and Ya.Z. Tsypkin, whose remarks were always to the point,
342 New Types of Feedback concerned the essence of the matter, and made for a correct development of the theory. We are also grateful to our disciples and followers, who, for many years, worked fruitfully and with enthusiasm in this field and made a signiflcant contribution to the new theory. First of all, we want to acknowledge the contribution made by I.G. Mamedov, A.L. Nersisyan, V.I. Sizikov, A.P. Nosov, and L.V. Levantovskii. IT is pleasant to point our the atmosphere of well wishing, scientific creative work and self-support which was typical of the scientists of the Institute of Systems Analysis of the Russian Academy of Science, which exerted a positive influence on our work. This is mainly the merit of Academician D.M. Gvishiani, the first director of the Institute of System Analysis of the Russian Aceidemy of Science. We want to express our special gratitude to Mr. Zhivilo Mikhail Yuryevich whose sincere wish to contribute to the development of the Russian science deserves deep esteem. Without the support and real help of Mr. Zhivilo the publication of this book could be delayed for many years. Finally, we want to point out the laborious and exceptionally useful work of putting the manuscript of the book into shape and preparation of the camera-ready copy. This work was done by A.P. Nosov, M.M. Belova, A.S. Fursov, L.A. Selivanova and the editors of the ISA of the Russian Academy of Science E.N. Sholokhova, T.S. Borshchova, and T.V. Kovalina. We are sincerely grateful to them for their highly professional work. When writing the book, the authors received some financial support as grants of the Russian Foundation for Fundamental Research and The European Economic Association.
introduction 343 Introduction It is believed now that the development of the basic problem of the automatic control theory is principally completed, and correspondingly the center of investigations shifted to the domain of applications, working out effective methods of analysis, and designing control system. It is also believed that the appearance of new ideas and principles is possible only upon a transition to objects of a new nature. It should be noted that there are, indeed, certain reasons for this viewpoint, and these reasons are rather weighty. The automatic control theory has attained impressive successes and today it can propose a wide spectrum of solution methods for various problem of applied automatics. The field of practical application of the automatic control theory is very wide, and one cannot think of the contemporary technology without means of automatization and, hence, without the use of recommendations of control theory. This if one aspect. Another aspect is that the most modern mathematical apparatus is used more and more actively in control theory whereas the books and articles in scientific journals concerning control theory are, in the main, of a generalizing, summing up chareicter. It may seem that there is a clear evidence that control theory is close to perfection and completes its development. Is this really so and there are ready solutions in control theory for every specific case? In certain situations this is really the fEu:t, but more frequently control theory gives not recipes but only recommendations which must be subjected to experimental verification as to the adequacy of the situation under consideration. Therefore it is not by chance that there exists a generally accepted sequence of stages of the development of automatic control systems, namely, the elaboration of a mathematical model of an object, the investigation and identification of the model, the formulation of requirements to the properties of the system, the choice of the law of control and performance of imitation experiment, the technological realization of the system and the conduction of a natural or seminatural experiment, and the adjustment of the system. In this sequence, the whole chain of elaboration or some of its links may be used repeatedly. If we also take into account that the realization of each stage requires certain creative efforts, it becomes clear that the creation and exploitation of control systems is a complicated process which requires the enlisting of the services of highly qualified experts. This requirement obviously contradicts the mass character of automatization. Consequently, the elaboration, designing, and keeping the control system in working order is a "bottleneck" which retards the progress in the
344 New Types of Feedback technology of automatization. This is a challenge for control theory which must give the needed methods and tools that would make it possible to effectively work out and exploit control systems with the use of small effort and without a resort to highly qualiffed specialists. To a certain degree, this problem can be solved with the use of systems of automated design (SAD), but not only of these systems. SAD is a tool which is effective only when it is well "equipped" theoretically. Otherwise SAD can cope with the routine phase of the development but will not promote the solution of the creative problems of automatization, and, strictly speaking, it is these problems that require high qualification. Only a developed theory, which not only gives strict recommendations for a certain class of situations but also suggests rules for reasonable actions in nonstandard and the methods of obtaining an adequate solution for every specific case, can become a foundation which will allow a further qualitative progress in automation. SAD with elements of an "intellect" in the theoretical basis is what we need today. Does the modern control theory satisfy this requirement (of a high "intellect")? We had to state that it does not. There are many reasons for this. The engineer who develops control systems has to resolve an objective contradiction between the elaboration of an object in detail and the possibility of a further analytic investigation of the system, and identification of its parameters, and the problems of the synthesis of the controller. Very likely, this is the most difficult stage whose formalization is hardly possible. And although a certain real process lies, as a rule, at the basis, the researchers who work in automatics strive to construct not an exEict but only an imitating model of the process which reflects "most important properties" with respect to the preassigned input and output variables. This is the main thing that distinguishes the models of control theory from the models that are exploited in such fundamental disciplines as physics, chemistry, etc. And, it should be pointed out that concept "the most important properties" often has an intuitive sense which poorly gives in to formalization. It is, perhaps, the reason why when constructing a control system we have iteratively return to this stage and make necessary corrections. Because of this circumstance, the most natural way of progressing seemed to be an elaboration of "as simple models as possible". This led to the formation of a collection of standard models which are, in the main, exploited in control theory. At present, this arsenal is quite poor and is based on linear models or models close to them. In this way, often to the detriment of the real circumstances, but in order to oblige the theory, a bank of simplified models hsis formed with which we deal, in the main, in control theory and which is, in the essence, one of the obstacles against which control theory "stumbles" in practice. Thus, the priority in the direction of development of the theory was given to analytics and this, in turn, led to a hypertrophied development of analytical methods which are often similar as concerns their final re-
Introduction 345 suits but which differ in the means of their attainment and the conditions of their application, namely, in transfer functions, differential equations, inlet-outlet representations, frequency and time characteristics, etc. However, we cannot wring out much from simple models even when we have a powerful apparatus. This especially concerns automatic control systems (ACS) since the attention given to the solution of problems of the synthesis of controllers is ineidequate. In feict, this branch of control theory remains almost virginal. There exists a rather restricted collection of techniques of syntheses for a small number of standard situations. We can say without exaggeration that today the processes of appear­ ance of controlling mechanisms are unclear. In all cases, the appearance of a new method of synthesis is sooner due to inversion that to theory. There fore the problem of the search for the general principles of synthesis which would make it possible to obtain the required law of control in concrete circumstances as if automatically seems to be very attraictive. The elab­ oration of these general principles will predetermine, in out opinion, the development of control theory in the near future. We can try to guess certain features of this development. It is clear first of all, that nonlinearity must become an inelienable element of the theory. In the first place, it is the requirement of practice: constraints, nonlinearity of the elements, etc. But this is not only reason, examples from other branches of science (and ACS as well) clearly demonstrate that the due account of nonlinear phenomena substantively enriches the theory many times over: the nonlinear "world" is incommensurably richer than the linear one and precisely on this way new phenomena, principles, and law, originate. As an illustration, we can cite an example when ACT was essentially enriched due to the solution of problems on absolute stability, on the inves­ tigation of self-sustained oscillation processes, cidaptive control. Examples from other branches of science, say physics and chemistry, are even more expressive. However, this statement is almost obvious, and it is much more difficult to indicate some constructive way that will lead to the nonlinear "world". Does it exist? In our opinion, it does, and this way lies in the direction of systematic use of the most important principle of cybernetics, namely, the principle of feedback. We have only to learn to use it correctly in nonstandard sit­ uations. It is clear today that this principle is the bsisis of self-control and the development of all living things. However, only the negative feedback and, correspondingly structurally stable processes "work" now in full mea­ sure in ACT. The "press" of linearity hinders the wide use of the positive feedback and structurally unstable processes. Only upon the transition to principally nonlinear systems, we shall be able to actively involve new effects connected with the employment of the positive or alternating feedЬг1ск.
346 New Types of Feedback Conclusion Feedback "penetrates" the environment and serves as a key element of biological evolution and natural selection; it ensures a regular mechanism in equilibrium systems, in particular, in natural ecosystem; it is a necessary element of successful economic constructions; finally, it serves as the basis for self-regulating and self-supporting biological system. And, although this list can be easily continued, we still know very little about the mechanism of feedback since, actually, it never was an object of investigation. There is an essential reason for this. Indeed, the idea of feedback is almost obvious, it can be easily understood, and its use in simple situation does not cause any problems. However, the synthesis of feedback in a nonstandard situation is, as a rule, not easily realized and requires nonstereotyped solutions. This is due to the absence of a theory which would explain the mechanism of formation of feedback. As a rule, these mechanisms escape the researcher since they are very complicated. Here the situation is similar to those concerning other laws of the natural science. At his time, the physicist Richard Feynman said about the law of gravitation that: the law acted in a complicated way, but the key idea it was based on was simple and that this circumstance maked all our laws related? It should be pointed out with good reason that regular at tempts to study feedback are made in the theory of automatic control, in bionics, and in economic theories. However, in these disciplines the emphasis is plax:ed on the use of feedbaw;k and not on the mechanism of its formation. This is natural since, according to Henon, an objective science works out rules for problem solving and not rules for choosing these rules. And yet the absence of rules of the second level, i.e. the methods for working out the rules themselves, forces us to guess a feedback law every time when we deal with a nonstandard problem. Sooner or later we manage to guess, but it is very difficult to think of new ideas and principles, this requires a very rich imagination. It is not by chance that the control theory has fixed very few revelations of this kind. As a result, the control theory actually contains minutes of solutions of nonstandard problems where as it is desirable to have laws of synthesis which can be extended to new situations. In this monograph, the authors make first attempts to develop the conjecture concerning the structure of the mechanism of feedback formation. This conjecture is based on the hierarchy of the complexity of feedback.
Conclusion 347 This idea concerning the structure of feedback seems to be quite natural since it makes it possible to reduce the problem of synthesis of a complicated nonlinear controller to the solution of a sequence of similar wellstudied problems, i.e. the visual complexity of the problem is recurrently generated by the invisible internal need. The concept of "signal-operator" was needed for the realization of the indicated hierarchy, which was new for the control theory. This term reflects the duality of the nature of signals in nonlinear dynamical systems. In conjunction with the principle of feedback the signal-operator presents the needed possibilities for transition from the direct solution of the problem to finding, first, the algorithm for solving the problem and, when necessary, to transition to the algorithm determining the algorithm of problem solving, an so on. The hierarchy of the structure of feedback obtained in this way is also distinguished by the fact that at every hierarchical level the controlling mechanisms are simple, single-type, and can be obtained by methods which are standard for the classical control theory. Pay attention to the fact that the idea concerning the duality of variables is conventional for natural sciences and very fruitful. Thus, for instance. Max Born introduced the concept of an operator of a physical quantity which proved to be very fruitful in quantum mechanics theory which deals with objects that are dual in their first principle, and the concept of time-operator, introduced by Ilya Prigogin, proved to be very useful in the physics of irreversible processes. The authors are sure that the appearance of binarity principle and new types of feedback is quite natural for the present stage of development of the general theory of feedbeick. In order to substantiate this thesis, the authors consider at length the evolution of the most important principle and methods of the control theory with the increase of the uncertainty factors in control problems, and this is of interest in itself and can serve as a brief introduction to the classical theory of feedback. It should also be pointed out that from the point of view of mathematics the proposed approach can be regarded as a method of synthesis of nonlinear dynamical systems with preassigned properties of their solutions, such, for instance, as stability, law stability with respect to the variation of the parameters of the problem etc. It stands to reason that the use of the proposed principle is not restricted to problems of stabilization, filtration, or optimization. Already today we are aware of its other applications. For instance, it ca be used to separate close signals of unknown frequency in a finite time whereas linear schemes of separation require, in general, infinitely much time, for robust solving inverse problems of dynamics which refer to the problems of synthesis of standard trajectories and dynamical processing of the results of measurements, to solve stabilization problems under uncertainty and the search for saddle equilibrium positions.
348 New Types of Feedback Thus, in this monograph we propose a hierarchical principle of formations of feedback which is based on the duality of the variables of a nonlinear system and which provides a system of automatic control with elements of perfect behavior in complicated uncertain conditions. Other mechanisms of the synthesis of complicated feedback possibly exist, but the advantage of the proposed method is that we can do without large amplification factors or discontinuous control elements. On the contrary, the needed behavior of a system of automatic control is attained for bounded gain factors and for smooth control signals, and this especially important since in natural systems the perfect operation of control mechanisms can be attained precisely under these conditions.
Издательская фирма ФИЗИКО-МАТЕМАТИЧЕСКАЯ ЛИТЕРАТУРА Академиздатцентра «Наука» РАН Вышли в свет при поддержке Российского фонда фундаментальных исследований УЧЕБНАЯ ЛИТЕРАТУРА ВЕЛОЦЕРКОВСКИЙ СМ. Численное моделирование в механике сплош­ ных сред, 1994, Пер.448, Б/о БОРИСОВИЧ Ю.Г., БЛИЗНЯКОВ Н.М., ИЗРАИЛЕВИЧ Я.А., ФОМЕН­ КО т . н . Введение в топологию.—2-е изд., 1995, Пер.416, 81-96.П ГОППА В.Д. Введение в алгебраическую теорию информации, 1995, Обл. 112, Б/о ЕЛКИН В.И. Редукция нелинейных управляемых систем: Дифференциальноразностный подход, 1997, Пер.320, 78-97.11 ЛАБЗОВСКИЙ Л.Н. Теория атома: Квантовая электродинамика электронных оболочек и процессы излучения, 1996, Пер.304, 81-97.1 ЛАВРОВ И.А., МАКСИМОВА Л.Л. Задачи по теории множеств, 1995, Обл.256, Б/о ЛАНДАУ Л.Д., ЛИФШИЦ Е.М. Статистическая физика. Часть 1.—4-е изд. (Теор. физ.; Т. V), 1995, Пер.608, 93-96.1 НИКУЛИН В.П., ПОХОЖАЕВ СИ. Практический курс по уравнениям математической физики, 1995, Пер.224, Б/о СВЕТОЗАРОВА Г.И.. КОЗЛОВСКИЙ А.В., СИГИТОВ Е.В. Современные методы программирования в примерах и задачах, 1995, Пер.432, Б/о СТРУКОВ Б.А., ЛЕВАНЮК А.П. Физические основы сегнетоэлесгрических явлений в кристаллах.—2-е изд., 1995, Пер.304, 94-96.1 СПРАВОЧНАЯ ЛИТЕРАТУРА ЗАЙЦЕВ В.Ф., ПОЛЯНИН А.Д. Справочник по обыкновенным диффе­ ренциальным уравнениям: Точные решения, 1995, Пер.560, Б/о Фундаментальные экологические проблемы в разработках Российской академии наук: Справочное руководство /Сост. А.А.Веденяпин, И.К.Козлова, Л.В.Шаумян, 1995, Обл.96, Б/о НАУЧНО-ПОПУЛЯРНАЯ ЛИТЕРАТУРА ИГОШИН В.И. Михаил Яковлевич Суслин (1894-1949), 1996, Обл. 160, 208-96.11 КОЧИНА П.Я. Николай Евграфович Кочин.—2-е изд., 1994, Обл.240, Б/о СОНИН А.С. «Физический идеализм»: История одной идеологической кампании, 1995, Обл. 224, Б/о СОНИН А.С., ФРЕНКЕЛЬ В.Я. Всеволод Константинович Фредерике (1885—1944), 1995, Обл. 176, 207-96.1 НАУЧНАЯ ЛИТЕРАТУРА АРУТЮНЯН Г.В. Термогидродинамическая теория гетерогенных систем, 1994, Пер.272, Б/о БЕСОВ О.В., ИЛЬИН В.П., НИКОЛЬСКИЙ СМ. Интегральные представ­ ления функций и теоремы вложения.—2-е изд., 1996, Пер.480, 63-97.1 БЛЕХМАН И.И. Вибрационная механика, 1994, Пер.400, Б/о БОГАЧЕВ В.И. Гауссовские меры, 1997, Пер. 352, 72-97.11 БУХАЛЁВ В.А. Распознавание, оценивание и управление в системах со случайной скачкообразной структурой (Теорет. основы техн. кибернетики), 1996, Пер.304, 56-97.1
ВОЛЕВИЧ Л.Р., ГИНДИКИН С.Г. обобщенные функции и уравнения в свертках, 1994, Пер.336, Б/о Воспоминания об академике М.А.Леонтовиче.—2-е изд. /Сост. В.И.Коган, В.Д.Н0ВИК0В, 1996, Пер.448, 140-95.11 ГАЛАНИН М.П., ПОПОВ Ю.П. Квазистационарные элепромагнигные поля в неоднородных средах: Математическое моделирование, 1995, Пер.320, 87-96.1 ГОЛОВАЧЕВ Ю.П. Численное моделирование вязкого газа в ударном слое, 1996, Пер.376, 82-96.11 ГОРИНЕВСКИЙ Д.М., ФОРМАЛЬСКИЙ А.М., ШНЕЙДЕР А.Ю. Управ­ ление манипуляцяонными системами на основе информации об усилиях, 1995, Пер.368, Б/о ГОРШКОВ А.Г., ТАРЛАКОВСКИЙ Д.В. Динамические контактные задачи с подвижными границами, 1995, Пер.352, 89-96.1 ГРИГОЛЮК Э.И., ФИЛЬШТИНСКИЙ Л. А. Регулярные кусочно-однород­ ные структуры с дефектами, 1995, Пер.ЗЗб, Б/о ДОБРОВИДОВ А.В., КОШКИН Г.М. Распространение волн в сдвиговых потоках, 1997, Пер.ЗЗб, 68-97.1 ЖАКОД Ж., ыгаРЯЕВ А.Н. Предельные теоремы для случайных процессов: В 2 т. Т. 1, 1994, Пер.544, Б/о ЖАКОД Ж., ШИРЯЕВ А.Н. Предельные теоремы для случайных процессов: В 2 т. Т. 2, 1994, Пер.368, Б/о ЗАЙЦЕВ А.А. Теория несущей поверхности: Математическая модель, численный метод, расчет машущего полета, 1995, Обл. 160, 92-96.1 ИВАНОВ П.М. Алгебраическое моделирование сложных систем, 1996, Пер.272, Б/о ИВАНОВ Ю.Н. Теоретическая экономика: Экономические доктрины. Теория потребления, 1997, Обл.128, 37-97.1 ИЛЬИН В.П. Методы неполной факторизации для решения алгебраических систем, 1995, Пер.288, 133-95.11 КАЦЕНЕЛЕНБАУМ Б.З. Проблемы аппроксимируемости электромагнитного поля, 1996, Обл.208, 77-97.1 КЛАПДОР-КЛАЙНГРОТХАУС Г.В., ШТАУДТ А. Неускорительная физика элементарных частиц: Пер. с нем., 1997, Пер. 528, 97-97.11 Колмогоров в воспоминаниях /Под ред. А.Н.Ширяева, 1993, Пер736, Б/о КОЧИНА П.Я., КОЧИНА Н.Н. Гидромеханика подземных вод и вопросы орошения, 1994, Обл.240, Б/о КУЗЬМИН В.П., ЯРОШЕВСКИЙ В.А. Оценка предельных отклонений фазовых координат динамической системы при случайных возмущениях, 1995, Пер.304, 61-96.1 ЛАРИЧЕВ О.И., МОШКОВИЧ Е.М. Качественные методы принятия решений, 1996, Пер.224, 63-96.11 ЛЯМШЕВ Л.М. Радиационная акустика, 1996, Пер.304, 76-97.1 Математические вопросы кибернетики: Вып. 5 /Под ред. С.В.Яблонского, 1994, Пер.304, Б/о Математические вопросы кибернетики: Вып. 6 /Под ред. С.В.Яблонского, 1996, Пер.480, 80-97.11 МИНДЛИН И.М. Интегродифференциальные уравнения в динамике тяже­ лой слоистой жидкости, 1996, Пер.304, 89-97.11 НИКИТИН Я.Ю. Аснмтотическая эффективность непараметрических кри­ териев, 1995, Обп.240, 130-95.11 ОЛЕЙНИК О.А., САМОХИН В.Н. Математические методы в теории пограничного слоя, 1997, Пер.512, 71-97.11 ОНИШИК А.Л. Топология транзитивных групп преобразований, 1995, Пер.384, Б/О
РОЗАНОВ Н.Н. Оптическая бистабильность и гистерезис в распределенных нелинейных системах, 1997, Пер.ЗЗб, 75-97.1 Российская наука: Выслмпъ и возродиться /Международный научный фонд. Российский фонд фундаментальных исследований, 1997, Пер.3б8, Б/о СТЕПАНЯНЦ Ю.А., ФАБРИКАНТ А.Л. Распространение волн в сдвиговых потоках (Пробл. соврем, физики), 1996, Обл.240, 90-96.11 СИНАЙ Я.Г, Современные проблемы эргодической теории, 1995, Обл.208, В/о СТУЛОВ В.П.. МИРСКИЙ В.Н., в и с л ы й А.И. Аэродинамика болидов, 1995, Обл.240, 100-96.1 Технология и проектирование углерод-углеродных композитов и конструкций /Ю.В.Соколкин, A.M. Вогинов, А.А. Ташкинов и др., 1996, Пер.240, Б/о ТОВСТИК П.Е. Устойчивость тонких оболочек: Асимптотические методы, 1995, Пер.320, Б/о УЗДЕМИР А.П. Динамические целочисленные задачи оптимизации в экономике, 1995, Пер.288, 102-95.11 ЦАГИ; Основные этапы научной деятельности (1968-1993), 1996, Пер.576, Б/о ЦЫПКИН Я.З. Информационная теория идентификации, 1995, Пер.ЗЗб, 62-96.1 ЧЕРНЫШЕВ Г.Н., ПОПОВ А.Л., КОЗИНЦЕВ В.М., ПОНОМАРЕВ И.И. Остаточные напряжения в деформируемых твердых телах, 1996, Пер.240, 71-97.1 ШЕВЧЕНКО В.Н. Качественные вопросы целочисленного программиро­ вания, 1995, Обл. 192, 86-96.1 ВЫХОДЯТ ИЗ ПЕЧАТИ БУЛЯРСКИЙ СВ., ФИСТУЛЬ В.И. Термодинамика и кинетика взаимодей­ ствующих дефектов в полупроводниках, 1997, Пер.320, 62-97.11 ГИНЗБУРГ В.Л. О науке, о себе и о других, 1997, Пер.272, 54-97.11 КЛАВДИЙ ПТОЛЕМЕЙ. Математическое сочинение в 13 книгах: Альмагест, 1997, Пер.800, 83-97.1 САМАРСКИЙ А.А., МИХАЙЛОВ А.П. Математическое моделирование: Идеи. Методы. Примеры, 1997, Пер.320, 62-97.11 Физика ядерного взрыва: В 2 т. Т. 1. Развитие взрыва /ЦФТИ МО РФ, 1997, Пер.528, 78-97.1 Планируемые к выпуску издания объявляются в полугодовых аннотированных тематических планах Ахадемиздатцентра «Наука» РАН (Наука. Физматлит). Заказывайте и приобретайте физико-математическую литературу в ма­ газинах Торговой фирмы *Академкнига» и в магазинах книготоргов, распрост­ раняющих литературу данной тематики. Заказы принимаются также по адресу Физматлита Телефон: (095) 955-03-30. Поставки книжной продукции в регионы осуществляются по предварительному заказу при 100%-ной предоплате на расчетный счет Фиэматлита и самовывозе Покупателем. Наложенным платежом книги не высылаются. БАНКОВСКИЕ РЕКВИЗИТЫ: Издательская фирма «НАУКА. ФИЗМАТЛИТ» РАН 117071 Москва В-71, Ленинский проспект, 15 Расч. счет 362505 в Октябрьском филиале АКБ МИБ г.Москвы. ИНН 7725031560. БИК 044583416. Кор. счет 416161400
Издательская фирма ФИЗИКО-МАТЕМАТИЧЕСКАЯ ЛИТЕРАТУРА Академиэдатцентра «Наука» РАН Готовятся к изданию при поддержке Российского фонда фундаментальных исследований БАКУЛИН В.Н., ПОТОПАХИН В.А. Динамические задачи оболочек: Упругопластическое деформирование при ударных воздействиях, 82-97.11 БАКУЛИН В.Н., ПОТОПАХИН В.А. Многослойные оболочки: Действие концентрированных потоков энергии, 83-97.11 БОГОМОЛОВ А.М., САЛИЙ В.Н. Алгебраические основы теории дискрет­ ных систем. В/о БОЛДИН М.В., СИМОНОВА Г.И., ТЮРИН Ю.Н. Непараметрический знаковый анализ, 73-97.11 БРЮНО А.Д. Многогранники Ньютона в алгебраических и дифференциаль­ ных уравнениях, 70-97.11 ВИЛЬДЕМАН В.Э., СОКОЛКИН Ю.В., ТАШКИНОВ А.А. Механика яеулругого деформирования и разрушения композиционных материалов. Б/о ГРИГОЛЮК Э.И., МАМАЙ В.Н. Нелинейное деформирование тонкостенных конструкций, 72-97.11 ГУРМАН В.И. Принцип расширения в задачах управления, 2-е изд.. Б/о ЖУРАВЛЕВ В.Ф. Основы теоретической механики. Б/о КАМЕНЯРЖ Я.А. Предельный анализ пластических тел и конструкций, 84-97.11 ЛАНДА П.С. Нелинейные колебания и волны. Б/о МАЛЮГИН В,Д. Параллельные логические вычисления посредством арифмети<^ских полиномов, Б/о ПОНТЕКОРВО Б. Избранные научные труды (Классики науки), 59-97.11 САДОВСКИЙ В.М. Разрывные решения в задачах динамики упругопластических тел. Б/о Физика ядерного взрыва: В 2 т. Т. 2. Действие взрыва /ЦФТИ МО РФ, 79-97.1 ЦИРЛИН A.M. Методы усредненной оптимизации и их приложения, 1997, 75-97.11 Планируемые к выпуску издания объявляются в полугодовых аннотированных тематических планах Академиэдатцентра «Наука» РАН (Наука. Физматлит). Заказывайте и приобретайте физико-математическую литературу в ма­ газинах Торговой фирмы *Академкнига» и в магазинах книготоргов, распро­ страняющих литературу данной тематики. Заказы принимаются также по адресу Физматлита. Телефон: (095) 955-03-30. Поставки книжной продукции в регионы осуществляются по предварительному заказу при 1(Х)%-ной предоплате на расчетный счет Физматлита и самовывозе Покупателем. Наложенным платежом книги не высылаются. БАНКОВСКИЕ РЕКВИЗИТЫ: Издательская фирма «НАУКА. ФИЗМАТЛИТ» РАН 117071 Москва В-71, Ленинский проспект, 15 Расч. счет 362505 в Октябрьском филиале АКБ МИБ г.Москвы. ИНН 7725031560. БИК 044583416. Кор. счет 416161400