/
Текст
Содержание
Предисловие редактора перевода .................................5
Предисловие . . 7
Глава 1. ЦИФРОВОЕ УПРАВЛЕНИЕ....................................11
Введение..............................................11
1.1. Вычислительная техника..................... ... 12
1.2. Теория цифрового управления........... . . 18
1.3. Системы с квантованием . 22
1.4. Этапы развития теории...........................25
Лите ратура...................................... 28
Глава 2. КВАНТОВАНИЕ НЕПРЕРЫВНЫХ СИГНАЛОВ .... 31
Введ ение.................................... . . 31
2.1. Механизм квантования............................31
2.2. Теорема о квантовании...........................32
2.3. Восстановление................................ 34
2.4. Поглощение частоты . . ... ............37
2.5. Практические аспекты выбора периода квантования . . 41
Выводы . ... .... 43
Задали............................................. 43
Литература.................. . . . . . 44
Глава 3. МАТЕМАТИЧЕСКИЕ МОДЕЛИ, ОРИЕНТИРОВАННЫЕ НА
ЭВМ: ДИСКРЕТНЫЕ СИСТЕМЫ..............................46
Введение.............................................46
3.1. Квантование непрерывных систем, заданных уравнениями состояния .... 46
3.2. Преобразование моделей в пространстве состояний . . 56
3.3. Модели типа «вход-выход» . ........ 58
3.4. /-преобразование . 66
3.5. Полюса и нули...................................69
3.6. Выбор частоты квантования ......................74
Зада чи............................................ 76
Литература . ... . .. 79
Глава 4. МОДЕЛИ, ОРИЕНТИРОВАННЫЕ НА ОБЪЕКТ УПРАВ-
ЛЕНИЯ ............................................. 81
Введение.............................................81
4.1. Цифровая система управления.....................81
4.2. Модуляционная модель.......................... 82
4.3. Частотная характеристика....................... 89
4.4. Формализм импульсной передаточной функции .... 96
4.5. Многочастотное квантование 104
Задачи..............................................107
Литература.........................-. ............108
Глава 5. АНАЛИЗ ДИСКРЕТНЫХ СИСТЕМ .....................ПО
Введение.............................................ПО
5.1. Устойчивость . . .........................ПО
5.2. Управляемость, достижимость и наблюдаемость .... 122
5.3. Анализ систем с одним контуром обратной связи . . . 129
Задачи...................... ........................137
Литература..........................................139
Глава 6. МОДЕЛИ ВОЗМУЩЕНИЙ....................................141
Введение . . . ...................... . . 141
6.1, Уменьшение влияния возмущений..................142
6.2. Классические модели возмущений...................145
6Г3. Кусочно-детерминированные возмущения ........... 147
6.4. Стохастические модели возмущений................ 150
6.5. Непрерывные стохастические процессы............ 169
6.6. Квантование стохастического дифференциального уравнения ................................................174
Выводы............................................... 175
Задачи ..................... -5.................., . 176
Литература ... ...................... . 178
Глава 7. АНАЛИТИЧЕСКОЕ КОНСТРУИРОВАНИЕ РЕГУЛЯТОРОВ.
ОБЗОР . ..................................... . 180
Введение ............................................ 180
7.1. Функциональные аспекты...........................182
7.2. Принципы структуризации..........................185
7.3. Подход «сверху-вниз».............................186
7.4. Подход «сиизу-вверх».............................190
7.5. Проектировние простейших контуров управления . . 193
Выводы.......................................... .... 196
Задачи . ......................................... 197
Литература .................... ... . . 197
Глава 8. ПРЕОБРАЗОВАНИЕ АНАЛОГОВЫХ РЕГУЛЯТОРОВ . . 199
Введение .'......................................... 199
8.1. Возможные способы аппроксимации..................199
8.2. Цифровые ПИД-регуляторы........................ 205
8.3. Модификация синтеза обратной связи по состоянию . .216
8.4. Методы проектирования по частотной характеристике 219
Выводы............................................... 220
Задачи.............................................. 221
Литература ..................................... .... 222
Глава 9. ПРОЕКТИРОВАНИЕ. МЕТОДЫ ПРОСТРАНСТВА СО-
СТОЯНИЙ ............................................. 224
Введение.......................................... . . 224
9.1. Управление, основанное на фиксации полюсов путем вве-
дения обратной связи по состоянию ..... . 224
9.2. Наблюдатели..................................... 234
9.3. Обратная связь по выходу.........................240
9.4. Серворегулирование...............................243
Выводы . 247
Задачи................................................248
Литература.................................... ..... 250
Глава 10. РАЗМЕЩЕНИЕ ПОЛЮСОВ, ОСНОВАННОЕ НА МОДЕ-
ЛЯХ ТИПА «ВХОД-ВЫХОД»................................ 251
Введение ..................................... 251
10.1. Постановка задачи.............................. 251
10.2. Решение задачи . ........ . 254
10.3. Алгебраический подход...........................258
10.4. Процедура аналитического конструирования........260
10.5. Чувствительность к ошибкам моделирования .... 265
10.6. Связь с другими методами конструирования . . . 268
10.7. Практические аспекты....................... ... 272
10.8. Пример аналитического конструирования регулятора . . 277
Выводы . ........................................284
Задачи............................................ - 284
Литература........................................... 286
Глава 11. МЕТОДЫ ПОСТРОЕНИЯ ОПТИМАЛЬНЫХ РЕГУЛЯТО-
РОВ . . .288
Введение............................................. 288
11.1. Линейно-квадратичное управление .................293
11.2. Теория прогнозирования и фильтрации..............304
11.3. Линейно-квадратичное гауссовское управление .... 310
11.4. Практические аспекты..................... . . .312
Выводы.................................................314
Задачи . 314
Литература............... .318
Глава 12 МЕТОДЫ ОПТИМАЛЬНОГО КОНСТРУИРОВАНИЯ . 320
Введение .......... ............. . 320
12.1. Постановка задачи . . . . . 320
" 12.2. Оптимальное прогнозирование . . 325
12.3. Управление с минимальной дисперсией..............330
12.4. ЛКГ-управление .... ....................339
12.5. Практические аспекты.............................350
Выводы . . . . 359
Задачи . . ........ ................. 360
Литература . ... .... 365
Глава 13. ' ИДЕНТИФИКАЦИЯ........................................ 367
Введение . ... 367
13.1. Построение математических моделей................368
13.2. Идентификация систем . . ..............369
13.3. Метод наименьших квадратов ..... . . 372
13.4. Рекурсивные вычисления...........................376
Выводы . . . . . . ... 385
Задачи.................................................385
Литература ... 387
Глава 14 АДАПТИВНОЕ УПРАВЛЕНИЕ............................ . . 388
Введение . . ..........................388
14.1. Самонастраивающиеся регуляторы ... 388
14.2. Анализ...........................................391
14.3. Другие подходы к адаптивному управлению . . 396
14.4. Реализация адаптивных алгоритмов ................401
14.5. Выводы . . ... 405
Задачи ... . . . . ............405
Литература . .... 406
Глава 15 РЕАЛИЗАЦИЯ ЦИФРОВЫХ РЕГУЛЯТОРОВ..........................408
Введение . ..................408
15.1. Общее описание...................................409
15.2. Предварительная фильтрация и вычислительные за-задержки ... ... . .411
15.3. Нелинейные исполнительные механизмы .... . 417
15.4. Интерфейс с оператором . . . . 422
15.5. Численные аспекты................................427
15.6. Программирование............................... 439
Задачи . ... . . 446
Литература . . . . 450
Приложение А . . ................... 452
Приложение В . . . ........ .............456
Приложение С . . ...... . . . 459
Приложение D ............................................. . 473
Предметный указатель............................................ 475
ББК 32 973 0 76
УДК 681.3
Переводчики: Николаев А. Н„ Чеботарева Т. С.
Острей К., Виттенмарк Б.
0 76 Системы управления с ЭВМ: Пер. с англ. — М.: Мир, 1987, —480 с., ил.
Книга известных шведских специалистов посвящена проектированию систем управления 'с цифровыми вычислительными машинами. Приводятся фундаментальные результаты теории регулирования детерминированных и стохастических дискретных систем. Изложение ориентировано на прикладные вопросы проектирования и реализации управления с применением управляющих мини- и микро-ЭВМ и интерактивных языков программирования и моделирования. В книгу включены многочисленные примеры и задачи.
Для специалистов в области автоматизированного управления и студентов соответствующих специальностей вузов.
Л 1502000000-460 г ~
° 041(01)-87— 6'87’ Ч-’
ББК 32.973
Редакция литературы по информатике и робототехнике
Монография
Карл Острём. Бьёри Виттенмарк
СИСТЕМЫ УПРАВЛЕНИЯ С ЭВМ
Зав. редакцией, проф., д-р. техн, наук Ю. И. Топчеев Зам. зав. редакцией Э. Н. Вадиков Ст. научный редактор Т. П. Сапожкова Мл. научный редактор В. Н. Соколова Художник А. И. Чаузов Художественный редактор'Н. М. Иванов Технический редактор А. Г. Резоухова Корректор Л. Д. Панова
ИБ № 6183
Сдано в набор 12.02.87. Подписано к печати 03.09.87. Формат 60Х90*/п«. Бумага книжно-журнальная. Печать высокая. Гарнитура литературная. Объем 15,00 бум. л. Уел. печ- л. 30,00.-Усл. кр.-отт. 30,00- Уч.-изд. л. 27,00. Изд. № 6/4872. Тираж 16000 экз. Зак.3322 Цена 2 р. 20 к.
ИЗДАТЕЛЬСТВО «МИР» 129820, ГСП, . Москва, И-110, 1-й Рижский пер., 2
Отпечатано с матриц Ленинградской типографии № 2 головного предприятия ордена Трудового Красного Знамени Ленинградского объединения «Техническая книга» им. Евгении Соколовой Союзполнграфпрома при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли. 198052, г. Ленинград, Л-52, Измайловский проспект, 29 в Ленинградской типографии № 4 ордена Трудового Красного Знамени Ленинградского объединения «Техническая книга» им. Евгении Соколовой Союзполиграф-прома при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли. 191126, Ленинград, Социалистическая ул., 14.
© 1984 by Prentice-Hall, Inc.
© перевод на русский язык, «Мир», 1987
Предисловие редактора перевода
Книга известных шведских специалистов в области теории автоматического регулирования посвящена проектированию систем управления дискретными процессами, основанных на применении цифровых управляющих ЭВМ. Задачи дискретного управления возникают в двух случаях: когда процесс управления по своей сути является дискретным и когда для управления непрерывным процессом используется дискретное управляющее устройство, например ЭЦВМ. В данной книге в основном исследуется именно второй случай.
Известно, что механический перенос «непрерывных» результатов на дискретный случай возможен далеко не всегда. Аппроксимация непрерывной системы дискретной (квантование), неизбежная при применении ЭЦВМ, может привести к таким нежелательным последствиям, как потеря устойчивости, возникновение предельных циклов и т. д. Вообще говоря, дискретное управление непрерывными процессами требует проведения тщательных исследований адекватности этого приема и оценки возможных ошибок. Такой анализ сопряжен с целым рядом проблем, в частности таких, как выбор частоты квантования, анализ устойчивости и управляемости системы, учет возмущений и погрешностей измерений, идентификация параметров регулятора. Весь этот спектр проблем рассматривается в настоящей книге.
Авторы излагают основные результаты теории автоматического регулирования и строят на их основе методы проектирования (аналитического конструирования) систем управления. Задача проектирования определяется путем введения модели управляемого процесса, критерия качества и области изменения управлений.
В книге представлены два подхода: один основан на понятии фазовых координат, или переменных состояния, а другой — на полиномиальном представлении передаточных функций «вход-выход». В обоих случаях преследуется одна цель — добиться нужного размещения полюсов замкнутой системы.
При проектировании систем управления очень полезным средством оказывается имитационное моделирование, позволяющее «проиграть» различные варианты поведения проектируемой системы. Это обстоятельство приобретает особую
важность, так как становится все более очевидно, что проектирование новых технологических процессов неотделимо от проектирования систем управления этими процессами. Таким образом, возникает необходимость разработки и включения подсистем проектирования систем управления в состав интеллектуальных систем автоматизированного проектирования (САПР). В книге описана одна из таких систем, основа-нная на интерактивном языке моделирования Simnon.
По существу книга содержит теоретические и методологические сведения, необходимые для проектирования систем управления. Она несомненно полезна и актуальна, если учесть, что новые поколения профессиональных персональных ЭВМ с их богатейшим интерактивным программным обеспечением и мощными вычислительными и графическими возможностями становятся доступными все более широкому кругу инженеров и проектировщиков.
С. Чеботарев
Посвящается Биа и Карин
Предисловие
Основным инструментом прикладной математики 60-х годов были непрерывные вычислительные методы. Они широко использовались в аналоговых вычислительных машинах, механических, пневматических и электрических системах, применявшихся для моделирования и реализации систем управления.
В связи с бурным прогрессом в микроэлектронике и цифровой вычислительной технике ситуация резко изменилась. Если на начальном этапе цифровые компьютеры использовались исключительно как элементы сложных систем управления производственными процессами, то в настоящее время компактные и дешевые компьютеры применяются даже в отдельных контурах регуляторов. Во многих случаях цифровые регуляторы при меньшей стоимости существенно превосходят по техническим показателям своих аналоговых конкурентов.
Цифровые компьютеры находят все большее применение как средство анализа и проектирования систем управления. Возможности цифровых вычислительных машин быстро возрастают вследствие интенсивного развития технологии сверхбольших интегральных схем. Технические достижения последних лет качественно изменили подход к анализу, проектированию и реализации систем управления. Вначале эти изменения сводились к «адаптации» известных аналоговых решений к новым техническим возможностям. Сейчас, однако, ясно, что потенциальные возможности новой техники пока используются далеко не в полной мере. Что же касается теории управления, то за последние 30 лет она также обогатилась серьезными результатами. Правда, реализация этих результатов в системах управления первое время сдерживалась несовершенством технических средств. Исключение составляли лишь довольно экзотические приложения, в основном связанные с аэрокосмической техникой и управлением новейшими технологическими процессами. Однако благодаря поразительным достижениям в микроэлектронике современные цифровые регуляторы применяются в самых различных областях науки и техники. Кроме того, появились сравнительно недорогие системы диалогового автоматизированного проектирования систем управления, и- их ассортимент постоянно расширяется.
Цель настоящей книги — изложение элементов теории управления, ориентированных на анализ и проектирование автоматизированных систем управления, с упором на фундаментальные понятия и представления. При этом предполагается, что у разработчика системы управления есть ЭЦВМ с достаточно богатым программным обеспечением, которая может «взять на себя» рутинные вычислительные задачи. Проектирование системы управления завершается написанием соответствующих программ на языке высокого уровня.
Глава 1 содержит обзор развития автоматизированных систем управления, где для полноты картины представлена и теория автоматизированного управления. (Тот, кто не знает истории, рискует повторить чужие ошибки.)
В гл. 2 обсуждается одно из основных понятий цифрового автоматизированного управления — квантование непрерывных систем. В гл. 3 рассматриваются модели, описывающие поведение управляемой системы в моменты квантования, а в гл, 4-модели, учитывающие динамику процесса на интервалах между этими моментами. Если на систему не действуют возмущения, то задача регулирования, вообще говоря, не вызывает принципиальных осложнений. В случае же возмущений необходимо уметь учитывать их влияние. Этим вопросам посвящена гл. 6.
В гл. 5 излагаются основные методы анализа и моделирования систем управления. Моделирование играет важную роль, так как при проектировании систем управления возникает необходимость учесть множество различных факторов, что очень сложно сделать лишь с помощью аналитических методов. Дчя моделирования в книге используется Simnon — диалоговый язык моделирования; его описание дается в приложении. Программы, написанные на этом языке, нетрудно «перевести» на другие языки моделирования. Наличие мощного средства машинного моделирования радикально изменяет идеи и методы анализа и расчета систем управления. При этом, однако, не следует забывать об аналитических методах, позволяющих получить определенные численные оценки, которые устанавливают границы применимости методов имитационного моделирования. В то же время необходимость в точных аналитических расчетных методах отпадает, поскольку с этой задачей легко может справиться ЭВМ-
Главы 7—12 посвящены проблемам проектирования систем управления, причем гл. 7 является вводной. В гл. 8 обсуждается перенос методов проектирования непрерывных систем на дискретные системы. Методы расчета детерминированных систем, основанные на представлении о пространстве состояний, описываются в гл. 9, а в гл. 10 те же задачи решаются с использованием моделей типа «вход-выход». В гл. 11 с позиций пространства состояний рассматриваются фильтр Калмана и детермини-
рованные и стохастические задачи оптимального управления с линейными уравнениями движения и квадратичным критерием качества. Гл. 12 посвящена решению тех же проблем с помощью моделей типа «вход-выход».
Многие новые методы проектирования систем управления основаны на моделировании регулируемого процесса и действующих на него возмущений. Построение таких моделей обсуждается в гл. 13. В гл. 14 дается краткое описание методов построения систем управления с адаптивной настройкой параметров. Такие методы можно рассматривать как комбинацию методов, описанных в гл. 9—12, с рекуррентными методами идентификации, описанными в гл. 14. Различные вопросы реализации систем управления на ЭЦВМ обсуждаются в гл. 15.
Все теоретические модели в книге строятся изначально в непрерывном режиме, что дает более естественное описание рассматриваемых физических процессов. Методы, основанные на представлении о пространстве состояний, покрывают многомерные системы, в то время как область применимости моделей типа «вход-выход», основанных на операциях с характеристическими многочленами, ограничивается классом систем с одним входом и одним выходом. При этом рассматриваются как детерминированные, так и стохастические задачи.
При проектировании систем управления задачу часто полезно анализировать с разных точек зрения. Поскольку цель книги — дать достаточно полнее описание систем управления, основанных на применении ЭЦВМ, по необходимости приходится рассматривать широкий круг вопросов. Хотя авторы и пытались добиться разумного компромисса между полнотой и глубиной изложения, тем не менее они не претендуют на исчерпывающее изложение вопросов, обсуждаемых в каждой из гл. 6, 11, 12, 13 и 14.
В теории дискретных систем комплексная переменная и оператор сдвига обозначаются одной буквой г. По мнению авторов, это не очень удобно для чтения и усвоения излагаемого материала, поэтому для обозначения оператора сдвига был введен символ q. Оператор обратного сдвига обозначается символом q~x. Аналогично символ s используется для обозначения комплексной переменной и р = d/dt для обозначения оператора дифференцирования в непрерывных системах.
Материал, представленный в книге, может быть использован для различных целей. Так, гл. 2, 3, 5, 7—10, 15 (разделы 6.1— 6.3) можно взять за основу курса по дискретным системам. Более подробное изучение материала, представленного в гл. 4, 6, 7, 9 15, может быть предметом спецкурса по системам дискретного управления с ЭВМ, а в гл. 3—5, 8—10 и 13—15 — как
лекционный материал для инженеров. В любом случае опыт показал, что лекции и упражнения желательно дополнять лабораторными работами, т. е. необходимо иметь доступ к ЭВМ.
ACKNOWLEDGMENTS
During the writing of this book we have had the pleasure and privilege of interacting with many persons. It is a particular pleasure to thank the nestor of sampled-data theory, Professor E. I. Jury, who has patiently read several versions of the manuscript and given many hints and much advice. Many thanks are also due to Per Hagander at Lund Institute of Technology; George Axelby, editor of Automatical and Brian Anderson of the Australian National University, Canberra — each of whom have given much useful criticism. We have also had very good feedback from professor Paul Houpt at MIT, Rick Johnson at Cornell, and Howard Elliot at University of Massachusetts, who have been teaching from the manuscript. We are indebted to many students who have given useful comments on different versions of the manuscript. We also extend thanks to Eva Dagnegard and Agneta Tuszynski for typing different versions of the manuscript and to Doris Nilsson for making the illustrations.
Карл Острём Бьёрн Виттенмарк
Цифровое управление
Краткий исторический обзор развития техники и теории цифрового управления
ВВЕДЕНИЕ
При реализации систем управления все шире используются цифровые вычислительные машины (ЦВМ), и поэтому необходимо иметь представление о возможностях и особенностях цифровых систем управления. Последние можно рассматривать как аппроксимацию непрерывных систем, хотя при этом заведомо сужаются потенциальные возможности автоматизированного управления. В лучшем случае такой подход дает результаты не хуже достигнутых при непрерывном управлении. Только глубокое изучение цифровых систем управления позволяет полностью использовать их возможности.
Цифровая система управления схематично изображена на рис. 1.1. Объект управления имеет на выходе непрерывный сигнал y(t), который преобразуется в цифровую форму аналого-цифровым преобразователем (АЦП). В зависимости от желания исследователя АЦП может рассматриваться либо как отдельное устройство, либо как составная часть ЦВМ. Преобразование осуществляется в моменты квантования tk. Преобразованный сигнал {y(tk)} интерпретируется вычислительной машиной как последовательность чисел; она производит изменения по некоторому алгоритму и вырабатывает новую последовательность чисел {и(tk)}- Полученная последовательность преобразуется в непрерывный сигнал цифро-аналоговым преобразователем (ЦАП).
♦♦♦ Заметим, что система между ЦА- и АЦ-преобразо-вателями разомкнута. *
Работа синхронизируется в компьютере таймером реального времени. ЦВМ функционирует последовательно; каждая операция занимает определенное время, но на выходе ЦАП должен иметь непрерывный по времени сигнал. Обычно это достигается
путем сохранения постоянного уровня управляющего сигнала между преобразованиями. Цифровые системы управления содержат как непрерывные, так и квантованные, или дискретные по времени сигналы. Такие системы традиционно называют дискретными системами *>.
При наличии сигналов различного типа описание поведения системы может вызывать затруднения. Однако часто можно
Рис 1.1. Принципиальная схема цифровой системы управления. (Control Engineering, 1980.)
ограничиться описанием поведения системы в моменты квантования. В этом случае сигналы выделяются только в дискретные моменты времени. Такие системы, называемые системами дискретного времени, оперируют с последовательностями чисел, и, следовательно, для их описания естественно использовать разностные уравнения.
1.1. ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА
Первые попытки использования вычислительных машин в качестве компонентов систем управления были предприняты в начале 50-х годов с целью удовлетворения нужд ракетной и авиационной техники. Однако ЭВМ общего назначения того времени оказались для этих целей непригодными: они были слишком громоздкими, слишком энергоемкими и недостаточно надежными. В связи с этим были созданы специализированные вычислительные машины — цифровые дифференциальные анализаторы.
В настоящее время автоматизированное управление широко используется в промышленности, в частности для управления производственными процессами (рис. 1.2). Идея применения ЭВМ для управления технологическими процессами возникла
о Этот термин в дальнейшем будет использоваться как синоним цифровых систем управления.
в середине 50-х годов. Первая серьезная работа в этой области относится К марту 1956 г., когда аэрокосмическая компания Thomson Ramo Woolridge (TRW) и фирма Texaco договорились о совместном исследовании возможности использования ЭВМ для управления производственными процессами. После предварительных обсуждений было принято решение об исследовании полимеризационного агрегата нефтеперегонного завода в г. Порт-Артур (шт. Техас). Группа инженеров из TRW и Texaco
Рис. 1.2. Рост числа ЭВМ, используемых для управления процессами производства.
Для сравнения дано общее число компьютеров (1).
провела тщательное обследование объекта, потребовавшее около 30 человеко-лет. В результате была разработана и введена в эксплуатацию система автоматизированного управления полимеризационным агрегатом на базе ЭВМ RW-300. Система контролировала 26 материальных потоков, температуру в 72 точках, давление в трех точках и химический состав трех смесей. Ее основными функциями были: минимизация давления в реакторе, установление оптимального режима на выходе пяти реакторов, управление подачей горячей воды в зависимости от каталитической активности и поддержание оптимальной рециркуляции.
Новаторская работа фирмы TRW открывала широкие возможности для производителей ЭВМ — потенциальный рынок для сбыта продукции. Это в свою очередь стимулировало многочисленные исследования возможности использования ЭВМ в процессах управления, результаты которых представлены на рис. 1.2.
Процесс внедрения ЦВМ в системы управления условно можно разбить на четыре этапа ’>:
• начальный этап (около 1955);
© этап прямого цифрового управления (около 1962);
© этап мини-компьютерной техники (около 1967);
© этап микропроцессорной техники (около 1972).
*’ В скобках указано время появления новых идей.
Начальный этап
Работа, выполненная фирмами TRW и Texaco, вызвала существенный интерес среди производителей вычислительной техники и исследовательских организаций: использование ЭВМ в системах управления означало для электронной промышленности появление нового рынка сбыта для своей продукции, для университетов — новую область исследований. Производители вычислительных машин, стремясь понять, что должен представлять собой компьютер, предназначенный для управления технологическими процессами, стали инициаторами специальных исследований. Процесс исследования возможностей ЭВМ продолжался все 60-е годы.
Вычислительные системы того времени имели низкое быстродействие, были дорогими и ненадежными. Они строились на вакуумных лампах. Вычислительная машина 1958 г. имела следующие параметры: время сложения 1 мс, умножения 20 мс, среднее время наработки на отказ (MTBF)0 50—100 ч. Для более полного использования дорогих машин последние должны были выполнять множество заданий. Из-за ненадежности вычислительных машин они осуществляли управление объектом, лишь печатая инструкции оператору или изменяя контрольные точки аналогового регулятора. Такие режимы управления получили название управление через оператора и управление по контрольным точкам.
К основным задачам, решаемым на ЭВМ этого периода, относились: определение оптимального режима функционирования; диспетчеризация и планирование производства; выдача справок о произведенной продукции и расходе сырья. При этом определение наилучших условий функционирования рассматривалось как статическая оптимизационная задача, для постановки и решения которой были необходимы математические модели рассматриваемых процессов. Достаточно полные модели строились на основе физических моделей и статистической обработки измеряемых данных. Делались также попытки оптимизации в реальном масштабе времени.
Прогресс внедрения ЦВМ в системы управления часто тормозился из-за неполного знания процесса управления. Кроме того, стало ясно, что статическая постановка оптимизационных задач неадекватна реальности — требовались динамические модели. В связи с этим значительная часть усилий исследователей была направлена на построение моделей процессов, что отнимало массу времени из-за отсутствия хорошей методологии. Это в свою очередь стимулировало разработку методов идентификации систем.
n Mean Time Between Failures. — Прим, перев.
В ходе исследований был накоплен огромный опыт. Стало очевидным, <что управление процессами предъявляет специфические требования к вычислительным машинам. Так, необходимость быстро реагировать на запросы объекта управления привела к развитию системы прерываний — специального оборудования, позволяющего внешнему событию прерывать текущую работу ЭВМ для обслуживания болеё' неотложного задания. Вместе с тем ощущалась нехватка многих необходимых датчиков, и существовали определенные трудности с внедрением новой технологии в ряде отраслей промышленности.
Достижения в области автоматизации управления подробно обсуждались на конференциях, симпозиумах и на страницах журналов. В журнале Control Engineering была опубликована серия статей, посвященная применению вычислительных машин для управления технологическими процессами. К марту 1967 г. было внедрено 37 систем автоматизированного управления производственными процессами (прокатными станами, химическими процессами, энергетикой), а через год их число возросло до 159.
Прямое цифровое управление
Первые управляющие ЭЦВМ работали в режиме косвенного управления либо через оператора, либо по контрольным точкам. В обоих случаях для реализации управления требовалось традиционное аналоговое оборудование. В 1962 г. было положено начало новой эры в управлении технологическими процессами: английская фирма Imperial Chemical Industries (ICI) заменила все аналоговое оборудование для управления процессом одним компьютером Ferranti Argus. Вычислительная машина измеряла 224 параметра и непосредственно контролировала 129 вентилей, при этом функции системы остались прежними. Чтобы подчеркнуть, что компьютер сам управляет объектом, был введен термин прямое цифровое управление (ПЦУ). В 1962 г. типичной управляющей вычислительной машине требовалось 100 мкс на сложение двух чисел и 1 мс на их умножение. Время наработки на отказ составляло около 1000 ч.
Основным критерием оценки системы управления стала стоимость, которая росла пропорционально числу контуров управления. Хотя начальная цена ЭВМ была велика, стоимость новых и дополнительных контуров была незначительна, и, таким образом, «удельная» цена цифровых систем управления падала при увеличении их размеров. Одним из преимуществ таких систем являлось радикальное изменение связи с оператором — вместо нагромождения аналоговых приборов появилась операторская панель управления вычислительной машины; панель системы, созданной фирмой ICI, представляла собой цифровой дисплей и несколько кнопок.
Другим преимуществом цифровых систем была гибкость: если изменение аналоговых систем управления осуществлялось перекомпоновкой звеньев, то цифровых систем — перепрограммированием. Цифровая техника имела и другие преимущества. Стало возможным простое взаимодействие между несколькими контурами управления, параметры которых изменялись в зависимости от условий работы. Программирование упрощалось за счет использования специальных языков управления. Пользователю такой системы не нужно было разбираться в программировании — ему следовало только занести входы, выходы, типы регулирования, масштабные коэффициенты и параметры регуляторов в таблицы. Поэтому для него система выглядела как объединение обычных регуляторов. Однако при эксплуатации таких систем возникала проблема осуществления непредусмотренных стратегий управления, что, естественно, тормозило создание систем управления.
Развитие цифровых систем управления шло главным образом в направлении прямого цифрового управления, при этом основное внимание уделялось реализации активного управления в отличие от пассивного слежения за состоянием процесса в системах первых поколений. Значительный шаг вперед был сделан в период 1963—1965 гг. Пользователи и проектировщики совместно выработали технические требования к системам ПЦУ. Наряду с ключевой проблемой надежности обсуждались вопросы, связанные с выбором периода квантования и управляющих алгоритмов. Концепция ПЦУ быстро завоевала признание, несмотря на то что эти системы часто оказывались значительно дороже соответствующих аналоговых систем управления.
Период мини-компьютерной техники
В 60-е годы отмечалось интенсивное развитие цифровой вычислительной техники. Требования к управляющей вычислительной машине росли параллельно с прогрессом в технологии производства интегральных схем. Компьютеры стали меньше, производительней, надежнее, дешевле. ЭВМ этого поколения получили название мини-компьютер. На их основе стало возможным создавать эффективные цифровые системы управления.
Достижения в области мини-компьютерной техники в сочетании со знаниями об управлении технологическими процессами с помощью ЭВМ, накопленными в начальный период и период прямого цифрового управления, позволили расширить сферу применения цифровых систем. Ряд фирм стали выпускать специализированные управляющие компьютеры. Типичная управляющая ЭВМ этого периода имела длину слова 16 бит (первичная память составляла 8—124 К слов, а в качестве вторичной памяти обычно использовался накопитель на магнитном диске); типичный компьютер (CDC 1700) имел время сложения
2 мкс и время умножения 7 мкс. Время безотказной работы процессора, составляло около 20 тыс. ч.
Важным фактором, благодаря которому стало возможным быстрое распространение цифрового управления, явилась миниатюризация ЭВМ. Появилась возможность использовать компьютерное управление для управления небольшими объектами и решения локальных проблем.'В результате появления мини-компьютеров количество ЭВМ, используемых для управления процессами производства, выросло с 5000 в 1970 г. до 50 000 в 1975 г.
Микрокомпьютеры
Мини-компьютер представлял собой довольно-таки большую систему, поэтому, несмотря на расширение возможностей и снижение цен, стоимость его в базовой конфигурации оставалась около 10000 долл., т. е. даже небольшая система управления редко стоила меньше 100 тыс. долл. Реализация цифрового управления все еще вызывала существенные затруднения. С развитием микрокомпьютеров цена одноплатной ЭВМ (с возможностями мини-компьютера 1975 г.) в 1980 г. упала до 500 долл, и вычислительные мощности стало возможно наращивать модулями, стоимостью, не превышающей 50 долл, за изделие. Это означало, что цифровое управление в принципе могло быть реализовано в любом объекте независимо от его масштабов.
Микро-ЭВМ дали толчок совершенствованию управляющего оборудования: они заменяют аналоговые регуляторы даже в одноконтурных системах управления. Появились небольшие микропроцессорные системы цифрового управления; связь с оператором в этих системах значительно улучшилась после появления цветных графических видеодисплеев. Сконструированы иерархические системы управления с большим количеством микропроцессоров и спроектированы регуляторы специального назначения на базе микро-ЭВМ.
Перспективы
Прогресс автоматизированного управления производственными процессами определяют четыре фактора:
® знание об объекте управления и динамике процесса;
® технология измерений;
® вычислительная техника;
• теория управления.
Знания об объекте управления и динамике процесса накапливаются медленно. Возможности изучения характеристик объекта управления существенно возрастают с внедрением систем управления, так как при этом упрощается сбор данных, проведение экспериментов и анализ результатов. Прогресс в иденти
фикации систем и анализе данных способствует получению цен* ной информации.
Технология измерений на современном уровне позволяет сочетать выходы нескольких различных датчиков и математических моделей. Кроме того, возможна реализация автоматической настройки параметров. (Заметим, что создание новых измерительных приборов всегда таит в себе новые возможности.)
С появлением СБИС открывается захватывающая перспектива развития вычислительной техники. Ожидается значительное понижение отношения стоимости к возможностям ЭВМ, увеличение производительности микрокомпьютеров и существенное улучшение дисплейной техники и средств связи.
Одним из узких мест теории управления до сих пор является программирование. За период 1950—1970 гг. удалось добиться лишь частичного улучшения его продуктивности. В конце 70-х годов многие цифровые системы управления все еще программировались на ассемблере. В области автоматизированного управления преодоление указанных трудностей осуществлялось, как правило, за счет использования таблично-управляемого математического обеспечения. Пользователь систем прямого цифрового управления снабжался так называемым пакетом ПЦУ, что существенно упрощало генерирование системы — для этого пользователю было достаточно заполнить таблицу; в результате создание системы требовало незначительных усилий.
Заметный прогресс теории управления начался с 1955 г., однако ее вклад в существующие цифровые системы управления был незначителен. Одной из причин этого являлась стоимость программирования.
Итак, многие факторы свидетельствуют о том, что наметились интересные тенденции в области развития цифровых систем управления. Один из возможных способов подготовиться к этому—тщательно изучить материал, изложенный в данной книге.
1.2. ТЕОРИЯ ЦИФРОВОГО УПРАВЛЕНИЯ
Принципиальная схема цифровой системы управления показана на рис. 1.1. Система содержит пять блоков: объект управления, аналого-цифровой и цифро-аналоговый преобразователи, управляющий алгоритм и таймер. Момент времени, в который измеряемый сигнал преобразуется в цифровую форму, называется моментом квантования-, промежуток времени между двумя последовательными моментами квантования — периодом квантования и обозначается буквой h. Обычно применяется периодическое квантование, хотя существуют и другие способы. Например, можно осуществлять квантование при изменении выходных сигналов на определенную величину. Допустимо также исполь
зование разных периодов квантования для различных цепей в системе; так называемое многочастотное квантование.
Единственное отличие цифровой системы управления от простой непрерывной системы с обратной связью состоит в том, что в первом случае управление реализуется с помощью цифровой вычислительной машины, следовательнд, налицо большее разнообразие законов управления. Например, в регуляторе нетрудно использовать нелинейные операции, включить логику и выполнять сложные вычисления. Для сбора информации о свойствах системы можно использовать таблицы.
Необходимость теории цифровых систем
Хорошая теория позволяет уяснить принцип действия системы, аналогичной изображенной на рис. 1.1, и принцип ее создания. Очевидно, что если период квантования достаточно мал, то дискретная система должна вести себя как непрерывная. Тогда возникает вопрос о целесообразности создания специальной теории цифровых систем управления. Однако, как следует из приводимых ниже примеров, система, изображенная на рис. 1.1, не может быть полностью объяснена в рамках теории стационарных линейных систем, даже если объект управления представляет собой линейную стационарную непрерывную систему.
Пример 1.1. Временная зависимость
Предположим, что требуется реализовать компенсатор, который является просто звеном линейного запаздывания. Такой компенсатор может быть выполнен с использованием аналого-цифрового преобразования, ЭВМ и цифро-аналогового преобразования. Дифференциальное уравнение первого порядка аппроксимируется разностным уравнением первого порядка. Реакция на ступенчатое воздействие рассматриваемой системы показана на рис. 1.3. Очевидно, что дискретная система не инвариантна по времени, поскольку ее реакция зависит ог момента подачи ступенчатого воздействия. При запаздывании входного сигнала выходной сигнал задерживается на ту же величину, но при условии, что время запаздывания кратно периоду квантования.
Наблюдаемое явление (рис. 1.3) обусловлено тем, что система управляется таймером (ср. с рис. 1.1). Реакция системы на внешнее воздействие зависит от того, как оно синхронизировано с таймером вычислительной системы.
Цифровая система управления с периодическим квантованием называется периодической системой. Эффекты периодичности можно свести к минимуму, выбрав достаточно высокую частоту квантования. Для полного понимания работы дискретных систем необходимо учитывать их периодическую природу. Проиллюстрируем это с помощью следующего примера.
Пример 1.2. Высшие гармоники
Хорошо известно, что синусоидальный сигнал на входе линейной, стационарной, непрерывной системы после переходного процесса дает на выходе синусоиду той же частоты. На рис. 1.4 показано, что происходит, когда цифровая система управления подвергается периодическому воздействию (к си-
Рис. 1.3.
а— структурная схема цифрового фильтра; б —реакция на ступенчатое воздействие линейного звена запаздывания, реализованного с помощью ЭВМ, для различного времени задержки входного сигнала относительно первого момента квантования.
Для сравнения показана реакция соответствующей непрерывной системы.
стеме, изображенной на рис. 1.1, приложен синусоидальный сигнал с частотой 4,9 Гц).
Очевидно, что наблюдаемое явление (рис. 1.4) не может быть объяснено в рамках теории линейных стационарных систем: колебания на выходе цифровой системы управления — следствие взаимного влияния частоты на входе и более высокой частоты, генерируемой в процессе квантования.
В задаче синтеза оптимального управления (проектирования закона управления) можно вначале применить теорию непрерывного управления, а затем непрерывное управление аппроксимировать дискретным процессом.
Пример 1.3. Дискретная аппроксимация
Двойной интегратор легко управляется обратной связью по состоянию. Непосредственный путь ее реализации — вычисление коэффициента усиления звена обратной связи методами теории непрерывного управления с последующей дискретной аппроксимацией. По-видимому, при достаточно малом пе риоде квантования цифровое управление будет иметь те же свойства и будет пригодным для любых практических целей в той же мере, как и непрерывное. В том, что это действительно так, нетрудно убедиться с помощью рис. 1.5. Согласование с непрерывным регулятором может улучшиться при уменьшении периода квантования.
Результаты примера 1.3 казалось бы свидетельствуют об отсутствии какой-либо необходимости в теории дискретных си
стем. Однако это не так, поскольку цифровые системы управления на 'самом деле могут функционировать лучше, чем их непрерывные аналоги.
Рис. 1.4. Синусоидальное возбуждение соответствующей дискретной системы, описанной в примере 1.4.
а —входной синусоидальный сигнал с частотой 4,9 Гц; б—выход дискретной системы, период квантования 0,1 с; в—выход соответствующей непрерывной системы.
Пример 1.4. Апериодическое управление
Рассмотрим двойной интегратор из примера 1.3. На рис. 1.6 показан ре-
стратегией, как и стратегия управления в примере 1.3, т. е. линейная обратная связь по дискретным значениям состояния, но коэффициенты обратной связи
и период квантования другие. Такая стратегия управления называется апериодическим управлением.
Сравнение рис. 1.5 и 1.6 показывает, что система, изображенная на рис. 1.6, переходит в установившийся режим быстрее, чем непрерывная система, даже если максимальное значение управляющего сигнала одинаково в обоих случаях. На самом деле величина скорости для системы, представленной на рис. 1.6, выше. У дискретной системы, кроме того, отсутствует перерегулирование. Следует также отметить, что сигналы достигают постоянного значения за конечное время, что невозможно в случае непрерывных систем, где сигналы есть сумма функций, являющихся в свою очередь композицией полиномиальных и экспоненциальных функций. Кроме того, период
Рис. 1.6. Двойной интегратор, управляемый ЭВМ с апериодической стратегией.
Период квантования 1 с.
квантования (рис. 1.6) в пять раз больше, чем период квантования, используемый прн аппроксимации непрерывной системы управления, изображенной на рис. 1.5.
Приведенный пример показывает, что даже в линейном случае возможно нечто лучшее, чем просто аппроксимация непрерывного регулятора.
1.3. СИСТЕМЫ С КВАНТОВАНИЕМ
Дискретные модели представляют собой естественный способ описания многих явлений, поэтому теория дискретных систем применяется не только в цифровом управлении.
Дискретные системы как модели алгоритмов для ЭВМ
Алгоритмы в ЭВМ могут быть представлены как дискретные процессы. Это иллюстрируется итеративным алгоритмом и системой реального времени.
Пример 1.5. Итеративное решение
Итеративные алгоритмы представляют собой пример систем, которым присуще квантование. Предположим, что ищется решение уравиення вида
x-f(x) = 0.
Рис. 1.7. Два варианта графического изображения итеративной схемы, описанной в примере 1.5.
Рис. 1.8. Выполнение программы в ЭВМ под управлением планировщика.
Один из способов нахождения решения состоит в задании начального приближения и последующего применения алгоритма Пикара, т. е. в использовании
итерации.
X (k + 1) = f [x (k) ],
где x(k)—значение на k-й итерации. Таким образом, численный алгоритм можно интерпретировать как дискретную систему, у которой время — номер итераций.
Предположим, в частности, что f(x) = 3— Vх- В этом случае легко показать, что х — (7 — -\/13)/2лг 1,697. Последовательность чисел, приведенная на рис. 1.7, получена при выборе начального приближения х(0) = 0.
Пример 1.6. Алгоритм управления
Простейшим алгоритмом для пропорционально-интегрального (ПИ) регулятора является следующий:
цс := adin(inl) у := adin(in2) е := ис—у
u := к * (е + i) dout(u)
i := i + h * e/ti
{ввести эталонное значение}
{ввести переменную состояния}
{вывести сигнал управления}
Программа выполняется планировщиком в каждый период квантования, как показано на рис. 1.8, и эквивалентна следующим разностным уравнениям:
е (k) = ис (А) — у (А), u(k) = k[e(k) + i(k- 1)],
ti
Квантование, обусловленное системой измерений
Во многих случаях квантование порождается самой процедурой измерения.
Пример 1.7. Радар
При вращении антенны радара информация о дальности и направлении поступает за один оборот антенны. Модель с квантованием, таким образом, является естественным способом описания работы радара. (Попытки описания радарной системы были одной из отправных точек теории дискретных систем.)
Пример 1.8. Аналитические приборы
В системах управления технологическими процессами многие параметры не могут быть измерены непосредственно; в результате образец продукта анализируется «на стороне» с помощью аналитических приборов, например масс-спектрографа’ или хроматографа.
Пример 1.9. Экономические системы
Отчетные операции в экономических системах часто привязываются к календарю. Хотя сделки совершаются в любое время, информация по важнейшим статьям выдается только за конкретный период, например за день, неделю, месяц, квартал или год.
Квантование, обусловленное импульсной операцией Многим системам изначально присуще квантование, так как информация в них передается импульсами.
Пример 1.10. Тиристорное управление
Электронные устройства, использующие тиристоры, — системы с квантованием. Рассмотрим цепь, изображенную на рис. 1.9. Ток протекает в ней
Рис. 1.9. Цепь тиристорного управления.
только в том случае, когда напряжение положительно. Следовательно, ток синхронизирован с периодом источника питания.
Призер 1.11. Биологические системы
Биологические системы также в основном дискретные, так как передача сигналов в нервной системе осуществляется в форме импульсов.
Пример 1.12. Двягатели внутреннего сгорания
Двигатель внутреннего сгорания — система с квантованием; зажигание можно рассматривать как таймер, синхронизирующий работу двигателя. В каждый момент зажигания создается импульс крутящего момента.
В приведенных выше примерах все системы периодические вследствие импульсного характера своей работы. Управление такими системами достаточно сложное, но оно существенно упрощается, если дискретные модели рассматривать только в
момент пульсаций. Процессы, таким образом, могут быть представлены в моменты квантования как стационарные, дискретные системы (примеры 1.10 и 1.12).
1.4. ЭТАПЫ РАЗВИТИЯ ТЕОРИИ
Хотя основные приложения теории дискретных систем связаны с цифровым управлением, многие ее задачи возникли довольно давно. Рассмотрим некоторые основные идеи, сформировавшиеся в процессе развития теории.
Теорема о квантовании
Все цифровые системы управления оперируют со значениями параметров процесса только в дискретные моменты времени,, поэтому важно знать условия, при которых непрерывный сигнал может быть полностью восстановлен по дискретным выборкам. Фундаментальный результат был получен Найквистом, который показал, что для восстановления синусоидального сигнала его необходимо квантовать по крайней мере дважды за период. Решение задачи в общем виде дано в работе [6].
Разностные уравнения
Первые зачатки теории цифровых систем управления с квантованием явились результатом анализа особых систем управления, и в частности поведения гальванометра с падающей дужкой [4]. Было показано, что многие свойства объекта можно понять, анализируя линейное, стационарное разностное уравнение. Разностное уравнение здесь заменяет дифференциальное уравнение для непрерывных систем. Например, устойчивость систем может быть исследована методом Шура — Коха, эквивалентным критерию Рауса — Гурвица.
Методы преобразования
Во время и после второй мировой войны большое внимание уделялось анализу радарных систем. Такие системы являются дискретными, так как каждое измерение положения цели производится за один оборот антенны. Естественным следствием эффективности применения методов преобразования для анализа непрерывных систем явилась попытка построить аналогичный аппарат для дискретных систем. Первый шаг в этом направлении был сделан автором работы [5], который ввел преобразование последовательности {f(kh)}, определяемое как
fc=0 =
Это преобразование, подобное производящей функции, успешно используемой во многих отраслях прикладной математики, впоследствии было названо z-преобразованием [11]
Дальнейшее развитие теория преобразования (методы анализа и проектирования дискретных систем) получила в докторской диссертации Джури (Колумбийский университет, США), который установил, что дискретные системы могут функционировать лучше, чем соответствующие им непрерывные (см. пример 1.4), и что можно создать замкнутую систему, достигающую установившегося состояния за конечное время. В более поздних работах он показал, что квантование может вызвать компенсацию полюсов и нулей. Тщательное исследование этого свойства в дальнейшем послужило толчком к развитию понятий наблюдаемости и достижимости.
Теория г-преобразования приводит к сравнительно простььм результатам, но она описывает систему только в моменты квантования. Между тем поведение системы между моментами квантования представляет не только академический интерес, поскольку было обнаружено, что в ней могут появиться скрытые колебания. Эти колебания не фиксируются в моменты квантования, но очень заметны между ними.
Иной подход к развитию теории дискретных систем был предпринят Линвиллом [10]. Следуя идеям Маккола [3], он рассматривал квантование как амплитудную модуляцию и, используя описывающие функции, смог дать характеристику поведения. системы между моментами квантования.
Одним из способов решения проблемы является известное модифицированное z-преобразование, предложенное Цыпкиным [13], Баркером и Джури [12]. Большой вклад в теорию внесла группа ученых, работавшая под руководством Рагаццини (Колумбийский университет, США).
К концу 50-х г. подход на основе г-преобразования стал хрестоматийным [14—17]. Теория дискретных систем, созданная по аналогии с теорией линейных стационарных систем, оказалась удобным средством анализа и синтеза дискретных систем. Требовались лишь некоторые усовершенствования, связанные с зависимостью дискретных систем от времени.
Теория пространства состояний
Данная теория основана на работах таких математиков, как Лефшец, Понтрягин, Беллман. Огромная заслуга в разработке подхода пространства состояний в теории управления принадле-
1 ’ Теория преобразования независимо развивалась в Советском Союзе, Соединенных Штатах и Великобритании. Я. 3. Цыпкин назвал его дискретным преобразованием Лапласа и на его основе создал строгую теорию импульсных систем управления. Метод г-преобразования был также независимо предложен в Англии Баркером [8].
жит Калману, который сформулировал основные принципы и нашел решения многих важных задач.
Несколько фундаментальных концепций явились результатом анализа проблемы возможности построения систем, переходящих в установившийся режим за конечное время. Это привело к понятиям достижимости и наблюдаемости. Работа Кал-мана [22] также способствовала развитию более простого представления задачи анализа дискретных систем: основные уравнения получались интегрированием исходных дифференциальных уравнений при допущении, что управляющий сигнал между моментами квантования постоянен.
Оптимальное и стохастическое управление
В конце 50-х г. Веллман [23] и Понтрягин [25] показали, что многие задачи проектирования могут быть сформулированы как задачи оптимизации. Для нелинейных систем это привело к неклассическому вариационному исчислению. Веллманом и др. [24] было найдено точное решение для линейных систем с квадратичными функциями потерь. В своей знаменитой работе [26] Калман доказал, что линейная квадратичная задача сводится к решению уравнения Риккати. Он также показал, что классическая задача фильтрации Винера может быть переформулирована в рамках теории пространства состояний. Это позволило добиться «решения» с помощью рекурсивных уравнений, очень удобных для решения на ЭВМ.
В начале 60-х г. стохастическая вариационная задача была сформулирована исходя из предположения, что возмущения являются случайными процессами. Задачу оптимального управления для линейных систем смогли сформулировать и решить для случая квадратичных потерь. Это привело к развитию теории стохастического управления. В результате возникла теория оптимального управления системами с квадратичным критерием качества, которая сейчас является основным средством проектирования многомерных линейных систем.
Алгебраическая теория систем
В конце 60-х — начале 70-х годов были пересмотрены фундаментальные проблемы теории линейных систем. В результате был восстановлен алгебраический характер задач, что привело к более глубокому пониманию основ теории линейных систем и позволило создать технику вычислений, использующую полиномиальные методы, для решения специальных задач [27—311.
Идентификация систем
Потребность в эффективных средствах моделирования стала очевидной уже при первых попытках применить теорию на практике. Это стимулировало множество исследований в об
ласти способов построения моделей, непосредственно использующих информацию от объекта управления, что в свою очередь привело к разработке большого количества алгоритмов [32, 33].
Адаптивное управление
Появление цифрового управления позволило реализовать более сложные алгоритмы, что возродило интерес к адаптивному управлению. В 70-х г. был достигнут определенный прогресс в развитии как численных алгоритмов, так и самой теории. Жизнеспособность адаптивного управления была также продемонстрировала в исследованиях принципиальных возможностей использования ЭЦВЛА для целей управления [35—37].
ЛИТЕРАТУРА
Для приобретенияtглубоких знаний по предмету полезно знать историю его развития и прочитать некоторые оригинальные работы.
Труды, написанные основателями дискретной теории
1. Jury Е. I. (1980): “Sampled-data Systems, Revisited: Reflections, Recollections, and Reassessments”, Trans, of the ASME, Journal of Dynamic Systems, Measurement, and Control, 102 (December 1980), 208-16.
2. Jury E. I., Tsypkin Y. Z. (1971): “On the Theory of Discrete Systems”, Automatica 7, 89-107.
Ранние разработки по дискретным системам
3. MacColl L. А. (1945): Fundamental Theory of Servomechanisms. New York. D. Van Nostrand. [Имеется перевод: Маккол Л. А. Основы теории сервомеханизмов. •—М.: ИЛ, 1947.]
4. Oldenburg R. С., Sartorius Н. (1948): The Dynamics of Automatic Control. New York. ASME. [Имеется перевод: Олденбург P., Сарториус Г. Динамика автоматического регулирования. — М.: Энергоиздат, 1949.]
5. Hurcwicz W. (1947): “Filters and Servo Systems With Pulsed Data”, in Theory of Servomechanisms, ed James H M., Nichols N. B., Phillips R. S. New York: McGraw-Hill.
Теорема с квантовании
6. Shannon С. E. (1949): “Communication in Presence of Noise”, Proc. IRE, 37, 10—21.
7. Котельников В. А. «О передающей способности эфира и проводников в электросвязи», Первая всесоюзная конференция по вопросам связи, Москва, 1933.
Ранние работы по теории дискретных систем, опубликованные в Англии
8. Barker R. Н. (1952): “The Pulse Transfer Function and its Application to Sampling Servosystems”, Proc. IEEE, 99, Pt. IV, 302-17.
9. Lawden D. E. (1951): “A General Theory of Sampling Servomechanisms”, Proc. IEEE, 98, Pt. IV (October), 31-36.
в Соединенных Штатах
10 Linvill W. К. (1951): “Sampled-Data Control Systems Studied Through Comparison of Sampling with Amplitude Modulation”, AIEE Trans., 70, Pt. II, 1778-88.
11. Ragazzini J. R„ Zadeh L. A. (1952): “The Analysis of Sampled-Data Systems”, AIEE Trans., 71, Pt. II (November), 225-88.
12. Jury E. I. (1956): “Synthesis and Critical Study of Sampled-Data Control Systems”, AIEE Trans., 75. Pt. II, 141-51.
в Советском Союзе
13. Цыпкин Я. 3. «Теория прерывистого управления», Автоматика и телемеханика, (1949) 3, (1949) 5, (1950) 5.
Первые книги по теории систем с квантованием вышли в свет в конце 60-х годов
14. Ragazzini J. R., Franklin G. F. (1958): Sampled-Data Control Systems, New York: McGraw-Hill.
15. Цыпкин Я. 3. Импульсные системы автоматического регулирования.— М.: Физматгиз, 1958.
16. Jury Е. I. (1958): Sampled-Data Control Systems. New York: John Wiley. [Имеется перевод: Джури Э. Импульсные системы автоматического регулирования.— М.: Физматгиз, 1963.]
17. Той J. Т. (1959): Digital and Sampled-Data Control Systems. New York: McGraw-Hill.
C rex пор появилось большое количество работ, из которых можно упомянуть следующие:
18. Ackermann J. (1972); Abtastregelung. Berlin: Springer-Verlag.
19. Isermann R. (1977): Digitale Regelsysteme. Eng. Trans. (1981): Digital Control Systems. Berlin: Springer-Verlag. [Имеется перевод: Изерман P. Цифровые системы управления. — М.: Мир, 1984.]
20 Кио (1980): Digital Control Systems. Tokyo: Holt-Saunders.
21. Franklin G. E., Powell J. D. (1980): Digital Control of Dynamic Systems. Readig. Mass.: Addison-Wesley.
Идея постановки задачи управления в пространстве состояний была впервые высказана в статье
22. Kalman R. Е. (1960): “On the General Theory of Control Systems”, Proc. First IFAC Congress, Moscow, Butterworths, 1, 481-92.
Основные источники no оптимальному и стохастическому управлению
23. Bellman R. (1957): Dynamic Programming. Princeton, N. J.: Princeton University Press. [Имеется перевод: Веллман P. Динамическое программирование. — М.: ИЛ, I960.]
24 Bellman R., Glicksberg I., Gross О. A. (1958): “Some Aspects of the Mathematical Theory of Control Processes”, Report R-313. Santa Monica, Calif.: The RAND Corporation. [Имеется перевод: Веллман P. Некоторые вопросы динамической теории процессов управления. — М.: ИЛ, 1962.]
25. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. Б., Мищенко Е. Ф. Математическая теория оптимальных процессов. — М.: Физматгиз, 1961.
26 Kalman R. Е. (1960): “Contributions to the Theory of Optimal Control”, Boletin de la Sociedad Matematica Mexicana, 5, 102-19.
Алгебраический подход к системе
27. Kalman R. E., Falb P. L., Arbib M. A. (1969): Topics in Mathematical System Theory. New York: McGraw-Hill. [Имеется перевод: Калман P. E., Фалб И. Л., Арбиб М. А. Очерки по математической теории систем. — М.: Мир, 1971.]
28 Rosenbrock Н. Н. (1970): State-Space and Multivariable Theory. London: Nelson. v
29. Wonham W. M. (1974): Linear Multivariable Control: A Geometric Approach. New York: Springer-Verlag.
30. Blomberg H., Ylinen R. (1983): Algebraic Theory for Multivariable Linear Systems. New York: Academic Press.
31. Kucera V. (1979): Discrete Linear Control, Prague: Academia.
Идентификация систем
32. Astrom К. J., Eykhoff Р. (1971): “System Identification: A Survey”, Automatica, 7, 123-62.
33. Goodwin G. K-, Payne R. L. (1977): Dynamic System Identification-. Experiment Design and Data Analysis. New York: Academic Press.
Адаптивное управление
34. Bellman R. (1961)- Adaptive Control: A Guided Tour. Princeton, N. J.: Princeton University Press. [Имеется перевод: Веллман P. Процессы регулирования с адаптацией. — М.: Наука, 1964.]
35. Astrom К. J., Wittenmark В. (1973): “On Seif-tuning Regulators”, Automatica, 9, 185-99.
36. Astrom К. J., Wittenmank B. (1980): “Self-tuning Controllers Based on Pole-Zero Placement”, Proc., I EE pt. D, 127, 120—30.
37. Astrom K. J. (1983): “Theory and Application of Adaptive Control”, Automatica, 19. _•
Кроме того, см. материалы Симпозиума 1FAC по применению цифровых вычислительных машин для управления технологическими процессами и по идентификации и оценке параметров систем, опубликованные Pergamon Press.
2
Квантование непрерывных Сигналов
Механизм квантования и некоторые фундаментальные принципы.-и понятия дискретных систем; проблема поглощения
ВВЕДЕНИЕ
В некоторых словарях слово выборка *’ означает «действие или процесс взятия небольшой части или количества чего-либо в качестве образца для проверки или анализа». В теории управления и систем связи под выборкой (квантованием)2’ подразумевается замена непрерывного по времени сигнала последовательностью чисел, представляющей значения этого сигнала в определенные моменты времени.
Квантование — неизбежный процесс в цифровых системах управления, обусловленный дискретной природой самих ЭЦВМ. Рассмотрим, например, систему, показанную на рис. 1.1. Объект управления вырабатывает на выходе аналоговые сигналы, которые затем переводятся в цифровую форму. Таким образом, непрерывно изменяющееся во времени состояние процесса преобразуется в последовательность чисел, которые обрабатываются цифровой вычислительной машиной. На выходе машины получается новая последовательность чисел, которая после преобразования в непрерывный сигнал подается на вход объекта управления. В рассматриваемой системе эту операцию выполняет цифро-аналоговый преобразователь. Процесс преобразования последовательности чисел в непрерывный сигнал называется восстановлением сигнала.
Так как квантование неизбежно в цифровых системах управления, необходимо хорошо понимать сущность этого процесса.
2.1. МЕХАНИЗМ КВАНТОВАНИЯ
Для анализа процесса полезно иметь математическое описание квантования. Квантование непрерывного сигнала означает про-
” В оригинале sampling. — Прим, перев.
21 В отечественной литературе принят термин «квантование», или «дискретизация». — Прим. ред.
стую замену этого сигнала его значениями на множестве дискретных точек. Пусть Z — множество положительных и отрицательных целых чисел Z = {..., —1, 0, 1, ...} и пусть {^: feeZ} подмножество действительных чисел, так называемых моментов квантования. Дискретный вариант сигнала f есть последовательность {f(tk): k^Z}. Квантование — это линейная операция. Моменты квантования часто отделены друг от друга равными промежутками времени, т. е. tk = k-h. Здесь h — период квантования, или время квантования, а соответствующая ему частота fs — \/h (Гц)—частота квантования. Такое квантование называется периодическим.
Существуют^ и более сложные способы квантования. Например, в различных контурах управления могут использоваться разные периоды квантования. Такое квантование называется многочастотным и рассматривается как суперпозиция нескольких схем периодического квантования. Случай периодического квантования изучен достаточно хорошо. Однако в связи с интенсивным -использованием многопроцессорных систем возросла роль многочастотного квантования. При современном уровне программного обеспечения для конкурирующих процессов также можно спроектировать систему как совокупность асинхронно выполняющихся процессов. Кроме того, технически выгодно использовать разные частоты квантования для различных переменных.
2.2. ТЕОРЕМА О КВАНТОВАНИИ
Если моменты квантования следуют достаточно часто, то при квантовании непрерывного сигнала потери информации незначительны, и наоборот. В качестве примера можно привести квантование синусоиды (рис. 2.1): дискретное изображение
Рис. 2.1. Потеря информации в результате медленного квантования.
Синусоида квантуется два раза за период.
синусоиды неотличимо от нулевого сигнала, если ее частота равна половине частоты квантования.
Для квантования непрерывного сигнала необходимо знать, при каких условиях он однозначно представляется своими дискретами. Теорема, приводимая ниже, дает условия для случая периодического квантования.
Теорема Шеннона. Непрерывный сигнал, преобразование Фурье которого равно нулю вне интервала (—о>о, Д»о), одно-
значно представляется своими значениями в равноотстоящих точках, если t частота квантования больше 2(d0. При этом непрерывный сигнал может быть получен из дискретного по интерполяционной формуле
оо f(o= X f(kh) k — — oo
sin (Os (t ~^kh)/2 ~w7(t - kh)/2 ’
(2.1)
где (Ds — угловая частота квантования (рад/с)
Доказательство. Пусть )— непрерывный сигнал, a F—его преобразование Фурье
F((o)= e~lb)tf — оо (2.2)
оо S(®) (2.3)
Введем функцию со
Ts(®) = -^- £ F((o + /?(oj, fe——-ОО (2.4)
разложение которой в ряд Фурье имеет вид
Fs((o) = Е Cke~ikh,i>, fe = — oo (2.5)
“s где Ck — -7- eiklu,>Fs ((о) rf(o.
о
Предположим теперь, что дискреты f (kh) можно рассматривать как коэффициенты ряда Фурье для периодической функции Fs((o). (Это проверяется непосредственными вычислениями.) Тогда, используя определение коэффициентов Фурье и выражения (2.3) и (2.4), можно показать, что
Ck = f(kh). (2.6)
Отсюда следует, что квантованный сигнал k— —1, О, 1, ...} однозначно определяет функцию Fs(cd). По условию теоремы функция F равна нулю вне интервала (—<оо, (d0). Если (Ds > 2(Оо, то
F((d) =
' hFs (©),
О,
(2.7)
Таким образом, преобразование Фурье непрерывного сигнала однозначно представляется функцией Fs, которая в свою очередь определяется дискретной функцией {[(kh), k= —1, О, 1,
Для доказательства справедливости формулы (2.1) заметим, что она может быть получена из (2.2) и (2.7)
оо °s/2
f(0 = -^7 eto/F(co)cZco = -^- f eib,tFs (co) do =
-oo -«s/2
«W2 oo
e~ikhb,[ (kh) do
—b>s/2 k~ — OO
с учетом (2.5) и (2.6). Меняя порядок интегрирования и суммирования, имеем
oo °s/2
f(t) = £ $ el^-^khdo =
k — — oo —i»sp
oo
= У f(kh)„ * ...
Z_j ' v f 2ra (t — kh)
k = — oo
gitot—itokh
oo
= £ m
k= — <XS
sin <os (t — /г/г)/2 n(t — kh)/h
откуда получаем (2.1), так как osh = 2л.
Замечание 1. Частота oN — os/2, очевидно, играет важную роль; она называется частотой Найквиста.
Замечание 2. Формула (2.1) определяет восстановление сигналов, преобразования Фурье которых стремятся к нулю при частотах больших, чем частота Найквиста.
Замечание 3. Из-за наличия множителя 1 /А в уравнении (2.4) иногда говорят, что операция квантования имеет коэффициент усиления 1/Л.
2.3. ВОССТАНОВЛЕНИЕ
Инверсия операции квантования, т. е. преобразование последовательности чисел ke^Z} в непрерывную функцию [(f), называется восстановлением. В цифровых системах управления необходимо преобразовывать управляющее воздействие, выработанное ЭВМ в виде последовательности чисел, в непрерывный
сигнал, подаваемый на объект управления. Аналогичная операция требуется и при цифровой фильтрации. Рассмотрим некоторые методы восстановления.
Восстановление Шеннона
В случае периодического квантования сигнала с ограниченным спектром восстановление осуществляется в соответствии с теоремой квантования по формуле (2.1). Такое восстановление получило название восстановления Шеннона. Уравнение (2.1) определяет обратную операцию, которая может рассматриваться как линейный оператор. Последний, однако, не является причинно-следственным, так как значение f в момент t выражается как через предшествующие {f (kh): k t/h}, так и через последующие {f (kh): k > t/h} дискреты. В связи с этим восстановление Шеннона неприемлемо в случае систем управления с ЭВМ, но оно может быть использовано в системах коммуникации, поскольку в них часто допускается запаздывание. Другими недостатками восстановления Шеннона являются его сложность и ограниченность только случаем периодического квантования.
Приближение нулевого порядка
Простейшее причинное восстановление определяется формулой f(t) = f(tk}, tk^t<tk+l. (2.8)
Это означает, что восстановленный сигнал кусочно-постоянен, непрерывен справа и равен сигналу квантования в моменты
Рис. 2.2. Квантование непрерывного сигнала и его восстановление методом приближения нулевого порядка.
tj ^4 tg tg t7 Время
квантования. Таким образом, восстановленное значение не изменяется до следующего момента квантования.
Вследствие простоты выполнения операции восстановления методом приближения нулевого порядка оно широко используется в цифровых системах управления. Стандартные ЦА-преобразователи часто проектируют таким образом, что старое значение выходной величины постоянно до тех пор, пока не потребуется новое преобразование. Преимуществом приближения нулевого порядка является его пригодность и для непериодического квантования.
*> В оригинале Zero-Order Hold (ZOH).— Прим, перев.
♦♦♦ Заметим, что восстановление (2.8) есть точная инверсия операции квантования только для сигналов непрерывных справа и кусочно-постоянных между моментами квантования. Во всех остальных случаях восстановление (2.8) дает ошибку. Наибольшее значение ошибки при периодическом квантовании сигнала с гладкой первой производной вычисляется по формуле
ezoH = max | f (tk+l) — f (tk) | < h max | f' (/) |, к t
(2.9)
где f'—производная f (рис. 2.2).
Приближения старших порядков
Приближение нулевого порядка можно рассматривать как полиномиальную экстраполяцию нулевой степени. Для гладких
Рис. 2.3. Квантование непрерыв-кого сигнала и его восстановление методом приближения первого порядка.
/ — восстановленный сигнал; 2—непрерывный сигнал.
функций экстраполяция старших степеней позволяет во многих случаях уменьшить ошибку. Причинная полиномиальная экстраполяция первого порядка имеет вид
f (0 = f (Д) + [f (Д)- f (tk-i)], tk^t< tk+l.
Таким образом, восстановление осуществляется проведением прямой линии между двумя соседними дискретами. Приближение первого порядка иллюстрируется на рис. 2.3.
Наибольшее значение ошибки при приближении первого порядка дается формулой
Cfoh = max шах к t
р(О-НД)
[Ж)~ f (Д_.)] |-
(2.10)
В случае периодического квантования сигналов с гладкой второй производной ошибка оценивается как
Cfoh < h2 m ах | f" (t) |. (2.11)
Для сигналов с гладкими высшими производными можно использовать экстраполяционные многочлены старших порядков, однако восстановление такого рода осуществляется крайне редко из-за сложности его реализации.
2.4. ПОГЛОЩЕНИЕ ЧАСТОТЫ
Если непрерывный сигнал, имеющий преобразование Фурье F, квантуется периодически, то из (2.5) и (2.6) следует, что дискреты f(kh), k =
О, 1, ... могут быть представлены Fsfa)
Рис. 2.4. Связь между преобразованиями Фурье для непрерывного и дискретного сигналов при различных частотах квантования.
Для простоты сделано допущение, что преобразование Фурье действительное.
как коэффициенты разложения (2.4).
Таким образом, функцию Fs образование Фурье дискретного
в ряд Фурье функции Fs вида можно рассматривать как пресигнала. Период функции (2.4)
Рис. 2.5. Два сигнала с различными частотами (0,1 и 0,9 Гц) могут иметь одинаковые значения во все моменты квантования
равен периоду квантования <os. Если спектр непрерывного сигнала не содержит частот выше частоты Найквиста, то дискретное преобразование Фурье есть не что иное, как простое периодическое повторение непрерывного преобразования Фурье (рис. 2.4).
Из (2.4) следует, что значение дискретного преобразования Фурье при частоте о> равно сумме значений непрерывного преобразования Фурье при частотах w ncos. Вследствие этого
после квантования невозможно выделить составляющие сигнала на данных частотах. Следовательно, можно считать, что частота со «поглощает» частоты а> + mos. Принято рассматривать
Снабжение водой.
Конденсированная Температура вода
К паровому котлу
Рис. 2.6. Схема процесса подогрева воды дтя парового котла.
только положительные частоты, поэтому <о поглощает частоты G)s — <о, со5 + о, 2(os — о, 2(os -|- со, ..., где 0 со < cow. В результате после квантования частота со не отделима от своих
вв г.пмин время
Рис. 2.7. Регистрация температуры и
давления.
скрытых, или поглощенных частот. Основная поглощенная частота для (01 > сад определяется как
® = | (®1 + <Ojv) mod (cos) — сол, |. (2.12)
♦♦♦ Заметим, что, хотя квантование является линейной операцией, оно зависит от времени. Этим объясняется, почему при квантовании возникают новые частоты.
Эффект поглощения иллюстрируется на рис. 2.5: два сигнала частотой 0,1 и 0,9 Гц квантуются с частотой 1 Гц (h = 1 с). Видно, что оба сигнала в моменты квантования имеют одинаковые значения.
Пример 2.1. Поглощение частот
На рис. 2.6 показана схема процесса подогрева воды в корабельном котле. Поток воды контролируется клапаном, позиционер которого вследствие износа имеет мертвый ход, что приводит к колебаниям температуры и давле-
-Шд, и uN
Рис 2.8. Поглощение частоты.
ния. На рис. 2.7 приведены результаты дискретных измерений температуры и непрерывных измерений давления.
Из приведенных данных следует, что период колебания температуры около 38 мин, а период колебания давления 2,11 мин. Поскольку, однако, оба параметра физически взаимосвязаны, они должны иметь одинаковый период колебаний. Температура квантуется каждую минуту (с частотой <ds = 2л/2 = = 3,142 рад/мин), в то время как частота колебания давления о>о==2л/2,11 = = 2,978 рад/мин. Наименьшая поглощенная частота cos — соо = 0,1638 рад/мин, что соответствует периоду колебания 38 мин.
Наложение частот
Уравнение (2.4) имеет и другую интерпретацию. Спектр непрерывного сигнала воспроизводят на листке бумаги, который затем сгибают в точках оси абсцисс, соответствующих нечетным кратным частоты Найквиста, как показано на рис. 2.8. Дискретный спектр получается суммированием вкладов с соответствующей фазой с каждого листка.
Предварительная фильтрация
На практике основная трудность заключается в том, что преобразования Фурье реальных сигналов отличны от нуля вне заданной полосы частот. Высокочастотные компоненты могут проявляться на низких частотах в результате эффекта поглощения. Вопрос стоит особенно остро при наличии в спектре поглощения периодических высокочастотных составляющих. Чтобы решить проблему поглощения, необходимо перед квантованием фильтровать непрерывную входную величину.
Практически все аналоговые датчики имеют какой-либо фильтр, но он редко соответствует данной конкретной задаче управления. Во многих случаях его удается так' модифициро
вать, что полученные сигналы не имеют частот, превышающих частоту Найквиста.
Иногда простейшим решением является ввод непрерывного фильтрующего элемента перед АЦ-преобразователем. Стандарт-
R R.
Рис. 2.9. Реализация фильтра второго порядка в виде операционного усилителя.
Переходная функция фильтра дана в (2.13), где •
ная схема аналогового фильтра второго порядка с переходной функцией
гл 2
Gf(s) = i-o^~i—2 (2.13)
'' ' s2 + 2g<os + co2 ' '
показана на рис. 2.9.
Фильтры высших порядков получают каскадным соединением систем первого и второго порядка. Примеры фильтров приведены в табл. 2.1.
Таблица 2.1. Собственная частота и затухание для фильтров ITAE, Баттер-ворса и Бесселя
Порядок фильтра Тип фильтра
Баттерворса ITAE Бесселя
СО/СОо 5 со/top t <0/<0о 5
2 1 0,71 1,00 0,71 1,00 0,87
4 1 0,38 1,33 0,32 3,39 0,62
1 0,92 0,75 0,83 3,02 0,96
6 1 0,26 1,30 0,32 5,14 0,49
1 0,71 0,98 0,60 5,57 0,82
1 0,97 0,79 0,93 4,34 0,98
Примечание, Фильтры высших порядков получены в результате каскадного соединения фильтров типа (2.13). Здесь too—номинальная собственная частота фильтра.
Фильтры Бесселя имеют линейную характеристику, означающую, что сигнал сильно не искажается, благодаря чему они используются в высококачественных системах.
Пример 2.2. Предварительная фильтрация
Полезность предварительной фильтрации иллюстрируется с помощью рис. 2.10. Непрерывный сигнал получен наложением синусоидального возмущения (0,9 Гц) на прямоугольную волну. Частота Найквиста равна 0,5 Гц. Возмущение с частотой 0,9 Гц имеет поглощенную частоту 0,1 Гц (что отчетливо видно на изображении дискретного сигнала). Выход предфильтра — фильтра ITAE четвертого порядка — имеет полосу пропускания 0,25 Гц. В результате амплитуда возмущающего воздействия существенно уменьшена.
В управлении технологическими процессами возникают ситуации, при которых предварительная фильтрация невозможна,
Рис. 2.1G. Предварительная фильтрация.
а — сигнал и синусоидальное возмущение; б — сигнал (а) на выходе ф гльтра ITAE четвертого порядка; в — квантование сигнала (а); г — квантование сигнала (б)
в частности, когда образцы состояния процесса посылаются на анализ. В этом случае рекомендуется сделать, как можно больше выборок, тщательно дополняя их друг другом, и только после этого передать в анализатор.
2.5. ПРАКТИЧЕСКИЕ АСПЕКТЫ ВЫБОРА ПЕРИОДА КВАНТОВАНИЯ
Выбор правильного периода квантования зависит от свойств сигнала, метода восстановления и назначения системы. При решении чистой задачи обработки сигналов все сводится к их записи в цифровой форме с последующим восстановлением из своих дискрет. Разумным критерием выбора периода квантования в этом случае может быть величина .рассогласования между исходным сигналом и восстановленным.
В идеальных условиях, когда при восстановлении допустимы большие временные задержки, а частотные составляющие сигнала не выходят из заданной полосы, для выбора периода квантования можно воспользоваться простым правилом, которое дает теорема квантования Шеннона. На практике, однако, часто возникает необходимость в ограничениях на запаздывание восстановленного сигнала. Кроме того, важное значение имеет степень вероятности, зашумления сигналов высокочастотными возмущениями.
Выбор периода квантования для обработки сигналов Рассмотрим задачу обработки сигналов, целью которой является минимизация ошибки восстановления. Предположим, что
преобразование Фурье сигнала равно нулю при ]со|^а>о- Если задержка восстановления допустима, то, согласно теореме Шеннона, минимально допустимая частота квантования равна 2соо-Если, однако, время запаздывания ограничено, то требуются значительно более высокие частоты квантования. В подобной ситуации необходимо использовать причинные методы восстановления, такие, например, как приближения первого или нулевого порядка. В этих случаях ошибка оценивается по формулам (2.9) или (2.11).
Пример 2.3. Типичный порядок ошибки
Предположим, что сигнал — синусоидальная волна с частотой в без возмущений. Максимальные ошибки полного размаха амплитуды для восстановления методами приближения нулевого и первого порядка вычисляются по формулам
<оЛ л (ah)2 2л2
' е‘ 2~~ ~ N2 '
где N — количество дискрет за период. Некоторые типичные значения даны в табл. 2.2. Чтобы при восстановлении методом приближения нулевого порядка
Таблица 2.2. Относительные ошибки при квантовании и восстановлении синусоидального сигнала с использованием различных частот квантования
Число квантований за период, N Максимальная относительная ошибка
приближение нулевого порядка приближение первого порядка
2 1,5 2,5
5 0,6 0,8
10 0,3 0,19
20 0,15 0,05
50 0,06 0,008
100 0,03 0,002
20Э 0,015 5 • 10-4
500 0,006 8- 10“5
получить относительную ошибку в 1 %, необходимо квантовать сигнал около 300 раз за его период. Из таблицы следует, что эффект применения приближения первого порядка значительно выше, если N больше 20. Аналогичные результаты получаются при квантовании и восстановлении других сигналов.
Приведенный пример свидетельствует о том, что квантование со скоростью несколько сотен импульсов за период хорошо оправдывает себя в системах обработки сигналов.
Замкнутое управление
Рациональный выбор частоты квантования в системах с замкнутым контуром управления должен основываться на понимании ее влияния на качество системы управления. Кажется естественным, что наибольшая искомая частота тесно связана с полосой пропускания замкнутой системы. В этом случае выбор скорости квантования производится исходя из ширины по
лосы пропускания, или, что то же самое, из времени разгона замкнутой 'системы. Разумные скорости квантования (в 6— 10 раз больше ширины полосы пропускания, или от 2 до 3 импульсов за время разгона) кажутся медленными в сравнении с типичной задачей обработки сигналов. Относительно низкие скорости квантования могут использоваться при управлении, так как динамические характеристики многих объектов невелики и их постоянные времени обычно больше времени разгона замкнутой системы. Таким образом, вклад в выходной сигнал одного периода квантования зависит от зоны пульсации, но относительно не чувствителен к форме импульса.
ВЫВОДЫ
В данной главе было рассмотрено квантование непрерывных сигналов. Проквантовать сигнал — значит представить его в виде последовательности его значений на множестве дискретных моментов времени. В случае периодического квантования сигнал может быть восстановлен из своих дискрет, если выполняются следующие условия:
• преобразование Фурье непрерывного сигнала равно нулю при | со | > сок
• частота квантования cos больше, чем 2соь
Таким образом, при работе с дискретными сигналами важно выбрать частоту квантования так, чтобы она была достаточно велика по сравнению с частотной составляющей сигнала. Кроме того, перед квантованием важно профильтровать непрерывный сигнал, чтобы частотные составляющие, превышающие частоту Найквиста cow = cos/2, не искажали низкочастотные компоненты вследствие эффекта поглощения или наложения частоты.
ЗАДАЧИ
2.1. Воспроизведите реакцию на импульсное воздействие восстановителя Шеннона, заданного (2.1).
2.2. Сигнал f (t) = «i sin 2л/ + a2 sin 20/ подается на вход цепи, выполняющей квантование и восстановление методом приближения нулевого порядка. Какие частоты будут на выходе, если период квантования h = 0,2?
2.3. Сигнал, предназначенный для квантования, имеет спектр, показанный на рисунке. Частоты лежат в диапазоне 0—fi Гц.
Возмущение имеет фиксированную частоту f2 ~ 5fi- Обоснуйте выбор периода квантования и предфильтра.
2.4. Покажите, что система, изображенная на рисунке, — реализация метода приближения первого порядка, и определите
ее реакцию на* импульсное воздействие и продолжительность одного интервала квантования.
2.5. Изобразите спектр сигнала, представленного на рисунке, после квантования с h = 2л/10 с, h = 2 л/20 с и h = 2л/50 с.
‘ЭД
& 10 со рад/с
2.6. Рассмотрите сигнал, о котором шла речь в задаче 2.5, со спектром, сконцентрированным около со — 100 рад/с и со« = = 120 рад/с; cos = 240 рад/с.
2.7. Кинокамера используется для получения изображения колеса с отметкой. Колесо вращается со скоростью г оборот/с. Камера снимает один кадр за h с. Опишите картинку, которая появится при воспроизведении фильма на экране. (Ср. с тем, что вы видели в фильмах.)
2.8. Сигнал c/(/)=sin3nt квантуется с периодом h. Определите h так, чтобы получился периодический дискретный сигнал.
ЛИТЕРАТУРА
Тот факт, что синусоида может быть получена из своих дискрет, если она квантуется по крайней мере дважды за период, был установлен в работе
1. Nyquist Н. (1928): “Certain Topics in Telegraph Transmission Theory", AIEE Trans., 47, 617-44.
Теорема о квантовании была доказана в работе
2. Shannon С. Е. (1949): “Communication in Presence of Noise", Proc. IRE, 37, 10-21, посвященной системам связи. Однако её основной результат является известным математическим фактом. В советской литературе по теории связи эта теорема была опубликована в работе
3. Котельников В. А. «О передающей способности эфира и проводников в электросвязи», Первая всесоюзная конференция по вопросам связи, Москва, 1933.
Теорема о квантовании с многочисленными ссылками на ранние результаты
4. Jerri А. I. (1977): “The Shannon Sampling Theorem — Its Various Extensions and Applications: A Tutorial Review”, Proc., IEEE, 65, 1565-95.
Обзор некоторых способов квантования
5. Jury Е. I. (1961): “Sampling Schemes in Sampled-Data Control Systems”, IRE Trans., AC-6, 88-90.
Различные типы восстанавливающих схем -V'
6. Ragazzini J. R., Franklin G. F. (1958): Sampled-Data Control Systems. New York: McGraw-Hill.
7. Gardenhire L. W. (1964): “Selection of Sample Rates", ISA Journal (April), 59-64.
3
Математические модели, ориентированные на ЭВМ: дискретные системы
Математическое описание цифровых систем управления с точки зрения применения ЭВМ. Принципы и методы работы с дискретными системами
ВВЕДЕНИЕ
В данной главе представлены математические модели цифровых систем управления, ориентированные на применение ЭВМ. Компьютер получает значения регулируемых параметров процесса в дискретные моменты времени и вырабатывает управляющие сигналы также в дискретные моменты времени. Поэтому цель моделирования заключается в описании сигналов только в моменты квантования. Необходимо подчеркнуть, что математические модели, ориентированные на ЭВМ, описывают процесс только в моменты квантования, хотя физически он по-прежнему остается непрерывным.
Анализ зависимости дискретных систем от времени (пример 1.1) в данном случае сводится к изучению сигналов в моменты квантования, которые синхронизированы с таймером ЭВМ. Такой способ иногда называют стробоскопическим моделированием, так как в нем доступно только прерывистое наблюдение сигналов. В результате получают модели, описываемые разностными уравнениями состояния и в форме «вход-выход».
3.1. КВАНТОВАНИЕ НЕПРЕРЫВНЫХ СИСТЕМ, ЗАДАННЫХ УРАВНЕНИЯМИ СОСТОЯНИЯ
Одной из основных проблем теории цифрового управления является способ описания непрерывной системы, связанной с ЭВМ посредством АЦ- и ЦА-преобразователей. Рассмотрим систему, показанную на рис. 3.1. Сигналы в ЭВМ представляют собой последовательности {u(tk)} и {y(tk)}‘, необходимо определить зависимость между ними. Построение дискретного эквивалента непрерывной системы называется квантованием непрерывной системы. Полученная в результате квантования модель назы-
вается стробоскопической, так как она дает связь между переменными системы только в моменты квантования. Для достижения удовлетворительных результатов необходимо описание обоих преобразователей и самой системы.
Рис. 3.1. Блок-схема непрерывной системы, соединенной с АЦ- и ЦА- преобразователями.
В дальнейшем будем считать, что непрерывная система задана следующими уравнениями состояния:
= Ах (/) + Ви (/), у (t) = Сх (0 -f- Du (О
(3-1)
и имеет г входов, р выходов и порядок п.
Квантование системы методом приближения нулевого порядка
Наиболее распространенная ситуация в цифровом управлении состоит в том, что АЦ-преобразователь сохраняет уровень аналогового сигнала постоянным до тех пор, пока не потребуется новое преобразование. Следовательно, моменты квантования tk можно определить как время, когда меняется управляющее воздействие. Так как управляющий сигнал прерывист, необходимо установить его поведение в точках разрыва. Допустим, что сигнал непрерывен справа. Тогда управляющий сигнал представляется дискретным процессом {u(tk): k — ..., —1, 0, 1, ...}.
Теперь определим связь между переменными системы в моменты квантования. При заданном состоянии в момент квантования tk состояние в некоторый момент t можно получить, решив систему (3.1) ,
t
X (/) = еА I*-'*) х (tk) + eAU-s/) Ви (s') dsJ. (3.2)
Тогда состояние в следующий момент квантования tk+i определяется как
x(tk+l) = eA^k+l~tk^x(tk)-{-
fk
1
4- J eA(/fe+>-s,)BU(/fc)ds' = h
= Ф(^+1, tk)x(tk) 4- Г (tk+1, tk)u(tk),
причем и не изменяется в течение периода квантования.
Следовательно, вектор состояния в момент времени tk+i есть линейная функция от x(tk) и u(tk). Если АЦ- и ЦА-преобразо-ватели абсолютно синхронизированы и время преобразования незначительно, то можно считать, что вход и и выход у квантуются в одни и те же моменты. Тогда уравнения, описывающие квантованную систему, примут вид
faUfe+l) = Ф(6:+1> ^k) X (tk) 4“ Г (/fc+i, (3.3)
t y(tk) = Cx(tk) +Du(tk),
где Ф(^+1, /fe) = eA{‘fc+"/fc). (3.4)
rfo+1, /ft)= J eAsBds. (3.5)
о
Таким образом, связь между дискретными сигналами выражается разностными уравнениями (3.3).
ффф Заметим, что уравнения (3.3) не приближенные: они дают точные значения переменных состояния и выхода в моменты квантования, так как управляющий сигнал постоянен в период квантования.
Вследствие сказанного модель (3.3) называется квантованием в приближении нулевого порядка системы (3.1). Систему (3.3) также можно назвать эквивалентом системы (3.1) в приближении нулевого порядка.
Во многих случаях D — 0. Одна из причин этого состоит в том, что в цифровых системах управления сначала измеряется выход у, а затем в зависимости от у(6г) генерируется управляющий сигнал «(ffe). На практике между АЦ- и ЦА преобразователями часто существует значительная временная задержка. Последнюю, однако, можно учесть, производя необходимые модификации. Используя уравнение (3.2), можно вычислить
вектор состояния между точками квантования, что позволяет исследовать, поведение системы между ними.
♦♦♦ Заметим, что характеристики системы между моментами ее квантования дают представление о реакции системы на ступенчатые воздействия с начальными условиями. Это означает, например, что между моментами квантования система функционирует как разомкнутая.
Для периодического квантования с периодом h, tk = k-h, модель (3.3) сводится к стационарной системе
х (kh + h) = Фх (kh) + Ги (kh), у (kh) — Сх (kh) + Du (kh), ф = ель (3.6)
где Г = еА’С ds. 0 (3-7)
Способы вычисления Ф и Г
При квантовании непрерывной системы требуется вычислить Матричную экспоненту и проинтегрировать ее. Это может быть осуществлено различными способами, в том числе такими, как • разложение матричной экспоненты в ряд;
• преобразование Лапласа — преобразование Лапласа ехр(Л/) есть: (si— Л)-1, где I— единичная матрица;
• использование теоремы Гамильтона — Кэли (см. приложение В);
• приведение к жордановой форме.
Вручную вычисления могут быть выполнены для систем низкого порядка, ц < 2, и высокого порядка, имеющих особую структуру. Один из способов упрощения выкладок состоит в предварительном вычислении
Г Л/>2 Л2/>3 Л1Ь‘+1
+ + + . (3.8)
о
Тогда матрицы Ф и Г получаются как
, ф = I + ЛТ Г = Ч'В.
(3.9)
Для вычислений на ЭВМ можно использовать несколько алга* ритмов.
Пример 3.1. Двойной интегратор
Такой интегратор (см. приложение А) описывается уравнениями
ГО 11 ГОТ
Но оГ+Lif (ЗЛ0)
г/ = [1 0]х.
Откуда имеем
Ф_^-/+л4 + ад+...-[^ “] + [“ ‘],
Тогда дискретная модель (3.10) принимает вид
Г—1
х (kh + h) = Г ^1 х (kh) + I L (kh),
LO 1J L h J
. y(kh) = [l 0] x (kh). 3'
Пример 3.?. Электромотор
Простая, нормализованная модель электромотора постоянного тока (см. пример А. 2 из приложения А) имеет вид
Г—1 ОТ Г 1 I
х = I I х + I и,
L 1 oj Lol
р = [0 1]х.
Преобразование Лапласа дает Ts + l ОТ-1 1 rs
(5/-Л) =1-1 J =Нпг[1
Ah Г e~h 01
Откуда Ф = е = I
Ll—e_/l 1J
1
s + 1
1
Решение уравнения состояния
Дискретная стационарная система может быть описана разностными уравнениями
х(й+ 1) = Фх(^) + Ги(й) y(k) = Cx(k).
(3.12)
(Здесь для простоты период квантования принят равным единице времени, т. е. h — 1.) Предположим, что даны х(/г0) и входные сигналы и(/г0), w(feo4-l)...Как в этом случае
изменяется состояние системы?
Систему уравнений (3.12) можно решить просто, выполнив итерации: ,
х (^о + 1) = Фх (&о) + Гн (/г0),
х (й0 + 2) = Фх (й0 + 1) + Ги (k0 + 1) =
= Ф2х (М + ФГи (й0) + Ги 1),
х(/О = Ф*-М6о) + Ф*-*”~1Гы(/го)+ ...+Гы(Л —1) = fe-i
= Ф*-*»х(*о)+Е ®k-'-lTu(i). (3.13)
i=ka
Полученное решение состоит из двух частей: одна зависит от начальных условий, другая является взвешенной суммой входных сигналов.
Инверсия квантования
Квантование определяет отображение непрерывных систем типа (3.1) в дискретные типа (3.6). Простой пример показывает, что это отображение не всегда обратимо.
Пример 3.3
Не существует дифференциального уравнения первого порядка, которое после квантования приводило бы к разностному уравнению
х (kh + Л) = —0,5jc (kh) + и (kh), поскольку уравнение
e“ft=-0,5
не имеет действительного решения, так как экспоненциальная функция всегда положительна.
Таким образом, модель (3.6) более общая," чем (3.1). Однако если матрица Ф не имеет действительных отрицательных собственных значений, то существует соответствующая непрерывная система, получающаяся в результате решения (3.7) и (3.9) относительно А и В. Из (3.7) следует, что
А = [In (Ф)]/Л = In (Ф'/Л),
где 1п(Ф)—матричная логарифмическая функция (вычисление 1п(Ф) рассмотрено в приложении В).
♦♦♦ Заметим, что 1п(Ф) иногда не единствен.
Уравнение (3.9) дает
В = Т“1Г.
Если система не содержит интеграторов, то Ф — / не вырождена, и из (3.9) имеем
в = W-,r = (ЛЧТ1 лг = (Ф - /)-' ЛГ, (3.14)
где Ч" определяется из уравнения (3.8).
Инверсия квантования гармонического осциллятора позволяет по-другому взглянуть на проблему поглощения частот (разд. 2.4).
Пример 3.4. Гармонический осциллятор
Дискретная система
[cos ай sin ай I .... , Г 1 — cos ай 1 , , х (kh) + . , и(йй)
— sin ай cos ай J L sin ай J
может быть получена в результате квантования непрерывной системы с
5] HJ]-
„ , 2л „ ,
• где р = а + • п, п — 0, 1.....
В этом случае обратная задача имеет много решений (ср. с примерами А. 3 и В. 1). Это обычно происходит, если матрица Ф имеет комплексные собственные значения.
♦♦♦ Заметим, что всегда существует единственное р в интервале —сод, =5 р к>к, где = л/й — частота Найквиста, связанная с периодом квантования й.
Квантование систем с запаздыванием по времени
Запаздывание по времени характерно для математических моделей производственных процессов. Теория непрерывных систем с запаздыванием сложна, поскольку в этом случае системы имеют неограниченную размерность.
Пусть система описывается уравнением
х = Ах (/) + Ви {I— т). (3.15)
Предположим, что время запаздывания т меньше периода квантования. Тогда квантование системы (3.15) можно осуществить в приближении нулевого порядка.
Интегрирование (3.15) в пределах одного периода квантования дает kh+h
х {kh + h) = eAhx {kh) + eA {kh+h~s''Bu {s' — r) ds'. (3.16)
kh
Так как сигнал u{t) кусочно-постоянен в течение периода квантования, то сигнал и{1 — т) также кусочно-постоянен. Однако запаздывающий сигнал изменяется между моментами квантования (рис. 3.2). Следовательно, для вычисления инте-
грала в (3.16) удобно разбить интервал интегрирования на две части так, чтобы u(t— т) была постоянна в обеих частях. Тогда kh+h kh+x
. ..= eA<kh+h~s'}Bu(kh— h)ds'-{-kh kh
kh+h
+ eA(kh+h~s'}Bu(kh)ds' — T\u(kh — h) + Vou(kh). kh+x
Таким образом, в результате квантования непрерывной системы (3.15) получим
х (kh + h) = Фх (kh) + Го« (kh) + Г,и (kh - h), (3.17)
где Ф = eAh,
Vx = eA<h-t^eAsBds, (3.18)
О h—i
Го= J eAsBds. (3.19)
о
Модель (3.17) в терминах уравнения состояния имеет вид
Гх(М-Н)1_ГФ 1 , ГГ01 ,,,,
Lu(kh) J Lo О J L Ы (fe/г — A) J + L I J
♦♦♦ Заметим, что здесь введено г дополнительных переменных состояния u(kh — h), представляющих прошлые значения управляющего сигнала. Непрерывная система (3.15) имеет неограниченную размерность; соответствующая ей дискретная система, однако, является конечномерной. Таким образом, зна
чительно проще работать с запаздыванием, если систему подвергнуть квантованию, поскольку, чтобы точно определить состояние системы, необходимо знать значение входной величины лишь в течение интервала времени, равного времени задержки. С помощью восстановления в приближении нулевого порядка входной сигнал всегда может быть представлен конечным числом значений.
Пример 3.5. Двойной интегратор с запаздыванием
Рассмотрим двойной интегратор из примера 3.1 и введем время запаздывания О -С т sj h. Тогда
Большое временное запаздывание
Если время запаздывания больше h, то проведенный анализ надо несколько модифицировать.
Если T, — {d—1)7г-|-тх, 0 < т7 h, где d — целое число, то можно вывести следующее уравнение:
х (kh ф- h) = Фх (kh) + Гоы (kh — dh-\- Гщ (kh — dh) (3.20)
(здесь Го и Г1 получаются из (3.18) и (3.19) заменой т на т7).
Соответствующее описание в пространстве состояний имеет вид
x(kh 4- h) ф Гг Го ... 0 x(kh) ~ “O'
,u(kh — dh + h) 0 0 1 ••• 0 u(kh — dh) 0
— • + u(kh)
u(kh — h) 0 0 0 I u(kh - 2h) 0
u(kh) ООО • 0_ _ u(kh -h)_ I
(3.21)
♦♦♦ Заметим, что если т > 0, то для учета запаздывания используются d-r дополнительных переменных состояния, где г — количество входов. Характеристический многочлен при этом имеет вид №rA (/.), где А(Х,)— характеристический многочлен матрицы Ф.
Пример 3.6. Простая машина для производства бумаги
Определим квантование системы в приближении нулевого порядка
х (0 = — х (0 + и (t - 2,5)
с временем квантования h — 1. В этом случае d = 3, т' = 0,5. Уравнение (3.17) модифицируется следующим образом:
' х (k + 1) = Фх (k) + Гои (k — 2) + Гщ (k — 3),
где Ф = е~1 » 0,37,
0,5
Го = e~s ds = 1 - е“°-5 0,39,
о
0,5
г, =-= е-0,5 e~s ds = е-0>5 - е~1 ял 0,24.
о
Другие типы устройств для приближения управляющего сигнала
Чтобы получить дискретную систему из непрерывной, необходимо знать вид управляющего сигнала между моментами квантования. Выкладки значительно упрощаются при использовании приближения нулевого порядка, так как управляющий сигнал в этом случае кусочно-постоянен. Кроме того, квантование нулевого порядка часто применяется на практике ввиду простоты его реализации обычными ЦА-преобразователями. Примеры других типов аппроксимирующих устройств даны в упражнениях, среди которых типичным является система с гидромотором, в которой вырабатываются гладкие управляющие сигналы для отработки скачков чрезмерного давления.
Управляемые системы часто имеют низкие пропускные характеристики. В этом случае вид управляющего сигнала в период квантования не так важен. Если период квантования мал по сравнению с временными параметрами системы, реакция по существу определяется значением интеграла от управляющего сигнала за период квантования.
Из (3.5) следует, что изменение вида управляющего сигнала влияет на Г, но не на матрицу переходов Ф.
Пример 3.7
Рассмотрим двойной интегратор, который квантуется с периодом h. Предположим, что приближающая цепь такова, что управляющий сигнал в первой и во второй половине периода квантования соответственно равен au(k) и Р«(й). Тогда
Л Г 1 h 1 ф —. eAh — I
Lo i J
Г==а\ eA<h~s>Bds + р + 1 .
J 8 I + 4М Г
Поведение системы между моментами квантования
Дискретные модели (3.3) и (3.6) позволяют определить значения переменных состояния и выходы в моменты квантования {Д}. Кроме того, интерес представляют их значения между мо
ментами квантования. Эти значения определяются уравнением (3.2), которое может быть записано как
х(/) = Ф(/, tk)x(tk) + r(t, tk)u(tk), (3.22)
где Ф(^, 4) = еЛ<'“Ч (3.23)
T(t, tft) = J eAsBds. (3.24)
о
3.2. ПРЕОБРАЗОВАНИЕ МОДЕЛЕЙ
В ПРОСТРАНСТВЕ СОСТОЯНИЙ
Как было показано, дискретная система может быть описана с помощью модели (3.12). Так же как и в случае непрерывных систем, в пространстве состояний можно ввести новые координаты.
Предположим, что Т—невырожденная матрица, и определим новый вектор состояния z(k) = Tx(k). Тогда г (k + 1) = Тх (£ + 1) = ТФх (k) + ТГи (k) = ТФ'Г'г (k) +
+ TTu(k) = G)z(k) + fu(k) и
у (k) = Сх (k) + Du (k) = CT~'z (k) + Du (k) = Cz (k) + Du (k).
Таким образом, матрицы Ф, Г и С зависят от координаты системы, выбранной для представления состояния. Интерес представляют инварианты, полученные после преобразования.
Теорема 3.1. Характеристическое уравнение det [X/— Ф] = О является инвариантом, если новые состояния вводятся через невырожденную матрицу преобразования Т.
Доказательство
det [X/ - Ф] = det [М7-1 - ТОТ-1] =
= det Г det [X/ - Ф] det Г1 = det [%/ - Ф].
Новые координаты вводятся для получения более простой формы уравнений системы.
Диагональная форма
Предположим, что матрица Ф имеет различные собственные значения. Тогда существует матрица Т, такая что
pi О']
УФТ'1 =
О
где X, — собственные значения Ф. (Определение Т рассматривается в равд. 5.2.) В этом случае получается множество несвязанных разностных уравнений первого порядка:
Zj (k -|- 1) = ZjZ] (fe) -f- Pjtz (fe),
zn (k + 1) = (k) + $nu (k),
У (k) = y1z1 (k) + • • • + VnZn №).
Решить такую систему уравнений несложно. Каждое состояние находится по формуле fe-i
Zt. (k) = Mfr (0) + z (/)• <3-25)
/=0
Если Ф имеет кратные собственные значения, то, вообще говоря, невозможно привести ее к диагональному виду. Однако любая матрица может быть приведена к жордановой форме. В такой форме преобразованная матрица Ф имеет собственные .значения на главной диагонали и несколько единиц на наддиагонали.
Наблюдаемая форма
Предположим, что характеристическое уравнение матрицы имеет вид
det [Л/ -Ф] = М + а,Г_ *+ ... +«„ = 0 (3.26)
и что матрица
который называется наблюдаемой канонической формой. Преимуществами этой формы являются простота нахождения модели «вход-выход» и определение подходящего наблюдателя. (Точное выражение для матрицы преобразования дано в разд. 5.2.)
Управляемая форма
Предположим, что характеристическое уравнение матрицы Ф определяется формулой (3.26) и что матрица
ГС = [Г ФГ ... Ф"“2Г Ф"-1Г] (3.29)
не вырождена.* Тогда существует такое преобразование, что
преобразованная система примет вид ~а„ 0 0 z(k) + “1“ 0 0 w(A)(3.30)
z(k + 1) = । • • О - а - О а ~a„-i 0 0
Х*) = который назыв; 0 0 ••• 1 ••• bn]z(k) 1ется управляемой 0 канон и ческой _0_ фо рмой. Ее
преимущество заключается в простоте вычислений модели «вход-выход» и закона регулирования с обратной связью по состоянию. (Точное выражение для матрицы преобразования дано в разд. 5.2.)
♦♦♦ Заметим, что наблюдаемую и управляемую формы также называют присоединенными.
3.3. МОДЕЛИ ТИПА «ВХОД-ВЫХОД»
Динамическая система может быть описана как с помощью внутренних, так и внешних моделей. Внутренние модели, например модели пространства состояния (разд. 3.1), описывают все внутренние связи между переменными системы. Внешние модели выражают зависимость только между входом и выходом.
Покажем, что связь между входом и выходом для обычных линейных систем может быть выражена импульсной характеристикой. После этого докажем, что применение операторов сдвига, использующихся для непосредственного получения зависимости между входом и выходом, ведет к описанию поведения типа «вход-выход» в терминах импульсных передаточных функций.
Импульсная характеристика
Рассмотрим дискретную одномерную систему. Входной и выходной сигналы в течение конечного интервала времени могут быть представлены векторами ограниченной размерности:
= [«(/0) ... м(/Лг._1)1г,
У [у (/о) ••• У (6v-i)F-
Тогда общая модель, связывающая У с U, имеет вид
Y = HU + Yp,
где П— матрица размера N%N, а вектор Yp учитывает начальные условия. Если зависимость между U и У причинная, то матрица И имеет нижнюю треугольную форму, т. е. элемент h(k,m) равен нулю, если т > k. Уравнение для обычной линейной системы можно записать как
k
y(tk)= £ h(k, m)u(tm) + у (tk), (3.31)
m=0
где yP введен для учета начальных условий. Функция h(k,m) называется импульсной характеристикой, или весовой функцией системы. Эта функция очень удобна, так как ее легко непосредственно измерить: для этого достаточно подать на вход системы единичный импульс шириной, равной интервалу квантования, и записать выходной сигнал. Для нулевых начальных условий значение импульсной характеристики h(k,m) есть реакция системы в момент времени tk на подачу на вход единичного импульсного сигнала в момент tm. Для многомерных систем импульсная характеристика — просто матричная функция.
Для стационарных систем импульсная характеристика зависит только р,тразности k — m, т. е. h(k,m) = h(k — m).
Несложно вычислить импульсную характеристику системы, описанной мо$6лью состояния (3.12). Из (3.13) следует, что
' 6-1
Л/г) = СФь-*°х (k0) + £ СФ*“'~*Гц (/).
f1 /=feo
Таким образом, импульсная функция дискретной системы есть
fi(k) =
k < 1, /г> 1.
(3.32)
Импульсная характеристика представляет собой сумму функций вида Re {Р (/г) Лг}, где Р — многочлен от k, а — собственные значения матрицы Ф,
Теорема 3.2. Импульсная характеристика (3.32) инвариантна относительно преобразования координат пространства состояний °.
Доказательство. Введем новую координату z = Tx. Тогда импульсная характеристика преобразованной системы примет вид
h (k) = = (ст') (тот-1)*-1 тт =
= (С7”‘) 7’Ф*-17’~17Т = СФЙ-1Г = h (k).
Оператор сдвига
Оператор дифференцирования — удобный инструмент для работы с линейными дифференциальными уравнениями с постоянными коэффициентами. Для систем, описываемых линейными разностными уравнениями с постоянными коэффициентами, можно построить аналогичное операционное исчисление, в котором системы описываются операторами, преобразующими входные сигналы в выходные Для задания оператора необходимо указать его область определения, т. е. определить класс входных сигналов и описать его действие на них. В операционном исчислении принято, что все сигналы — неограниченные справа и слева последовательности {f(k): k = ... —1, 0, 1, ...}. (Для удобства период квантования выбран равным единице времени.) Оператор прямого сдвига, обозначаемый через q, обладает следующим свойством:
Если норма сигнала определена как
||f|| = sup|f(fe)|, k
oo
или ||f||2 = у, f2(k), то оператор сдвига имеет единичную = —оо
норму. Это означает, что исчисление операторов сдвига проще дифференциального исчисления, так как оператор дифференцирования неограничен. Инверсия оператора прямого сдвига называется оператором обратного сдвига и обозначается q~l. Тогда
^-7(fe) = f(fe-l).
♦♦♦ Заметим, что оператор определен на неограниченных справа и слева последовательностях, — в противном случае оператор прямого сдвига необратим. При рассмотрении проблем, связанных с характеристическим уравнением системы, как, на-
*> Имеется в виду линейное невырожденное преобразование. — Прим, ред.
пример, устойчивость и порядок системы, более удобно использо-вать оператцр прямого сдвига, а при рассмотрении проблем, связанных с причинностью, — оператор обратного сдвига.
Операционное исчисление дает компактное описание систем и упрощает определение взаимосвязей между ее переменными, так как решение разностных уравнений,сводится к чисто алгебраической задаче. Во многих разделах симол z используется для обозначения как оператора сдвига, так и комплексной переменной г-преобразования. Однако удобнее иметь разные обозначения для этих двух понятий, как это обычно делается для обозначения комплексной переменной s в преобразовании Лапласа и оператора дифференцирования р — d/dt.
Оператор сдвига используется для упрощения работы с разностными уравнениями высокого порядка. Рассмотрим уравнение
У (k + па) + а{у (k + па — 1) + ... +
+ апау (k) = bou(k + nb)+ ... + bnbu (k), (3.33) где na~^nb.
Применение оператора сдвига дает
(q™ + + • - - + апа) у (k) = (boqnb + .. . + bnb) и (k).
Введя многочлены
А (z) = zna + OjZ"0-1 + ... 4- апа,
В (2) = b^“b + blZnb~l + ... + ЬпЬ, разностное уравнение можно записать в виде
A(q)y(k)=B(q)u(k). (3.34)
В случае необходимости степень многочлена указывается нижним индексом, например Ana(q)-
Уравнение (3.34) также выражается через оператор обратного сдвига. Отметим, что (3.33) можно записать в виде
у (k) + (k — 1) + ... + апаУ (k — па) =
= boU (k — d) + ... -|- bnbu (k — d — nb), где d~na— nb— эксцесс полюсов системы. Многочлен
Л* (z) = 1 + OjZ + ... + anazna = zna A (z"1) получается из многочлена А перестановкой коэффициентов в обратном порядке. Он называется обратным многочленом. Его введение позволяет записать систему (3.33) как
A* (q~l) у (k) = В” (q~l) u(k — d). (3.35)
В операциях с обратным многочленом надо соблюдать некоторую осторожность, так как А** не обязательно совпадает с А,
Многочлен A(z) = z имеет обратный Д*(з)=1, а последний в свою очередь также имеет обратный Д**(г)—1, который, очевидно, отличается от А.
Ограничения
Цель алгебраической теории систем — свести операции с разностными уравнениями к чисто алгебраическим задачам. Из определения оператора сдвига следует, что решения разностного уравнения (3.34) не изменяются при его умножении на степень q, что означает прямой сдвиг по времени. Уравнения со сдвигом по времени также можно умножать на действитель ные числа и складывать, что соответствует умножению урав нения (3.34) на многочлен от q. Если равенство (3.34) выполняется, то также верно, что C(q)A (q)y(k) = C(q)B(q)u(k) Кроме того, полезно иметь возможность делить равенства, по добные (3.34), на многочлены от q. Например, если A(q)y(k) = = 0, то хорошо, если бы из него вытекало, что
y(k) = 0.
Если деление разрешено, то уравнение вида (3.34) разрешимо относительно y(k). Однако простой пример показывает, что нельзя делить на многочлен от q, пока не введены специальные допущения.
Пример 3.8
Рассмотрим разностное уравнение
y(k+ V)-ay(k) = u(k),
где |а| <. I. В операционной форме оно записывается так:
(q — а) у (k) = и (/г).
Если y(k0) = уо, то (3.13) дает следующее решение:
у (k) = ak~k-y0 + £ ak~,~iu(j) = ak~k,yll+ a‘~'u(k— i). (3.36) /=fe0 i=i
Кроме того, формально можно получить следующее решение операторного уравнения:
Покольку q~* имеет единичную норму, правая часть уравнения выражается через сходящийся ряд:
У W — У~1 (1 + aq-' + a2q~2 + • -.) и (k) = У а*~1и (k — /). (3.37)
Ясно, что решения (3.36) и (3.37) совпадают только при введении дополнительных условий.
Можно построить операторную алгебру, в которой разрешено деление на произвольный многочлен от q, если предположить, что существует ko> такое, что все последовательности рав
ны нулю при /г /г0. в этом случае допускаются как обычные операции умножения и деления уравнений на многочлены от оператора сдвига, так и сложение и вычитание. Однако это предположение, которое используется в настоящей книге, означает, что начальные условия разностных уравнений равны нулю.
Если на входную последовательность не накладываются ограничения, то можно построить несколько иную алгебру оператора сдвига, которая разрешает деление только на многочлены с корнями внутри единичного круга. Это отражает тот факт, что влияние начальных условий на устойчивость системы при известных обстоятельствах часто оказывается ничтожным. Такая алгебра несколько сложнее, так как в ней не определено обычное деление.
Импульсный передаточный оператор
Использование операционного исчисления позволяет выражать зависимость «вход-выход» как рациональную функцию от оператора прямого или обратного сдвига. Эту функцию, называемую импульсным передаточным оператором, легко получить чисто алгебраическими преобразованиями любого описания системы, исключив внутренние переменные.
Рассмотрим, например, модель в терминах пространства состояния (3.6). Для получения уравнения «вход-выход» необходимо исключить вектор состояния. Из (3.6) следует
х (k + 1) = qx (k) — Фх (k) + Ги (k), откуда
(qj - Ф) х (k) = Ги (fe).
Тогда
у (k) = Сх (k) + Du (k) = [C {ql - Ф)~* Г + О] и (k).
Таким образом, импульсный передаточный оператор системы (3.6) имеет следующий вид:
H(q) = C(qI -Ф)~'Г + D.
Его также можно выразить с помощью оператора обратного сдвига:
//• (<?-*) = С (I - «Т'ФГ^-’Г + D = H (q).
Следовательно, импульсный передаточный оператор системы (3.6)—это матрица, элементы которой есть рациональные функции от q. Для одномерной системы
Н (?) = С [ql - ФГ1 Г + D = В (q)/A (?). (3.38)
Если размерность вектора состояния равна п, а многочлены A(q) и B(q) не имеют общих множителей, то степень многочлена А равна п. Из (3.38) следует, что многочлен А также является характеристическим многочленом матрицы Ф. Это озна
чает, что модель «вход-выход» можно записать как
у (k) + щу (k — 1) + ... + any(k — п) = bou(k) + ... + bnu(k — n).
В общем случае в цифровых системах управления Ьо = 0, т. е. в дискретных моделях нет одновременности: обычно сначала измеряется y(k) и только потом определяется u(k). Таким об разом, u(k) не влияет на y(k), даже если в непрерывной системе есть «одновременность».
Пример 3.9
Рассмотрим двойной интегратор (пример 3.1) при h— 1. Из (3.38) имеем
oip-1 -1 Г Г °-5 UP.-5 (9 + 1)^
L о g-l J L 1 J (д-1)2
0,5 (д-1 + д-2)
1 — 2д-‘ + д“2’
Пример 3.10
Положим h — 1 для двойного интегратора и введем временное запаздывание 0,5 с. ТогЛа из (3.17) и примера 3.5 получаем
Я(д) = С(д/-Ф) 1(Г0 + Г,д-1) = гд-! 1 1
L 0 д-1 J ГО, 125 + 0,375д--1
11 01 (д-1)2 L 0,5 + 0,5g-1 J
0,125 (д2 +6д + 1) 0,125 (д~'+ 6д~2 + д~3)
~' д(д2 —2д+1) ~ 1—2д-‘ + д—2
Пример 3.11
Рассмотрим систему, записанную в наблюдаемой канонической форме
д(/г) = [1 0]х(/0.
Импульсный передаточный оператор имеет вид
btq + b2 bjq-' + b^-' g2 + a,g + o2 1 + a,q~' + <z2g“2
Таким образом, ai и bi в канонической форме определяют многочлены А и В соответственно. Это справедливо для n-мерных систем как в наблюдаемой, так и управляемой формах.
Теорема 3.3. Импульсный передаточный оператор Н (<?) для модели в пространстве состояний не зависит от выбора пространства состояний..
Таблица 3.1. Квантование непрерывной системы G (s)
H(q)
G(s)
1
Л'
1
Л'2
г-**
а
? + с
а
s(s + а)
д2
(s + а)2 ab
6' + a)(s 4- bj
(s + с)
(j + a)(s + b)
s1 + 2C&>os + &>o
h
4 ~ ।
h2(q + 1,
2(9 ~ D-
9~‘
1 — qxp(—c/i) q — exp (—ah)
bi = — 1 + e~aK) bi = -1-(1 — e~ob — ahe~‘,f!)
<71 = —(1 + e~ah) аг — e~ah
bi = 1 — e~o/,(I + ah) Л? = e~ah(e~ah + ah — 1)
ai = —2e~ah аг = e~2ab
b fe(l — e"n)l) - c(l ehb)
1 i> - a
_ c(l — e-i<i)e-a.i fe(| — e-n/i)e-iA
2 b - a
ai = - (e~°b 4 e~th)
a2 = e-ta+b1h
b = eMl — ea* + (l—e bb)c]b — (1 — e~ah)clg
1 b — a
bt в „л“(а+Л)Л _L Ь C -ah I C a
2 ab b(a - b) a(a - b)
ai = — e~ah — e~bb ai — e~,a+b>h
bl = a2 +a(^}' - P]
at = —2aP
ai = a2
bi = ^e~C‘Mh sin ((ah)
ci = —2e~^C№h cos (cah)
s
s2 + 2?<a0i +
ca caoVl — C2 f < 1
a =
P = cos (cah) у = sin (cah)
bi = —bi ca = coo-%/1 — 42
a2 = С“2<адЛ
Примечание. Эквиваленты непрерывной системы даны в приближении нулевого порядка. Дискретные системы опнтаиы передаточными операторами. Для систем второго порядка оператор задается коэффициентами в выражении Н (о) = —г—1" ,
q1 + а,д + аг
Доказательство. Пусть заданы импульсный передаточный оператор
Я(9) = С(?/-Ф)-1Г
и матрица преобразования Т. В новых координатах
Н (q) = C(ql - Ф)-1 Г = CT~l (qTT~l - ТФТ-1)^ ТГ =
= СТ~‘ [Г (<?/ — Ф) Г-1]-1 7Т =
= СТ-'Г (ql - Ф)-1 Т~ЧТ = C(qI~ Ф)'1 Г == Н (q).
Модели «вход-выход» для системы в приближении первого порядка можно получить, используя соотношения (3.7) и (3.38). Для упрощения вычисления импульсного передаточного оператора H(q) удобно воспользоваться табл. 3.1, в которой даны H(q) для некоторых стандартных функций.
Полюса, нули и порядок системы
Корни знаменателя в H(q), т. е. характеристического многочлена, называются полюсами системы. Нули системы — это полюса обратной системы; они получаются из уравнения В(г) — = 0. Так, система, рассмотренная в примере 3.9, имеет один нуль в —1 Ичдва полюса в 1.
Временное запаздывание в системе ведет к появлению полюсов в начале координат. Система, описанная в примере 3.10, имеет три полюса (два в 1 и один в начале координат) и два нуля:—3±д/8. Размерность пространства состояний, или, что то же самое, количество полюсов системы, определяют порядок системы.
♦♦♦ Заметим, что для учета запаздывания при определении порядка системы следует использовать форму прямого сдвига. Вообще говоря, определение полюсов, нулей и порядка системы — это те случаи, когда необходима форма прямого сдвига.
3.4. Z-ПРЕОБРАЗОВАНИЕ
Удобным средством изучения линейных разностных уравнений с начальными условиями и без них является дискретный аналог преобразования Лапласа или г-преобразование. Такое преобразование отображает полубесконечную последовательность дискретных значений на комплексную плоскость. Следует обратить внимание на разницу в обозначениях для г-преобразова-ния и оператора сдвига. Переменная z — это комплексная переменная, которую следует отличать от оператора q.
Определение z-преобразования. Рассмотрим дискретный сигнал {f(/j): /г = 0, 1, ...}. /-преобразование такого сигнала определяется соотношением
оо
F{z)=^f{kh}z~k, (3.39)
fe=0
где z—комплексная переменная, (/-преобразование f обозначается через Zf или F.) Обратное преобразование осуществляется по формуле
f(kh) = ^r&F(z)z^'dz, (3.40)
Z/J Lt
где контур интегрирования включает все полюса F(z).
Пример 3.12
Пусть y(kh) = kh для k 0. Тогда
hz
У (z) = 0 + hz~' + 2hz~2 + ... = h (z-1 + 2z“2 + ...)= 2 .
\z и
Некоторые свойства г-преобразования приведены в табл. 3.2.
Таблица 3.2. Некоторые свойства z-преобразования
1. Определение
F (z) = f(kh)z-k fe=0
2. Обратное преобразование f(feh)=-^r^F(z)zfc-1dz
3. Линейность £(af + |)g) = a£f +
4. Сдвиг по времени
3£q-nf = Z-"F,
{qnf} = zn(F - Ft),
где
n—I
Л (z) = £ f UV Z~1 i~o
5. Теорема о начальном значении
lira f (kh) = lim F (z)
fe -> 0 Z -> oo
6 Теорема о конечном значении
Если (1 — z~’) F (z) не имеет полюсов на границе или вне единичной окружности, то
lim f(kh)= lim (l-z-')F(z)
fe -> oo Z -> 1
7. Свертка
£f*g = Z£f(n)g(k-n) = £f£g n=0
♦♦♦ Заметим, что формулы для прямого и обратного временного сдвига неодинаковы. Это следствие допущения полубесконечности временных последовательностей.
/-преобразование можно использовать для решения разностных уравнений, например
x(k+ 1) = Фх(/г) + Ги(/г), y(k) = Cx(k).
Выполняя z-преобразование для обеих частей
£z kx(k+ 1) = z Г £ z~kx (/г) — х (0) | = fe=o L*=o J
— £(I>z-kx(k) 4- ^Vz~ku(k),
U 0
получаем
z [X (г) - X (0)] = ФХ (z) + W (z)
X (z) = (zl — Ф)-1 [zx (0) + ГУ (z)] и
Y (zf= C (zl - Ф -1 zx (0) + C (zl — Ф)-1 YU (z,.
Тогда можно ввести импульсную передаточную функцию вида
H(z = С(г/-Ф)-1Г, (3.41)
что идентично (3.38) с заменой q на г. Осуществляя обратное преобразование, получаем последовательность y(k).
Теорема 3.4. Импульсная характеристика (3.32) и импульсная передаточная функция связаны г-преобразованием.
Нахождение импульсной передаточной функции
Импульсную передаточную функцию можно непосредственно определить из непрерывной передаточной функции. Пусть на
H(z)
Рис. 3.3. Квантование непрерывной системы
вход системы с передаточной функцией G(s) подаются сигналы нулевого приближения (рис. 3.3). Реакция системы на входной сигнал однозначно определяет импульсную передаточную функцию. Рассмотрим, например, систему с единичным ступенчатым входом. В этом случае члены последовательности (u(kh)} равны единице и сигнал u(t) также является единичной ступенью. Пусть У(я) есть преобразование Лапласа функции y(t), т. е. Y(s) = G(s)/s, а дискретный выход (y(kh)} имеет z-преобразо-вание вида У = S&y — У. В результате деления V на входную импульсную передаточную функцию, равную z/(z— 1), имеем
H(z) = (l-z~l)Y(z). (3.42)
Таким ооразом, для нахождения импульсной передаточной функции необходимо (1) определить оригинал преобразования Лапласа (j(s)/s\ (2) найти соответствующее г-преобразование (обычно табличное); (3) произвести умножение на 1 — z~l для получения импульсной передаточной функции с нулевым порядком приближения.
Для комбинирования первого и второго шага может быть использована табл. 3.3; в которой приведены некоторые функции времени и их преобразования Лапласа и г-преобразования.
Таблица 3.3. Некоторые функции времени и их преобразования Лапласа и z-преобразования
f Zf
1 1 Z •
S 2 — 1
kh 1 hz
S2 (г - I)2
1/2 (kh)2 1 S3 h2z (z + 1) 2 (z - I)3
e-MHT Т z
1 + sT z-e~h‘T
l-e~kf4T 1 zli-e-W}
s (1 +sD (z - 1) (z - e~hlT)
sin (£>kh со z sin oh
s2 + со2 z2 — 2z cos a>h + 1
Примечание. Используйте таблицу только так, как рекомендовано!
♦♦♦ Заметим, что в табл. 3.3 не определяет квантование нулевого приближения системы с передаточной функцией Sf. Требуемая импульсная передаточная функция находится с помощью следующей процедуры.
При отсутствии в непрерывной системе «одновременности» справедливо (3.42), a H(z) задается соотношением
ц и = Е jzbRes {£^f-L ° (S)J <3-43’
где si — полюса G(s).
3.5. ПОЛЮСА И НУЛИ
Для характеристики систем с рациональными передаточными функциями удобно использовать понятия полюсов и нулей передаточной функции. Это в свою очередь требует установления
связи между полюсами и нулями непрерывной системы и соответствующей ей дискретной системы.
Полюса
Рассмотрим непрерывную систему, описываемую n-мерной моделью в пространстве-состояний:
х — Ах + Ви,
у — Сх. (3.44)
Полюса системы — это собственные значения матрицы А, которые обычно обозначаются через Х/(А), i=l, ..., п. Квантование в приближении нулевого порядка системы (3.44) дает дискретную систему
х (kh + h) = Фх (kh) + Ги (kh),
у (kh) = Сх (kh), (3.45)
полюсами которой являются собственные значения матрицы Ф, Х/(Ф), i=l, ..., п. Так как Ф = ехр(А/г), то из свойств мат-
Рис. 3.4. Конформное преобразование г — exp (sh).
ричной функции (см. приложение В) следует, что
Уравнение (3.46) задает отображение
(3.46) полюсов непрерывной
Каждая полоса на левой s-полуплоскости отображается в единичный круг. Это означает, что обе пары полюсов pt и р2 отображаются в пару р.
На рис. 3.4 показано отображение комплексной s-плоскости на z-плоскость, когда z = exp(s/z). В частности, левая s-полуплоскость отображается в единичный круг на z-плоскости.
Рис. 3.6. Реакция на ступенчатое воздействие дискретной системы, описанной в примере 3.13, для различных значений h при £ = 0,5 и too = 1,83.
Время разгона Гг=1
Однако такое отображение не является взаимно однозначным, поскольку несколько точек на s-плоскости отображаются в одну точку на z-плоскости (рис. 3.5). Это еще одна иллюстрация эффекта поглощения частоты, рассмотренного в разд. 2.4. Для основной полосы So (рис. 3.5) существует простая связь между полюсами непрерывной и дискретной систем (ср. с при* мером 3.4). :
Рис. 3.7. Годограф постоянных ь и <ооЛ при квантовании (3.47)
Пример 3.13
Рассмотрим непрерывную систему cog
s2 + 2gw0s + <0^
Полюса соответствующей дискретной системы находятся из характеристического уравнения
z2 + atz + a2 = 0,
где
а, = - cos (71 - £2 ы0/г), a2 = e-^ah
(ср. с табл. 3.1). Реакции дискретной системы на ступенчатое воздействие для различных периодов квантования при соо=1,83 и £ = 0,5 показаны на рис. 3.6, а отображение полюсов непрерывной системы при ее квантовании в единичный круг для различных значений £ и ссчЛ — на рис. 3.7.
Нули
Для описания отображения нулей невозможно получить простую формулу. Если непрерывная передаточная функция рассматривается как рациональная, то нули системы совпадают с корнями числителя, и, кроме того, имеется d = r—1 нулей в бесконечности (здесь г — эксцесс полюсов непрерывной передаточной функции, т. е. разность между количеством полюсов и нулей).
Для коротких периодов квантования дискретная система имеет нули в точках
sfh Zj ~ е ‘ •
где Si — нули непрерывной системы, г—1 нулей, соответствующих нулям в бесконечности непрерывной системы, при стремлении периода квантования к нулю будут стремиться к значениям корней многочлена Zr (табл. 3.4), так как при больших s передаточная функция непрерывной системы задается приближенным равенством G(s) та s~r.
Таблица 3.4. Числитель Zr при квантовании s~r
Г zr
1 1
2 г+1
3 z2 + 4z + 1
4 z3 + llzz+ 11г+ 1
5 г4 + 26г3 + 66zz + 26г + 1
Пример 3.14
Рассмотрим непрерывную передаточную функцию
2
(s + 1) (s + 2) *
С помощью табл. 3.1 найдем нуль импульсной передаточной функции
(1 _ e-2h) e~h - 2 (1 - e~h) e~2h
Z 2 (1 — e-ft) — (1 — e~2ft) ’
При небольших h z ~ —1 + 3/i и при уменьшении h нуль системы стремится к —1. При увеличении h нуль приближается к началу координат. (Нули для небольших значений h можно получить из табл. 3.4.) Эксцесс полюсов непрерывной системы равен двум. При достаточно малых h дискретная система будет иметь нуль в точке zr(z) = г + 1 = 0.
Нули дискретной системы, полученной квантованием непрерывной системы, зависят от используемой приближающей цепи.
Пример 3.15
Рассмотрим двойной интегратор (пример 3.7). Его приближающее устройство вырабатывает управляющий сигнал au(k) в течение первой половины периода квантования и $u(k) в течение второй половины периода квантования. Импульсная передаточная функция системы задается следующим соотношением:
и 1-\ г< Л1 t-r л\-1г _ Л2 [г (За + 0) + (а + 3₽)]
** \z) [1 Ф (zl Ф) 1 8 (г I)2
Низкочастотное усиление определяется значением а + р. Пусть а + Р — 2. Тогда импульсная передаточная функция будет иметь нуль в точке
а + ЗР 3 — а
2 За + Р 1 +а'
Таким образом, выбирая подходящие а, можно варьировать нулем импульсной передаточной функции. При значении а = 1, соответствующем нулевому приближению, г = —1, а при а = 3 имеем г = 0.
Аналогичное рассмотрение возможно и в случае систем п-го порядка. Можно показать, что нулям системы можно придавать произвольные значения, если управляющий сигнал постоянен в течение каждой n-й части периода квантования. Такая приближающая цепь реализуется высокочастотным квантованием управляющего сигнала. Однако эта идея не нашла широкого распространения, так как при этом возможна сильная нерегулярность управляющего сигнала.
Системы, имеющие неустойчивые обратные
Непрерывная система с рациональной передаточной функцией неминимально-фазовая, если она имеет нули в правой полуплоскости или временное запаздывание. Аналогично дискретная система неминимально-фазовая, если ее нули лежат вне единичной окружности. Это означает, что запаздывание не определяет неминимально-фазовость системы. Вместе с тем она не приводит к таким сложнейшим задачам, как в непрерывных системах. Таким образом, в случае дискретных систем целесообразнее говорить о системах с устойчивыми обратными или без них.
Определение неустойчивой обратной системы. Система, обратная к данной дискретной, неустойчива, если она имеет нули вне единичной окружности.
Непрерывная система с устойчивой обратной после квантования может стать дискретной системой с неустойчивой обратной. Из табл. 3.4 следует, что обратная система всегда неустойчива, если эксцесс полюсов непрерывной системы больше двух, а период квантования достаточно мал. Однако непрерывные, неминимально-фазовые системы не всегда становятся дискретными системами с неустойчивой обратной.
Пример 3.16
Передаточная функция G (s) = . , имеет неустойчивый нуль
(S т- 2) (3 “г о)
з=1. Квантование системы дает дискретную импульсную передаточную функцию с нулем в точке
8е~2Л - 9е~зл + е~5/*
21 “ 1 — 9е-2й 4- 8е~зл
При h « 1,25, «1 = — 1; для больших h нуль всегда лежит внутри единичной окружности и система, обратная к данной дискретной системе, устойчива.
3.6. ВЫБОР ЧАСТОТЫ КВАНТОВАНИЯ
Значение выбора правильной частоты квантования уже обсуждалось в разд. 2.5. Слишком длинный период кванювания не
Рис. 3.8. Пример квантования синусоида льного и экспонеициально. о сигналов.
Время разгона обоих сигналов ?г=1.
позволит осуществить восстановление непрерывного сигнала, слишком короткий увеличит загрузку ЭВМ. Рассмотрим, как связан выбор частоты квантования с полюсами непрерывной системы.
Для характеристики периода квантования полезно иметь безразмерную величину, имеющую определенный физический смысл. Для колебательных систем ее естественно связать с периодом колебаний, а для неколебательных с временем разгона. Определим Nr как число периодов квантования за время разгона:
Nr = TTlh,
где 7г —время разгона. Нижний предел для этой величины дает теорема квантования Шеннона. Для чисто синусоидальных сигналов Nr ~ 0,32, однако, восстановление Шеннона довольно сложно.
Для систем первого порядка время разгона равно постоянной времени, поэтому разумно выбирать Nr между 2 и 4. Тогда для систем второго порядка с затуханием £ и собственной частотой coo время разгона определяется как
Тг = <^е^,
где Е; = cos (р. Для затухания около £ = 0,7 это дает (о0/г
0,5— 1 (<йо измеряется в рад/с).
Период квантования для различных видов сигнала показан на рис. 3.6 и 3.8. Как правило, его следует выбирать в пределах Nr = Tr/h «2 — 4.
ЗАДАЧИ
3.1. Имеется система
х = — ах-}- Ьи,
у = сх.
Предположим, что входной сигнал постоянен в течение периодов продолжительностью h. Постройте соответствующую дискретную систему и покажите, как меняются ее полюса в зависимости от периода квантования h.
3.2. Напишите уравнения дискретных систем, соответствующих следующим непрерывным системам (в приближении нулевого порядка):
. dX _ г о 11 го-1
а) dt [-! ojx+LlJW’
г/ = [1 0] х;
«)-& + 34+'2!'“-аг + 3“:
в) $=»
3.3. Предположим, что следующие разностные уравнения:
а) у (kh) — 0,5г/ (kh — h) = 6u (kh — h)-, Г— 0,5 11 Г °>51
б) х (kh + h) = 0 _ 0 3 j х (kh) + [ 0 7 J «(^),
y(kh)—\\ l]x(kh);
в) у (kh) + 0,5г/ (kh — h.) = f)u (kh — h)
описывают непрерывную систему, квантованную в приближении нулевого порядка с периодом квантования h. Если возможно, восстановите исходную непрерывную систему.
3.4. Имеется гармонический осциллятор [см. пример А. 3 или задачу 3.2(a)], Определите реакцию на ступенчатое воздействие в моменты 0, h, 2h, ..., если период квантования h = n/2, /г = л/4. Сравните с аналогичной реакцией непрерывной системы.
3.5. Проквантуйте систему с передаточной функцией G(s) = = 1/s, используя приближение первого порядка.
3.6. Рассмотрим систему, изображенную на рис. 3.1. Предположим, что входной сигнал есть сумма импульсов в моменты квантования, т. е. ц(/)=^б(/ — kh)u(kh). Определите дискретное представление системы.
3.7. Найдите матрицу преобразования Т, которая переводит представление двойного интегратора (3.11) из формы пространства состояний в управляемую каноническую форму.
x (kh) +
x
3.8. Определите импульсную передаточную функцию системы Г 0,5 — 0,2 [ 0 0
y(kh) = [\ O]x(kh).
3.9. Многие физические системы можно описать с помощью уравнения вида
dx _ dt
— а b с — d
где а, Ь, с и d — неотрицательны. Напишите формулу дискретной системы нулевого приближения. (Ключ. Сначала покажите, что система имеет действительные полюса.)
3.10. На рисунке изображена система, состоящая из двух ре-
и,
зервуаров. Входной сигнал—поток жидкости в первый резервуар, а выходной.— ее уровень во втором. Используя уровни в качестве переменных состояния, получаем систему уравнений
0,0263
0
dx
~dt ’
и,
— 0,0197 0
0,0178 —0,0129. У = [0 1]х.
Проквантуйте систему с периодом h — 12; покажите, что оператор импульсного перехода системы имеет вид
„ , . 0,030? + 0,026
"° ~ q2 — 1,65? + 0,68
3.11. Нормализованное описание мотора дано в примере А. 2. Докажите, что соответствующая дискретная система описывается уравнениями (А.6). Определите импульсную передаточную функцию; импульсную характеристику; разностное уравнение, связывающее входной и выходной сигналы; изменение по
люсов и нулей импульсной передаточной функции в зависимости от периода квантования.
3.12. Непрерывная система с передаточной функцией G(s) = ==(l/s)e-st квантуется с периодом h—1 при т = 0.5. Определите порядок дискретной системы в представлении дискретной системы в пространстве состояний; импульсную передаточную функцию и импульсную характеристику дискретной системы; полюса и нули дискретной системы.
3.13. Решите задачу 3.12 при условии, что G (s) =-^—р и
т= 1,5, h — 1.
3.14. Имеется дискретная система y(k -f- l) = ay(k)A~b3u(k— 3)-|--j-64« (& — 4) с периодом квантования 1 с. Покажите, что эта система может быть получена квантованием системы
= — ау (t) + bu(t — т), где
__л In (о^З + ^4)/(&3 + Ьа)
1п а
3.15. Имеется система
у (k) — 0,5у (k — 1) = и (k — 9) + 0,2« (k — 10).
Найдите многочлены A(q), B(q), А* (у-1) и B*(q~l) в представлениях
A (q) у (k) = В (q) и (k)
И
A*(q-l)y(k) = B*(q-l)u(k-d).
Определите d и порядок системы.
3.16. Фильтр с импульсной передаточной функцией
H*(q-') = b0 + biq-' + ...+bnq~''
называется фильтром ограниченной импульсной реакции.
Определите порядок системы и дайте ее представление в пространстве состояний в наблюдаемой канонической форме.
3.17. Используйте г-преобразование для определения выходной последовательности разностного уравнения
у (k + 2) - l,5i/ (k + 1) + 0,5у (k) = u(k + 1),
если u(k) — ступень при k = 0 и если у(0) = 0,5, а у(—1)= 1.
3.18. Покажите, что
(Сверьтесь с табл. 3.3.) Используйте формулу для определения импульсной передаточной функции двойного интегратора (пример А. 1).
3.19. С помощью уравнения (3.43) определите импульсную передаточную функцию системы (задача 3.1) и нормализованного мотора (пример А.2).
3.20. Покажите, что изображение коэффициента затухания £ на s-плоскости при отображении z = exp(sh)—это логарифмическая спираль на z-плоскости.
3.21. Если р < а, то (s + ₽)/(« +а) ^называется фазоопережающим звеном (т. е. оно дает опережение фазы). Рассмотрите дискретную систему: (z + b)/(z + а) и определите, при каких условиях она является фазоопережающим звеном. Смоделируйте импульсную характеристику для различных нулей и полюсов.
3.22. Имеется система
г + Ь
(1 + b) (z2 - l,lz + 0,4)
полюса которой соответствуют непрерывной системе с затуханием t = 0,7. Постройте модель системы и определите перерегулирование для различных значений b в интервале (—1, 1). 3.23. Проквантуйте устойчивую непрерывную систему G(s) = = (s 4- b) / (s + а), где a=j^b, с периодом h. Определите условия, при которых система имеет устойчивую обратную.
ЛИТЕРАТУРА
Первые работы по дискретным системам
1. Jury Е. I. (1958): Sampled-Data Control Systems. New York: John Wiley. [Имеется перевод: Джури Э. Импульсные системы автоматического регулирования.— М.: Физматгиз, 1963.]
2. Ragazzini J. R., Franklin G. F (1958): Sampled-Data Control Systems. New York: McGraw-Hill.
3. Цыпкин Я 3. Импульсные системы автоматического регулирования. — М.: Физматгиз, 1958.
посвящены исключительно моделям «вход-выход» и теории преобразования. Подход, изложенный в данной главе, позволяет значительно упростить операции в случае дискретных систем: при нулевом приближении управляющий сигнал постоянен в течение периода квантования, а дискретная модель получается простым интегрированием уравнений состояния в пределах одного периода квантования. Эта проблема была рассмотрена в работе
4. Kalman R. Е., Bertram J. Е. (1958): “General Synthesis Procedure for Computer Control of Single and Multiloop Linear Systems”, AIEE Trans. 77, 602-09. Потребовалось некоторое время, чтобы этот подход нашел отражение в фундаментальных работах. Теперь благодаря своей простоте он является доминирующим.
Преобразование переменных состояния в канонические формы — привычные вещи в теории пространства состояний Они очень близки соответствующим результатам для непрерывных систем. Более подробно об этом говорится в книге
5. Kailath Т. (1980). Linear Systems Englewood Cliffs, N. J.: Prentice-Hall, Inc.
Исторически подход «вход-выход» предшествовал подходу пространства состояний. В упомянутых работах исследования проводятся именно с этой точки зрения. Многомерный случай рассматривается в работах
6. Rosenbrock Н. Н. (1970): State-Space and Multivariable Theory. London: Nelson.
7. Kucera V. (1979): Discrete Linear Control. Prague: Academia.
Z-преобразование
8. Jury E. I. (1958): Sampled-Data Control Systems. New York: John Wiley. Second printing: Krieger, 1977.
9. Jury E. I. (1964): Theory and Application of the Z-Transform Method. New York: John Wiley. Second Printing: Krieger, 1973.
10. Doetsch G. (1971): Guide to the Applications of the Laplace and Z-Transorm. New York: Van Nostrand Reinhold
(приводятся большие таблицы связанных Z-преобразований).
Таблица эквивалентов нулевого приближения передаточной функции (ср. с табл. 3.1) содержится в работе
11. Neuman С. Р., Baradello С. S. (1979): “Digital Transfer Functions for Microcomputer Control”, IEEE Trans. Sys., Man and Cybernetics Smc-9, 856-60.
Связь нулей непрерывных и дискретных систем
12. Astrom К’ J., Hagander Р., Sternby J. (1980): “Zeros of Sampled Systems”, Proc. 19th IEEE Conf, on Decision and Control, Albuquerque, 1077-81.
В этой статье приводятся теоремы для ограниченных нулей при больших и малых периодах квантования. По-видимому, в данной работе впервые сделан вывод о возможности помещения нулей дискретной системы в произвольные точки с помощью выбора соответствующей приближающей цепи.
Модели, ориентированные на объект управления
Построение математических моделей, описывающих связи между Непрерывными сигналами в дискретной системе
ВВЕДЕНИЕ
В гл. 3 были построены математические модели дискретных систем в случае применения ЭВМ. Эти модели достаточно просты: в них управляемый и управляющий сигналы рассматриваются только в моменты квантования, синхронизированные с таймером системы, и обрабатываются ЭВМ как последовательности чисел. Это позволяет не учитывать зависимость дискретных систем от времени, и система с квантованием описывается как стационарная, дискретная система. Такая модель получила название стробоскопической. С ее помощью можно решать задачи анализа и синтеза дискретных систем оптимального управления, а также получать полное описание системы в случае применения ЭВМ. Однако этого иногда бывает недостаточно. Поэтому полезно иметь другие модели, которые дают более детальное описание системы. Они необходимы при рассмотрении цифровой системы управления со стороны процесса, например когда частотная характеристика снимается в ее аналоговой части. Подобные модели неизбежно оказываются более сложными, чем описанные в гл. 3, поскольку они должны учитывать периодическую природу системы.
4.1. ЦИФРОВАЯ СИСТЕМА УПРАВЛЕНИЯ
Принципиальная схема цифровой системы управления показана на рис. 4.1. В отличие от системы, рассмотренной в гл. 3, контур управления которой разрывался внутри ЭВМ, т. е. между АЦ- и ЦА-преобразователями (например, в точке С), в данном случае контур управления разрывается в аналоговой части системы (например, в точке Л).
Рассмотрим более подробно последовательность операций в цифровой системе управления. В ЭВМ выполняются следую-
щие операции: (1) ожидание импульса от таймера; (2) аналого-цифровое преобразование; (3) вычисление управляющей переменной; (4) цифро-аналоговое преобразование; (5) изменение
Рис. 4.1. Принципиальная схема цифровой системы управления.
состояния регулятора; (6) переход к операции (1). Так как на каждую операцию в ЭВМ отводится определенное время, между второй и четвертой операциями существует задержка. Связь между различными сигналами в системе показана на рис. 4.2. При реализации закона управления на ЭВМ программу надо
этапе выполнения операции (3) (см. гл. 15).
Важное значение имеет также точное описание синхронизации сигналов. Моменты квантования при анализе выбираются произвольно как моменты времени, в которые заканчивается ЦА-преобразование. Из-за прерывистости управляющего сигнала существенную роль играет точность определения точек разрыва. В связи с этим принято соглашение о его непрерывности справа.
ффф Заметим, что реальный входной сигнал объекта управления непрерывен из-за ненулевого времени установки ЦА-преобразователя и воздействующего устройства.
4.2. МОДУЛЯЦИОННАЯ МОДЕЛЬ
Характерной чертой цифровых систем управления с приближением нулевого порядка является постоянство управляющего
сигнала в течение периода квантования. Ранее (гл. 3) это свойство использовалось для описания поведения системы между моментами квантования при интегрировании уравнений системы на интервале квантования. В данном случае делается попытка описать процесс между моментами квантования. Для этого требуются иные математические модели,-поскольку теперь сигналы должны рассматриваться не как последовательности (функции, отображающие Z в R), а как непрерывные функции (функции, отображающие R в R). В связи с этим центральной задачей является построение модуляционной модели. Главная трудность при этом заключается в необходимости явно учитывать периодическую природу дискретных систем. Последние можно представить как амплитудный модулятор, последовательно соединенный с линейной системой, а модулирующий сигнал — как последовательность прямоугольных импульсов. Дальнейшая идеализация достигается их заменой на импульсы. Такая модель впервые была предложена в ранних работах по системам квантования Макколлом, Линвилом и др.
В частном случае цифрового управления с алгоритмом единичного усиления и незначительными временными задержками совокупность АЦ-преобразователя, ЭВМ и ЦА-преобразова-теля можно описать как систему, которая квантует аналоговый сигнал и вырабатывает другой аналоговый сигнал, непрерывный в течение периодов квантования. Такие цепи называют квантующими цепями с кусочно-постоянным восстановлением *. АЦ-преобразователь также можно представить как КВЦ. Восстанавливающая цепь поддерживает постоянное аналоговое напряжение в течение преобразования в цифровое представление.
Модель КВЦ
Принципиальная схема аналоговой КВЦ показана на рис.4.3. Предполагается, что к цепи подсоединен усилитель с очень большим полным входным сопротивлением. Принцип работы цепи состоит в следующем: при замкнутом квантующем переключателе конденсатор заряжается до входного напряжения через сопротивление R-, если же переключатель открыт, конденсатор сохраняет свое напряжение до следующего переключения.
Для описания операций включения и выключения квантующего переключателя в системе введена функция, которая задается следующим образом:
( 1, если переключатель замкнут; m (/) — (
( 0, если переключатель открыт.
*> В дальнейшем для краткости такие цепи будем называть КВЦ, т. е. квантующевосстанавливающие цепи. — Прим, перев.
Величина тока определяется из соотношения
• и — у 1=_^т.
Таким образом, ток модулируется функцией tn, которая называется функцией модулирования. Если полное входное со-
Таймер
Рис. 4.3. Принципиальная схема квантующей цепи с кусочно-постоянным восстановлением.
противление цепи, последовательно соединенной с КВЦ, очень велико, то напряжение на конденсаторе определяется как
С= i (/) = m (4 i)
Дифференциальное уравнение (4.1) определяет линейную нестационарную систему, в которой нестационарность порождается модуляцией. В случае когда период квантования h постоянен и переключатель замкнут в течение т с в каждое квантование, функция m имеет форму, показанную на рис. 4.4. Так как tn— периодическая функция, то система также является периодической.
Теперь проанализируем реакцию построенной модели цепи на входной сигнал и. Из уравнения (4.1) непосредственно следует, что напряжение на конденсаторе постоянно при открытом и
Рнс. 4.4. Вид функции модулирования m с периодом h и шириной импульса т.
переключателе, т. е. когда m(f) = 0. Если переключатель замкнут, напряжение у приближается к входному сигналу и как динамическая система первого порядка с постоянной времени RC. Постоянная RC цепи должна быть значительно меньше ширины прямоугольного импульса; в противном случае будет недостаточно времени для зарядки конденсатора до входного напряжения при замкнутом переключателе.
Результаты моделирования КВЦ показаны на рис. 4.5. Для выбранных параметров ширина прямоугольного импульса т такова, что входной сигнал существенно меняется при замыкании переключателя-
2
t
О
W /
о
in(t) I 0
0 5/0
Время
Рис. 4.5. Моделирование КВЦ.
Ширина импульса т=0,2 с, постоянная времени ^С=0,01 с.
Система с менее длинным импульсом представлена на рис. 4.6; здесь демонстрируется более разумный выбор параметров: напряжение КВЦ быстро достигает значения входного сигнала, а затем остается постоянным в течение всего периода квантования.
Рис. 4.6. Моделирование КВЦ.
Ширина импульса т=0,05 с, постоянная времени ДС=0,01 с.
Реальные квантователи
Квантователь, изображенный на рис. 4.3, на практике не используется. Обычно реализуется квантователь, показанный на рис. 4.7. Операционный усилитель применяется для ускорения
Рис. 4.7. Практическая реализация КВЦ.
процесса зарядки конденсатора. Такую цепь также можно описать уравнением (4.1).
Чтобы избежать трудностей, связанных с шумом и наводками через * «землю», необходимо электрически изолировать ЭВМ от воздействия объекта управления. Это достигается в КВЦ, показанной на рис. 4.8, которая называется управляющей цепью с емкостной связью. В ней остроумно сочетаются электроизоляция с квантованием и восстановлением. Когда конденсатор подсоединен ко входной линии, он заряжается до входного напряжения, а при его подключении к ЦА-преобразова-телю он поддерживает на нем это напряжение. Электроизоляция достигается за счет связи конденсатора либо с объектом
Рис. 4.8. КВЦ на базе управляющей цепи с емкостной связью.
управления, либо с ЦА-преобразователем управляющей ЭВМ. На практике конденсатор обычно заряжается через операционный усилитель. Цепь с емкостной связью также описывается уравнением (4.1).
Математическая идеализация
Моделирование модуляции прямоугольными импульсами не вызывает особых затруднений, однако этого нельзя сказать относительно анализа Поэтому рассмотрим более простую математическую модель. Кажется разумным проектировать КВЦ так, чтобы ширина прямоугольного импульса т была значительно меньше периода квантования. Кроме того, целесообразно выбрать постоянную времени RC меньше ширины прямоугольного импульса. Тогда ток через конденсатор будет представлять собой совокупность коротких импульсов прямоугольной формы. Как их высота, так и интеграл по времени пропорциональны раз
ности и— у между входным напряжением и и напряжением конденсатора у в момент квантования.
В идеализированной модели прямоугольные импульсы тока заменяются на импульсы. Для простоты интеграл от импульса выбирается пропорциональным значению входного сигнала и в момент квантования. В этом случае конденсатор заменяется интегратором. Так как прямоугольные ймпульсы пропорциональны и, а не и — у, необходимо вновь устанавливать интеграл в нуль при поступлении нового прямоугольного импульса. Тогда ток определяется из уравнения
и = ит, (4.2)
где «(/)== X б (Z — kh) (4.3)
= —оо
и g — дельта-функция (сравните с (4.1)). Сигнал и* называют дискретным представлением непрерывного сигнала и.
♦♦♦ Заметим, что и* связан с током через конденсатор КВЦ на рис. 4.3.
Сигнал и* может быть представлен как модуляция и несущим сигналом в форме последовательности импульсов. Поэтому такую модель называют моделью амплитудно-импульсной модуляции. Сигнал и* несет ту же информацию, что и последовательность {u{kh), k— —1,0, 1, ...}.
Заметим, что и*, вообще говоря, есть функция времени. Сигнал и* введен для того, чтобы представить дискретный сигнал в форме, пригодной для линейной фильтрации.
Восстанавливающая цепь
Такую цепь можно представить как интегратор, который автоматически устанавливается в нуль после каждого периода квантования. Подобная система имеет передаточную функцию вида G(s) = 4(l —e~sh). (4.4)
Импульсная характеристика передаточной функции 1/«есть единичная ступень, а функция (l/s)exp(—sh) также единичная ступень, но задержанная на h единиц времени. Их разность дает импульсную характеристику, равную прямоугольному импульсу единичной высоты и ширины h.
♦♦♦ Заметим, что коэффициент усиления G(0) восстанавливающей цепи в установившемся состоянии равен h. В разд. 2.2 было показано, что идеальное квантование имеет коэффициент усиления l/h. Таким образом, сочетание квантующей и восстанавливающей цепей в установившемся режиме дает единичное усиление. Следовательно, при очень быстром квантовании КВЦ
ведет себя как непрерывная система с единичной передаточной функцией.
Идеализированная модель КВЦ была получена в результате комбинации квантователя с импульсной модуляцией, заданной
Квантователь ®шсатоР
•---->1 ----•
квц
Рис. 4.9. Блок-схема КВЦ и ее идеализированного представления.
уравнениями’ (4.2) и (4.3), и восстанавливающей цепи (4.4)’.
Блок-схема этой системы показана на рис. 4.9.
♦♦♦ Заметим, что если импульсный модулятор является периодической системой, то KB-цепь также периодическая система.
Связь «вход-выход»
Получив удобное представление КВЦ, определим реакцию дискретной системы на произвольное входное воздействие. Рассмотрим систему (рис. 4.10, а), состоящую из КВЦ, соедипен-
F(s)
Рис. 4.10. Принципиальная схема КВЦ, связанной с линейной системой, и ее представление с использованием идеализированной модели квантования и восстановления.
ной со стационарной, линейной, динамической системой с передаточной функцией G. Это типичное представление квантователя и ЦА-преобразователя, связанных с объектом управления. Использование модели импульсной модуляции КВЦ позволяет преобразовать блок-схему системы к виду, показанному на рис. 4.10, б.
Пусть и — вход, а у — выход. Из модели импульсной модуляции (4.2) следует, что и* = ит.
Пусть далее F—передаточная функция совокупности восстанавливающей цепи нулевого порядка и объекта управления, т. е.
F(S) = 1(1 — e~sh)G(s). (4.5)
Тогда связь «вход-выход» легко определяется с помощью интегрального преобразования. Преобразование Лапласа и* за
дается соотношением
U’ (s) = J е~ stu (0 dt = £ e~sllhu (kh), О fe-0
и для выходного сигнала имеем
Y (s) = F (s) £ e~skhu (kh). k=0
(4.6)
(4.7)
Таким образом, преобразование Лапласа выходного сигнала вычисляется непосредственно. Отметим, что преобразование Лапласа сигнала и в правой части уравнения (4.7) нельзя разложить на множители. Это означает, что связь «вход-выход» системы не может описываться обыкновенной передаточной функцией из-за нестационарности рассматриваемой системы.
4.3. ЧАСТОТНАЯ ХАРАКТЕРИСТИКА
Во многих случаях при синтезе систем управления на их частотные характеристики накладываются ограничения. Типичным примером может служить автопилот самолета. Чтобы гарантировать отсутствие влияния высокочастотных составляющих на систему управления, необходимо убедиться, что частотная реакция разомкнутой системы в области высоких частот по величине меньше 1. Одним из путей проверки выполнения данного условия является снятие частотной характеристики всей системы. Если регулирующее устройство выполнено на базе ЭВМ, то особенно важно понимать особенности частотной характеристики дискретной системы.
Частный случай
Частотную характеристику естественно снимать в аналоговой части системы, например в точке А (рис. 4.1). Для упрощения анализа рассмотрим частный случай, в котором выход ЦА-пре-образователя эквивалентен входу АЦ-преобразователя. Таким образом, действие ЭВМ на сигнал может быть приравнено к действию КВЦ. Из рис. 4.9 следует, что эту цепь можно представить как квантователь, последовательно соединенный с восстанавливающей цепью. В этом случае задача сводится к определению реакции системы, состоящей из квантующего устройства и линейной стационарной части.
Уравнение (4.2) дает дискретное представление и* входного сигнала и. Формальней разложение в ряд Фурье последовательности дельта-функций приводит к выражению
оо Г 00 *1
m(t) = б (t — kh) = -^ I 1 + 2 У cos kt£>st I, (4.8)
oo *- k—\ -I
где h — период квантования, a <os — соответствующая ему частота в рад/с.
Предположим, что вход системы имеет вид
и (f) — sin (со/ -j- tp) == Im [exp i (со/ + ф)].
Тогда разложение в ряд выхода квантователя и* = ит имеет следующий вид:
[СО “I
sin (со/ + ф) + 2 cos sin («>/ + ф) I = fc=i J
/ 00
= у s sin (at + ф) + [sin (kast -f- at + ф) —
I fe=i
— sin (kast — at — ф)] f •
Сигнал и* имеет составляющую с частотой а входного сигнала с коэффициентом 1//г, поскольку коэффициент усиления
Рис. 4.11. Спектр частот входного квантованного сигнала и .
квантующего устройства в установившемся режиме равен I/ft. Кроме того, сигнал содержит компоненты, соответствующие боковым полосам kas ± а. Спектр выхода квантователя и* показан на рис. 4.11. Выходной сигнал у получен в результате линейной фильтрации сигнала и* системой с передаточной функцией F(s). Тогда выход включает в себя составляющие основной частоты а и боковых полос ka> ± ю.
При а kaN (здесь со«— частота Найквиста) основная составляющая выхода следующая:
у (t) = у Im [F (ia) el <«>#+<₽)].
При <о = kaN частота одной из боковых полос совпадает с основной частотой. Таким образом, компонента с частотой о вы
ражается следующей формулой:
у (t)'= у Im {F (йо) е£ (со<+ф) — р (ico) ei (cirf-<p)j = = -^ Im {(1 — e~2Z<p) F (ia) el <“*+<₽>} = = ± Im {2e‘ W2-<rt sin фГ (ГаУё1 (“<+<p>}.
Если входной сигнал — синусоида с частотой со, то выход содержит основную частоту со и боковые полосы fecos ± <о,
Рис. 4.12. Квантование синусоидального сигнала с частотой, согласующейся с частотой Найквиста.
Вид дискретного сигнала зависит от того, как синусоида синхронизирована с моментами квантования.
k = 1, 2, ... (ср. с разд. 5, где рассматривается проблема поглощения частоты). Передаточная функция по основной частоте характеризуется соотношением
F (ias) =
о
F (гео) е1 <"/2-<₽) sin ф,
СО =/= fecdjy, со = k<oN.
(4.9)
Для со kaN передаточная функция определяется просто комбинацией передаточных функций КВЦ и системы G, при этом множитель 1/Л отражает наличие коэффициента усиления квантователя в установившемся режиме.
Передача сигнала на частоте Найквиста (cow) зависит от ф, т. е. от того, как входной синусоидальный сигнал синхронизирован с частотой квантования (рис. 4.12).
Боковые полосы могут оказывать сильное влияние на основную частоту и вызывать нерегулярность выходного сигнала, о чем свидетельствует пример 1.2. В данном случае основная составляющая имеет частоту 4,9 Гц, а частота Найквиста 5 Гц. Взаимодействие между основной компонентой и боковой полосой частоты 5,1 Гц приводит к биениям с частотой 0,1 Гц (рис. 1.4).
Если отфильтровать боковые полосы, то дискретная система будет вести себя как линейная и стационарная, за исключением частот, кратных частоте Найквиста, <щ/2. На этой частоте передаточное число амплитуды и запаздывание фазы зависят от сдвига по фазе выходного сигнала относительно моментов квантования.
При попытке получить частотную характеристику дискретной системы по частотной характеристике непрерывной важно тщательно отфильтровать боковые полосы. Однако на частоте Найквиста проблемы могут возникнуть даже при полной фильтрации, при этом результаты будут существенно зависеть от того, как входной сигнал синхронизирован с таймером ЭВМ.
Общий случай
Проведенный выше анализ легко распространить на общий случай системы, показанной на рис. 4.1. Соответствующая разомкнутая система изображена на рис. 4.13: она состоит из АЦ-пре-образователя, ЭВМ, ЦА-преобразователя и объекта управления. Предполагается, что ЦА-преобразователь сохраняет постоянный
H(z) Gfs)
Рис. 4.13. Разомкнутая цифровая система управления
уровень сигнала в течение интервала квантования, вычисления в ЭВМ выражаются импульсной передаточной функцией H(z), а объект управления описывается передаточной функцией G(s).
Если к входу АЦ-преобразователя приложен синусоидальный сигнал
v (I) = sin (al + <р) = Im [exp i (at + <p)],
то ЭВМ выработает последовательность чисел, которая в установившемся состоянии может быть представлена как
w(kh) = lm{H(eie>h)el^kh+^}, k=...,~ 1,0, 1,....
Такая последовательность подается на вход ЦА-преобразователя. Так как последний сохраняет сигнал постоянным в течение периода квантования, то его выход аналогичен результату
действия восстанавливающей цепи. Тогда справедливы уже проведенные, рассуждения: выход содержит основную частоту и и боковые полосы kas ± и. Усиление основной составляющей сигнала можно описать передаточной функцией вида
K(ia>) = ' h2 ~~h
H (eiah) F (ia), ?
H (eiah) F (tw) e* sin <p,
CD ktoN, to = kaN,
(4.Ю)
где a>N — частота Найквиста, a
F (s) = (I — e~sh) G (s).
(4.H)
Если w не кратно частоте Найквиста, то усиление основной составляющей может характеризоваться передаточной функцией,
Рис. 4.14. Передаточная функция и ее аргумент в случае восстанавливающих цепей первого (7) и нулевого (2) порядка приближения.
являющейся произведением четырех членов: усиления l/h квантующего устройства, передаточной функции восстанавливающей цепи [1—ехр(—sh)]/s, импульсной передаточной функции программы ЭВМ /7[exp(s/i)] и передаточной функции объекта управления G(s). Однако выход системы вследствие квантования имеет и другие частоты. На частоте Найквиста основная компонента и низшие боковые полосы совпадают.
Из вышесказанного следует, что восстанавливающую цепь можно интерпретировать как фильтр. Частотные .функции для восстанавливающих цепей нулевого и первого порядка приближения показаны на рис. 4.14. Из рисунка следует, что восстановление как нулевого, так и первого порядка допускает значительное усиление сигнала в области частот выше частоты Найквиста — л//г.
♦♦♦ Заметим, что частотные функции терпят разрыв в точках w/z = 2kn, k= 1, 2, ... . Так как фаза определена по модулю 2л, величина скачка может быть п или —л.
Пример 4.1. Вычисление и интерпретация частотной характеристики дискретной системы
Рассмотрим систему, состоящую из устройства нулевого порядка приближения, заданного (4.4), и последовательно соединенной с ним линейной системы с передаточной функцией G(s) = l/(s + 1). Период квантования h равен 0,05 с. В этом случае частота Найквиста есть л/0,05 = 61,8 рад/с. На рис. 4.15 приведена диаграмма Боде этой системы, где для сравнения также
Рис. 4.15. Диаграммы Боде для КВЦ нулевого порядка приближения, последовательно соединенной с элементом линейного запаздывания.
Период квантования 0.05 с.
дана диаграмма Боде передаточной функции G. Кривые очень близки на частотах, значительно меньших частоты Найквиста. Отклонение сначала становится заметным для фаз: на частоте со = 0,1 соЛ' кривые фаз отличаются примерно на 10°. На частотах, кратных частоте квантования <os, усиление сигнала равно нулю, так как в них передаточная функция восстанавливающего устройства нулевого порядка приближения равна нулю. Кривая фазы на этих частотах также прерывиста (ср. с рис. 4.14). Кроме того, следует подчеркнуть, что передаточная функция на частотах, кратных частоте Найквиста, не определена.
Интерпретация диаграммы Боде требует некоторой осторожности вследствие модуляции, вносимой квантованием. Если рассматривать на входе системы синусоиду с частотой со, то выходной сигнал есть сумма ее выходов и всех ее поглощенных частот. Это иллюстрируется на рис. 4.16, на котором показаны установившиеся выходные сигналы для различных частот. На частотах, меньших частоты Найквиста, доминирующей оказывается основная компонента. На частотах, близких к частоте Найквиста, существенной стано-
вится связь с первой поглощенной частотой cos — <о: в результате возникают типичные биения. На частоте Найквиста частота сигнала и его первая поглощенная частот^ совпадают и имеют одинаковую амплитуду. В этом случае результирующий сигнал зависит от сдвига фаз между сигналами На частотах
Рис. 4.16. Установив шаяся реакция на сину соидальное воздействие различной частоты восстанавливающего устройства нулевого порядка приближения, последовательно соединенного с линейной системой, постоян ная времени которой равна единице.
Период квантования (рад/cj а—5; б—60, в—130, показаны стрелками на рис. 4.15.
выше частоты Найквиста основной вклад вносят поглощенные частоты из области (0, <йц).
Приведенный пример наглядно показывает значение фильтрации сигнала перед квантованием для минимизации усиления в районе частоты Найквиста (ср. с разд. 2.7).
Приложения
Типичным примером системы, которой присуще квантование, является двигатель внутреннего сгорания. Квантование вызвано механизмом зажигания, частота которого равна частному от деления количества цилиндров с независимым зажиганием на время полного цикла.
Попытки исследования динамической характеристики мотора привели к воспроизводимым результатам для частот, меньших частоты квантования. Однако результаты для более высоких частот оказались непредсказуемы: в разных экспериментах были получены различные данные и выводы экспериментов не подтверждались при их повторении. Подобная ситуация явилась следствием дискретной природы процесса. Для входных сигналов с частотами, близкими к частоте Найквиста, сильно ощущалось влияние боковых полос. На частоте Найквиста результаты зависели от синхронизации синусоиды с импульсами зажигания.
Когда, наконец, причина расхождения результатов была установлена, выход из создавшейся ситуации оказался очень простым: синусоиду просто синхронизировали с импульсами зажигания, в результате чего стало возможным измерить час-
Рис. 4.17. Измеренная частотная характеристика дизельного двигателя.
Частоты приведены в соответствии с частотой квантования.
тотную характеристику на высоких частотах. Типичный пример показан на рис. 4.17. В частности, необходимо отметить, что измерения проводятся на частотах, включающих частоту Найквиста.
4.4. ФОРМАЛИЗМ ИМПУЛЬСНОЙ ПЕРЕДАТОЧНОЙ ФУНКЦИИ
Линейные непрерывные системы удобно описывать, анализировать и синтезировать алгебраическими методами. После того как была построена теория дискретных систем, стало естественным попытаться создать для них аналогичные алгебраические средства. Именно в этом направлении работали большинство исследователей в области дискретных систем.
Алгебраический подход полезен, прост и результативен, если система рассматривается «с позиций» ЭВМ или если объект управления описывается в моменты времени, синхронизированные с таймером компьютера, поскольку в этих случаях система стационарна (гл. 3). Однако если система анализируется «от объекта управления», как в данной главе, то она
зависит от времени. Тогда алгебраический подход теряет свою простоту, так как умножение на функции времени не позволяет применить дифференциальный и разностный операторы.
Цели
Главная цель — это построение формальной теории, позволяющей работать с описанием системы. Она будет имееть много общего с методами преобразования линейных стационарных систем. Каждый АЦ- и ЦА-преобразователь связан с операцией квантования. Поскольку квантование можно представить как амплитудную модуляцию, нестационарные члены системы будут ассоциироваться с этими операциями. Таким образом, систему можно разделить на члены — просто линейные стационарные, к которым применимы обыкновенные методы преобразования, и состоящие из квантователей, внутренне зависящих от времени.
z- П реобр азован ие
Определение. z-Преобразование непрерывной функции задается следующим соотношением:
F (г) = £ z~kf (kh). (4.12)
fe=0
Обратное преобразование есть
f(/s/i) = ^r^z^>F(z)dz, (4.13)
г
где контур интегрирования Г охватывает все особые точки подынтегральной функции.
Таким образом, z-преобразование непрерывного сигнала осуществляется его квантованием и z-преобразованием полученной дискретной последовательности. Так как преобразование зависит только от значений в моменты квантования, то все функции, имеющие в этих точках равные значения, имеют одинаковое изображение.
♦♦♦ Заметим, что изображение непосредственно связано с таймером, задающим моменты квантования. Кроме того, обратное преобразование дает значения функции только в моменты квантования. Эти свойства z-преобразования непрерывной функции порой недопонимаются, что ведет к большим неприятностям и ошибкам.
Две основные теоремы
Чтобы построить алгебру, позволяющую выполнять формальные операции с системами, рассмотрим две теоремы. Первая из них устанавливает связь z-преобразования непрерывной функции с ее преобразованием Лапласа.
Теорема 4.1. Пусть функция f имеет преобразование Лапласа F и z-преобразование Р. Пусть F* — преобразование Лапласа дискретного представления f* функции /. Предположим, что для некоторого е > О, |F(s) | |s|-1-E для больших |s|. Тогда
оо
F*(s) = F (е^‘)=~ £ F (s + ikas), (4.14)
= — oo
где <os — 2n/h — частота квантования.
Доказательство. Из определения F* следует, что
оо оо
F* (s) — e~stf* (/) dt = e~stf (/) tn (/) dt = о о
оо /со \
= e~stf (/) j 2^ б — ^) ( О **&» — со '
где последнее равенство получено из (4.3). Изменение порядка интегрирования и суммирования дает
оо оо оо
Г (s) = £ J (0 6 (Z - k/г) dl = Y f = F (4-15) —оо 0 fe=0
Последнее равенство следует из (4.12).
Так как преобразование Лапласа произведения двух функций есть свертка их изображений, то
v+/°°
F* (s) = F (s) * Al (s) = F (v) M (s — v) dv —
y-i™
v+i°°
=~ \ F(v)~-----------L-^—^-dv. (4.16)
2ra J 1 — e "v'
y-i™
Контур интегрирования должен проходить справа от всех полюсов F и слева от всех полюсов М (рис. 4.18).
Если F стремится к нулю быстрее, чем |s|-1-8, то при |s|->oo интеграл от FM по большой полуокружности обращается в нуль. Если путь интегрирования завершается большой полуокружностью справа, интеграл можно определить с помощью исчисления вычетов. Подынтегральная функция в области, ограниченной контуром интегрирования, имеет простые полюса в корнях уравнения
exp h(s — о) = 1, т. е. в точках
vk = s=s + ikas, k=..., —1, 0, 1....................
Рис. 4.18. Особые точки контур интегрирования.
Вычеты этих полюсов следующие:
Суммирование вычетов приводит к (4.14).
Замечание 1. Уравнение (4.14) может быть записано и так: r(s) = ^[F(S) + /7(i4 + s) + /7(S-/cos)+ ...]. (4.17)
Замечание 2. Если F — аналитическая при Re s < —у0, то контур интегрирования в (4.16) может замкнуться по большой полуокружности слева. В результате получаем следующую формулу:
F(z) = £ReS{F(s)7-iw}. (4.18)
из которой вытекает соотношение (3.43).
Замечание 3. Теорему можно обобщить на случай, в котором функция F стремится к нулю как 1/|s| при больших |s|. Тогда уравнение (4.14) заменяется уравнением
оо
Г(«) = 4 £ F(s + ikus) + ±f(0+). (4.19)
k = — oo
Замечание 4. В литературе для функций F* и F иногда используются одинаковые обозначения, что приводит к недоразумениям.
Замечание 5. Формула (4.14) тесно связана с формулой преобразования Фурье дискретного сигнала (2.4).
Импульсная передаточная функция. В разд. 4.2 было показано, что связь между входом и выходом системы, состоящей из квантователя и линейной части, выражается уравнением (4.7). Это уравнение не может быть описано передаточной
функцией. Если на выход системы добавить фиктивное квантующее устройство, то возникнет конфигурация, изображенная
Таймер
Рис. 4.19. Блок-схема системы с двумя квантователями.
на рис. 4.19, для которой возможно определить передаточную функцию. Связь «вход-выход» задается соотношением
y(t) = [f(t)*u*(t)]\ (4.20)
Теорема 4.2. Пусть f и g— функции, для которых существует преобразование Лапласа, и пусть т — модулирующая функция, определяющая импульсную последовательность. Тогда
m (0 {f (0 * [«(/) • g (/)]} = [т (/) • f (/)] * [m(i) g (/)], (4.21)
или, что то же самое,
[ПО*£*(ОГ“ПО*^0. (4.22)
Доказательство. Используя определение свертки, запишем левую часть (4.22) следующим образом:
оо
(t *ёУ 5 —т)г*(т)с!т =
— оо
оо
== \ .m (t) — (т) g (т) dr.
Аналогично для правой части уравнения (4.22) имеем
оо
(Г * £*) (0 = 5 т (z — т) f (z ~ т)т (т) s (*) du =
—оо
оо
— т)т (т) g (т) du.
— оо
Последнее равенство справедливо, так как т(т)#= 0 только для т = nh и m(t — nh) — m(t).
Замечание 1. Преобразование Лапласа (4.22) дает
[F(s)G’(s)]* = r(s)G*(s). (4.23)
Замечание 2. Умножение на т за скобками в (4.21) можно интерпретировать как введение фиктивного квантователя.
Формализм
Теперь можно построить формальную алгебру для работы с дискретными системами. Сначала систему изображают в виде блок-схемы. Каждый АЦ-преобразователь представляют как идеальный квантователь, а каждый ЦА-преобразователь как восстанавливающую цепь с передаточной функцией (4.4). Линейные стационарные элементы обозначают их передаточными функциями, линейные вычисления в ЭВМ — импульсными передаточными функциями. Участки между квантователями свертываются по обычным правилам преобразования линейных стационарных систем. После этого можно записать уравнение системы, которое затем преобразуют с помощью теорем 4.1 и 4.2. Изложенный порядок действий иллюстрируется примером.
Пример 4.2
Рассмотрим стандартную конфигурацию цифровой системы управления, изображенную на рис. 4.20, а. Объект управления характеризуется линейной передаточной функцией G, а вычисления, выполняемые ЭВМ, импульсной передаточной функцией Н. Как обычно, аналоговая и цифровая части системы соединяются посредством ЦА- и АЦ-преобразователей. Чтобы применить формализм, АЦ-преобразователь представлен как идеальный квантователь, ЭВМ как система, которая преобразует один импульсно-модулированный сиг
О&ъет
ЭВМ управления
Объект
Программа. управления
Рис. 4,20. Стандартная конфигурация цифровой системы управления.
нал в другой, ЦА-преобразователь как квантователь, последовательно соеди-ненный с восстанавливающим устройством нулевого порядка приближения. Предполагается, что квантователи абсолютно синхронизированы. В результате получается блок-схема, показанная на рис. 4.20,6. Таким образом, аналоговые части — это восстанавливающее устройство и объект управления. Их общая передаточная функция есть
F(s) =у(1 — e~sh)O(s).
Преобразование Лапласа У выхода у задается соотношением
у (S) = F (а) и* (з).
Дискретный выход имеет следующее изображение:
а r*(s) = [F(a)t/*(s)]* = F*(s)t/*(s).
где последнее равенство получено на основании теоремы 4.2. В результате связь между у* и и* может быть описана импульсной передаточной функцией
F(z) = F*(s)|s_(lnz)/h.
Вычисления в ЭВМ в дальнейшем могут представляться импульсной передаточной функцией Н(г). Если контур управления разорвать внутри ЭВМ, то импульсная передаточная функция будет иметь вид H(z)F(z).
Блок-схема системы «с точки зрения компьютера» показана на рис. 4.20, в. Рассмотрение всех сигналов как последовательностей типа {y(kh), k = ..., —1, О, 1, . .} и введение соответствующих импульсных передаточных функций для алгоритма и объекта управления с квантованием и восстановлением позволили получить представление системы, эквивалентное обычной блок-схеме непрерывной системы.
Пример 4.3
Система, полученная в результате процедуры, описанной в примере 4.2, и показанная на рис. 4.21, а, имеет два измеряемых аналоговых сигнала yt и у2 и один аналоговый командный сигнал ис. Непрерывные сигналы сканируются мультиплексором и преобразуются в цифровую форму. ЭВМ вырабатывает управляющий сигнал, который после ЦА-преобразования подается на объект управления.
Введем функции
F, (s) = G, (s)l(l — e~sh),
F2 (s) = G2 (s) F, (s).
Тогда преобразование Лапласа выходных сигналов имеет вид
Г. («) = F, (s) U* (з),
r2(s) = F2 (s)G*(s), откуда
у; (s) = [F, (s) (/’ (s)f = Fj (s) и* (s),
У'г (s) = [F2 (s) U (s)j’ == F; (s) ff (s).
Из (4.14) и (4.23) следует, что
У i (z) U (z),
Г2 (z) = F, (z) U (z).
Пусть вычисления, выполняемые управляющей ЭВМ, описываются уравнением
Таймер
a
в
Рис. 4.21. Цифровая система управления с мультиплексором и двумя контурами обратной связи и эквивалентная блок-схема.
U (г) = Нс (г) Uc (г) - Я, (z) Г, (z) - Н2 (z) Г2 (z).
Связь между выходом Yz и дискретным командным сигналом Uc получается после исключения Y, из записанных уравнений:
Не (z) Fz (г)
Г2 (г) =----------------(г)
1 + //, (г) Г, (г) + Н2 (г) Г2 (г)
♦♦♦ Заметим, что связь между ус и ис не может быть описана как простая импульсная передаточная функция из-за периодической природы дискретной системы.
С введением дискретных сигналов как последовательностей и импульсных передаточных функций система приводится к виду, показанному на рис. 4.21, в.
Модифицированное /-преобразование
Проблема квантования системы с временным запаздыванием решается с помощью модифицированного z-преобразования, которое определяется следующим образом.
Определение модифицированного z-преобразования. Модифицированное z-преобразование непрерывной системы задается соотношением
F (z, tn) = z~kf (kh — h-\- mh), 0 tn 1. fe=0
Обратное преобразование осуществляется по формуле f (nh — h + mh) = F (z, tri) zn~l dz,
г
где контур Г охватывает все особые точки подынтегральной функции.
Модифицированное z-преобразование полезно во многих случаях, например при анализе поведения системы между моментами квантования. Существуют обширные таблицы модифицированного z-преобразования и большое число теорем о его свойствах.
4.5. МНОГОЧАСТОТНОЕ КВАНТОВАНИЕ
До сих пор рассматривались системы, в которых АЦ- и ЦА-преобразования осуществлялись с одинаковой частотой. В ряде случаев (пример 3.16) выгодно увеличить скорость работы ЦА-преобразователя, однако возможны ситуации, в которых желательно обратное. Например, сложно реализовывать частотные фильтры с большими постоянными времени на базе аналоговой техники и значительно проще квантовать сигнал с высокой частотой, используя аналоговые фильтры, а затем осуществить цифровую фильтрацию. В обоих случаях системы имеют два квантующих устройства, работающих с разной скоростью. Это называется многочастотным квантованием. Такие схемы квантования могут быть необходимы для систем со специальными звеньями передачи данных или особыми регистрирующими и воздействующими устройствами и полезны для улучшения характеристик систем, в которых измерения осуществляются на низких скоростях, скажем, при использовании лабораторных инструментов. Кроме того, в многочастотных
системах легче контролировать их поведение между моментами квантования. В многомерных системах также могут быть выгодны различные частоты квантования в различных контурах управления для уменьшения загрузки ЭВМ и улучшения числовых характеристик функционирования. Использование многочастотного квантования естественно и в многопроцессорных системах.
Детальное рассмотрение многочастотных систем выходит за рамки данной книги. Однако здесь будет дан краткий обзор основных идей, с тем чтобы показать, как методы, описанные в книге, могут быть перенесены и на многочастотные системы.
Описание в пространстве состояний
Рассмотрим систему, состоящую из двух непрерывных динамических подсистем с постоянными коэффициентами. Предположим, что существуют два периодических квантователя с периодами hi и h2. Пусть отношение их периодов есть рациональное число hi/h-i = пц/пц, где т,\ и т2 не имеют общих множителей. Тогда существуют наименьшее целое т и действительное число h, такие что
hi — (hmJIm, (4.24)
h2 = (hm^m (4.25)
и
m = гщт?. (4.26)
Если квантователи синхронизированы, то управляющие сигналы будут постоянны в течение периода квантования длиной hfm. Квантование с этим периодом дает периодическую дискретную систему с периодом h. Таким образом, систему можно описать как дискретную систему с постоянными коэффициентами, если значение ее переменных рассматривать только в моменты, являющиеся целыми кратными h. В результате можно применить обыкновенную теорию дискретных систем.
Пример 4.4
Рассмотрим систему, показанную на рис. 4.22 и имеющую две линейных подсистемы и два квантователя с периодами 0,5 и 1. Предполагается, что квантователи синхронизированы, а восстанавливающие цепи включены в подсистемы. Если подсистемы квантуются с периодом 0,5 и значение 0,5 выбрано как единица времени, то
Гх1(А + 1) = Ф1х1(А) + Г1и,(й)
I Ю (А)=С,Х| (А),
С х2 (Л + 1) = Ф2х2 (k) + Г2и2 (k)
\ У г (k) = С2х2 (k).
Внешние связи описываются уравнениями
(6) = у2 (k), k = 1, 0, 1, 2..
и2 (к) — 4/i (k), k=,.., — 2, 0, 2, 4, ..,.
Система имеет период, равный двум интервалам квантования. Описание, независимое от времени, достигается, если рассматривать переменные системы только в четные периоды квантования. Дальнейшие вычисления дают
х} (2k + 2) х2 (2k + 2)
ф2 +
+ Г2) С,
+ 1 Гх1(л)1 (427)
Ф2 ] L *2 W J
Это уравнение можно использовать для анализа характеристик многочастотной системы. Например, условие устойчивости состоит в том, чтобы все соб-
Период h
Период
Рис. 4.22. Блок-схема простой многочастотной системы.
.4/ О} у,
ствепные значения матрицы в правой части (4,27) находились внутри единичного круга. Значения переменных состояния в нечетные периоды следующие:
pi (2k + 1)
Lx2 (2fe + 1)
ГА ф2
HXl (2k)
х2 (2k)
Проведенный анализ можно обобщить на произвольное число квантователей, отношения периодов у которых — действительные числа. Квантование с задержкой также описывается методами, рассмотренными в разд. 3.1.
Модели типа «вход-выход»
Многочастотные системы также можно исследовать с помощью моделей типа «вход-выход». Заметим, что система имеет период h, если отношения периодов квантования — рациональные числа. Значения переменных системы в моменты, синхронизированные с периодом квантования, описываются как стационарные динамические системы. В этом случае можно использовать обыкновенные методы линейных систем: операторы или передаточные функции.
Процедура анализа систем приблизительно следующая. Сначала строятся блок-схема системы, включающая все подсистемы, и квантователи. Затем определяют период квантования h. Тогда все квантователи в системе имеют период h/m, где т — целое. После этого используют прием, называемый релейно-фазовой декомпозицией *>, для преобразования квантователей с периодом h/m в комбинацию квантователей с периодом h. Наконец, проводят анализ с помощью методов, описанных в разд. 4.4.
о В оригинале — «switch decomposition». — Прим, перев.
Релейно-фазовая декомпозиция Г
Для того чтобы понять принцип релейно-фазовой декомпозиции, рассмотрим сначала квантователь с периодом /г/2. Такое квантование можно получить, соединив два квантователя с периодами h, один из которых имеет временную задержку /г/2
Рис. 4.23. Представление квантователей с периодами (а) /г/2 и (б) him с помощью релейно-фазовой декомпозиции.
относительно другого (рис. 4.23,о). Эта идея легко расширяется до квантования с периодом h/m, где т — произвольное целое (рис. 4.23,6).
Многочастотные системы с нерациональными периодами
Методы, рассматриваемые до сих пор, работают только тогда, когда отношения периодов квантования — рациональные числа. В противном случае невозможно получить периодическую систему, нужно использовать другие методы. Многочастотные методы также приводят к сложным задачам, если имеется много квантователей с широким диапазоном периодов.
ЗАДАЧИ
4.1. Напишите программу для вычисления частотной характеристики дискретной системы. Пусть входом программы будет следующая информация: многочлены импульсной передаточной функции; период квантования' максимальные и минимальные частоты.
Используйте программу для графического изображения Н [ехр (йв/i) ] в случае нормализованного электродвигателя, квантованного с нулевым порядком приближения, и сравните его со случаем для непрерывной системы.
4.2. Найдите F* для системы, изображенной на рисунке.
ЛИТЕРАТУРА
Подход, принятый в этой главе, соответствует классическому методу изучения дискретных систем. Модуляционная модель была впервые предложена Мак-колом (1945) и тщательно разработана Линвиллем (1951). Более детальное рассмотрение проблемы содержится в классических трудах Рагацциии и Франклина (1958) и Джури (1958), о которых уже упоминалось в гл. 1.
Аппроксимация идеального квантователя
1. Li Y. Т., Meiry J. L., Curry R. Е. (1972): “On the Ideal-Sampler Approximation”, IEEE Trans., AC-17, 167-68.
Частотная характеристика важна как с точки зрения анализа, так и проектирования. Она достаточно полно рассматривается в работе
2. Lindorff D. Р. (1956): Theory о] Sampled-Data Control Systems. New York: John Willey.
Практические аспекты применения частотной характеристики
3. Flower J. О., Windett G. P., Forge S. C. (1971); “Aspects of the Frequency Response Testing of Simple Sampled Systems”, Int. Journal Control, 14, 881-96.
Другие материалы по z-преобразованию
4. Jury E. I. (1964): Theory and Application of the Z-Transform Method. New York: John Wiley.
Модифицированное z-преобразование
5. Jury E. I. (1958): Sampled-Data Control Systems. New York: John Wiley. [Имеется перевод: Джури Э. Импульсные системы автоматического регулирования.— М.: Физматгиз, 1963.]
В ней также приводятся таблицы модифицированного Z-преобразования. Системы с многочастотным квантованием
6. Kranc G. М. (1957): “Input-Output Analysis of Multirate Feedback Systems”, IEEE Trans., AC-3, 21-28.
Дополнительные результаты
7. Jury Ег I. (1967): “A note on Multirate Sampled-Data Systems’, IEEE Trans., AC-12, 319-20.
8. Jury E. I. (1967): “A General Z-transform Formula for Sampled-Data Systems”, IEEE Trans., AC-12, 606-08.
9. Konar A. F., Mahesh J. K. (1978): “Analysis Methods for Multirate Digital Control Systems”, Honeywell Report No. FO636-TRI, Honeywell Systems and Research Center. Minneapolis, Minn:
10. Whitbeck R. F. (1980): “Multirate Digital Control Systems with Simulation Application”, Report AFWAL-Tr-80-2101, vols. I, II, and III Flight Dynamics Laboratory, Air Force Wright Aeronautical Lab., Wright-Patterson Air Force Base, Ohio.
Анализ дискретных систем
Понятия, устойчивости, достижимости и наблюдаемости. Подробный анализ простых контуров обратной связи и моделирование
ВВЕДЕНИЕ
В предыдущих главах было показано, как трансформируются непрерывные системы при квантовании Матрица А непрерывной системы определяет матрицу дискретной системы Ф=ехр Ah. Важным инструментом для анализа дискретных систем, например при исследовании поведения системы между моментами квантования, является моделирование.
Данная глава посвящена в основном анализу дискретных систем. Рассматриваются дискретные системы, заданные моделью в пространстве состояний:
x(k+ 1) = Фх(А0+ Гн(£),
y(k) = Cx(k) (5.1)
или моделью типа «вход-выход»
A (q) y(k) = B (q) и (k), (5.2)
где
Д (<?) = <?" +ад"-1 + ... 4-а„,
B(q) = biqn-'+ ... +bn.
5.1. УСТОЙЧИВОСТЬ 11
Рассмотрим дискретное уравнение движения в терминах пространства состояний (возможно, нелинейное и нестационарное)
x(k+ l) = f[x(k), k\. (5.3)
Пусть x°(k) и x(k)—решения (5.3) при начальных условиях х°(^о) и х(&о) соответственно. (В дальнейшем ||-|| будет обозначать норму.)
Предполагается, что понятие устойчивости хорошо известно из учебников по теории управления.
Определение устойчивости. Решение x°(k) уравнения (5.3) устойчиво, если для заданного е > 0 существует 6(е, k0), такое что для всех решений, удовлетворяющих условию |]х(/г0) — — х°(^о)11<6, ||x(fe) —х°(^)|| < е для всех k до-
определение асимптотической устойчивости. Решение х°(&) уравнения (5.3) асимптотически устойчиво, если оно устойчиво и если ||х(А0 — х°(^)||->0 при /г->оо, при условии что ||х(/г0)— — x°(ko) || достаточно мало.
Из определения следует, что устойчивость, вообще говоря, определяется для конкретного решения, а не для системы в целом.
Устойчивость линейной дискретной системы Рассмотрим линейную систему
х° (k + 1) = Фх° (k), х° (0) = а°. (5.4)
Чтобы исследовать устойчивость решения уравнения (5.4), изменим начальные условия. Тогда
x(k + 1) = Фх(/г), х(0) = а.
Разность х = х — хР удовлетворяет уравнению
x(k + 1) = Фх(/г), х(0) = а —а0. (5.5)
Это значит, что если решение устойчиво, то каждое другое решение также устойчиво. Таким образом, для линейных стационарных систем устойчивость — свойство системы, а не конкретного решения.
Система (5.5) имеет решение
х (k) = Фйх (0)
[см. (3.13)]. Если матрицу Ф можно привести к диагональному виду, то решение есть линейная комбинация Л,?, где t= 1, ..., п — собственные значения Ф [см. (3.25)]. В общем случае, когда диагонализация Ф невозможна, решение представляет собой линейную комбинацию р£. (k) №tt где р£ (k) — многочлен от k порядка на единицу меньшего кратности соответствующего собственного значения. Для достижения асимптотической устойчивости все решения должны стремиться к нулю при й->оо. В этом случае собственные значения матрицы Ф обладают следующим свойством:
| | < 1, i — 1, ..., n.
Теорема об асимптотической устойчивости линейной системы. Дискретная, линейная, стационарная система (5.4) асимптоти-
5
•5'-------------------1----------------1_
0 to 20
Рис. 5.1. Вход и выход системы, описанной в примере 5.1, при со=1, й=0,5 _| и нулевых начальных ЗОС условиях.
чески устойчива тогда и только тогда, когда все собственные значения матрицы Ф лежат строго внутри единичного круга.
Выше была определена устойчивость по отношению к возмущению начальных условий. Однако возможны и другие понятия устойчивости.
Определение BIВО-устойчивости °. Линейная стационарная система BIBO-устойчива, если ограниченный вход вызывает ограниченный выход при любых начальных условиях.
Из определения следует, что асимптотическая устойчивость самое сильное условие, т. е. справедлива следующая теорема.
Теорема 5.1. Если система асимптотически устойчива, то она также устойчива и BIBO-устойчива.
В дальнейшем под устойчивостью будет подразумеваться асимптотическая устойчивость.
Можно привести примеры, показывающие, что устойчивость не вызывает BIBO-устойчивости и наоборот.
Пример 5.1
Рассмотрим квантованный гармонический осциллятор (см. пример А. 3)
... । «.х Г cos сой sin сой! .... Г1 — cos сой! ,,,,
х (kh + й) = . , х (kh) 4- , и (kh),
L—sin сой cos coftj L Sin сой J ' ’
у (kh) — [1 0] x (kh).
В данном случае собственные значения матрицы равны единице. Система устойчива, так как || x(kh) || = || х(0)|| при u(kh) = 0. Пусть на ее вход поступает волна прямоугольной формы с частотой со рад/с (рис. 5.1). Амплитуда выходного сигнала растет — система не BIBO-устойчива.
Критерии устойчивости
Для определения устойчивости дискретных систем существуют различные методы, в том числе:
о Bounded-input-bounded-output (BIBO)—ограниченный вход — ограниченный выход. — Прим, перед.
• непосредственное вычисление собственных значений матрицы Ф;
• методы, основанные на свойствах характеристического многочлена;
• метод корневого годографа;
• критерий Найквиста;
• метод Ляпунова.
Из теоремы об асимптотической устойчивости линейной системы следует, что непосредственно проверку устойчивости данной системы можно осуществить путем вычисления собственных значений матрицы Ф. Для этого существуют хорошие численные алгоритмы. Они, например, неплохо реализованы в пакете EISPACK °, который имеется во многих вычислительных центрах. Однако вычислять вручную собственные значения для систем порядка более двух неудобно; кроме того, этот метод нельзя применять, когда матрица имеет параметры в своих коэффициентах.
В ряде случаев проще вычислить характеристический многочлен
A (z) = aozn + (5.6)
и исследовать характеристическое уравнение
A (z) = aozr + ajz"-1 + ... + ап = 0. (5.7)
Было показано (разд. 3.3), что характеристический многочлен есть знаменатель импульсной передаточной функции. Проверка устойчивости может осуществляться путем исследования условий, при которых его корни попадают внутрь единичного круга.
Одним из методов, позволяющих определить, располагаются ли все корни многочлена в левой полуплоскости, является критерий Рауса — Гурвица. Преобразование Мёбиуса w — = (z-f-l)/(z—1) отображает единичный круг на z-плоскости в левую половину ay-плоскости. Преобразование может быть применено к (5.7), после чего можно использовать критерий Рауса — Гурвица.
Полезно знать условия, непосредственно определяющие положение корней многочлена относительно единичного круга. Такой критерий, эквивалентный критерию Рауса — Гурвица, был предложен Шуром, Кохом и Джури.
Задача вычисления коэффициентов характеристического многочлена по элементам матрицы плохо обусловлена — предпочтительнее непосредственно определить ее собственные значения, чем решать характеристическое уравнение.
Для дискретных систем можно использовать и хорошо известный метод корневого годографа. Границы устойчивости в этом
11 Библиотека стандартных программ для решения задач линейной алгебры.— Прим, ред,
случае меняются от мнимой оси к единичной окружности, а эмпирические правила вычерчивания корневого годографа такие же. Метод корневого годографа и критерий Найквиста используются при определении устойчивости замкнутой системы, если известны характеристики разомкнутой.
Критерий Джури
Чтобы определить, все ли корни многочлена (5.6) находятся внутри единичного круга, составляют следующую таблицу:
Со Ci ... 1 с« ап
с.п == —-
1 ... С1 Со Со
где
ai= ai - akak-i’ ak = ak/ao-
Первая и вторая строки — это коэффициенты из (5.6) в прямом и обратном порядке. Третья строка получается умножением второй строки на ап = ап1ай и вычитанием произведения из первой строки; таким образом, последний элемент в третьей строке равен нулю. Четвертая строка — это третья, записанная в обратном порядке. Схема повторяется до (2п-|-1)-й строки. Последняя строка состоит только из одного элемента.
Теорема о критерии устойчивости Джури. Если а0 > 0, то все корни уравнения (5.7) лежат внутри единичного круга тогда и только тогда, когда все aft, k — 0, 1, ..., п — 1 положительны. Если нет а* равных нулю, то количество отрицательных aj равно количеству корней вне единичного круга.
♦♦♦ Заметим, что если все положительны для k — 1, 2, ..., п—1, то можно показать, что условие > О эквива-
лентно условиям:
Л(1) > О, (—1)"Л(—1)>0,
которые составляют необходимые условия устойчивости и, следовательно, могут использоваться до составления таблицы.
Пример 5.2
Пусть задрно следующее характеристическое уравнение:
A(z) = z2 + a,z + а2 = 0. (5.8)
В этом случае таблица Джури имеет вид
*1
1 0.1 02
Oz Ot 1 G>2 #2
а, (1 — с2)
Ci (1 — а2) ‘-«2 “* '14-02
1 - о| - ^(1~«2)
1 + С2
Все корни уравнения (5.8) находятся внутри единичной окружности, если
1 — > О,
[0 +«2)2-«?]>о-
Отсюда условия устойчивости определяются как
п2 < 1,
С2 > — 1 + С1,
с2 > — 1 — at.
Область устойчивости для уравнения второго порядка показана на рис. 5.2.
Рис. 5.2. Область устойчивости для уравнения второго порядка (5.8) как функция коэффициентов at и а2.
Процесс с временной задержкой (примеры А. 4 и 3.6) описывается характеристическим уравнением
z2 — z ехр (— h) = О,
где h—период квантования. Система устойчива, так как ехр(—й) < 1.
Модель, описанная в примере А. 5, имеет характеристическое уравнение
г2 — г = 0.
Такая модель устойчива, но не асимптотически, так как характеристическое уравнение имеет корень г = 1.
Критерий Найквиста
Одним из хорошо известных методов определения устойчивости непрерывных систем является критерий Найквиста, основанный на принципе вариации аргументов. Однако этот критерий легко
Рис. 5.3. Простейшая система с обратной связью.
сформулировать и для дискретных систем. Особенно он эффективен при определении устойчивости замкнутой системы, если задана разомкнутая.
Рассмотрим дискретную систему, изображенную на рис. 5.3. Замкнутая система имеет импульсную передаточную функцию и /„1 _ У (г) _ Но (г)
П ™ Uc (z) 1 + Но (г)
и характеристическое уравнение вида
Ц-Яо(г) = О. (5.9)
Устойчивость замкнутой системы можно исследовать по диаграмме Найквиста для /70(z). Для дискретных систем областью устойчивости на z-плоскости является единичный круг, а не левая полуплоскость. На рис. 5.4 показан контур Гс, охватываю-
Рис. 5.4. Контур Гс, охватывающий область вне единичного круга.
щий область вне единичного круга. Небольшая выемка в точке z — 1 сделана с целью исключения интеграторов в разомкнутой системе. Бесконечно малые полуокружности в точке z = 1 при уменьшении аргумента от л/2 до —л/2 отображаются на плоскость как бесконечно большая окружность от —нл/2 до
пл/2 (здесь п — количество интеграторов в разомкнутой системе) . Еслй на единичной окружности имеются полюса кроме z = 1, то все они должны быть исключены маленькими полуокружностями так же, как в точке z = 1. Отображение единичной окружности — это Но (е‘и), где о е (0, 2л).
Устойчивость замкнутой системы теперь можно определить, исследовав, как контур Гс отображается функцией H0(z). Отображение Ho(eiv>)- при изменении аргумента от 0 до л называется частотной характеристикой или диаграммой Найквиста системы. Согласно принципу вариации аргументов, количество обходов N точки (—1,0) в положительном направлении отображением Гс равно
N = Z — Р,
где Z и Р — количество нулей и полюсов функции 1 H0(z)
вне единичного круга соответственно. Отметим, что если разомкнутая система устойчива, то Р = 0 и, следовательно, N = Z. Таким образом, устойчивость замкнутой системы гарантирована, если отображение Гс не охватывает точку (—1,0). Если H(z) —> 0 при 2—>-оо, параллельные линии III и V не влияют на критерий устойчивости. Существенно найти отображение единичной окружности и маленьких полуокружностей в 2 = 1. Критерий Найквиста в дальнейшем можно упростить, если разомкнутая система и обратная ей устойчивы. В этом случае замкнутая система устойчива, если точка (—1,0) на Но (z) -плоскости находится слева от отображения Я0(е‘“) для со е [О, л], т. е. слева от диаграммы Найквиста.
Пример 5.3
Рассмотрим систему с периодом квантования h = 1 и импульсной передаточной функцией
„ ... °-25/<
0 ' ' ~ (z - 1)(г- 0,5)
Тогда
,. / _ 0,25К [1,5 (1 — cos <а) — 2 sin2 со — г sin со (2 cos со — 1,5)]
0 'е (2 — 2 cos со) (1,25 + cos со)
Отображение Гс показано на рис. 5.5: сплошная линия — это диаграмма Найквиста, т. е. отображение 7/о(с1ю)при изменении со от 0 до л. Как следует из рисунка, диаграмма Найквиста пересекает отрицательную действительную полуось в точке —0,5. Таким образом, замкнутая система устойчива, если К< 2.
Критерий Найквиста до сих пор применялся только к дискретным системам общего вида. Теперь предположим, что импульсная передаточная функция получена квантованием непрерывной системы G(s), ко входу которой подсоединено квантующее устройство приближения нулевого порядка с периодом квантования h. В этом случае критерий устойчивости вытекает
из (4.14) и (4.17). так как
оо
//0 (е™) = 1 £ /? (ко + ik(>)s), fe=—СО
где
F (s) = l-.-^exg.l-fe) G (s)
Если имеются числовые значения G(tco), то с помощью приведенного разложения в ряд можно определить значения импульсной передаточной функции на единичной окружности. Во
Рис. 5.5. Отображение Гс на Но (z)-плоскость для системы, описанной в примере 5.3, при К — 1. с
плошная линия — кривая Найквиста
многих приложениях | G (/со) | уменьшается при увеличении со. Тогда доминирующим становится член с k = 0, роль которого особенно ощутима, если G(s) включает эффективный фильтр поглощенных частот. Это означает, что необходимо знать поведение G(s) вплоть до частоты Найквиста.
Недостатком данного критерия является сложность вычерчивания диаграммы Найквиста. Однако применение ЭВМ позволяет значительно упростить вычисление устойчивости замкнутой системы.
Робастность
Интерес представляет метод определения чувствительности системы к возмущениям, которые могут иметь место вследствие допусков в ее компонентах. Так как проектирование систем управления основывается на упрощенных моделях, то необходимо также знать, как можно уточнить модель при ее реализации.
Рассмотрим простейшую замкнутую систему, изображенную на рис. 5.3. Пусть H°(z)—реальная импульсная передаточная функция разомкнутой системы, a H(z)— ее номинальное значение. В данном случае для устойчивости замкнутой системы важна близость Н и Н°. Импульсная передаточная функция замкнутой системы имеет вид
= (5Л0)
Тогда полюса замкнутой системы совпадают с корнями функции f (z) = I + н° (z) = 1 + Н (z) + Н° (z) - Н (z).
Если
| Н° (z) - Н (z) | < |1 + Н (z) | (5.11)
на единичной окружности, то из принципа вариации аргумента следует, что разности между количеством полюсов и нулей вне единичного круга для функций (1 + //) и (1-|-Я0) одинаковы.
Теорема 5.2. Рассмотрим замкнутые системы S и S0, полученные из систем с импульсными передаточными функциями Н и Н° соответственно путем включения в них отрицательной обратной связи с единичным усилением. Система S0 устойчива, если выполняются следующие условия:
• S — устойчива;
• Н и Н° имеют одинаковое количество полюсов вне единичного круга;
• неравенство (5.11) выполняется для |z| = 1.
Из теоремы следует, что для проектирования регулятора для системы важно знать число неустойчивых состояний. Кроме того, неравенство (5.11) определяет область частот, для которой требуется хорошее описание процесса. В частности, требования к точности незначительны для частот, на которых усиление велико. Высокая точность необходима для частот, где H°(z)^ — 1.
Полученный вывод тесно связан с результатом, который позволяет взглянуть на проблему с иной точки зрения. Импульсную передаточную функцию замкнутой системы (5.10) также можно записать в виде
Н 1/Н° с 1 + 1/#° ‘
Тогда полюса замкнутой системы совпадают с корнями функции fc (z) = 1 -f- иа - 1 + + [ но — 77Д5)] •
Из принципа вариации аргумента следует, что разности между количеством нулей и полюсов функций (1 + 1 /№)' и (1 ф-
+ 1///) вне единичного круга одинаковы, если
~ Wrl< I 1 (5‘12)
на единичной окружности.
Теорема 5.3. Рассмотрим замкнутые системы S и S0, полученные путем включения отрицательной обратной связи с единичным усилением в системы с импульсными передаточными функциями Н и № соответственно. Система 5° устойчива, если выполняются следующие условия:
• S-устойчива;
• Н и имеют одинаковое число нулей вне единичного круга;
• неравенство (5.12) выполняется для |г| = 1.
Из теоремы следует, что необходимо знать число нулей вне единичного круга, а также, что устойчивость может сохраняться, несмотря на заметную разницу между Н и Н°, при условии большого усиления в цепи.
Из теорем 5.2 и 5.3 вытекают правила проектирования систем с обратной связью по приближенным или неточным моделям:
• важно знать число неустойчивых полюсов и нулей;
• необязательно иметь точную модель для частот, на которых усиление цепи можно сделать большим;
• необходимо минимизировать усиление на частотах, для которых модель неточна;
• необходимо, чтобы модель точно описывала систему на частотах, для которых H°(z) ~ —1.
Второй метод Ляпунова
Для определения устойчивости нелинейных динамических систем полезным инструментом является второй метод Ляпунова. Ляпунов разработал свой метод для дифференциальных уравнений, но аналогичные выводы могут быть получены и для разностных уравнений.
Определение функции Ляпунова. V(x) является функцией Ляпунова для системы
x(k+ l) = f(x(k)), НО)-о, (5.13)
если
® У(х) непрерывна по л и У(0) = 0;
• 1/(х) положительно определена;
• Д V(х) = V(f (х)) — V(x) отрицательно определена.
Простая геометрическая иллюстрация определения приводится на рис. 5.6. Линиями уровня положительной функции V
являются замкнутые кривые, окружающие начало координат; при этом каждой линии соответствует определенное значение функции. Согласно условию 3, динамика системы такова, что решение всегда перемещается в направлении линий с меньшим значением функции. Все линии уровня охватывают начало координат и не пересекаются с линиями другого уровня. Таким
Рис. 5.6. Геометрическая иллюстрация теоремы Ляпунова.
образом, кажется разумным, что существование функции Ляпунова обеспечивает асимптотическую устойчивость.
Теорема устойчивости Ляпунова. Решение x(k) = 0 асимптотически устойчиво, если для системы (5.13) существует функция Ляпунова. Кроме того, если
О < <Р (II х ||) < V (х),
где <р(||х||)->-оо при ||х||-> оо, то решение асимптотически устойчиво для любых начальных условий.
Главная трудность, возникающая при использовании теоремы Ляпунова, состоит в построении подходящей функции Ляпунова. Обычно это очень сложная задача; однако для линейной системы (5.4) легко построить квадратичную функцию Ляпунова. Проверим, является ли функция V(х) — хтРх функцией Ляпунова. Ее приращение равно
AV (х) = V (Фх) — V (х) = х7Ф7РФх - хтРх =
= хт [ФГРФ - Р] х = - xTQx.
Для того чтобы V была функцией Ляпунова, необходимо и достаточно, чтобы существовала положительно определенная матрица Р, удовлетворяющая уравнению
ФГРФ —P = -Q, (5.14)
где Q — положительно определена. Уравнение (5.14) называется уравнением Ляпунова. Можно показать, что оно всегда имеет решение, если линейная система устойчива. Матрица Р положительно определена, если Q также положительно определена.
5.2. УПРАВЛЯЕМОСТЬ, ДОСТИЖИМОСТЬ И НАБЛЮДАЕМОСТЬ
Данный раздел посвящен рассмотрению двух фундаментальных свойств динамических систем. Первое связано с возможностью перевести систему из заданного начального состояния в любое другое, второе — с возможностью определить состояние динамической системы по наблюдаемым входам и выходам. Оба этих свойства были сформулированы и продемонстрированы Калманом [5], который также ввел понятия управляемости и наблюдаемости для одномерных и многомерных систем.
Управляемость и достижимость
Рассмотрим систему (5.1). Предположим, что задано ее начальное состояние х(0). Тогда состояние системы в момент времени п (здесь п — порядок системы) определяется соотношением
х (п) = Фпх (0) 4- Ф"-1Гы (0) + ... + Ги (п — 1) = Фпх (0) + lFct/,
(5.15) где
ГС = [Г ФГ ... Ф"-Т], U = \uT(n—\) ... и7 (О)]7.
[Ср. с уравнением (3.13).] Если 1ЕС имеет ранг п, то можно найти п уравнений, решением которых является такой управляющий сигнал, что из начального состояния система перейдет в желаемое конечное состояние х(п).
♦♦♦ Заметим, что такое решение неединственно, если существует более одного входного сигнала.
Определение управляемости. Система (5.1) управляема, если существует управляющая последовательность, переводящая систему из любого начального состояния в начало координат за конечное время.
С управляемостью тесно связано понятие достижимости.
Определение достижимости. Система достижима, если существует управляющая последовательность, переводящая систему из любого начального состояния в произвольное состояние за конечное время.
Управляемость не означает достижимость, что следует из уравнения (5.15). Если Ф"х(0)—0, то нулевое состояние получается при нулевом входе, но система необязательно достижима. Однако эти понятия эквивалентны, если матрица Ф обратима.
Из определения достижимости следует приводимая ниже теорема, которая проверяется непосредственно.
Теорема 5.4. Система (5.1) достижима тогда и только тогда, когда матрица имеет ранг п.
♦♦♦ Заметим, что матрицу Wc обычно называют матрицей управляемости по аналогии с непрерывными системами.
Пример 5.4 •' -V
Система
Г1 °1 Г 11
х(£ + 1) = ^0 ! Jx + L ! J «
недостижима, так как
Если же было бы два входа с невырожденной матрицей Г, то система достигала бы любого состояния за конечное время.
В силу теоремы Гамильтона — Кэли из (5.15) следует, что все состояния, достигаемые из начала кординат, «натянуты» на столбцы матрицы управляемости Wc. Это означает, что достижимые состояния принадлежат линейному подпространству, порождаемому столбцами матрицы Wc-
Пример 5.5
Пусть дана система
+ J]*14+[-«]““* '«"-[г]'
Можно ли найти такую управляющую последовательность, что хт(2) = = [—0,5 1]? Из уравнения (5.15) следует, что
х (2) = Ф2х (0) + ФГи (0) + Ги (1), или
[ ~Г ] ~ [ ] + [ - ад] <"> + “ >'»•
Отсюда получаем, что
0,5и (0) + «(1) = —4.
Следовательно, одна допустимая управляющая последовательность существует: н(0) ——2 и и(1) =—3. Предположим теперь, что хт (2) = [0,5 1]. Соответствующая система уравнений
[~23 J0,5][0’5k(0) + k(1)’
не имеет решения, поскольку система недостижима. Матрица управляемости имеет следующий вид:
Г 1 0,5 -]
Wc ~ L — 0,5 — 0,25 J’
Из начала координат возможно достичь только тех точек в пространстве состояний, которые принадлежат подпространству, натянутому на вектор [1 —0.5]г. В примере достижимы и другие точки из-за влияния начального значения.
Предположим, что с помощью невырожденной матрицы преобразования Т введены новые координаты (разд. 3.2). В этих координатах
№С = [Г ФГ ... ф'г-1Г] =
= [7Т ГФГ^ТТ ... ТФп~1Т~1ТГ] = Т])7с. (5.16)
Если Wc имеет ранг п, то и будет того же ранга. Это означает, что достижимость системы не зависит от выбора системы координат.
Заметим, что формула, связывающая и Wc, полезна для вычисления матрицы преобразования, переводящей систему из одной формы Ь другую.
Управляемую форму (разд. 3.2) можно получить, при условии что матрица (3.29) имеет обратную матрицу.
Пример 5.6
Рассмотрим систему третьего порядка
которая приведена к управляемой форме. Матрица управляемости и обратная матрица имеют вид
-1 °1
w~1 = 0 1 «1
_0 0 1 _
Пример можно обобщить до порядка и, где
~1 0 ci аг • 1 • * —2 &п— 1 * ^*п— 3 2
и-'г1 = •
0 0 1 at
о 0 0 1
Задача слежения
Из приведенных выше определений и выкладок следует, что можно найти такую управляющую последовательность, что любое состояние достигается в результате не более п шагов. Но
означает ли при этом достижимость возможность отслеживания некоторой заданной траектории в пространстве состояний? Допустим, 1Гто из произвольного известного состояния x(k) систему надо перевести в состояние x(k + 1). Из (5.15) видно, что это выполнимо только в том случае, когда Г имеет ранг п, т. е. необходимо, но не достаточно иметь п входных сигналов. Вообще говоря, для одномерной системы некоторое состояние можно получить только в каждой n-й точке квантования при условии, что оно известно за п шагов до него.
Задача отслеживания заданного выхода существенно проще. Предположим, что заданная траектория есть uc{k). Тогда управляющее воздействие и должно удовлетворять условию
£/(£) ^=^^u{k) = uc(k),
или
= (5.17)
Предположим далее, что в системе существует временная задержка на d шагов. Тогда модель u(k) имеет причинный характер только тогда, когда требуемая траектория известна за d шагов. В этом случае управляющий сигнал вырабатывается в реальном времени. Таким образом, управляющее воздействие получают, подавая на вход обращенной системы А/В требуемый выходной сигнал. Уравнение (5.17) имеет единственное решение, если сигнал uc(k) таков, что существует k0, при котором u(k) =0 для всех k < k0 (разд. 3.3.). Сигнал и ограничен, если ис ограничен и обратная система устойчива.
Наблюдаемость
Для решения проблемы отыскания состояния системы по ее выходу вводится понятие ненаблюдаемых состояний.
Определение. Состояние х°#=0 ненаблюдаемо, если существует конечное ki^n—1, такое что y(k) — O для 0 k ki при х(0) = х° и и(/г) = О для 0 /г k\.
Система (5.1) наблюдаема, если существует такое конечное k, что знания входов и(0), ..., u(k—1) и выходов у (б), ... ...,y(k—1) достаточно для определения ее начального состояния.
Рассмотрим систему (5.1). Действие известного входного сигнала всегда можно определить, и поэтому общность решения не пострадает, если предположить, что и(/г) = О. Допустим, что даны 1/(0), г/(1), ...,у(п—1). Можно записать следующую
систему уравнений:
у(О) = Сх(О), г/(1) = Сх(1) = СФх(0),
у(п — 1) = СФп' 'х(О).
Используя векторную запись, получаем
3 с СФ х(0) = КО) У(1) (5.18)
* _у(н - 1)
Состояние х(0) можно получить из (5.18) тогда и только тогда, когда матрица наблюдаемости
С ~
СФ
(5.19)
имеет ранг п. Состояние х(0) ненаблюдаемо, если принадлежит нуль-пространству 1Е0. Если два состояния ненаблюдаемы, то их линейная комбинация также ненаблюдаема. Следовательно, ненаблюдаемые состояния образуют линейное подпространство.
Теорема 5.5. Система (5.1) наблюдаема тогда и только тогда, когда 1^о имеет ранг п.
Такой способ определения наблюдаемости (теорема 5.5) эквивалентен методу для непрерывных систем. Легко показать, что матрица наблюдаемости, так же как и матрица управляемости, не зависит от выбора системы координат.
Пример 5.7
Рассмотрим систему
Г 1,1 — 0,3 "I
х {k + 1) = [ j 0 Jx(fe),
r/(fe) = [l -0,5]x(fe).
2
Г
/
примере 5.7.
; в—[2,5 0]; г—[1 -0.»
g-Ь .......*
Юк
г
i - .
" ,!_•••..............
Ю.к в
Рис. 5.7. Выход системы, описанной
Начальные условия: а—[0,5 I]; б—[1,5 0,51
Матрица наблюдаемости имеет вид
Ранг матрицы Wo равен 1, и наблюдаемые состояния принадлежат нуль-про-странству U^o, т. е. [0,5 1]. На рис. 5.7 показаны выходы для четырех различных состояний: все начальные состояния, лежащие на линии, параллельной [0,5 1], дают одинаковый выход (рис. 5.7,6 и г).
Декомпозиция Калмана
Достижимая и ненаблюдаемая части системы — это два линейных подпространства в пространстве состояний. Они не зависят от выбора системы координат в пространстве состояний. Кал-ман показал, что существует такая система координат, в кото-
где Ф//, Г/ и Ci — матрицы соответствующего ранга. Система разлагается на четыре части, каждая из которых соответствует достижимому и наблюдаемому, недостижимому, но наблюдаемому, достижимому, но ненаблюдаемому, недостижимому и ненаблюдаемому состояниям.
В результате несложных алгебраических преобразований оператор импульсного перехода можно записать в виде
#(</) = С. (^-ФпГ’Гр
Таким образом, он определяется достижимой и наблюдаемой частью системы.
Теорема 5.6. Декомпозиция Калмана. Линейная система может быть разложена на четыре подсистемы со следующими свойствами:
Sor — наблюдаемая и достижимая подсистема;
Sor—наблюдаемая, но недостижимая подсистема;
^ог — ненаблюдаемая, но достижимая подсистема;
St- — ненаблюдаемая и недостижимая подсистема.
Импульсная передаточная функция системы однозначно определяется наблюдаемой и достижимой подсистемой.
Блок-схема декомпозиции показана на рис. 5.8; очевидно, что связь «вход-выход» определяется только подсистемой SOr.
Потеря достижимости и наблюдаемости при квантовании
Квантование непрерывной системы дает дискретную систему с матрицами, ранг которых зависит от периода квантования. Проанализируем, как это влияет на достижимость и наблюдаемость дискретной системы. Для получения достижимой дискретной системы необходимо, чтобы исходная непрерывная система также была достижима, так как допустимые управляющие сигналы дискретной системы (кусочно-постоянные сигналы) есть подмножество допустимых управляющих сигналов непрерывной системы. Однако для некоторых значений периода квантования достижимость теряется.
Условия ненаблюдаемости в непрерывном случае более строгие, так как выход должен быть равен нулю на некотором ин-
тервале времени, тогда как дискретный выход — только в моменты квантования. Это значит, что непрерывный выход может колебаться между моментами квантования и быть равным нулю в них. Данное явление иногда называют скрытым колебанием. Таким образом, дискретная система может быть ненаблюдаема, даже если соответствующая непрерывная — наблюдаема. Для иллюстрации сказанного воспользуемся гармоническим осциллятором.
Пример 5.8
Дискретная модель гармонического осциллятора задается следующими уравнениями (пример А. 3):
[cos сой sin сой 1 Г 1 “ cos сой ”1
, , I х (kh) + . , и (kh),
sin сой cos сой J L sin сой J
у (kh) = [1 0] х (kh).
Определители матриц управляемости и наблюдаемости имеют вид
det Wc = — sin сой (1 — cos сой)
det tt7o = sin сой.
Достижимость и наблюдаемость теряются при сой = пл, хотя соответствующая непрерывная система (А. 7) управляема и наблюдаема.
5.3. АНАЛИЗ СИСТЕМ С ОДНИМ КОНТУРОМ ОБРАТНОЙ СВЯЗИ
Применение обратной связи в дискретных системах, как и в непрерывных, позволяет получить некоторые преимущества, например: (1) улучшить переходной процесс в системе; (2) уменьшить чувствительность к изменению параметров в разомкнутой системе; (3) устранить установившуюся ошибку, если в разомкнутой системе достаточно интеграторов.
Устойчивость замкнутой системы можно исследовать методами, указанными в разд. 5.1. Метод корневого годографа удобен для анализа системы с одним контуром обратной связи. Так как введение обратной связи изменяет полюса системы, то важно понимать взаимосвязь между расположением полюсов дискретной системы и характером переходных процессов в ней (разд. 3.5).
Установившееся состояние
При анализе систем управления важно вычислить значения установившегося выхода и ошибки. Рассмотрим простейшую систему с обратной связью, показаннуо ра рис. 5.3. Для обобщения предположим, что в контуре обратной связи передаточная функция —1 заменена на —Н(д). Тогда ошибка e(k) определяется из соотношения
е = [1 + Нй (q) Н (q)} Uc (5-20)
Для вычисления установившегося значения e(k) при условии, что оно существует, можно воспользоваться теоремой о предельном значении (разд. 3.4, табл. 3.2). В случае ступенчатого входного сигнала установившаяся ошибка определяется подстановкой в (5.20) значения q — 1.
Число интеграторов в разомкнутой системе определяет класс задающих значений, для которых нет установившейся ошибки. Если разомкнутая система имеет р интеграторов, то ошибка
Рис. 5.9. Генерация задающего значения при использовании динамической системы с импульсным входом.
в установившемся режиме будет равна нулю (при условии, что система асимптотически устойчива) для задающих сигналов, которые являются многочленами от k порядка, меньшего или равного р— 1.
Пример 5.9
Рассмотрим систему
, w w < и - Al) to-В “»
Замкнутая система (рис. 5.3) дает
(<7 - 0,8) (</— 1) — (q - 0,8) (q - 1) + q - 0,5 с
Предположим, что ис — единичная ступень. Так как замкнутая система устойчива, можно применить теорему о предельном значении, чтобы показать, что статическая ошибка равна нулю. Это легко сделать, положив q — 1. Можно поступить иначе и воспользоваться тем, что разомкнутая система содержит один интегратор, т. е. полюс в точке -|-1.
Если ис — единичный люфт, то его z-преобразование определяется с помощью табл. 3.3 (разд. 3.4). В этом случае установившаяся ошибка определяется соотношением,
(2-0,8) (2-1) 2(1-2-*)
felimoe(fe)-limi (z_0,8)(z-l) + z-0,5 (2-I)2 ’°’ '
Для упрощения записи во многих случаях удобно считать, что входные сигналы или возмущения генерируются динамической системой (рис. 5.9). При этом предполагается, что вход динамической системы — единичный импульс т. е.
uc{k)~ Нс
Чтобы выработать ступень, используется передаточная функция Hc(q) = q/(q—I)-, а люфт Нс (q) = <?/(<? — I)2. Конечное значение легко получается из теоремы о предельном значении.
Моделирование
Г
Изучение динамических систем, например поведения цифровых систем управления между моментами квантования, осуществляется с помощью моделирования. В этом случае последнее должно дополняться анализом, так как. при моделировании не всегда можно учесть все неблагоприятные ситуации, например с точки зрения устойчивости, наблюдаемости или достижимости.
Важно, чтобы моделирующая программа была настолько простой в эксплуатации, что исследователь, которого в первую очередь интересует результат, мог бы всецело сосредоточиться только на процессе исследования.
В начале 60-х годов было создано несколько пакетов программ для моделирования. Они, как правило, представляли собой цифровую реализацию непрерывных моделей. Программирование осуществлялось с использованием блок-схем и модулей с фиксированными функциями. Позднее были созданы программы, в которых модели задавались непосредственно уравнениями.
При моделировании важно, чтобы исследователь имел надежную связь с ЭВМ и умел легко изменить параметры и модифицировать модель. Использование операционных систем с разделением времени позволяет создавать итерактивные моделирующие программы. В этом случае пользователь может непосредственно контактировать с ЭВМ и определять следующий шаг на основе полученных результатов. Один из путей реализации подобного моделирования — предоставить ЭВМ право задавать вопросы, а исследователю выбирать один из заранее определенных ответов. Такой способ взаимодействия пользователя и ЭВМ называется режимом меню. Возможен и командный режим, напоминающий проблемно-ориентированный язык высокого уровня, в котором пользователь имеет возможность выбора команды из всех доступных в системе. Такой способ связи с ЭВМ оказывается более гибким и очень эффективным, если им оперирует квалифицированный пользователь.
В моделирующих пакетах также важно иметь гибкую систему представления результатов, которые часто изображаются графически. Наконец, чтобы решать рассматриваемые в данной книге задачи, необходимо уметь сочетать непрерывные и дискретные системы.
На факультете автоматического управления Лундского технологического института был создан итерактивный моделирующий пакет Simnon, работающий в командном режиме. Большинство приведенных в книге примеров получено с его помощью. Возможности и свойства пакета Simnon перечислены в приложении С (см. литературу).
Управление интегратором второго порядка
В качестве типичного примера, демонстрирующего изменение поведения системы при различных регуляторах, рассмотрим интегратор второго порядка. Оператор импульсного перехода в этом случае для периода квантования h — 1 имеет вид
• (5.21)
Предположим, что управление заключается в отслеживании заданного выхода при изменении установочных 'значений. Кроме
Рис. 5.10. Корневой годограф (5.23) при К>0.
того, допустим, что процесс управляется ЭВМ, использующей пропорциональную обратную связь, т. е.
u(k) = K[uc(k) — y(k)] = Ke(k), Л>0, (5.22)
где ис — установочное значение. Характеристическое уравнение замкнутой системы имеет вид
(q- 1)2 + О,5Л(<7+ 1) = 0. (5.23)
Вид корневого годографа (рис. 5.10) свидетельствует о том, что замкнутая система неустойчива при всех значениях коэффи
Рис. 5.11. Дискретный регулятор с обратной связью по положению и скорости двойного интегратора.
циента усиления К- Этот результат согласуется с выводом, полученным по критерию Джури (пример 5.2).
Для получения устойчивой системы необходимо модифицировать регулятор. Из теории синтеза непрерывных систем известно, что дифференцирование улучшает их устойчивость, по
этому введем в дискретную систему пропорциональную обратную связь по производной, т. е.
u(k) = K[e(k)-TDy(k)] (5.24)
(рис. 5.11). Таким образом, скорость у также квантуется и подается на вход системы по каналу-юбратной связи. Чтобы
Рис. 5.12. Корневой годограф характеристического уравнения системы (5.26) при ТD=* 1,5 по отношению к параметру К.
Im z
найти модель «вход-выход» замкнутой системы с регулятором (5.24), заметим, что
Так как и постоянно в течение периода квантования, то
У (k + 1) — у (k) = и (k),
или
(5.25)
Уравнения (5.21), (5.24) и (5.25) определяют замкнутую систему
У = (<7 - 1) (<7 - 1 + ТдК) + 0,5К (<7 + 1) Uc (5-26)
Это система второго порядка с двумя параметрами К п Тв, которые можно варьировать для выбора полюсов замкнутой системы. Замкнутая система устойчива, если Л>0, TD > 0,5 и TDK < 2. Корневой годограф относительно К для характеристического уравнения системы, заданного уравнением (5.26), показан на рис. 5.12 при TD — 1,5.
Пусть задающий сигнал — ступень. На рис. 5.13 показаны непрерывные выходные величины для четырех различных значений К- Поведение замкнутой системы варьируется от колебательного до быстрозатухающего процесса. При К = 1 выход становится равным установочному значению после двух квантований. Такой процесс называется апериодическим управлением. При К > 1 входной и управляющий сигналы колеблются вследствие наличия дискретного полюса на отрицательной дей
ствительной оси. Полюса расположены внутри единичной окружности, если К < 4/3.
Для определения реакции замкнутой системы важно понимать связь между расположением полюсов дискретной системы и ее реакцией (разд. 3.5). Из рис. 3.7 следует, что /С = 0,75 соответствует коэффициенту затухания £ — 0,4. Расстояние до начала координат является мерой быстродействия системы.
рис. 5.13. Непрерывный выход системы, изображенной на рис. 5.11. при 7" = 1,5 и К = 0,5, 0,75, 1 и 1,25 соответственно.
Таким образом, используя дискретную модель, можно получить хорошую систему управления, однако при этом необходимо соблюдать осторожность. В качестве примера возьмем для начала модель (5.21), которую можно описать разностным уравнением
y(fc) = 2i/(fc- 1) — y(k-2) + Q,5u(k- 1) + 0,5u(fe - 2).
Управление заключается в отслеживании некоторой заданной траектории uc(k). Если выбрать управляющий сигнал так, что правая часть предыдущего уравнения будет равна установочному значению в момент времени k — 1, то регулятор будет описываться уравнением
«(^) - (^) ~ 2 v+\ ° у <5-27>
Замкнутая система задается соотношением y(k) — uc{k— 1). Выход становится равным установочному значению после одного шага. Использование регулятора (5.24) при /\ = 1 и TD = — 1,5 приводит к тому же результату через два шага. Реакция на ступенчатое воздействие и управляющий сигнал для закона управления (5.27) показаны на рис. 5.14. В моменты квантования система имеет расчетные характеристики, однако непрерывный выход колеблется. Следовательно, для изучения пове-
дения системы между моментами квантования необходимо построить ее' имитационную модель. Однако обнаружить, что что-то не так, можно и при анализе дискретной системы. То, что здесь что-то не в порядке, видно по управляющему сигналу.
__Л__ fAf\№ и (к)
Рис. 5.14. Реакция на ступенчатое воздействие и управляющий сигнал двойного интегратора при использовании регулятора (5.27).
/
О
5
О
-5
О 5 Юс
Закон управления (5.27) и (5.21) определяет замкнутую систему управления
у = U + 1) [<?2 -2^1 - (- 2? + 1)] =
= ис (&) — ис (k — 1).
(q + 1) L ' 7
Такая система имеет порядок, равный трем; объект управления имеет два режима, а регулятор — один. Нуль на границе устойчивости компенсируется полюсом. Подобный режим в замкнутой дискретной системе ненаблюдаем. Это означает, что замкнутая система в результате неверного выбора регулятора потеряла наблюдаемость.
Результаты, полученные при рассмотрении поведения двойного интегратора второго порядка с некоторыми простейшими регуляторами, могут быть обобщены и для более сложных систем.
Скрытые колебания
Непрерывный выход объекта управления может обнаруживать колебания, которые не заметны в моменты квантования (рис. 5.13 и 5.14). Это явление называют скрытыми колебаниями или вибрацией между моментами квантования. Эффективное средство обнаружения скрытых колебаний—моделирование, а также использование модифицированного z-преобразования или уравнения (3.2); однако и несложный анализ может прояснить ситуацию.
Вибрация между моментами квантования непосредственно определяется динамикой разомкнутой системы, поскольку си
стема между точками квантования функционирует как разомкнутая. Можно выделить два типа скрытых колебаний:
• разомкнутые или замкнутые системы с колебаниями в непрерывном выходе, которые не отражаются на управляющем сигнале;
• колебания между моментами квантования, вызванные колебаниями управляющего сигнала.
Скрытые колебания первого типа могут иметь место вследствие потери наблюдаемости разомкнутой системы при кван-
Рис. 5.15. Реакция на ступенчатое воздействие непрерывной системы, описанной в примере 5.10.
Моменты квантования показаны кружками.
товании: импульсная передаточная функция компенсирует полюса и нули, и их действие не проявляется в моменты квантования. Кроме того, скрытые колебания могут появляться, если непрерывная система имеет колебательный режим и период квантования соответствует его частоте. Скрытые колебания подобного типа возникают только при определенных значениях периода квантования. Изменение последнего приводит к тому, что система становится наблюдаемой и колебания начинают проявляться в дискретном выходе. Для выявления таких вибраций между моментами квантования необходимо проверить наблюдаемость дискретной системы (пример 5.8).
Скрытые колебания второго типа возникают, когда слабо демпфированные нули разомкнутой системы демпфируются регулятором. В этом случае колебания проявляются в управляющем сигнале, они являются причиной вибрации между моментами квантования (рис. 5.13 и 5.14). Скрытые колебания данного типа нельзя выявить, просто изменив период квантования, если при этом нули процесса по-прежнему компенсируются.
Итак, скрытые колебания отсутствуют, если ненаблюдаемые разомкнутые режимы не носят колебательный характер и если неустойчивые и слабозатухающие нули объекта управления не компенсируются регулятором.
Пример 5.10
Рассмотрим непрерывную систему, имеющую следующую передаточную функцию:
s + 1 ~ (s + 0,02)2 + л2 '
Квантование системы с периодом h = 2 дает импульсную передаточную функцию
где а = е~2.
Дискретная система имеет порядок, равный единице, тогда как непрерывная — равный трем. Компенсация полюсов и колебательных нулей — признак того, что возможны скрытые колебания. На рис. 5.15 показана реакция непрерывной системы на ступенчатое воздействие. Моменты квантования изображены маленькими кружками. В точках квантования поведение системы аналогично поведению системы первого порядка.
ЗАДАЧИ
5.1. Определите, имеют ли следующие уравнения:
a) z2—1,5z + 0,9 = 0; б) z3—3z24-2z— 0,5 = 0; в) z3— — 2z2 4* 2z — 0,5 = 0; г) z3 -f- 5z2 — 0,25z — 1,25 = 0; д) z3 — — l,7z2 + l,7z — 0,7 = 0 все свои корни внутри единичного круга 5.2. Пусть для системы, изображенной на рис. 5.3
z(z-0,2)(z-0A) ’
А > 0.
Определите значения К, при которых замкнутая система устойчива.
5.3. Предположим, что квантование системы, изображенной на рис. 4.20, а, осуществляется с перидом h и что ЦА-преобразо-ватель поддерживает постоянный уровень управляющего сигнала в течение интервала квантования. Пусть закон управления задается соотношением
и (kh) = A [ис (kh — т) — у (kh — т)],
где К>0 и т — время вычислений. Передаточная функция объекта управления имеет вид G(s)=l/s. Определите значения коэффициента усиления регулятора А, при которых замкнутая система устойчива, если т = 0 и т = h?
Сравните эту систему с соответствующими непрерывными, т. е. при непрерывном пропорциональном регуляторе и временной задержке в объекте управления.
5.4. Постройте диаграмму Найквиста для системы H0(z) = - 1/(2— 0,5).
5.5. Найдите функцию Ляпунова для нелинейного управления в примере 1.5 и покажите, что решение асимптотически устойчиво.
5.6. Для системы
Г 1 ° 1 г И
^(^+1)=[1 j J x(k)+ | 0 J «(&),.
j/(fe) = [0 l]x(fe)
получены следующие значения:
У(1) = О,
У(2)=1,
и(1)= 1, п(2) = — 1.
Определите состояния при k = 3.
5.7. Выясните, наблюдаема и достижима ли следующая система:
Г 0,5 —0,5 1 Г 6 1
х(^+1) = [0 о,25 + L 4
^(*) = [2 -4]x(fe).
5.8. Выясните, достижима ли следующая система:
Г 1 0 1 г 1 11 х(А+1)==|^0 05Jx(fe)+[ j 0J«(6).
Введем скалярный вход u'(k), такой что u(k) можно представить как
Г 1 1
«(£)=! lu'(k).
Достаточно ли только u'(k) для достижимости?
5.9. Дана система
ГО
х(/с-Ы) = о
Г0“]
2’
3 х(к) + 1 и(Л)
О
О
1 О о
L0 J
Найдите управляющую последовательность, переводящую систему из начального состояния хт(0) = [1 1 1] в начало координат. Определите минимальное число шагов для решения этой задачи. Объясните, почему невозможно найти последовательность, которая переводила бы систему из начала координат в [1 1 1]г.
5.10. Проверьте формулу для IF71» данную в примере 5.6 для системы порядка п.
5.11. Система
х (k + 1) = Фх (/г) + Ги (k)
получена из системы
z (k 4- 1) — Fz (k) 4* Gu (k)
линейным преобразованием z — Tx.
Используя результаты разд. 5.2, получите формулу для Т, при dim(M)=l; dim(w) = r. Используйте полученный ответ для решения задачи 3.7.
5.12. Определите область устойчивости и установившееся значение выхода для системы, показанной на рисунке, у которой
? _ о,5) >
ис — ступенчатая функция, a (a) Hr(q) = K (пропорциональный регулятор) К>0и (б) Hr(q) = Kq/(q—1) (интегральный регулятор) К > 0.
5.13. Определите для системы из задачи 5.12 стационарную ошибку между задающим сигналом ис и выходом, если ис — единичный люфт, т. е. uc(k) = k. Решите задачу для случая Нг — пропорциональный регулятор; Нг — интегральный регулятор.
5.14. Проквантуйте систему
I \ s Я- 1
G ~ S2 + 0,2s + 1
и найдите периоды квантования, при которых реакция системы будет иметь скрытые колебания. Проверьте результат моделированием.
5.15. Имеется система с оператором импульсного перехода (задача 3.10). Введите регулятор, как на рис. 5.15; пусть задающий вход — ступень. Определите стационарную ошибку при использовании пропорционального регулятора К, интегрального регулятора /С/(1— q~})- Промоделируйте систему, используя эти регуляторы. Подберите К так, чтобы полюса замкнутой системы соответствовали затуханию £ = 0,7.
5.16. Рассмотрите систему, приведенную на рис. 5.3, и получите выражение для коэффициента ошибки скорости, дающее установившуюся ошибку, если ис — единичная наклонная линия.
ЛИТЕРАТУРА
Первые работы, посвященные методам определения положения полюсов
I Schur J. (1918); “Ober Potenzreihen, die im Inneren des Einheitskreises beschankt sind. II", Zeitschrift jiir die reine und angewandte Matematik, 148, 122-45.
2. Cohn A. (1922); “Uber die Anzahl der Wurseln einer algebraischen Gleichung in einetn Kreise”, Motematische Zeitschrift, 14, 110-48.
Критерий Джури — это упрощенный метод Шура — Коха
3. Jury Е. I., Blanchard J. (1961): “A Stability Test for Linear Discrete Systems in Table Form”, Proc. IRE, 49, 1947-48.
Простое доказательство критерия Джури
4. Astrom К. J. (1970): Introduction to Stochastic Control Theory. New York: Academic Press. [Имеется перевод: Острей К. Введение в стохастическую теорию управления. — М.: Мир, 1973.]
Использование теоремы Ляпунова в дискретных системах управления
5. Kalman R. Е., Bertram J. Е. (1960): “Control System Analysis and Design via the Second Method of Lyapunov: II Discrete-Time Systems”, Trans. ASME Journal Basic Eng., Series D, no 3, 371-400.
Понятия управляемости и наблюдаемости
6. Kalman R. E. (1960): “On the General Theory of Control Systems”, Proc. First I FAC Congress, Moscow, Butterworths, 1, 481-92.
7. Kalman R. E., Ho Y. C., Narendra K. S. (1963): Controllability of Linear Dynamical Systems. In Contribution to Differential Equations, 1, 189-213, New York: John Wiley.
Скрытые колебания и их причина
8. Jury Е. I. (1957): “Hidden Oscillations in Sampled-Data Control Systems”, AIEE Trans., 75, pt. II, 391-95.
Общие аспекты моделирования на ЭВМ
9. Gordon G. (1969): System Simulation. Englewood Cliffs, N. J.: Prentice-Hall, Inc.
Пакет моделирования SIMNON
10. Elmqvist H. (1977): “Simnon: An Interactive Simulation Program for Nonlinear Systems”, Proc. International Symposium 'T1, Montreux.
11. Astrom K. J. (1982): A Simnon Tutorial. Department of Automatic Control, Lund Inst of Tech., CODEN: LUTED2/(TERT-3168) 1-52/(1982).
12. Astrom K. J (1983): “Computer-Aided Modeling, Analysis and Design of Control Systems: A perspective”, IEEE Control Systems Magazine, 3, no 2 4-16.
Модели возмущений
Различные способы устранения возмущений и их эффективность. Детерминированные и стохастические модели возмущений.
Реакция линейных систем на возмущения
ВВЕДЕНИЕ
Одной из главных побудительных причин введения автоматического управления являются возмущения. При их отсутствии отпадает необходимость в контуре обратной связи. Характер возмущений налагает фундаментальные ограничения на эффективность системы управления. Шум при измерениях в следящей системе сужает диапазон регулирования в системах управления с обратной связью, а его природа определяет возможное качество регулирования. Возмущения также несут важную информацию о свойствах системы. Изучая их характеристики, можно выявить состояние системы, включая регистрацию неполадок на ранней стадии.
Все классические модели возмущений — импульс, скачок, люфт, синусоида — могут быть представлены как выход линейной системы с соответствующими начальными условиями. В результате проблема анализа действия возмущений на линейную систему сводится к решению некоторой задачи Коши. С точки зрения модели типа «вход-выход» возмущения можно рассматривать как импульсную характеристику линейного фильтра, а их анализ в этом случае ограничить ее вычислением. Это особенно полезно, если возмущения имеют форму скачка или синусоиды. Когда же требуется определить реакцию системы на специфическое возмущение, то часто прибегают к моделированию, при этом анализ влияния возмущений вновь сводится к решению задачи Коши.
Если возмущения нельзя ни устранить, ни измерить, необходимо обратиться к прогнозированию. В этом случае требуются модели возмущений, приводящие к разумным постановкам задачи прогнозирования.
Другой подход к проблеме прогнозирования заключается в описании возмущений как случайного процесса. Ошибка прогнозирования определяет фундаментальные ограничения возможного качества регулирования.
6.1. УМЕНЬШЕНИЕ ВЛИЯНИЯ ВОЗМУЩЕНИЙ
Прежде чем перейти к анализу моделей возмущений, целесообразно обсудить вопрос о том, как можно уменьшить их влияние на поведение системы. Можно попытаться уменьшить возмущения в самом источнике их возникновения. Кроме того, их воздействие можно ослабить, вводя локальную обратную связь или прямую связь по возмущению, если оно измеримо.
Для оценки неизмеряемых возмущений применяется прогнозирование; тогда прогнозируемый вклад возмущений можно подавить введением прямой связи по возмущению.
ft
Уменьшение возмущений в источнике
Самый очевидный путь уменьшения влияния возмущений — воздействие на источники их возникновения. Такой подход тесно связан с проектированием объекта управления. Приведем типичные примеры:
• увеличение однородности состава рабочей смеси за счет использования резервуара с эффективным перемешиванием;
• уменьшение трения в сервомеханизме путем применения более качественных подшипников;
• размещение датчиков там, где возмущения минимальны;
• модифицирование электросхемы датчика с целью минимизации чувствительности к шумам;
• замена датчика другим, имеющим более быструю реакцию;
• изменение процедуры квантования для оптимизации положения дискрет во времени и пространстве в целях лучшего представления характеристик процесса управления.
Уменьшение возмущений с помощью локальной обратной связи
Если возмущения нельзя уменьшить в источнике, то можно попытаться ослабить их влияние путем введения локальной обратной связи. Основная идея такого подхода иллюстрируется на рис. 6.1. Для его реализации требуется, чтобы возмущения поступали в систему локально и легко фиксировались. Кроме того, необходимо чтобы были доступны контролируемые переменные, подверженные возмущениям, а также управляющие переменные, поступающие в систему в непосредственной близости от них. Тогда, применив локальную обратную связь, можно ослабить влияние возмущений. Зависимость измеряемой и управляющей переменных должна быть такой, чтобы можно было использовать высокий коэффициент усиления в контуре управления.
Подобная обратная связь часто оказывается очень простым и эффективным средством уменьшения влияния возмущений,
так как при достаточно большом коэффициенте усиления пол-ная информация о процессе необязательна. Однако в этом случае требуется дополнительный контур обратной связи. Примеры использования локальной обратной связи:
• уменьшение колебаний давления на клапаны, приборы и стабилизаторы путем введения регулятора давления;
Объект управления
Рис. 6.1. Ослабление влияния возмущений с помощью локальной обратной связи. Возмущение должно поступать в систему между точками А и В.
Динамика системы между этими точками должна быть такой, чтобы можно было использовать большой коэффициент усиления в контуре обратной связи-
• уменьшение колебаний измеряемых значений температуры за счет стабилизации напряжения питания.
Уменьшение возмущений с помощью прямой связи
Влияние измеряемых возмущений можно ослабить путем введения прямой связи. Основной принцип этого метода показан на рис. 6.2. Вначале измеряется возмущение, после чего вырабатывается управляющий сигнал, нейтрализующий действие возмущения. Если передаточные функции, связывающие выход
г
Рис. 6,2. Ослабление влияния возмущений с помощью прямой связи,
у с возмущением w и управлением и, есть Hw и Нр соответственно, то легко убедиться, что идеальная передаточная функция компенсатора прямой связи определяется из соотношения
В случае если прямая связь неустойчива или нереализуема, подбирается подходящее приближение. Синтез компенсатора прямой связи часто основывается на простых статических моделях. При этом передаточная функция Нц есть не что иное, как статическое усиление. Прямая связь особенно полезна, когда возмущения генерируются при изменениях в управляющем или задающем сигналах, а также при каскадном соединении объектов управления, если поток возмущений возникает при колебаниях в нормальном течении процесса.
Уменьшение влияния возмущений посредством прогнозирования
Если возмущение измерить нельзя, то его прогнозируют по измеряемому сигналу, а затем по контуру прямой связи подают корректирующее воздействие. Таким образом, прогнозирование по существу представляет собой развитие принципа прямой связи для случая, когда возмущение нельзя измерить.
♦♦♦ 3 аметим, что необязательно прогнозировать само воз-
мущение; необходимо смоделировать только сигнал, являющийся результатом воздействия возмущения на основные переменные процесса.
Цели моделирования
После рассмотрения различных способов уменьшения влияния возмущений становится понятным, как можно использовать модели возмущений. Чтобы определить целесообразность уменьшения возмущений, нужно оценить их влияние на важнейшие переменные системы, что по существу является задачей анализа реакции системы на заданный входной сигнал. Модели возмущений могут быть довольно простыми: необходимо лишь, чтобы они отражали основные характеристики истинных возмущений. Столь же простые модели годятся и Для оценки возможного эффекта от введения локальной обратной и прямой связей.
При прогнозировании требуются более точные модели, так как в этом случае качество управления существенно зависит от характера возмущений. Кроме того, возникают принципиальные затруднения при построении моделей возмущений для разумной постановки задачи прогнозирования,
6.2. КЛАССИЧЕСКИЕ МОДЕЛИ ВОЗМУЩЕНИЙ
Характер возмущений
Принято выделять следующие типы возмущений: отклонение нагрузки, ошибки измерений и колебания параметров системы.
Отклонения нагрузки влияют на переменные процесса. Их источником могут быть возмущающие силы в механических системах, например воздействие порывов ветра на стабилизированную антенну, волн на корабль, нагрузки на мотор. В управлении процессами отклонениями нагрузки могут быть колебания интенсивности входного или выходного потока; в тепловых системах ими могут быть колебания окружающей температуры и т. д. Возмущения нагрузки происходят обычно медленно. Они могут быть и периодическими; например, волны в системе управления корабля.
Ошибки измерения возникают в датчиках и могут быть как статическими (неточность калибровки), так и динамическими (динамика самого датчика). Типичный случай: термоэлемент, который в зависимости от степени его герметизации имеет постоянную времени в пределах 10—50 с. Кроме того, существует сложная динамическая взаимосвязь между датчиками и объектом управления. Типичные примеры: гироскопические измерения и измерения уровня жидкости в ядерном реакторе. Характер ошибок измерений часто зависит от качества фильтрации в приборах. Нередко хорошие результаты дает модификация предфильтра прибора для того, чтобы он отвечал конкретной задаче.
В тех случаях, когда управляемую переменную нельзя измерить непосредственно, ее определяют косвенно по другим переменным. Связь между управляемой и измеряемой переменными может оказаться достаточно сложной, и ее можно характеризовать как нелинейную, нестационарную, динамическую систему. Наиболее распространенная ситуация — это когда один прибор осуществляет измерения быстро, но с большими ошибками, а другой дает точные значения, но с длительной задержкой (например, результаты лабораторного анализа).
Колебания параметров системы. Поскольку мы используем линейную теорию, то здесь рассматриваются только аддитивные отклонения нагрузки и шумы в измерениях. Однако реальные системы часто бывают нелинейными. Это означает, что возмущения могут принимать более сложный характер. Так как линейные модели получают линеаризацией нелинейных, то некоторые возмущения проявляются в виде колебаний параметров линейных систем,
Простейшие модели возмущений
При анализе систем управления обычно используют четыре вида возмущений — импульс, скачок, люфт и синусоиду (рис. 6.3).
Импульс и пульсация — это простейшие модели возмущений короткой продолжительности, которые могут описывать как отклонения нагрузки, так и ошибки измерений. Для непрерывных систем возмущение моделируется импульсом (дельта-функцией), для дискретных систем — пульсацией с единичной амплитудой и продолжительностью, равной одному периоду квантования.
Пульсация й импульс важны и в теоретическом плане, так как линейная непрерывная система, так же как и дискретная, полностью определяется импульсной характеристикой.
Рис. 6.3. Идеализированные модели простейших возмущений. а — прямоугольный импульс; б— скачок; г—люфт; в — синусоида.
Скачок также является моделью возмущения (рис. 6.3) и обычно используется для представления отклонения нагрузки или смещения в измерении.
Люфт представляет собой сигнал, который равен нулю, если время меньше нуля и далее линейно возрастает (рис. 6.3). Он используется при моделировании накапливающейся ошибки измерений и возмущений, которые неожиданно начинают расти. На самом деле возмущения чаще всего ограничены, однако люфт все же полезная модель.
Синусоида, или синусоидальная волна, — это прообраз периодического возмущения. Выбор ее частоты позволяет моделировать как низкочастотные отклонения нагрузки, так и высокочастотный шум в измерениях.
Возмущения удобно рассматривать как выход динамической системы. С точки зрения модели типа «вход-выход» их можно описать импульсной характеристикой. Кроме того, можно считать, что возмущение — это реакция динамических систем с нулевым входом, но с ненулевыми начальными условиями. В обоих случаях их основные характеристики определяются генерирующей динамической системой. Такой подход, конечно, применим как к непрерывным, так и к дискретным системам.
Скачок может вырабатываться интегратором, люфт — интегратором второго порядка, а синусоида — гармоническим осциллятором (примеры А.1 и А.З из приложения А).
Анализ влияния возмущений
Возмущения можно рассматривать как выход линейных динамических систем, поэтому можно непосредственно проанализировать их воздействие на систему.
Анализ в пространстве состояний. Так как возмущения можно считать решениями линейных- дйфференциальных уравнений с некоторыми начальными условиями (задачи Коши), то
Прямоугольный
Рис. 6.4. Сведение анализа влияния возмущений к вычислению импульсной характеристики (ср. с рис. 5.9).
нетрудно исследовать их влияние на линейные системы. К переменным состояния просто добавляются переменные, описывающие возмущения. Система уравнений затем решается с начальными условиями, соответствующими данным возмущениям. Таким образом, анализ возмущений можно проводить методами, описанными в гл. 5.
Анализ «вход-выход». Вследствие того что возмущения представимы как выход линейной системы, на вход которой подается импульсное воздействие, то их влияние на линейную систему можно анализировать, рассматривая каскадное соединение исходной системы и системы, генерирующей возмущения (рис. 6.4). Такой подход особенно полезен в случае приближенной оценки влияния возмущений с помощью теорем о начальном и конечном значениях или диаграмм Боде. Кроме того, он хорош и при моделировании.
6.3. КУСОЧНО-ДЕТЕРМИНИРОВАННЫЕ ВОЗМУЩЕНИЯ
Модели, рассмотренные в разд. 6.2, полезны для анализа влияния возмущений на систему. С помощью этих моделей можно также оценить эффект применения локальной обратной и прямой связи. Однако они не пригодны для исследования характера уменьшения возмущений при применении прогнозирования. Чтобы предсказать сигнал, необходимо иметь более реалистические модели возмущений. Поэтому фундаментальной проблемой является построение модели, позволяющей разумно поставить задачу прогнозирования.
Фундаментальная проблема
Пример 6.1. Предиктор ступенчатого сигнала
Для прогнозирования значения ступенчатого сигнала вполне естественно использовать его текущее значение. Для дискретных сигналов предиктор задается соотношением
у [(/г + т) h I kh] = у (kh}.
Запись j/(Z|s) означает прогноз y(t) на основании данных в момент времени®.
Прогноз имеет ошибку в моменты времени t = 0, h, 2h, .... (т—l)ft, т. е. через т шагов после того, как произошло ступенчатое изменение значения у. Затем он прогнозирует сигнал без ошибки.
Пример 6.2. Предиктор сигнала типа «люфт»
Предиктор люфта можно построить, получив уравнение кривой, проходящей через предшествующее и текущее значения сигнала, и применив затем линейную экстраполяцию по формуле
Q \(k + т) h\ kh] = у (kh} + т[у (kh) — у (kh — h)] ==
= (1 + tn) у (kh) — my (kh — h)
Этот предиктор имеет начальную ошибку для t = /г, 2/г.mh, после чего
он безошибочен
Приведенные примеры показывают, что ошибка прогнозирования равна нулю всюду, кроме нескольких точек, что, однако, не согласуется с практикой, так как на самом деле прогнозировать возмущения непросто. Причина заключается в том, что скачок и люфт — плохие модели для задачи прогнозирования. Построить модели сигналов, которые ведут к ее разумной постановке, конечно, непростая задача. Аналитические сигналы в данном случае бесполезны, так как аналитическая функция однозначно задается своими значениями в произвольно коротких интервалах.
Одна из возможностей построения модели сигнала, отвечающей предъявляемым требованиям, — ввести дополнительные
У, У А
Рис. 6.5. Кусочно-постоянные и кусочно-линейные сигналы и их прогноз на т шагов прн т = 3.
точки нерегулярности. Таким образом, сигналы можно представить какг выход линейных динамических систем с нерегулярными входами. Вместо пульсации в начале координат вводятся входные сигналы, отличные от нуля в нескольких точках. Интересующий класс сигналов получают из предположения, что пульсации отделены друг от друга по., крайней мере на п квантований (где п — порядок системы). Предполагается, что время генерации пульсации, а также их амплитуда заранее не известны. Такие сигналы называют кусочно-детерминированными, так как они определены везде, кроме некоторых отдельных точек, в которых их поведение непредсказуемо. Примеры кусочно-детерминированных сигналов показаны на рис. 6.5.
Для случая кусочно-детерминированных сигналов можно поставить содержательные задачи прогнозирования.
Модели в пространстве состояний
Пусть сигнал вырабатывается динамической системой
x(k+ 1) = Фх(&) + v(k),
y(k) = Cx(k). (6.1)
Предполагается, что выход у — скаляр, система полностью наблюдаема, а вход v равен нулю везде, кроме отдельных изолированных точек. Если известно состояние системы, то легко предсказать ее состояние спустя любой интервал времени, в течение которого вход равен нулю. Однако в случае пульсации состояние может измениться произвольно, но всегда будет существовать промежуток, в течение которого вход будет равен нулю. Так как система наблюдаема, то можно вычислить состояние процесса и дать точный прогноз до появления нового импульса. Подобным рассуждениям можно дать следующее формальное описание. Из условия наблюдаемости (разд. 5.2) следует, что состояние определяется соотношением
x(£-n+l)=^o-Ih/(fe-«+l) ... y(k)]T, (6.2)
где Wo — матрица наблюдаемости, определяемая уравнением (5.19). Следующий предиктор дает состояние на m шагов вперед:
^k + m\k) = ®m+n-'Wo'{y{k-n+ 1) ... y(k)]T. (6.3)
Таким образом, предиктор получен линейной комбинацией п значений измеряемого сигнала. Его можно выразить и так: x(fe+ m | k) = P*(q~1) у (k),
где P — многочлен степени n— 1.
Предиктор также можно описать рекуррентным уравнением x(k\k) = CPx(k — 1 |fe- l} + K[y(k)-C<Dx(k- 1 |&—1)], £(km\k) = Cbmx(k\k). ’ (6.4)
Здесь матрица К выбирается так, чтобы все собственные значения матрицы (/ — КС)Ф были равны нулю.
Несложные вычисления для интегратора первого и второго порядка дают те же результаты, что и в примерах 6.1 и 6.2. Это следствие того, что важнейшие характеристики возмущений определяются динамикой генерирующей их системы. Свойства предикторов иллюстрируются на рис. 6.5.
Модели типа «вход-выход»
Так как предиктор для кусочно-детерминированных сигналов принимает вид многочлена, кажется естественным попытаться получить его непосредственными вычислениями. Для этого предположим, что сигнал вырабатывается динамической системой y(k) = -^w(k), (6.5)
где вход w —сигнал, равный нулю везде, кроме отдельных изолированных точек, отстоящих друг от друга на расстояние, большее, чем deg/l-|-m, a deg С-< deg Д. Определим F(z) и G(z), используя тождество
zm~'C (z) = A (z)F (z) + G (z).
Можно показать, что m-шаговый предиктор для у задается разностным уравнением
С(<?) у (k + т | k) = qG(q)y(k). (6.6)
Доказательство можно найти в работе [4].
♦♦♦ Заметим, что сигналы, рассмотренные в данном разделе, аналогичны сигналам, описанным в разд. 6.2, в том смысле, что они определяются динамическими системами. Единственное различие состоит в том, что входы в системы разные.
6.4. СТОХАСТИЧЕСКИЕ МОДЕЛИ ВОЗМУЩЕНИЙ
Для описания возмущений естественно использовать стохастический, или случайный принцип построения моделей. Такой подход позволяет охватить широкий класс возмущений, что ведет к хорошей постановке задачи прогнозирования.
Стохастические модели
Понятие стохастического процесса довольно сложно. Чтобы прийти к его правильному пониманию, выдающимся ученым потребовалась не одна сотня лет. Окончательно понятие стохастического процесса было сформулировано в работе советского математика А. Н. Колмогорова в 1930 г. В данной книге дано лишь простое изложение основных понятий. Любознатель
ным читателям настоятельно рекомендуется обратиться к первоисточникам, перечисленным в конце главы.
Стохастический процесс (случайный процесс, случайная функция) можно рассматривать как семейство стохастических переменных Стохастические переменные индекси-
руются параметром I, который принадлежит множеству Т, называемому множеством индексов. В теории стохастического управления он интерпретируется как время. Таким образом, Т — это множество действительных переменных. В случае дискретных систем множество Т — это совокупность моментов квантования, т. е. Т — {..., —Л, 0, h, ...}, или Т = {..., —1, О, 1, ...}, если период квантования равен единице
Случайный процесс можно рассматривать как функцию x(t, ю) двух переменных. Для фиксированного со = соо функция х(-,соо) сводится к обычной функции времени, называемой реализацией. При фиксированном t — t0 функция x(t0, •) есть случайная величина. Следовательно, можно считать, что случайный процесс вырабатывается генератором случайных сигналов. Аргумент со при записи часто опускают.
Полностью детерминированные стохастические процессы. Одна из возможностей получения случайного процесса заключается в том, чтобы задать в качестве начального условия для обыкновенного дифференциального уравнения случайную величину и, решая его, генерировать функции времени. Однако случайные процессы данного типа малоинтересны, поскольку они «недостаточно случайны». Это становится очевидным при анализе случайного процесса, вырабатываемого интегратором со случайными начальными условиями. Так как выход интегратора постоянен, то
х (/, со) — х (I — h, со) = О
для всех t, h и со. Такой стохастический процесс называется полностью детерминированным стохастическим процессом, потому что его будущие значения могут быть точно определены по его прошлому.
Вообще говоря, случайный процесс x(Z,co) называют полностью детерминированным, если lx(t, со) = О для почти всех со (здесь I — произвольный линейный оператор, не равный тождественно нулю). Это значит, что полностью детерминированные случайные процессы можно точно прогрнозировать с помощью линейного предиктора почти для всех со (почти все <о означает все со, кроме возможного множества точек с мерой нуль).
Полностью детерминированные случайные процессы тесно Связаны с сигналами, рассмотренными в разд. 6.2. Такие сигналы становятся полностью детерминированными случайными процессами, если в качестве начальных условий для динамиче
ских систем выбраны случайные процессы. Однако их обычно не рассматривают, так как они слишком регулярны, чтобы представлять какой-либо интерес.
Основные понятия теории случайных процессов. Значения случайного процесса в п различных моментов времени представляют собой n-мерные случайные величины. Функция
F&.........U h, .... tn) = P {%(/,) .......(6-7)
где P— вероятность, называется конечномерной функцией распределения вероятностей случайного процесса (рис. 6.6). Слу-
Рис. 6.6. Стохастический процесс и конечномерная функция распределения.
чайный процесс называется гауссовым, или нормальным, если все конечномерные распределения нормальны.
Математическое ожидание (среднее значение) случайного процесса х определяется соотношением
m (0 == Ex (i) = f W (I, /). (6.8)
— оо
Математическое ожидание есть не что иное, как обыкновенная функция времени. Аналогично определяются моменты высших порядков.
Ковариация процесса задается формулой
rXK(s, 0 = cov[x(s), x(/)] = £[x(s) — m(s)] [%(/) —m(;)]r =
= $$ К, - m(s)J & - m(/)]rdF(£„ £2; s, t). (6.9)
Гауссовский случайный процесс полностью характеризуется своими математическим ожиданием и ковариацией.
Аналогично определяется взаимная ковариация для двух стохастических процессов:
rxy(s, /) = cov[x(s), ^(/)J.
Стохастический процесс называется стационарным, если конечномерное' распределение вероятностей х(Л), х(^), , x(tn) тождественно распределению х(Л+т), х(/2-(-т), .... х(/п + т) для любых т, п, t\, ..., tn. Процесс называют слабо стационарным, если первые два момента распределений одинаковы для всех 1.
Математическое ожидание (слабо) стационарного процесса постоянно. Взаимная ковариация слабо стационарных процессов зависит только от разности аргументов s— t. Несколько отступив от принятого обозначения функции, запишем
rxy (s, t) = rKy (s — t). (6.10)
Взаимная ковариация (слабо) стационарных процессов есть функция только одного аргумента. Следовательно,
гху (т) = cov [х (t + т), у (/)]. (6.11)
Если х — скаляр, то функция
гх 00 = Гхх СО = COV [х (t + т), X (/)] (6.12)
называется автоковариацией.
Взаимная спектральная плотность (слабо) стационарных процессов — это преобразование Фурье их ковариации. Отсюда
со
ЧРхУ(®) = ^Г £ rxy(k)e~ika (6.13)
k = — оо
и
Л
rvy (&) — § (®) (6.14)
— Л
Фхх и <рХ{/ также принято называть автоспектральной плотностью и взаимной спектральной плотностью соответственно. Автоспек-тральную плотность для удобства называют просто спектральной плотностью.
Интерпретация ковариации и спектра. Стационарные гауссовские процессы полностью характеризуются своими математическим ожиданием и ковариацией. На практике всегда полезно интуитивно понимать, как свойства стохастического процесса отражаются этими функциями.
Математическое ожидание (среднее значение) почти не нуждается в разъяснениях. Значение ковариации гх (0) в нуле есть не что иное, как дисперсия процесса, характеризующая величину его флуктуации. Среднеквадратическое отклонение равно квадратному корню из гх(0). Если нормализовать ковариацию по гДО), то получим корреляционную функцию, определяемую
Ковариация ry(t)
Спектр 1Фу(0))1
Реализация у{к)
Рис. 6.7. Ковариации, спектральные плотности и дискретные функции для некоторых стационарных случайных процессов.
Все процессы имеют единичную дисперсию.
Из неравенства Шварца вытекает, что |гх(т) | гх(0). Следо-
вательно, корреляционная функция по величине всегда меньше единицы.
Функция рх(т) определяет взаимную зависимость значений процесса, разделенных промежутком времени т. Если она близка к единице, то это означает сильную связь, если она равна нулю — отсутствие связи, а если отрицательная, то связь отрицательная. Таким образом, исследование формы корреляционной функции позволяет судить ©.временной взаимозависимости процесса.
Для оценки связей стохастических процессов полезно анализировать их реализации и ковариации (рис. 6.7; все процессы имеют дисперсию, равную единице).
Функция спектральной плотности также имеет физическую интерпретацию. Интеграл
2 j ф(со)й<в' (6.15)
Шт
дает мощность сигнала в полосе частот (coi,<o2). Таким образом, площадь, ограниченная графиком спектральной плотности, есть не что иное, как мощность сигнала в заданной полосе. Присутствие в спектре выраженных максимумов отражает наличие почти периодических компонент. Общая площадь пропорциональна полной дисперсии сигнала. Для практической деятельности полезно знать, как свойства сигнала связаны с его спектром (ср. с рис. 6.7).
♦♦♦ Заметим, что математическое ожидание, ковариация и спектральная плотность определяются только первыми двумя моментами. Сигналы с сильно различающимися реализациями могут иметь одинаковые моменты. Так, например, спектры случайной телеграфной волны, переключающейся между 0 и 1, и шума обычной /?С-цепочки одинаковы.
Дискретный белый шум
Рассмотрим стационарный дискретный стохастический процесс х, такой что его реализации x(f) и x(s) независимы, если t s. Тогда его можно представить как последовательность {х(£, <о), t—..., —1, 0, 1, ...} независимых, одинаково распределенных случайных величин. В этом случае ковариация определяется из соотношения
( а\ т = 0,
г(т) = 1о, г=±1, ±2........
Процесс с такой ковариацией называется дискретным, белым шумом. Из (6.13) следует, что его спектральная плотность равна <р(со) = о2/(2л), т. е. она постоянна на всех частотах.
Белый шум играет важную роль в стохастической теории управления — все случайные процессы генерируются просто его фильтрацией. Поэтому белый шум здесь играет ту же роль, что и прямоугольные импульсы в детерминированных системах.
АРСС-процессы
Линейная система, на вход которой подается белый шум, генерирует широкий класс процессов. Пусть {e(k), k= .. , —1, О, 1, ...}—дискретный белый шум. Процесс, вырабатываемый си
стемой
y(k) = e(k) + bie(k — 1)4- ... + bne(k — n), называется скользящим средним, или СС-процессом. Процесс, вырабатываемый системой
y(k) + a1y(k~l)+ ... 4- апу (k — n) = e (ft), называется авторегрессионным, или АР-процессом.
Процесс
У (k) 4- щу (ft— 1)4- ... 4-a„y(ft —и) =
< =e(ft)4-&ie(ft—1)4- ... -\-bne(k — п)
называется авторегрессионным процессом со скользящим средним или АРСС-процессом.
Модели в пространстве состояний
Понятие состояние имеет своим началом причинно-следственные связи классической мехники. Движение системы частиц в будущем однозначно определяется их текущими координатами и импульсами, а также возникающими силами; при этом предыстория частиц не имеет значения. Состояние есть абстрагирование этого свойства, т. е. это необходимый минимум информации об истории системы для прогнозирования ее поведения.
Для стохастических систем невозможно точно определить их будущее состояние. Поэтому естественным развитием понятия состояния для этих систем является требование, чтобы распределение вероятностей следующего состояния однозначно определялось текущим. Стохастические процессы, обладающие таким свойством, получили название марковских. Таким образом, марковские процессы есть не что иное, как стохастический эквивалент моделей в пространстве состояний. Формально они определяются так.
Определение марковского процесса. Пусть ti и t — такие элементы индексного множества Т, что А < А < • -. < tn < t. Стохастический процесс {%(/), t^T} называется марковским, если
Р {х (0 < £ I х (А).х (/„)} = Р {х (0 < 11 х (/„)}.
Здесь Р{-|х(А), .... х(Аг)} обозначает условную вероятность при заданных х(А), , x(tn).
Марковский процесс вполне определяется распределениями начальных вероятностей F(£,; t0) = P{x(t0) Е} и вероятностей перехода
F&, s) = P{x(0<£ilx(S) = £s}.
Используя правило умножения условных вероятностей, можно определить все конечномерные распределения.
Линейные стохастические разностные уравнения. Рассмотрим дискретную .систему, в которой период квантования равен единице. Пусть x(k)— состояние в момент времени k. Тогда распределение вероятности состояния в момент времени k 4- 1 есть функция x(k). Если математическое ожидание линейно по x(k) и распределение вокруг него не зависит от x(k), то x(ft4"l) можно представить следующим образом"*
x(k + 1) = Фх(/г) 4- v (k), (6.16)
где v(k) — случайная переменная с нулевым математическим ожиданием, не зависящая от x(k) и всех прошлых значений х. Это означает, что v(k) также не зависит от всех прошлых v. Последовательность {o(ft), k= —1, 0, 1, ...} состоит из не-
зависимых, одинаково распределенных случайных переменных. Стохастический процесс {и(ft)}, таким образом, представляет собой дискретный белый шум.
Уравнение (6.16) называется линейным стохастическим разностным уравнением. Чтобы окончательно определить случайный процесс {%(£)}, необходимо задать начальные условия. Предполагается, что начальное состояние имеет математическое ожидание т0 и матрицу ковариации /?0- (Ковариация случайной переменной v обозначается через /?ь)
Свойства линейных стохастических разностных уравнений. Исследуем характер случайного процесса, заданного линейным стохастическим разностным уравнением вида (6.16) и вычислим его первый и второй моменты.
Для получения математического ожидания
m (k) — Ex (k)
определим математические ожидания обеих частей уравнения (6.16). Так как математическое ожидание v равно нулю, то справедливо следующее равенство:
m(k 4- 1) = ®m(ft) (6.17)
с начальным условием т(0) = то. Следовательно, математическое ожидание передается так же, как и в системе без возмущений.
Чтобы вычислить ковариацию, введем функцию
P(k) = cov[x(k), x(k)] —Ex(k) хт (k), где x — x — tn.
Из уравнений (6.16) и (6.17) следует, что х удовлетворяет уравнению (6.16) с начальным условием, имеющим нулевое математическое ожидание. Для вычисления ковариации построим выражение
х (k 4- 1) Хт (k 4- 1) = {Фх (ft) 4- V (ft)} {Фх (ft) 4- v (k)}T =
= Фх (k) ХТ (ft) ФГ 4- Фх (ft) VT (ft) 4- v (ft) XT (ft) ФГ 4~- V (ft) VT (ft).
Определяя математические ожидания его правой и левой частей и учитывая, что v(k) и x(k) независимы, получаем
P(k+ I) == ФР(/г) Фг +/?!
с начальным условием Р(0) = /?0- Рекурсивное уравнение для Р определяет передачу ковариации.
Чтобы вычислить ковариацию состояния, заметим, что
X (k + 1) ХТ (k) = [Фх (k) + V (k)] хт (k).
Так как v(k) и x(k) независимы и математическое ожидание v(k) равно нулю, то
гхх (&•'+ 1, k) = cov [х (k + 1), х (/г)] = ФР (k).
Повторяя эти рассуждения, имеем
rxx(ft + ?, АО = ФТР(А).
Полученные результаты настолько важны, что их следует систематизировать.
Теорема 6.1. Рассмотрим случайный процесс, заданный линейным стохастическим разностным уравнением (6.16) (здесь {о(&)}—белый шум с нулевым математическим ожиданием и ковариацией Pi). Пусть начальное состояние процесса имеет математическое ожидание т0 и ковариацию Ро. Тогда математическое ожидание и ковариация процесса определяются соответственно как
m(k 1) = ®m(fe), т(0) = то, (6.18)
г (k + т, k) — ФТР (k), т^О, (6.19)
где P(k) — cov[x(k),x(k)] задается уравнением
P(k + 1) = ФР(£)ФГ + Рь Р(О) = Ро. (6.20)
Замечание 1 Если распределение случайных переменных является гауссовским, то стохастический процесс однозначно определяется своими математическим ожиданием т и ковариацией г.
Замечание 2. Если выход системы у = Сх, то его математическое ожидание задается уравнением вида ту = Ст, а ковариация— уравнениями вида гуу = СгххСТ. Взаимная ковариация у и х есть ГуХ = Сгхх.
Замечание 3. Разностное уравнение в (6.20) для матрицы Р такое же, как уравнение (5.14), которое использовалось при вычислении функции Ляпунова в гл. 5.
Замечание 4. Различные члены в уравнении (6.20) имеют определенную физическую интерпретацию. Ковариация Р есть неопределенность состояния, произведение ФР(/г)Фг показывает,
как передается неопределенность в момент времени k в соответствии с динамикой системы, а член /?1 описывает увеличение неопределенности вследствие наличия возмущения v.
Пример 6.3
Рассмотрим систему первого порядка
х (k -|- 1) = ах (Ze) +v
где v — последовательность некоррелированных случайных величин с нулевым математическим ожиданием и ковариацией п. Пусть состояние в момент времени feo имеет математическое ожидание т0 и ковариацию Го- Из (6.18) следует, что математическое ожидание m(k) — Ex(k) определяется соотношением m(fe+l) — am(k), m(fe0) = т0. Откуда ra(/i) = afe"fc,m0. Уравнение -(6.20) дает
Р (k + 1) = а2Р (fe) + г„ P(fe0) = r0.
Откуда следует, что
rx (lt k) = al~kP (k), I > k,
rx (I, k) = ak~lP (Z), I < k.
Если |cz| < 1 и Ze0 —*—oo, to m (k) > 0,
/l । i.i r1al't|
rx(k + t,
В этом случае процесс становится стационарным, так как т есть константа, а ковариация зависит только от т.
Если ввести выход y(k) = x(k) + е(й), где е — последовательность некоррелированных случайных величин с нулевым математическим ожиданием и ковариацией га, то ковариация у принимает следующий вид:
Г2 + ~Г^’ т = °-
Спектральная плотность получается из уравнения (6.13):
) 2л [ 2 (е‘а — а) (е 1Ю — а) ] 2л t 2 1 + а2 — 2а cos со ]
Модели типа «вход-выход»
Для лучшего понимания обсуждаемых вопросов здесь приводится модель типа «вход-выход» сигналов, задаваемых линейными разностными уравнениями. При этом следует иметь ввиду, что сигнал, определяемый уравнением (6.16), можно представить как выход линейной динамической системы, на вход которой подается белый шум. С этой точки зрения естественно ис
на)
следовать изменение свойств стохастических процессов при их фильтрации динамическими системами.
Анализ. Рассмотрим систему, изображенную на рис. 6.8. Положим для простоты, что период ее квантования равен единице. Далее предположим, что вход и есть стохастический процесс с заданными математическим ожиданием ти и ковариацией ги,
у Рис. 6.8. Генерация возмущений путем — подачи иа вход динамической системы белого шума.
а импульсная -характеристика системы имеет вид {h(k), k == = 0, 1, ...}.
♦♦♦ Заметим, что h используется также для обозначения периода квантования. Что имеется в виду под h в каждом конкретном случае, становится ясно из контекста.
Связь «вход-°выход» имеет следующий вид:
y(k) = У h(k — п)и(п) = У, h(n)u(k — iп). (6.21)
n= —со 4 = 0
Определив математические ожидания правой и левой частей, получим
ту (/) — Еу (k) — E У h (ri) u(k — и) == п= 0
— У h («) Ей (k — ri) = У h (n) ти (k — ft). (6.22)
Таким образом, математическое ожидание выхода получается при подаче на вход системы математического ожидания входного сигнала.
Перед тем как определить ковариацию, заметим, что вычитание (6.22) из (6.21) дает
ОО
у (k) — my(k)= У h (ri) [и (k —ri)ти (k — и)]. 4=0
Следовательно, разность между входным сигналом и его математическим ожиданием передается, через систему так же, как и сам входной сигнал. При вычислении ковариац. . можно допустить. что математические ожидания равны нулю, что существенно упрощает запись.
Определение ковариации приводит к следующему результату: гу (т) =rEy (k + т) ут (k) ==
= Е У h (п) и (k + т — n) I У, h (I) и (k — /) I =3 п-0 LZ=O J
-У У ft(n)£[«(ft4-T-n)^(ft-/)]ftr(/)== гг—О /=о
оо оо
— У У h (п) ги (т 4-1 — п) hT (Z). (6.23)
n=0 Z=0
Аналогично можно получить формулу для взаимной ковариации входа и выхода:
гии (т) — ЁУ (& + т) ит (k) = E У h (п) u(k-Y т —' п) ит (k) =
в п~0
= У h (n) Е [и (k 4- т — п) ит (ft)] — У h (п) ги (т — п). (6.24) п—О п~С
♦♦♦ Заметим, что эти вычисления основывались на предположении о существовании бесконечных сумм и на свободном изменении порядка выполнения операций бесконечного суммирования и определения математического ожидания. Справедливость подобного предположения требуется доказать, что легко сделать в смысле среднеквадратичной сходимости, если предположить, что четвертый момент входного сигнала конечен.
Связи, выражаемые уравнениями (6.23) и (6.24), можно описать и в более простой форме, если ввести спектральные плотности.
Используя определение спектральной плотности (6.13), запишем
оо
Ф» (®) = %у (и) =*= ~ £ е-г«%(п).
п~~ ОО
Подставляя выражение для гу из (6.23), получаем
оо сю оо
ФИ®^-^ Z J]ft(ft)r„(n4-Z —^)Лг(/)== п-^-оо k=0 l=^Q
оо оо со
Е Ее"гй“/г(А:)^‘<"+г’*й)Юг“(п+/_/г)е1/“/гГ(/)=я
fe=o п = — оо /==0
оо оо оо
==’^гЕе^1Й<Л^^^ Е e~lna>ru(.rt) ^eilu>hT(I), п=~^оо 1^0
Введем импульсную передаточную функцию системы Н. Она связана с импульсной характеристикой h следующим соотношением:
H(z) = £ z-nh(n). (6.25)
n= О
Теперь уравнение для спектральной плотности можно записать в виде
Фр (и) = Н (е1И) фи (со) Нт
Аналогично имеем
оо
qw(®)=~2^ 2 =
п~~ ОО оо оо
= Е ^-“£A(/e)ru(n-/e) =
П—~ ОО k~o
’ оо оо
Е Е e~ina>ru (п)—н (eiB>) ч>и (®)-
k=0 П — — ОО
Чтобы получить общий результат, кроме всего прочего, необходимо исследовать передачу математического ожидания входного сигнала через систему.
Теорема о фильтрации стационарного процесса. Рассмотрим стационарную дискретную динамическую систему с периодом квантования 1 и импульсной передаточной функцией Н. Пусть входной сигнал есть стационарный стохастический процесс с математическим ожиданием ти и спектральной плотностью <ри. Если система устойчива, то выход является также стационарным процессом с математическим ожиданием
ту = Н (6.26)
и спектральной плотностью
Фр (и) = Н (е‘“) Фв (и) НТ(е~‘“). (6.27)
Взаимная спектральная плотность между входом и выходом определяется как
Фуи (и) = Я (eto) Фи (и). (6.28)
Замечание 1. Результат имеет простую физическую интер-* претацию. Число |/7(е‘“)| — это установившаяся амплитуда реакции системы на синусоидальную волну с частотой ы. Тогда значение спектральной плотности выхода есть произведение квадрата коэффициента усиления |/7(е‘ш) |2 и спектральной плотности входа ф«(й).
Замечание 2. Из уравнения (6.28) следует, что взаимная спектральная плотность равна передаточной функции системы, если вход представляет собой белый шум единичной спектральной плотности. Это свойство можно использовать для определения импульсной передаточной функции системы.
Пример 6.4 Л
Рассмотрим процесс {x(fe)}, описанный в примере 6.3. С точки зрения модели «вход-выход» можно считать, что он вырабатывается фильтром с передаточной функцией Н (z) — —-на вход которого поступает белый шум.
Так как спектральная плотность процесса {ц(й)} равна
то из уравнения (6.27) следует, что спектральная плотность {х(&)} будет равна
Фх(И) = Я(^<»)Я(е-‘<»)-§г=
__ И . _________1___________________п_________
2л (е‘а — а) (е~1а -— а) 2л (1 + а2 — 2а cos <»)
Тогда спектральная плотность процесса y(k) = x(k) +е(/г) определяется как
ЧР» (и) 2л Р2 + 1 + а2 — 2а cos и ]'
(ср. с вычислениями в примере 6.3).
Спектральная факторизация
Рассмотрим задачу нахождения такой линейной системы, выход которой имеет заданную спектральную плотность, если на ее вход поступает белый шум. Решение этой задачи имеет важное значение, так как оно показывает, как, фильтруя белый шум, можно генерировать сигнал с требуемой спектральной плотностью. Кроме того, оно позволяет определить, насколько универсальна модель (6.16).
Из теоремы о фильтрации стационарного процесса следует, что случайный процесс, вырабатываемый линейной системой, на вход которой поступает белый шум, имеет спектральную плотность, задаваемую соотношением (6.27). Если система конечномерная, то импульсная передаточная функция Я и спектральная плотность ср— рациональные функции от exp(ico), или, что то же самое, от сори. С небольшим допущением такую спектральную плотность называют рациональной. Введя обозначение г = ехр(ко), правую часть уравнения (6.27) можно записать в виде
F(z) = H(z) HT(z~l).
Если zt — корень Я(г), то zr1 — корень Я (z-1)- Таким образом, нули функции F симметричны относительно действительной
оси и единичной окружности. Если коэффициенты рациональной функции Н действительные, то нули функции F также будут симметричны относительно действительной оси (рис. 6.9). Это рассуждение имеет силу и для полюсов функции Н (рис. 6.9).
Рис. 6.9. Симметрия полюсов и нулей функции спектральной плотности.
Теперь можно найти функцию Н, соответствующую заданной рациональной спектральной плотности. Сначала определим полюса pt и нули. Zi функции F, связанной со спектральной плотностью. Из установленной симметрии полюсов и нулей следует, что они всегда появляются такими парами, что
ZiZj= 1,
PiPi=l-
В каждой паре выбираем полюс или нуль, по величине меньший или равный единице, а затем строим из них требуемую передаточную функцию вида
H(z) =
П (z ” р.)
Вследствие стационарности стохастического процесса выбранные полюса pi всегда будут меньше единицы. Однако могут существовать нули, равные единице.
Теорема о спектральной факторизации. Пусть задана спектральная плотность ср (со), являющаяся рациональной функцией от cosco. Тогда существует такая линейная система с импульсной передаточной функцией Н (г) = В (z)/A (z) (6.29), что выход, полученный подачей на ее вход белого шума, есть стационарный случайный процесс со спектральной плотностью ср. Многочлен А (г) имеет все корни внутри единичного круга, а В — внутри или на границе единичного круга.
Замечание 1. Теорема о спектральной факторизации имеет важное значение: из нее вытекает, что все стационарные процессы можно представить как выходы устойчивых линейных систем, на вход которых подается белый шум, т. е. АРСС-процесс
особого типа. В этом случае достаточно понимать поведение систем при возбуждении их белым шумом и иметь возможность моделировать его. Все другие стационарные процессы с рациональными спектральными плотностями могут быть получены фильтрацией белого шума.
Замечание 2. Так как непрерывную .функцию на небольшом интервале можно сколь угодно близко аппроксимировать рациональной функцией, модели (6.16) и (6.21) могут описывать сигналы, спектры которых произвольно близки любой непрерывной функции. Однако существуют модели с нерациональной спектральной плотностью. Например, в теории турбулентности есть спектральные плотности, которые при больших со убывают как дробные степени со.
Важным следствием теоремы о спектральной факторизации является возможность представления для систем с одним входом чистого действия всех возмущений одним эквивалентным, которое определяется посредством вычисления общей спектральной плотности выходного сигнала и применения рассмотренной теоремы.
Замечание 3. Часто предполагается, что многочлен B(z) имеет все корни внутри единичного круга. Это значит, что система, обратная к И, устойчива.
Пример 6.5
Рассмотрим процесс {y(k)}, описанный в примерах 6.3 и 6.4. Его спектральная плотность равна
(ш) — 2зт [Гг + (г — а) (г-1 — а) ]г=е1ш ~
= 1 Г г' + + а2) — г2« (г + г~‘) 1
2л L (z — a)(z~'—a)
(здесь знаменатель уже разложен на множители). Чтобы факторизовать числитель, заметим, что его можно записать в виде
Л2 (z — b) (z-1 — 6) = r1 + r2(l + а2) — r2a (z + г-1)-
Определяя коэффициенты при одинаковых степенях г, получаем
г»: Л2(1 + 62) = г, +гг(1 +а2),
z1: 72Ь = г2а.
Исключив X, получим алгебраическое уравнение второго порядка относительно Ь, которое имеет следующее решение:
ь г, + r2 (1 + а2) - У[г, + г2 (1 + а)2] [г, + г2 (1 - а)2]
2аг2
(другой корень отбрасывается, так как он находится за пределами единичного круга). Тогда значение X определяется из соотношения
= у {/Г + г2 (1 + а2) + V[rt + r2 (1 + a)2] [n + r2 (1 — а)2] }.
Новационное представление
Из теоремы о спектральной факторизации вытекает ряд фундаментальных следствий. Одно из них состоит в том, что процесс с рациональной спектральной плотностью можно представить как
k
y(k) = У, h (k — ri) е (и), (6.30)
П- — оо
где е — дискретный белый шум, a h — импульсная характеристика, соответствующая импульсной передаточной функции (6.29). Система-- имеет устойчивую обратную, если все корни многочлена B(z) находятся внутри единичного круга. Это значит, что
k
e(k) = У g(k — ri)y(ri),
где g—импульсная характеристика, соответствующая устойчи-вой импульсной передаточной функции A(z) /B(z). Таким образом, последовательности y(k), y(k—1), ... и e(k), e(k—1), ... эквивалентны в том смысле, что их можно вычислить одну из Другой.
Теперь рассмотрим переменную
fe+i
у (kV) = У h(k + 1 — ri)e{ri)~
k
— У h(k + 1 — n)e(«) + h(O)e(k + 1) = n= —OO
k k
= £ h(k+i-n) У g(n-r)y(l) + h(O)e(k+V).
П^=~оо I = —oo
Эту переменную можно записать в виде суммы двух членов, один из которых есть линейная функция от y(k), y(k—1), ..., а другой — /г(О)е(/г + 1). Тогда е(/г + 1) можно интерпретировать как часть g(ft-j-l), содержащую новую информацию, которая не содержится в прошлых значениях y(k), y(k—1), ... . Стохастический процесс {е(£)} называют новацией процесса {y(k), Г}, а представление (6.30) — новационным. На самом
деле член
k п
у h (k + I — ri) У g (п — /) у (/) П= — ОО — оо
— лучший прогноз y(k-t-l), сделанный на основании y(k), y(k-l), ... в смысле минимума среднеквадратической ошибки.
Пример 6.6
Рассмотрим процесс ЕД/г)}, описанный в примере 6.3. Его спектральная плотность равна
*^6®) 2л |/2 1 Ц-а2 —2а cos со ]“
Из примера 6.5 следует, что ее можно разложить на множители следующим образом:
<Ру («)
s Я,2 (z-b)(z~l -b) 2Л (z — a) (z-1 — а)
Следовательно, процесс у можно генерировать, пропуская белый шум через систему с передаточной функцией 7/(z) = (z— b)l(z— а) Модель типа «вход* выход» для такой системы можно записать в виде
у (k 4-1) = ay (k) + е (k + 1) - be (й),
где {е(й)} —белый шум с дисперсией X2.
Вычисление дисперсий
Дисперсию сигнала, полученного фильтрацией белого шума, можно вычислить по рекуррентному уравнению (6.20), если модель задана в пространстве состояний. Его также возможно применить для системы, описываемой передаточными функциями, если предварительно переписать ее в терминах пространства состояний. Естественно, удобно иметь аналогичные формулы, если система задана уравнениями вида «вход-выход».
Рассмотрим сигнал, генерируемый системой
y^ = 4we(k}’
(6.31)
где е — белый шум с единичной дисперсией. Из теоремы о флуктуации стационарного процесса следует, что спектральная плотность сигнала определяется соотношением
. ... 1 B(z)B(z~‘)
44 2jt Д (z) Д (z-1) ’
где 2 — exp(ico). Из нее также вытекает, что дисперсия сигнала задается комплексным интегралом
Л Jt
Ez;2 за ф (ш) da -р <р (со) e~ia,d (eia>) =s
—Л —л
Lj 1 £ В (г) В (г-i) dz , 2лг j A (z) A (z~‘) z
(6.32)
Вычисление интегралов такого рода тесно связано с критё* рием устойчивости Джури (разд. 5.1). Для определения значе* ния интеграла составляется следующая таблица:
^n—l «0 ь0 ьх ... Ьп_} Ьп аП &п ап^} а1 ^0 Рп
77 i е с со Q Q — -Ч 04 1 1 I е -> а е q а 7 77 со ее е a 7 ^е 77 7 е с со •а сз — — OJ 1 1 1 е — ее Q 7 77 со ее I а
1 „I t1 t1
«О al 60
a\ a'o a, a\ a° 0,
c0 • 1 &0 Po
где
an == an/a0> P n = bnlO-Qt
= Vk = bk/ao
ak-i^ak_aka^_f
ькг'-ь1-^_г
Теорема 6.2. Интеграл (6.32) вычисляется по формуле
п
<6-33>
1=0
Используя теорему, получаем следующие значения интеграла при п = 1 и п = 2:
(frjj-4- Ь* 2{)а0-2Ь0Ь1а1 «о («о - а1)
J Boaoei - Biauai + В2 (а2 - а2е,)
2 ао [(“j - al) ei ~ (aoai “ а1аг) «11 ’ где
Во — bj + ь\ + ь\,
В1 = 2(60&, + ^2),
В2 — 2&о&2>
е1 = а0 + а2-
6.5. НЕПРЕРЫВНЫЕ СТОХАСТИЧЕСКИЕ ПРОЦЕССЫ
Иногда полезно строить модели в непрерывном времени, даже если закон управления реализуется на ЦВМ. В связи с этим проведем краткий обзор непрерывных стохастических процессов.
Определения
Непрерывные стохастические процессы определяются подобно дискретным. Единственное различие состоит в том, что индексное множество Т состоит из действительных переменных, а не из дискретных. Ковариация и стационарные процессы определяются так же, как и в дискретном случае с помощью конечномерных функций распределения. Спектральная плотность вводится как преобразование Фурье ковариации. Тогда уравнение (6.13) принимает следующий вид:
оо
<МИ) = ’2Г $ e-le>trxy(t)dt, (6.34)
— оо
Обратное преобразование задается формулой
оо
гХу (0 = J) eiatqxy (со) d&, (6.35)
— ОО
которая заменяет (6.14). Спектральная плотность имеет ту же интерпретацию, что и в дискретных системах.
Белый шум
Стационарный процесс с постоянной спектральной плотностью называют белым шумом. Если
Ф («) = -£. (6.36)
то из (6.35) формально вытекает, что соответствующая ковариация является дельта-функцией, т. е.
г(/) = гоб(/). (6.37)
Следовательно, значения сигнала непрерывного белого шума в различные моменты времени некоррелированы (ср. со свойствами дискретного белого шума). Вместе с тем он имеет бесконечную дисперсию, что затрудняет выполнение соответствующих математических выкладок. Интуитивно понятно, что непрерывный белый шум подобен дельта-функциям в теории линейных систем. Некоторые трудности можно исключить, введя стохастический процесс, который формально задается интегралом t
w (0 = е (s) ds, „ (6.38)
о
где е —белый шум. Стохастический процесс w имеет нулевое математическое ожидание. Его приращения в несмежных интервалах некоррелированы. Если ковариация е есть
cov [е (t), е ($)] = гоб (t — s),
то дисперсии приращений w определяются из уравнения
Е [w (/) — w (s)]2 — 1t — s | r0.
Стохастический процесс {щ (/), t e 7"} называют процессом Винера, если он гауссовский. Процесс Винера — модель случайного блуждания. Бесконечно малое приращение dw = w(t-\-+ dt) — w(t) имеет дисперсию E(dw)2 = rodt. Следовательно, приращение dw имеет значение -\/rQdt в среднеквадратическом смысле. Величину rGdt называют приращением ковариации процесса Винера.
Модели в пространстве состояний
Модели состояния непрерывных процессов формально можно получить, приводя уравнение (6.16) к виду
где v — вектор, каждый элемент которого есть процесс типа «белого шума». Так как v имеет бесконечную дисперсию, это уравнение обычно записывают как
dx — Ах dt -j- dv, (6.39)
где v — интеграл от v.
Таким образом, предполагается, что сигнал v имеет нулевое математическое ожидание, некоррелированные приращения и дисперсию
cov[u(/), п (/)] = /?]/. (6.40)
Кроме того, предполагается, что dv некоррелировано с х.
Точное толкование уравнению (6.39) можно дать без всякой ссылки на «белый шум». Поэтому эта форма обычна для математической записи. Она также полезна как напоминание, что dv имеет величину, пропорциональную ^dt.
Уравнение (6.39) называется стохастическим дифференциальным уравнением. Чтобы полностью определить его, необходимо задать начальное распределение вероятностей для х в начальный момент. Для непрерывного случая справедлива следующая теорема, являющаяся аналогом теоремы 6.1.
Теорема 6.3. Рассмотрим случайный процесс, определенный линейным стохастическим дифференциальным уравнением (6.39), в котором процесс v имеет нулевое математическое ожидание и
приращение ковариации R^dt. Пусть математическое ожидание начального.-состояния равно та, а ковариация — Ra. Тогда математическое ожидание процесса х задается уравнением
m(O) = mo, (6.41)
а ковариация — уравнением -•
cov [х ($), х (/)] — s^t, (6.42)
где P(f) = cov[x(/),%(/)] определяется из соотношения
^- = AP(t) + P(t)AT + Ri, P(O)~Ro. (6.43)
Доказательство. Формулу (6.41) для математического ожидания получают простым вычислением математического ожидания уравнения (6.39).
Заметим, что dv имеет нулевое математическое ожидание.
При переходе к дифференциальному уравнению (6.43) надо иметь в виду, что
d (ххг) = (х + dx) (х + dx)T — ххт — х dxT -ф- dxxT + dx dxT.
Тогда из уравнения (6.39) получаем
d (ххт) = х [Ах dt + dv]T + [Ах dt + dv] хт +
+ [Ах dt + dv] [Лх dt + dv]T.
Операция определения математического ожидания дает d (Еххг) = (Еххт) Ardt +А (Еххт) dt + Edv dvT + А (Еххт) Аг (dt)2, так как dv некоррелировано с х. Далее из (6.40) следует, что Edv dvr — Rl dt.
Откуда
dP = РАТ dt + АР dt + Ri dt + APAT (dt)2.
Деление на dt и переход к пределу при dt, стремящемся к нулю, приводят к дифференциальному уравнению (6.43). Для доказательства уравнения (6.42) допустим, что s t и проинтегрируем (6.39):
х (s) = еА (s~^x (t) + еА dv (s'), t
Умножая правую часть этого равенства на xT(t) и вычисляя математические ожидания, получаем уравнение (6.42). Следует иметь в виду, что dv(s') некоррелировано с x(t), если s'^t.
Пример 6.7
Рассмотрим скалярное стохастическое дифференциальное уравнение dx = — ах dt + dv, к (t0) == m0, var [x (Yo)] = r0,
где процесс {v(t), teTj имеет приращение ковариации ridt. Из (6.41) следует, что математическое ожидание задается соотношением
dm ,, ,
= — am, m(t0) = mD.
Это уравнение имеет решение
т (t) = тое~а^~1°\
Ковариация определяется из формул
г (s, /) = cov [х (s), х (#)] = е~а^~^р (/), s^t и
r(s, ss^t.
Из уравнения (6.43) вытекает дифференциальное уравнение для Р dP
—=-2аР + Г1, Р(/0) = г0,
Которое имеет решение t
р + J e-2o(/-s>r1ds = e-2a(<-^r0 +-^- [1 -в-2“<*-*»>].
^0
При to ->—оо математическое ожидание стремится к нулю, а ковариация — к
r(s, =
Так как ограниченная ковариационная функция зависит только от разности аргументов s — t, то ограниченный процесс — (слабо) стационарный и его ковариацию можно записать как
Г (т) = ~ е~а 1 х I.
Из уравнения (6.34) вычисляется соответствующая спектральная плотность
Ч’(Ш) = ‘2?Г со2 + а2 ’
Фильтрация непрерывных процессов
Анализ линейных систем, вход которых есть непрерывный стохастический процесс, аналогичен анализу соответствующих дискретных систем. Рассмотрим стационарную устойчивую систему с импульсной характеристикой h. Модель типа «вход-выход» будет иметь вид
у (/) = h (t — s) и (s) ds — h (s) и (t — s) ds (6.44)
-*-oo 0
[ср. с уравнением (6.21)]. Пусть на вход этой системы поступает сигнал и, являющийся стохастическим процессом с математическим ожиданием ти и ковариацией ги.
Теорема о фильтрации стационарных процессов. Рассмотрим линейную стационарную систему с передаточной функцией G.
Пусть входной сигнал — стационарный непрерывный стохастический процесс с математическим ожиданием ти и спектральной плотностью' фи. Если система устойчива, то ее выход также стационарный процесс с математическим ожиданием
ту — G (0) ти (6.45)
и спектральной плотностью Л
% (<о) = G (/<о) <ри (<о) GT (— йо). (6.46)
Взаимная спектральная плотность между входом и выходом определяется из соотношения
4>уи (“) = G (М 4>и (®). (6.47)
Результат можно интерпретировать так же, как и в дискретных системах (ср. с замечаниями 1 и 2 к теореме о фильтрации стационарного процесса).
Пример 6.8
Рассмотрим систему, описанную в примере 6.7. Можно считать, что процесс х есть результат фильтрации «белого шума» с дисперсией Г1/2л системой с передаточной функцией
G(S) ==—!—.
s + а
Из (6.46) следует, что спектральная плотность определяется как
, . _ Г1____1________1______и_______1_
2л «со + а — ia + а 2л со2 * * s * + а2 '
Спектральная факторизация
Из уравнения (6.46) следует, что если вход системы — «белый шум» с фи = 1, то спектральная плотность выхода задается уравнением
Ф^, (со) == G (гео) G7’(—/со). (6.48)
Это значит, что, пропуская непрерывный «белый шум» через фильтр с передаточной функцией G, можно генерировать любое возмущение, спектральную плотность которого можно записать в этом виде.
Поскольку линейные конечномерные системы имеют рациональные передаточные функции, то с их помощью можно генерировать сигналы с произвольными рациональными спектральными плотностями. В этом случае ковариационная функция неотрицательна и симметрична. Тогда из (6.34) следует, что ф также симметрична. Если ф рациональна, то все ее полюса и нули симметричны относительно действительных и мнимых осей. Таким образом, передаточную функцию G в (6.48) можно подобрать так, что все ее полюса окажутся в левой полуплоскости, а все нули — в правой или на мнимой оси.
Теорема о спектральной факторизации. Пусть задана рациональная спектральная плотность <р(со). Тогда существует такая конечномерная линейная система с рациональной передаточной функцией G (s) — В (s) /А (s), что ее выход при подаче на вход «белого шума» есть стационарный стохастический процесс с заданной спектральной плотностью. Многочлен А имеет все корни в левой полуплоскости, а многочлен В — в правой.
6.6. КВАНТОВАНИЕ СТОХАСТИЧЕСКОГО ДИФФЕРЕНЦИАЛЬНОГО УРАВНЕНИЯ
Если модели процессов задаются в непрерывном времени стохастическими дифференциальными уравнениями, то для получения дискретных представлений надо уметь квантовать эти уравнения.
Рассмотрим процесс, описывающийся стохастическим дифференциальным уравнением
dx — Axdt ф- dv, (6.49)
где процесс v имеет нулевое математическое ожидание и некоррелированные приращения. Приращение ковариации v равно Ridt. Пусть = 1, ...}—моменты квантования. Интегрирование (6.49) в пределах одного периода квантования дает
^fe+i
x(tk+i) = eA^k+l~tkh(tk)= e4Pfe+i~s) dv (s').
fk
Рассмотрим случайную переменную
ffe+i
е (fk) = еА ^k+i~s) dv (s).
Она имеет нулевое математическое ожидание, так как математическое ожидание v равно нулю. Случайные переменные е(^) и е(6) также некоррелированы при k I, поскольку приращения v в несвязных интервалах некоррелированы. Следовательно, ковариация e(tk) задается уравнением
1
E[e(tk), er(tk)] = E ~s) dv(s)dvT (t) eAT =
<fe t
== ds. (6.50)
*k
Таким образом, случайная последовательность {х(^), k = 0, 1, полученная квантованием процесса {х(/)}, описывается следующим разностным уравнением:
x(tk+1)^eA^+^x(ik) + e(tk),
где {е(6г)}—последовательность некоррелированных случайных переменных с нулевым математическим ожиданием и ковариацией (6.50).
выводы
Предложен универсальный метод построения моделей широкого класса сигналов. Сигналы рассматриваются как выходы динамических систем, на вход которых подается прямоугольный импульс, последовательность прямоугольных импульсов или белый шум. Можно также считать, что сигналы генерируются динамическими системами с начальными условиями.
Показано, что простейшие модели возмущений, как, например, скачок, люфт и синусоида, можно получать как выходы линейных систем, управляемых прямоугольными импульсами. Другие возмущения можно рассматривать как импульсные характеристики более сложных систем.
Оказалось, что класс возмущений можно расширить, подавая на вход систем сигналы, состоящие из нескольких прямоугольных импульсов; это приводит к кусочно-детерминированным сигналам.
Получен универсальный способ моделирования различных видов возмущений. Возмущения определяются динамической системой
= (6.51)
где вход е — прямоугольный импульс, несколько прямоугольных импульсов или белый шум. Такая система называется генератором возмущений. Динамическую систему, конечно, можно задать и в пространстве состояний.
Задача прогнозирования имеет важное значение при управлении системами с возмущениями, которые нельзя измерить. Задача прогнозирования сигнала, заданного уравнением (6.51), сводится к вычислению е из у. Она эквивалентна задаче нахождения системы, обратной к динамической (6.51). Для получения устойчивой обратной системы необходимо, чтобы многочлен S(?) имел все свои корни внутри единичного круга. Вообще говоря, в случае детерминированных возмущений это приводит к ухудшению качества прогноза и требуется более1 длинный интервал для его получения. Для стохастических систем из теоремы о спектральной факторизации следует, что все корни мно
гочлена B(q) лежат внутри единичного круга или на единичной окружности.
Существенным моментом является вывод о том, что предикторы сигналов однозначно задаются импульсной передаточной функцией Н — В/А. Следовательно, они одинаковы для прямоугольных импульсов, последовательностей прямоугольных импульсов и «белого шума». Это значит, что предикторы для детерминированных возмущений также неплохо функционируют и в стохастическом случае, если генераторы возмущений одинаковы.
Универсальный метод моделирования возмущений ведет также к существенному упрощению теории, так как в результате достаточно изучить только несколько «прототипов» возмущений,
ЗАДАЧИ
6.1. Составьте список случаев, когда возможно сократить влияние возмущений, подавляя их в источнике возникновения; с помощью местной обратной связи; путем прогнозирования.
6.2. Определите Нй на рис. 6.4 так, чтобы дискретный выход был синусоидой с частотой и рад/с; равным в моменты квантования /ехр(—t), если вход — прямоугольный импульс.
6.3. Покажите, что предиктор (6.4) эквивалентен предиктору (6.3).
6.4. Найдите m-шаговый предиктор для модели возмущений
У " 'ZO)' w
где w(k) равна нулю, за исключением отдельных точек, разделенных более чем на deg Л. Используйте полученный результат для определения сигнала и прогноза, когда A(q) = q— 0,5; C(q) = q, т — 3 и если w(k) равно нулю везде, кроме k — О и 5. Предполагается, что начальные условия равны нулю.
6.5. Используйте теорему 6.1 для вычисления стационарной ковариации процесса
Г 0,4 0 1 x(k+ 1)=^ __06 02 J х (/г) + ц (/г), где v — «белый шум» с нулевым математическим ожиданием и ковариацией
Г1 ₽| = [о 2Г
6.6. Имеется стационарный стохастический процесс, генерируемый системой
x(k+ 1) = Фх(/г) + о(й)?
y(k) — Cx(k),
где v(k)—последовательность одинаково распределенных случайных переменных с нулевым математическим ожиданием. Пусть характеристическое уравнение матрицы А имеет вид
гп + а1гп-'+ ... + а„ = 0.
Покажите, что автоковариация выхода г#:(т) удовлетворяет уравнению
Гу (т) + ЩГу (т — 1) + ... + апгу (т — п) = О
ДЛЯ Т п + 1.
6.7. Имеется процесс
Г — а 01
*(6+1) = [ 0 _b J-v(fe) + v(k),
г/(/г) = [1 1]х(/г),
где v(k)—белый шум с нулевым математическим ожиданием и ковариацией
Га? 0 1
R1==[° aj
Покажите, что у (k) можно представить в виде
у(k) = к . ал е(k\
’ (q + a)(q + b) v ”
где е(/г)—белый шум с нулевым математическим ожиданием и единичной дисперсией. Найдите уравнение, из которого можно определить X и с.
6.8. Стохастический процесс y(k) описывается уравнениями
х (k + 1) = ах (k) + v (k), y(k) = x(k) + e(k),
где v и е — нормально распределенные процессы типа «белого шума» со следующими свойствами:
Ev = Ее = 0
var v = 1
var е = г2
Ev (k)e(j) —г12 при k = j и 0 в противном случае.
Покажите, что у (Л) можно представить как выход линейного фильтра
где е(А) — белый шум с нулевым математическим ожиданием Ji единичной дисперсией. Определите X и с,
6.9. Найдите ковариацию гу(х) и спектр фи(®) процесса y(k), если
у (k) — 0,7у (/г — 1) = е (k) — 0,5е (k - 1),
где e(k)—белый шум с единичной дисперсией.
6.10. Определите дисперсию стохастического процесса y(k), заданного уравнением
У (k) — l,5y(k — l) + 0,7y(k-2) = e(k) + 0,2e(k- 1), где е— белый шум с единичной дисперсией.
ЛИТЕРАТУРА
Принципы уменьшения возмущений с помощью обратной и прямой связи и классические модели
J. Brown G. S., Campbell D. Р. (1948): Principles of Servomechanisms. New York: John Wiley.
2. Chestnut H., Mayer R. W. (1959): Servomechanisms and Regulating Systems Design (vol. 1), New York: John Wiley.
3. Gille J. C., Pelegrin M. J„ Decaulne P. (1959): Feedback Control Systems. New York: McGraw-Hill.
Понятие кусочно-детерминироваиных сигналов и вывод формулы прогнозирования
4. Astrom К. J. (1980): “Piece-Wise Deterministic Signals”, in Time Series, ed. O. D. Anderson. Amsterdam: North Holland.
Таблица интегралов для малых значений п
5. Jury Е. I. (1964): Theory and Application of the Z-Transform Method. New York: John Willey. Second printing: Krieger, 1973.
Идея представления возмущений как стохастический процесс
6. James II М., Nichols N. В., Philips R. S. (1947): Theory of Servomechanisms. New York: McGraw-Hill.
7. Tsien H. S. (1955): Engineering Cybernetics. New York: McGraw-Hill.
8. Laning J. H., Battin R. H. (1956): Random. Processes in Automatic Control. New York: McGraw-Hill.
9. Newton G. C., Gould L. A., Kaiser J. F. (1957): Analytical Design of Linear Feedback Controls. New York: John Willey. [Имеется перевод: Ньютон Дж. Л., Гулд Л. А., Кайзер Дж. Ф. Теория линейных следящих систем. Аналитические методы расчета.—М.: Физматгиз, 1961.]
Введение в теорию стохастических процессов
10. Karlin S. (1966): A First Course in Stochastic Processes. New York: Academic Press. [Имеется перевод: Карлин С. Основы теории случайных процессов.— М.: Мир, 1971.]
11. Parzen Е. (1962): Stochastic Processes. San Francisco: Holden-Day.
12. Papoulis A. (1965): Probability, Random Variables, and Stochastic Processes. New York: McGraw-Hill.
Теория прогнозирования
13. Колмогоров A. H. «Интерполяция и экстраполяция стационарных случайных последовательностей», Бюллетень Московского Университета, Серия математики, 5, 1941.
14. Wiener N. (1949): The Extrapolation, Interpolation, and Smoothing of Stationary Time Series With Engineering Applications. New' York: John Willey.
15. Kalman R. E. (I960): “A New Approach to Linear Filtering and Prediction Problems”, Trans., ASME Ser. D. Journal Basic Eng., 82, 34-45.
16. Kalman R. E., Bucy R. S. (1961): “New Results in Linear Filtering and Prediction Theory”, Trans., ASME Ser. D. Journal Basic Eng., 83, 95-107.
Более доступное изложение работы А. Н. Колмогорова
17. Whittle Р. (1963): Prediction and Regulation by Linear-Squares Methods. London. English Universities Press.
Результаты Винера впервые были опубликованы в 1942 г. в виде отчета Массачусетского технологического института. Они получили известность как «желтая опасность» из-за желтой обложки книги и стиля изложения. Можно также рекомендовать статью, написанную Калманом в 1960 г. и посвященную дискретным процессам.
Прогнозирование, теория фильтрации и стохастическое управление
18. Astrom К. J. (1970): Introduction to Stochastic Control Theory, New York: Academic Press. [Имеется перевод: Острём К. Введение в стохастическую теорию управления. — М.: Мир, 1973.]
19. Anderson В. D., Moore J. V. (1979): Optimal Filtering. Englewood Cliffs, N. J Prentice-Hall, Inc.
20. Box G. E., Jenkins G. M. (1970): Time Series Analysis, Forecasting, and Control. San Francisco: Holden-Day. [Имеется перевод: Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. — М.: Мир, 1973.]
21. McGarty Т. Р. (1974): Stochastic Systems and State Estimation. New York: John Willey.
7
Аналитическое конструирование регуляторов. Обзор
Синтез цифровых систем управления, их применение в проектировании и реализации технологических процессов. Способы структуризации
и выбор принципов управления. Обзор методов выбора технических характеристик и конструирования простых систем управления
ВВЕДЕНИЕ
В дачной главе задачи управления понимаются в более широком смысле. На практике постановка задачи управления часто занимает больше времени, чем ее решение, поэтому необходимо иметь представление о всех аспектах оптимального управления и регулирования тем более, что они редко рассматриваются в имеющихся учебниках во всей полноте.
Задачи автоматического регулирования и управления возникают в основном при проектировании технических систем. Такие задачи, как, например, проектирование электростанций, химических заводов, промышленных роботов, самолетов, космических кораблей и биохимических систем, обычно имеют большую размерность и слабо очерченные границы. Вместе с тем теория управления имеет дело с небольшими, хорошо определенными задачами вроде синтеза закона обратной связи для системы, описываемой линейными дифференциальными уравнениями с постоянными коэффициентами, дающего заданное расположение полюсов замкнутой управляемой системы.
Главная трудность проектирования системы управления состоит в согласовании многомерных «размытых» реальных задач с простыми и корректными задачами, подвластными теории управления. Однако именно в этой «зоне неопределенности» инженер может эффективно использовать свой творческий потенциал и изобретательность. Такое положение свойственно не только проектированию систем управления — аналогичные проблемы возникают почти во всех областях техники. Все же управление— одна из тех ее областей, где для полного понимания проблем требуется сравнительно сложная теория. Для практических целей крайне важно иметь представление о методологии проектирования систем, о той роли, которую теория играет в
понимании этого процесса. Хорошее инженерное решение должно удовлетворять большому числу требований, и не исключено, что эквивалентных решений будет много. Принятый проект часто представляет собой компромисс между его ценой и качеством. К сожалению, приходится признать, что часто лучшее — враг хорошего. Поэтому, когда слово «оптимальное» употребляется в данном контексте, к этому надо относиться с некоторой долей скептицизма.
Решение нередко появляется в результате взаимодействия производителя и потребителя, в которое вмешиваются такие субъективные факторы, как гордость, традиции и амбиция. Вместе с тем довольно часто трудно понять, что же на самом деле нужно потребителю, если меняется технологическая схема. Типичный признак этого — бурные дискуссии в рекламных журналах о целесообразности применения пневматических или электронных регуляторов, аналогового или цифрового управления и т. д.
Хорошая теория позволяет лучше понять сущность проектируемого процесса, в частности она нередко дает возможность точно определить фундаментальные ограничения на качество управления. Кроме того, существуют некоторые идеализированные задачи, которые решаются аналитически, что позволяет развить необходимый навык в выборе подходящих схем и алгоритмов управления.
Следует иметь в виду, что задачи управления весьма разнообразны по своей сущности — от создания простого одноконтурного регулятора для конкретной системы до проектирования интегрированной системы управления сложным технологическим процессом. Подходы к проектированию типовых и уникальных систем также различны. При типовом проектировании основные усилия концентрируются на создании дешевой системы с достаточно хорошим качеством, а при уникальном часто выгоднее использовать гибкую стандартную систему и настроить ее на конкретную задачу.
Важно также понимать тесную связь между проектированием технологических процессов и систем управления. Традиционно системы управления вводились в данный технологический процесс для упрощения или улучшения его функционирования. Однако со временем стало ясно, что можно достичь большего, если проектировать процессы и системы управления как единое целое. Система управления всегда дает конструктору дополнительную свободу, часто используемую им для улучшения производительности и повышения экономичности проекта. Вместе с тем нередко чрезвычайно сложные задачи управления возникают исключительно из-за несовершенства технологического процесса (разд. 6.1).
7.1. ФУНКЦИОНАЛЬНЫЕ АСПЕКТЫ
Всегда полезно иметь представление о том, как система управления взаимодействует с окружающей средой. Рассмотрим связь между процессом и регулятором, а также настройку, функционирование и модификацию системы.
Процесс и регулятор
На ранней стадии развития автоматики систему управления всегда проектировали после завершения проектирования технологического процесса. Подобная ситуация часто наблюдается и в наши дни. Объект управления проектируется в основном статически — в результате им трудно управлять. В связи с этим очень полезно рассматривать проектирование управляющей системы совместно с проектированием процесса. Автоматическое управление объектом предоставляет конструктору дополнительную свободу, которая используется им для получения более эффективных компромиссных решений. Следовательно, процесс и регулятор необходимо проектировать совместно.
Пример 7.1. Снижение уровня возмущений с помощью перемешивания
Уменьшение неоднородности выходного потока жидкости — одна из главных задач управления технологическим процессом. Ее можно решить, введя в систему резевуары большого объема и тем самым увеличив количество ресурса, задействованного в процессе. Кроме того, такое решение имеет низкую скорость перенастройки, в результате чего переход на выпуск другого продукта занимает длительный промежуток времени, в течение которого выходной поток не удовлетворяет технологическим требованиям.
Другой способ уменьшения неоднородности продукта состоит в измерении его качества и уменьшении дисперсии состава с помощью обратной связи. В этом случае можно использовать значительно меньшие емкости и получить системы с более приемлемым временем реакции — при этом, однако, система управления значительно усложняется. Так как система в целом всегда имеет ограниченную полосу пропускания, для исключения быстрых колебаний должны использоваться небольшие смесительные емкости.
Устойчивость и управляемость (маневренность) Нередко требования к устойчивости и управляемости взаимно противоречивы, как, например, при проектировании летательных аппаратов. Братья Райт преуспели в создании своего аэроплана, решив создать маневренный, но неустойчивый самолет, тогда как их соперники пытались получить устойчивую конструкцию. В кораблестроении устойчивый корабль обычно плохо управляется, а маневренный — часто неустойчив. Традиционно при проектировании основное внимание уделялось устойчивости. Однако интересно отметить, что при наличии управления целью проектирования может быть создание управляемого, пусть и неустойчивого объекта, так как устойчивость в этом случае обеспечивается системой управления. Пример из области самолетостроения показывает, что этот подход позволяет получить значительную экономию.
Пример 7.2. Проектирование сверхзвукового самолета
У самолетов, обладающих широким скоростным диапазоном, центр давления при увеличении скорости перемещается к хвостовой части. У современного сверхзвукового истребителя сдвиг центра давления достигает 1 м. Если самолет спроектирован статически устойчивым на дозвуковых скоростях, то на низких скоростях центр будет на несколько дециметров впереди центра давления. Следовательно, на сверхзвуковых скоростях расстояние между ними увеличится почти до 1 м. В результате ^того возникнет очень сильный стабилизирующий момент, сохраняющий прямой курс самолета. Этот момент пропорционален произведению тяги на расстояние между центрами масс и давления. Поэтому, чтобы управлять самолетом на больших скоростях, необходим большой руль, который, однако, приводит к значительной потере скорости.
Существенно лучшей оказывается конструкция, у которой положение центра масс соответствует середине диапазона колебания центра давления. В этом случае можно использовать руль гораздо меньших размеров, при этом потеря скорости сократится на несколько процентов (до 10 %). Однако такой самолет будет статически неустойчивым на низких скоростях, т. е. при взлете и посадке! Требуемой устойчивости все же можно достичь с помощью системы управления, которая, конечно, должна быть абсолютно надежной. Современная тенденция в самолетостроении состоит в создании машин, которые статически неустойчивы на низких скоростях, а необходимая устойчивость обеспечивается системой управления. Подобные примеры можно найти в конструкциях других летательных аппаратов.
Аналогичные ситуации имеют место при управлении химическими процессами.
Пример 7.3. Экзотермический химический реактор
Для увеличения выхода экзотермического химического реактора может возникнуть необходимость в обеспечении таких условий функционирования, при которых неуправляемый процесс будет неустойчивым. Очевидно, что тогда работа реактора будет существенным образом зависеть от системы управ лення, стабилизирующей реактор.
Управляемость, наблюдаемость и динамика
При проектировании процесса необходимо убедиться, что все его важнейшие параметры легко могут быть изменены. Термин управляемость часто используется именно в этом смысле, хотя он понимается гораздо шире, чем формальная концепция управляемости (разд. 5.2).
Для построения агрегатов, управляемых в широком смысле, прежде всего необходимо иметь достаточное количество исполнительных механизмов. Если у процесса раздельно обрабатываются, скажем, четыре важных параметра, то должно существовать по крайней мере четыре исполнительных механизма. Кроме того, статическая связь в системе между параметрами и исполнительными механизмами должна быть однозначной. Для достижения хорошего качества управления динамическая связь между дополнительными механизмами и параметрами процесса в идеале должна обеспечивать устойчивое управление. Это значит, что необходимо исключить временные задержки и неминимально-фазовые связи. Идеальные динамические связи должны представлять интеграторы или звенья линейного запаз
дывания. Однако такие процессы не всегда легко получить, поэтому в системах управления технологическими процессами широко используются неминимально-фазовые контуры управления.
Простейшие динамические модели часто полезны для оценки динамики системы на стадии проектирования. Конструкция исполнительных механизмов должна позволять менять параметры процесса в достаточно широком диапазоне и с приемлемой точностью. Структура системы также должна обеспечивать минимальное изменение усиления в любых условиях функционирования. Наиболее общая ошибка в системах с потоками жидкости— выбор слишком большого регулирующего клапана. Это приводит к ярко выраженной нелинейной зависимости между степенью открытия клапана и потоком жидкости. Изменение интенсивности потока незначительно при движении клапана от полностью открытого состояния до почти закрытого. Затем при небольшом его перемещении происходит резкое уменьшение потока жидкости.
Процесс также должен иметь подходящие датчики, сигналы которых должны быть однозначно связаны с важнейшими параметрами. Их необходимо разместить так, чтобы поступающая от них информация о процессе была наиболее репрезентативна. Например, не стоит располагать датчики в карманах, где свойства потока жидкости нетипичны. Необходимо также исключить временное запаздывание, которое может иметь место вследствие перемещения или изоляции температурного датчика.
Простые динамические модели, дополненные анализом наблюдаемости, очень полезны для согласования работы датчиков и исполнительных механизмов. Кроме того, они необходимы для оценки постоянных времени.
Проектирование регулятора или непосредственная настройка
Конструкция регулятора в значительной степени зависит от трудоемкости его проектирования. Создание регулятора для систем, производимых в большом количестве, может потребовать больших затрат инженерного труда. В этом случае регулятор будет управлять фиксированным числом параметров и не требовать настройки. Однако во многих приложениях экономически невыгодно идти по такому пути, а целесообразнее использовать стандартный и универсальный регулятор с настраиваемыми параметрами. После его установки на объект требуемые характеристики определяются в процессе наладки.
Возможности создания гибкого, универсального регулятора существенно возросли с появлением цифрового управления Если регулятор выполнен на базе ЭВМ, то саму систему также можно оснастить машинно-ориентированными приборами, упрощающими ее построение и настройку.
В технологических процессах большинство систем управления потоками жидкости, температурой, давлением спроектированы эмпирически и настроены непосредственно на объекте. Систематизированные методы проектирования применяются при управлении химическими составами, кислотностью и щелочностью, а также такими многомерными, нелинейными системами с возмущениями, как дистилляционные кйлонны.
Связь между процессом, регулятором и оператором
Работа регулятора и процесса, несомненно, должна быть хорошо согласована. Регулятор обычно проектируют для установившегося состояния процесса, которое чаще всего единственно. При этом необходимо убедиться, что система также будет удовлетворительно работать при запуске, останове и в непредвиденных обстоятельствах, таких, как, например, неожиданный сбой в процессе. Для нормальных условий функционирования естественно предусмотреть максимальную эффективность системы, а в случае сбоя более важная задача — ликвидировать его последствия и вернуться к предусмотренным условиям работы.
В установившемся состоянии процессы обычно управляются автоматическим регулятором, который в переходных режимах отключается и управление принимает оператор. Однако с увеличением уровня автоматизации эффективное автоматическое управление будет требоваться на всех режимах процесса.
7.2. ПРИНЦИПЫ СТРУКТУРИЗАЦИИ
Как уже отмечалось, реальные задачи управления характеризуются высокой размерностью и неопределенностью, тогда как теория имеет дело с небольшими и хорошо обусловленными задачами. Слово структуризация может означать построение упорядоченной структуры чего-либо. В нашем случае под структуризацией подразумевается процесс формулирования реальных задач в виде, поддающемся решению в рамках теории управления.
Проблемы структуризации очень важны для проектирования систем управления. К сожалению, их еще нельзя полностью систематизировать, и поэтому в литературе о них часто умалчивают. По аналогии можно сказать, что структуризация связана с системой управления так же, как грамматика с литературным произведением. Совершенно невозможно хорошо писать, не зная грамматики, но и грамматически безупречное сочинение — не обязательно хорошее сочинение. Структуризация системы управления, конечно, должна основываться на научных принципах теории управления, но она немыслима без элементов творчества, изобретательности и искусства. Может быть, лучшим путем обу
чения структуризации является развитие соответствующих навыков.
Используемая в данной главе терминология заимствована из области вычислительных систем и программирования, где структуризация больших программ являлась темой многих исследований и где утвердились два основных подхода — «сверху-вниз» и «снизу-вверх».
При подходе «сверху-вниз» вначале ставится общая задача, которая затем посредством детализации расчленяется на мелкие подзадачи. Эта процедура завершается, когда каждой подзадаче соответствует какая-либо хорошо известная задача. Характерно, что при "этом с самого начала многие детали опускаются, а затем по мере дробления задачи они вводятся в рассмотрение. Поэтому термин «последовательное» уточнение часто ассоциируется с подходом «сверху-вниз».
Решение задачи структуризации методом «снизу-вверх» начинается с выделения мелких задач, имеющих ясный смысл. Затем их начинают группировать до тех пор, пока не будет получено решение всей проблемы.
Нередко считают, что подход «сверху-вниз» систематизиро-ваннее и логичнее. Однако его невозможно применить, пока свойства системы хорошо не изучены. Вместе с тем использование подхода «снизу-вверх» вызывает существенные затруднения, если проблема не осознана в целом. На практике обычно широко используется комбинация этих подходов — подход «вширь-вглубь».
Структуризация — это итеративная процедура, и для ее полной систематизации потребуется еще много времени. Трудно оценить проблемы структуризации без рассмотрения задач достаточно большого размера и сложности, именно поэтому большинство работ в этой области сделано в промышленности. Кроме того, на производстве есть инженеры, хорошо разбирающиеся в вопросах структуризации. В связи с этим читателю настоятельно рекомендуется изучать работы «мастеров структуризации», как художники изучают живопись великих мастеров.
7.3. ПОДХОД «СВЕРХУ-ВНИЗ»
Данный подход включает выбор принципов управления, выделение управляющих и измеряемых переменных и установление связей между ними.
Выбор принципов управления
Принцип управления дает общее представление о способе управления процессом; он показывает, как процесс должен реагировать на возмущение и управляющие сигналы. Выбор принципа
управления — отправная точка при проектировании методом «сверху-вниз?.
Пример 7.4. Управление потоком жидкости
При управлении клапаном можно регулировать его положение, поток жидкости или то и другое. Проще и дешевле управлять положением клапана. Так как поток жидкости, вообще говоря, нелинейная функция от положения клапана, то связь между управляющей переменнЬй (положение клапана) и физической переменной (поток) сильно нелинейная. Она также зависит от таких факторов, как изменение давления и степень износа клапана. Этих трудностей можно избежать, если управлять как положением клапана, так и потоком жидкости. Однако система управления потоком значительно сложнее, так как требует наличия специального измерительного прибора.
Пример 7.5. Управление составом
При управлении важнейшими параметрами продукта, как правило, необходимо, чтобы они совпадали с требуемыми значениями. Этого можно достичь, минимизируя отклонение в составляющих конечного продукта. Если поток направить в большой смесительный резервуар, колебание однородности получаемого в нем состава будет минимальным. Это не совсем то же самое, что минимизация отклонений в потоке составляющих в данный резервуар.
Пример 7.6. Управление поршневым паровым котлом
Рассмотрим турбину и электрогенератор, работающие от парогенератора. Выходной переменной в данной системе является величина вырабатываемой мощности. Парогенератором можно управлять двумя способами: сохраняя или не сохраняя постоянное давление пара при изменении выходной мощности. Эти принципы управления называются постоянным давлением и скользящим давлением соответственно. Если давление постоянно, то в паровом котле наблюдаются только небольшие температурные скачки. Однако в этом случае энергия, запасенная в котле, при внезапной необходимости в увеличении выходной мощности не используется.
Пример 7.7. Управление кораблем
При проектировании автопилота для высокоманевренного корабля возникает множество вариантов: можно создать такой автопилот, чтобы капитан смог перевести корабль на другой курс с определенной скоростью; либо задать лимб вместо скорости. Преимуществом этого последнего варианта является независимость пути корабля от его скорости. Принцип управления лимбом приводит к более сложным системам, потому что в этом случае необходимо измерять как скорость перестройки на другой курс, так и скорость корабля.
Пример 7.8. Управление материальным балансом
Технология многих производственных процессов включает перемещение и хранение материалов. Хотя процессы очень разнообразны, везде необходимы запасы материалов с целью сгладить нерегулярность нх потоков. В связи с этим неразумно управлять данными системами, поддерживая постоянным количество хранимых материалов. Вместо этого критериями управления могут быть:
• ограничения на минимум и максимум номенклатуры товаров;
• точный долгосрочный материальный баланс входа и выхода;
• равномерные скорости потока материалов.
Пример 7.9. Управление в условиях ограничений
При проектировании системы управления часто необходимо учитывать различные варианты условий ее функционирования. Это означает, что, возможно, потребуется рассматривать ограничения из соображений безопасности или экономической целесообразности. Кроме того, может возникнуть необходимость учета ограничений в периоды пуска и останова системы. Управление в таких ситуациях обычно осуществляется цифровыми регуляторами. В на
стоящее время цифровое и аналоговое управление реализуется с помощью одного вида оборудования, обычно называемого программируемыми системами управления. Это означает, что существуют возможности для интегрирования различных функций систем управления.
Выбор принципа управления — весьма важный момент, поскольку хороший принцип управления упрощает решение задачи. Нередко выбор принципа управления осуществляется с учетом технических и экономических ограничений. Кроме того, он почти всегда основывается на исследовании моделей процесса, которые обычно строятся в соответствии с внутренними физическими принципами. Поэтому трудно определить общие правила для формулировки принципа управления.
Выбор управляющих переменных
Следующим шагом после определения принципа управления является выбор управляющих переменных, который часто ограничен в различных практических задачах. Так как принцип управления указывает на управляемые физические величины, то естественно связать их с управляющими переменными. Поскольку математические модели необходимы для нахождения принципов управления, их также можно использовать для изучения управляемости при выборе управляющих переменных.
Выбор измеряемых переменных
При определении принципа управления предварительно отбираются измеряемые переменные. Если переменные, используемые для формулирования принципа управления, не могут быть измерены, то следует взять величины, наиболее тесно связанные с ними. Для этого могут оказаться очень полезными математические модели и анализ наблюдаемости. Типичный пример — управление химическим процессом, где температура, которую легко измерить, выбирается вместо состава, определение которого трудоемко и дорого.
Установление связей между входными и выходными переменными
Большая система обычно имеет огромное количество входов и выходов. Даже если первоначальный принцип управления включает всего несколько переменных, то все же необходимо учитывать введение многих переменных, которые можно измерить или обработать. В подходе «сверху-вниз» система разбивается на небольшие подсистемы. Желательно сгруппировать различные входы и выходы, чтобы получилась совокупность маленьких систем. Если возможно, то эта операция должна быть такой, чтобы в результате (1) между подсистемами сохранялись только ела-
Рис. 7.1. Управление материальным балансом по направлению потока (а) и в направлении, противоположном потоку (б).
бые связи и (2) каждая подсистема динамически хорошо управлялась, т. е. постоянные времени имели бы ту же величину, а временные задержки, неминимальная фазовость и сильные колебания исключались.
Для операции группировки не только не существует общих правил, но и нет хорошего критерия возможности нахождения группировки, которая отвечала бы требуемым свойствам. Единственный путь решения этой проблемы — метод проб и ошибок в сочетании с анализом моделей.
Пример 7.10. Управление материальным балансом
Система с потоками материалов (рнс. 7.1) состоит из последовательно соединенных резервуаров. Интенсивность потоков между ними управляется насосами. Рис. 7.1 иллюстрирует две различные структуры управления. В первом случае — поток из каждого резервуара управляется по уровню жидкости в нем, т. е. по направлению потока. Для поддержания баланса между выходом конечного продукта и поступлением исходного сырья необходимо управлять потоком в первый резервуар с помощью обратной связи по уровню в последнем резервуаре. Во ртором случае поток в каждый резервуар управляется по уровню жидкости в нем, т. е. в направлении, противоположном потоку. Данный режим предпочтительнее, так как все контуры управления — простые системы первого порядка, и здесь нет проблемы устойчивости. При управлении по направлению потока могут возникнуть неустойчивые состояния из-за наличия обратной связи через все резервуары. Кроме того, в случае управления в направлении, противоположном потоку, можно обойтись резервуарами меньшей емкости.
7.4. ПОДХОД «СНИЗУ-ВВЕРХ»
При подходе «снизу-вверх» сначала выбирают управляющие и измеряемые переменные. Затем начинают вводить различные регуляторы, основанные на принципах обратной и прямой связи, прогнозирования и оценки возмущений, оптимизации и адаптации.
Обратная связь
Используемые контуры обратной связи включают, например, простые ПИД-регуляторы и их каскадные соединения. Если регулятор реализован на базе ЭВМ, то становится возможным бо-
Рис. 7.2. Блок-схема предиктора Смита.
лее сложное управление, как-то: предиктор Смита для компенсатора с задержкой, обратная связь по состоянию, управление по эталонной модели.
Обратная связь здесь применяется в своем обычном значении. Ее преимущество заключается в том, что она позволяет уменьшить чувствительность системы к возмущениям и колебаниям параметров. Обратная связь особенно эффективна, когда динамика процесса такова, что можно использовать широкополосные устройства.
Многие трудно реализуемые на базе аналоговой техники системы легко строятся на основе автоматизированного управления. Типичный пример — предиктор Смита. Его блок-схема показана на рис. 7.2, из которой видно, что существует необходимость в запоминании сигналов. Это нелегко сделать в аналоговой реализации, но достаточно просто в цифровой.
Прямая связь
Прямая связь — это еще один метод управления. Как было показано в гл. 6, он применяется для устранения измеримых возмущений. Основная его идея состоит в том, что измерения возмущений используются для упреждения их воздействия на
Рис. 7.3. Пример сложной системы управления, состоящей из простых структур управления.
РГГ — регулятор потока; РД — регулятор давления; РТ—регулятор температуры; РУ — регулятор уровня.
переменные процесса и наработки подходящих компенсирующих сигналов. Его преимущество по сравнению с обратной связью заключается в том, что корректирующее воздействие можно генерировать до того, как возмущение окажет влияние на систему. Так как прямая связь реализует разомкнутую схему компенсации, то требуется хорошая модель процесса. В случае цифрового управления эту модель легко включить в состав регулятора, поэтому эффект от применения прямой связи возрастет. Проектирование компенсатора прямой связи, по существу, сводится к вычислению обратной динамической системы.
Прогнозирование и оценка
Переменные состояния и параметры системы часто нельзя непосредственно измерить. В этом случае при проектировании обратной связи вначале удобно допустить, что их величины известны, а затем заменить их оценочными или прогнозируемыми значениями. Нередко это решение оказывается оптимальным, поэтому прогнозирование и оценка имеют особую важность. Оценка переменных состояния легко осуществляется как с помощью аналоговой техники, так и цифровой. Однако оценку параметров системы значительно легче производить на ЭЦВМ, чем применяя аналоговые методы. Таким образом, прогнозирование и оценку прощейиспользовать в цифровом управлении.
Оптимизация
Некоторые задачи управления удобно ставить как оптимизационные задачи. В цифровых системах управления в качестве элемента можно ввести оптимизирующую программу.
Компоновка системы
При подходе «снизу-вверх» базовые структуры управления объединяются в большую систему, решающую главную задачу.
Параметры процесса
Рис. 7.4. Блок-схема самонастраивающегося регулятора, полученного компоновкой звеньев оценки параметров и расчета параметров регулятора.
Часто бывает удобно делать соединения иерархическими. Многие структуры, как, например, каскадное управление, обратная связь по состоянию и наблюдатели известны из элементарного курса теории управления. Из них можно компоновать очень сложные системы управления (рис. 7.3). На самом деле подход «снизу-вверх» при создании систем управления преобладает в практике управления процессами, хотя успех его применения во многом зависит от искусства инженера-проектировщика.
Адаптивная система, полученная компоновкой звеньев оценки и расчета параметров регулятора, показана на рис. 7.4, .
7.5. ПРОЕКТИРОВАНИЕ ПРОСТЕЙШИХ КОНТУРОВ УПРАВЛЕНИЯ
Проектирование в случае подхода «сверху-вниз» завершается созданием простейших контуров управления, содержащих один или несколько регуляторов или датчиков. Вместе с тем при подходе «снизу-вверх» проектирование начинается с создания простейших контуров. Таким образом, их построение — важнейший шаг в обоих случаях. Проектирование простейших контуров также является одной из областей, в которой используется реальная теория, рассматриваемая в последующих главах. Чтобы дать общее представление о проблеме, в настоящем разделе кратко обсуждаются методы создания простейших контуров управления, а также рассматриваются примеры задач проектирования регуляторов и сервомеханизмов.
Простые критерии
Простейшим путем задания требований к качеству регулирования является определение допустимых величин ошибок при типичных видах возмущений. Например, можно потребовать, чтобы ступенчатое возмущение не вызывало установившейся ошибки, а ошибка вследствие возмущения «люфт» составляла часть его скорости. Эти ограничения (разд. 5.3) обычно выражаются в терминах установившегося поведения. Коэффициенты ошибок определяют требования только на низких частотах. Следовательно, кроме коэффициентов ошибок необходимо также задать и полосу пропускания системы.
Другой более сложный способ определения ограничений на качество регулирования состоит в задании требований к передаточной функции от возмущений к выходу процесса.
Требования к задаче регулирования
Назначение регулирования — сохранение значений переменных процесса близкими к заданным вне зависимости от возмущений и колебаний в его динамике.
Управление по минимальной дисперсии. При регулировании важнейших переменных нередко можно найти объективный критерий качества регулирования. Типичная ситуация проиллюстрирована на рис. 7.5, где показаны различные плотности распределения переменных. Часто требуется, чтобы определенное процентное содержание продукции было бы на более высоком качественном уровне, чем заданное значение. Уменьшая отклонения качества, можно приблизить установочное значение к цели регулирования. Улучшение качества управления можно выразить с помощью уменьшения расхода энергии или сырья либо увеличения выпуска продукции. Таким образом, уменьшение качественных отклонений можно определить непосредственно через экономические показатели.
Для высокопроизводительных процессов уменьшение колебаний даже на долю процента может привести к большой прибыли. Например, сокращение колебаний влажности в системе управления бумагоделательной машины на 1 % приведет к дополнительным доходам около 100 000 долл, в год.
Если отклонения качества выражаются гауссовским законом распределения, критерий сводится к минимизации дисперсии качественных переменных. В этих задачах управляющие воздействия не существенны, пока они не вызывают чрезмерного износа или слишком больших сигналов. Стратегия управления,
,, Плотность вероятностей
Точечное множество Зля регулятора 1 с низкой дисперсией
Рис. 7.5. Качество регулирования в терминах колебаний качественных переменных.
минимизирующая дисперсию выхода процесса, называется управлением по минимальной дисперсии.
Оптимальное управление. Управление по минимальной дисперсии— типичный пример постановки задачи управления как оптимизационной. В общем случае недостаточно только минимизировать дисперсию выхода, поэтому вводится критерий вида
ti
Е g [х (s), и (s)] ds,
to
где х—переменная состояния, и — управляющая переменная, а Е — математическое ожидание.
Пример 7.11. Управление кораблем
Можно показать, что относительное увеличение сопротивления вследствие отклонения корабля от прямого курса приближенно может быть выражено как
Т
= (0 + pfi2 (01 dt,
К i J
о
где ф —- отклонение носа корабля, 6 — угол поворота руля, /? — сопротивление, р — параметр. Характерные значения параметров для танкера: k = 0,014; р = 0,1.
Методы проектирования регуляторов
Существует много методов для оценки качества регулирования и проектирования регуляторов. Задачи регулирования часто решают с помощью обратной связи, но и прямая связь может оказаться очень полезной для исключения измеряемых возмущений.
Если требования к качеству заданы с помощью передаточной функции, связывающей выход с возмущениями, естественно применить методы, позволяющие управлять ею. Одним из них является размещение полюсов системы, который позволяет специфицировать всю передаточную функцию. Недостатком данного способа является тот факт, что фиксация всех полюсов не оставляет практически никакой свободы выбора.
Другой метод состоит в использовании частотного метода, в результате чего оказывается возможным управлять частотной характеристикой выхода в зависимости от возмущений. Такие задачи наиболее удобно ставить с помощью непрерывной теории. Полученные регуляторы затем преобразуются в алгоритмы цифрового управления приемами, описанными в гл. 8.
Если критерий определен как оптимизационный, наиболее естественно использовать методы, основанные на оптимизации. Методы, основанные на минимизации дисперсии выхода процесса, и другие виды квадратичного критерия качества рассмотрены в гл. 11 и 12.
Требования к задаче серворегулирования
Цель серворегулирования состоит в том, чтобы «заставить» переменные процесса реагировать на изменения командного сиг-
Рис. 7.6. Переходная харак терис.тика как средство опи сания задачи серворегули рования.
нала строго определенным образом. Для этого полезен метод обратной связи. Поскольку командный сигнал известен, естественно сочетать обратную и прямую связи.
Отслеживание модели. Одним из способов описания реакции системы на командный сигнал является задание модели требуемой реакции. Это можно сделать, например, определив требования к передаточной функции от командного сигнала к переменным процесса. Если точное совпадение с моделью реакции невозможно, то минимизируются отклонения от нее.
Требования к времени и частоте. Так как линейная система полностью определяется своей переходной характеристикой, то задачу серворегулирования возможно поставить в форме требований к переходной или частотной характеристикам замкнутой системы. Эти типы требований включают: время разгона Тг, перерегулирование М, время регулирования Ts, установившуюся ошибку ео, полосу пропускания сов, резонансный максимум Мр. Время регулирования определяется как время, за которое процесс достигает значения, не отличающегося от установившегося состояния более чем на ±р (обычно равно 5%) (рис. 7.6 и 7.7).
Рис. 7.7. Диаграмма Боде замкнутой передаточной функции Gc.
Показано, как задачу серверегу лирования можно описать ча_ Стотной характеристикой.В уста' новнвшемся режиме система имеет единичное усиление.
Кроме того, некоторые параметры можно найти по диаграмме Боде разомкнутой системы, например запас по усилению Ат, запас по фазе <рт и частоту среза сос. Запасы по усилению и фазе связаны с устойчивостью замкнутой системы, а частота среза пропорциональна полосе пропускания замкнутой системы.
Методы проектирования серворегуляторов
Известно много методов проектирования серворегуляторов. Если все переменные состояния измеримы, то естественно применить метод размещения полюсов. Если система управляема, то можно использовать обратную связь по состоянию, которая дает требуемые полюса замкнутой системы. Если некоторые переменные состояния не измеримы, то их можно восстановить с помощью наблюдателя или фильтра Калмана.
ВЫВОДЫ
В данной главе дан обзор задач аналитического конструирования. Существует большая разница между большими и неопределенными реальными задачами и маленькими и ясными задачами, рассматриваемыми в теории управления, поэтому в главе рассмотрены и вопросы структуризации.
При описании подхода «сверху-вниз» введено понятие принципа управления. Кроме того, показано, как можно использовать подход «снизу-вверх» для построения сложных систем из простых структур, как, например, обратная связь, прямая связь, ис
ключение возмущений и оптимизация. Наконец, обсуждены требования и подход к созданию простых контуров управления.
Химический процесс проходит во множестве отдельных блоков, например в реакторах, смесителях и дистилляционных колоннах. При подходе к проектированию систем управления методом «снизу-вверх» сначала создаются управляющие контуры для этих простейших операций. Затем устанавливаются взаимосвязи между ними, в результате чего получается система как целое. При подходе «сверху-вниз» сначала постулируются принципы управления для всего объекта, например управление химическим составом или управление балансом материалов. Затем при декомпозиции эти принципы применяются к конкретным блокам и контурам.
В управлении технологическими процессами большинство контуров управления уровнем жидкости, потоками и давлением удобнее всего проектировать интуитивно и настраивать непосредственно на объекте. Однако системы управления химическим составом, кислотностью и щелочностью выходного продукта, а также нелинейные, распределенные большие системы с сильным взаимодействием нередко проектируют точно и аккуратно.
ЗАДАЧИ
7.1. Рассмотрим задачу о материальном балансе (рис. 7.1). Предположим, что каждый резервуар — интегратор, а каждый регулятор реализует пропорциональное управление. Опишите влияние на эти две системы импульсного возмущения с источником в емкости с сырьем.
7.2. Выведите передаточную функцию замкнутой системы (рис. 7.2). Опишите качество управления этой системой. Каково основное свойство предиктора Смита? (Ср. со случаем, когда нет временного запаздывания и используется регулятор Gr.)
7.3. Определите и опишите назначение каскадного управления, прямой связи, нелинейного элемента (рис. 7.3).
ЛИТЕРАТУРА
Для более детального ознакомления с материалом, изложенным в главе, можно рекомендовать следующие работы:
1. Polya G. (1945): How to Solve It. Princeton, N. J.: Princeton University Press.
2. Wirth N. (1975): Algorithm + Data Structures = Programs. Englewood Cliffs, N. J.: Prentice-Hall, Inc.
Работы по структуризации
3. Buckley P. S. (1964): Techniques of Process Control. New York: John Walley.
4. Shinskey F. G. (1979): Process Control Systems (2nd ed.). New York: McGraw-Hill.
5. Bristol E. N. (1980): “Strategic Design: A Practical Chapter in a Textbook on Control” Paper WA4-A, Preprints JACC, San Francisco.
О проблеме структуризации написано немного. Статья
6. Buckley Р. S. (1978): “Distillation Column Design Using Multivariable Control, Part 1: Process and Control Design; Part 2: Economics, Energy, and Equipment”, Instrumentation Technology, September, 115-22; October, 49-53 содержит полезные сведения общего характера, хотя и посвящена очень узкой области. Более широкий круг вопросов охватывает работа
7. Foss A. S. (1973): “Critique of Chemical Process Control Theory”, IEEE Trans. Autom. Control, AC-18, 646-52.
Проектирование системы управления и объекта управления осуществляется совместно только в некоторых областях техники. Конструирование высококачественных летальных аппаратов одна из них:
8. Burns В. R. А. (1975): “Fly-by-wire and Control Configured Vehicles — Rewards and Risks”, Aeronautical Journal, February.
9. Boudreau J. A. (1976): “Integrated Flight Control System Design for CCV”, Proc. AIAA Conf, on Flight Mechanics. Guidance and Control.
Требования к качеству регулирования в простых контурах
10. Dorf R. С. (1980): Modern Control Systems (2nd ed.) Reading, Mass.: Addison-Wesley.*
11. Elgerd O. (1967); Control System Theory. New York: McGraw-Hill,
Преобразование аналоговых регуляторов
Получение с помощью преобразования и модификации аналоговых регуляторов цифровых, включая цифровые ПИД-регуляторы, и перепроектирование обратной связи по состоянию
ВВЕДЕНИЕ
Иногда аналоговые системы управления заменяют цифровыми только потому, что последние дешевле и надежнее. При этом, естественно, необходимо чтобы цифровая система обладала теми же свойствами, что и непрерывная. Непосредственное решение подобной задачи предусматривает использование коротких интервалов квантования и соответствующей дискретной аппроксимации непрерывного регулятора. Такой подход иллюстрируется примером 1.3, характер дискретного и непрерывного управления показан на рис. 1.5. Заметим, что дискретный управляющий сигнал отстает от непрерывного в среднем на половину периода квантования, что вызывает запаздывание по фазе и ухудшает качество управляемой системы. Поэтому выбор периода квантования играет очень важную роль. Вообще говоря, для дискретной аппроксимации непрерывных регуляторов требуется довольно частое квантование, хотя существуют методы проектирования дискретных систем управления, допускающие применение достаточно длинных периодов квантования (рис. 1.6).
8.1. ВОЗМОЖНЫЕ СПОСОБЫ АППРОКСИМАЦИИ
Предполагается, что непрерывный регулятор задается своей передаточной функцией G(s). Требуется найти такой численный алгоритм управления, чтобы цифровая система регулирования достаточно хорошо аппроксимировала передаточную функцию G(s) (рис. 8.1). Подобная задача интересна как с точки зрения изучения свойств аналогового регулятора, так и в плане реализации дискретного фильтра. Существует множество способов аппроксимации сигналов. При реализации на ЭВМ эта процедура включает прежде всего восстановление данных, которое также можно осуществить различными способами, например используя приближения нулевого и первого порядков. Рассмот-
Hk.)*6(s)
Рис. 8.1. Аппроксимация непрерывной передаточной функции с помощью ЭВМ
рим несколько наиболее простых и распространенных методов аппроксимации.
z-Преобразование
Один из способов аппроксимации передаточной функции G(s) состоит в использовании результатов, полученных в гл. 3, для вычисления импульсной передаточной функции H(z), соответствующей G(s), т. е. в квантовании системы. Это можно сделать с помощью таблиц соответствия (например, табл. 3.1), или уравнений (3.7) и (3.38), предварительно выразив G(s) через фазовые координаты. Далее можно построить интерполяцию выхода дискретной системы между моментами квантования, например нулевого порядка. Данный метод дает точные значения выходной переменной в момент квантования, если сигнал на входе фильтра постоянен на протяжении всего периода квантования. Такой метод должен хорошо работать и в тех случаях, когда изменения входного сигнала на протяжении всего периода квантования малы.
Дифференцирование и аппроксимация Тустена
Передаточная функция фактически задает некоторое дифференциальное уравнение, для дискретизации которого проще всего воспользоваться аппроксимацией первых производных конечными разностями (метод Эйлера) прямой
или обратной
рх(/) = ^-~
В случае изображений это равносильно замене переменной s на (г— 1)/й или на (г — l)/(zft). В разд. 3.5 было показано, что переменные г и s могут быть связаны соотношением
z = exp (sh). Разностная аппроксимация соответствует разложениям в ряд:
z = 1 4- sh (прямая разность, или метод Эйлера), (8.1)
z — esh^ ! _1-^- (обратная „разность). (8.2)
Аппроксимация, аналогичная методу трапеций в численном интегрировании, задается уравнением
z = esh (метод трапеций). (8.3)
В цифровом управлении приближение (8.3) часто называют аппроксимацией Ту стена, или билинейным преобразованием (ср. с преобразованием Мёбиуса в разд. 5.1). Использование этих методов аппроксимации приводит к тому, что импульсная передаточная функция Н (z) получается из непрерывной функции G(s) простой заменой аргумента s на s', где
Итак,
, z — 1
s —г~
z Z — 1
s =т
, 2 z— 1
S ~ h г+1
(метод Эйлера),
(обратная разность),
(аппроксимация Тустена).
/7(z) = G(s/).
(8.4)
(8.5)
(8.6)
Этот метод весьма прост, даже если вычисления выполняются вручную.
Аппроксимация Тустена обладает тем преимуществом, что левая s-полуплоскость отображается в единичную окружность в то время, как в методе Эйлера левая s-полуплоскость переходит в полуплоскость Rez<l. Следовательно, после аппроксимации Тустена дискретная система остается устойчивой, тогда как метод Эйлера этого гарантировать не может.
Предварительная частотная коррекция
Рассмотренные выше методы аппроксимации могут вызвать нежелательные искажения частотной шкалы. Например, если требуется построить полосовой фильтр или фильтр-пробку, то фильтр, полученный при дискретной аппроксимации, может иметь отличную от заданной рабочую частоту. Это явление называется частотным искажением. Рассмотрим аппроксимацию Тустена. Передача синусоидального сигнала цифровым фильтром описывается выражением
1 1 /о ______ 1 X
— (1 — e~iah) Н (eiah) = —(1 — e~iv>h) G ( - —- ).
/ш/f itifh \ h e h + 1 z
Первые два сомножителя — следствие операций квантования и приближения [ср. с (4.10)]. Рассмотрим аргумент передаточной функции G, т. е.
2 __ ] 2 _e — l<i>hl2
~h elah + 1 =Т +
Если, например, непрерывная система имеет нулевое усиление на частоте со, т. е. G(tco) = 0, то нулевое усиление для дискретной аппроксимации будет на частоте .со', такой что
2 , ( а>' h х
откуда со' = -| arctg(-^-) ~со(1 (8.7)
Это выражение определяет искажение частотной шкалы (рис. 8.2). Из уравнения (8.7) следует, что при со = 0 искажения нет, и оно мало, если сой также мало.
Рис. 8.2. Частотное искажение при аппроксимации Тустена.
Несложно ввести преобразование, которое исключало бы искажение шкалы на заданной частоте coi, модифицировав преобразование Тустена (8.6) следующим образом:
s' = ; -т2) (аппроксимация Тустена (8.8)
к' 1 ' ’ с предварительной коррекцией).
Из уравнения (8.8) следует, что •
Н [exp (itoih)] = G (zcoj),
т. е. непрерывный фильтр и его дискретный аналог имеют одинаковое усиление на частоте ®ь Однако искажение на других частотах по-прежнему остается,
Пример 8.1. Предварительная частотная коррекция
Предположим, что интегратор G(s)=-^- необходимо реализовать в виде дискретного фильтра. Использование преобразования (8.6) без предварительной коррекции дает
rr i . 1 Л z + 1
НТ ~ 2 z - 1 — 2 ’г - 1 ’ h ' z+1
Предварительная коррекция позволяет получить следующий результат:
н tg(w,A/2) z 4-1 w/><2)=——т^т-
Частотная функция Нр есть
U (еi<fh\ = tg (со,/г/2) . eiv>h + 1 = tg (со,/г/2) . 1
р со! eiv>h — 1 гео. tg (соЛ/2)
Таким образом. G (ссо) и Нр [exp (ссо/г)] равны при со = СО].
Выбор периода квантования
Выбор периода квантования зависит от многих факторов. Один из способов его определения заключается в использовании непрерывных аргументов. Дискретную систему можно аппроксимировать приближающей цепью, последовательно соединенной с непрерывной системой. Для небольших периодов квантования передаточная функция приближающей цепи аппроксимируется рядом:
1 - e~sh ~ 1 - 1 + s/г - (shy/2 + ... , s/г .
sh sh 2 *" ' ’ ''
Первые два члена соответствуют разложению в ряд функции гхр(—sh/2). Следовательно, для небольших h приближающая цепь аппроксимируется временным запаздыванием в половину периода квантования. Предположим, что запас по фазе можно увеличивать до 15° с приращением 5°. Это позволяет получить следующее эмпирическое правило:
Лсос ~ 0,15 ч- 0,5,
где сйе — частота среза непрерывной системы в рад/с. Оно дает довольно короткие периоды квантования. Частота Найквиста будет в 5—20 раз больше частоты среза.
Пример 8.2. Дискретный компенсатор с опережением
Рассмотрим систему, описанную в примере А. 2 и являющуюся нормализованной моделью электродвигателя. Передаточная функция управляемой системы •
+ . (8-91
получается при наличии компенсатора с опережением:
s -4- 1
= <8ло)
Замкнутая управляемая система имеет коэффициент затухания £=0,5 и собственную частоту (i>o = 2 рад/с. Требуется найти импульсную передаточную функцию И (г) (рис. 8.3), аппроксимирующую модель (8.10).
Рис. 8.3. Цифровое управление электромотором
Рис. 8.4. Выход процесса у (/) в случае, когда электромотор управляется компенсатором (8.11) при h = 0,1, 0,25 и 0,5.
Управляющий сигнал показан для /1=0,25. Для сравнения приведены непрерывные сигналы.
(8.11)
Приближение методом Эйлера дает
Н (г) = 4 z~'+< = 4 ^-(1-/(1 Е{> z-l-f-2/г г —(1—2Л) ’
а аппроксимация Тустена:
и (-> и (2 +/г) 2 — 2/г 2 +/г г - (2 - Л)/(2 + А) т'- ' (2 + 2/г) г — 2 + 2/г 2 + 2/г г - (1 — /г)/(1 + h) ’
Наконец, квантование нулевого порядка приближения функции (8.10) приводит к
4г — 2(1 + е~2/г) 2-0,5(1 +е-2Л)
НZOH <z> =-------------= 4-----” --------
2 —е-2Л z — e~2h
Все приближения можно записать в общем виде:
н
2 + Щ
Частота среза ojt непрерывного процесса, каскадно соединенного с компенсатором (8.10), равна 1,6 рад/с. Применение эмпирического правила, приведенного вып5е, дает период квантования порядка 0,1—0,3 с.
На рис. 8.4 показан управляющий сигнал и выход процесса при аппроксимации Эйлера для различных периодов квантования. К аналогичным результатам приводят и другие приближения. Динамика замкнутой системы для любых компенсаторов удовлетворительна, если период квантования мал. Эмпирическое правило также дает разумные значения для периода квантования. Перерегулирование для периода ft = 0,5 с приблизительно в два раза больше, чем в непрерывном компенсаторе. В приведенном примере изменение ис происходит в моменты квантования — в действительности это не всегда так, поскольку запаздывание реакции может превышать длину интервала квантования.
8.2. ЦИФРОВЫЕ ПИД-РЕГУЛЯТОРЫ
Во многих системах управления можно ограничиться использованием стандартного ПИД-регулятора. Рассмотрим различные способы реализации цифровых ПИД-регуляторов, а также некоторые функциональные аспекты. Стандартный, «учебный», непрерывный ПИД-регулятор часто описывается с помощью преобразования Лапласа
/ ! Tns \
(8.12)
где U(s) и E(s)— преобразования Лапласа выхода регулятора и ошибки соответственно; К—пропорциональное усиление; Т,— интегральное время или время возврата; TD — время упреждения. В регуляторе существует фильтр с постоянной времени Td/N для дифференцирующей части. Кроме того, W чаще всего принимает значение в интервале 3—10 и обычно фиксируется разработчиком регулятора.
Для преобразования системы (8.12) в цифровой регулятор можно использовать методы приближения непрерывных систем, изложенные в предыдущих разделах. Непосредственное квантование (8.12) дает
и (kh) = К (1 + + ~ЙГ-) е &h), (8-13)
где а = hjTh |3 = А\ у = — ехр
D
ПИД-регулятор можно аппроксимировать и другими методами. Чаще всего аппроксимация интегральной части осуществляется методом Эйлера, а дифференциальной— методом приближения обратной разйости; она приводит к следующему результату:
/ h Тп q — 1 \
и (kh) = /ЦI + (<? _ + -h + T^N • ? _ T[)i^h + J е (kh).
(8.14)
Приближения (8.13) и (8.14) имеют одинаковую принципиальную структуру, кроме незначительной разницы в коэффициентах. При уменьшении h выходы (8.13) и (8.14) становятся все ближе и ближе. Если дифференциальная часть аппроксимируется методом прямых разностей, то регулятор становится неустойчивым при h > 2Td/N, т. е. постоянная времени Грдолжна быть отличной от нуля. Однако дифференциальная часть (8.13) и (8.14) устойчива для всех возможных значений h. Иногда аппроксимация методом обратной разности также используется и для интегральной части. В этом случае единственное различие заключается в том, что запаздывание в числителе интегральной частив исчезает, т. е. последняя измеренная ошибка в интегральной части обрабатывается без задержки.
Для упрощения записи обозначим символами П, И и Д члены к Kph ^РТРР ~
ЛП’ TID (q - 1) ’ h (q + у)
соответственно* (здесь TID и TDD — дискретные эквиваленты времен возврата и упреждения). Размерности параметров непрерывного и дискретного регуляторов будут одинаковыми. Классическая форма записи уравнения ПИД-регулятора имеет следующий вид:
, ( h 1 Тпп q — 1 \
u(kh) = KD(l +— —+ -^4—-}e(kh). (8.15)
В зависимости от того как аппроксимирован непрерывный регулятор, коэффициенты Ко, TlD и TDo будут иметь различную интерпретацию, хотя это различие исчезает, если период квантования мал.
Уравнения (8.13) — (8.15) называются интегральными формами описания ПИД-регулятора, так как в них вычисляется его полный выход. Если вместо этого определяется изменение управляющего сигнала Ku(kh), то из (8.15) можно получить описание регулятора в дифференциальной форме:
Ku (kh) — и (kh) — и (kh — h) =
Г я
= KD i-<r1+-v~
L 1 ID
ТРР^~2Я 1 + ? 2) л(1 + у?-1)
e(kh).
Часто запаздывание в интегральной части исчезает, что происходит при ее аппроксимации обратными разностями. При ис пользовании дифференциальной формы интегратор помещают вне регулятора. Например, выход — прямоугольные импульсы — может направляться на шаговый двигатель, управляющий положением клапана. В этом случае интегральная часть реализуется двигателем. Недостаток дифференциального алгоритма заключается в том, что он не охватывает П- или ПД-режимов. Эту
трудность можно преодолеть, компенсируя внешний интегратор дифференцирующим звеном в цифровой части. В этом случае неустойчивый режим работы исключается.
Различные структуры ПИД-регуляторов
Существует много способов изменения структуры классического ПИД-регулятора (8.12). На рис. 8.5 показаны различные ПИД-структуры, которые могут быть использованы как в непрерывном, так и в дискретном случаях. Структура, изображенная на рис. 8.5,6, имеет то преимущество, что регулятор не дает большого управляющего сигнала при скачкообразном изменении задающего сигнала. Регулятор с принципом «вход только на И» (рис. 8.5, в) не так распространен. Фильтр для дифференциальной части можно использовать по-разному — наиболее общая схема описывается уравнением (8.12). Кроме того, можно фильтровать все три части регулятора или только пропорциональную и дифференциальную части — последний способ, например, позволяет уменьшить высокочастотный шум в измерениях.
Настройка регулятора часто осуществляется с помощью скачкообразных возмущений в задающем сигнале. Полученные при этом значения параметров могут оказаться неудовлетворительными, если основное возмущение есть возмущение процесса. Однако можно показать, что для структуры, изображенной на
5
Рис. 8.5. Различные способы реализации регулятора с ПИД-функцией.
а—классический регулятор; б—'регулятор, дифференцируют л л выход; в — регулятор ^ФОЗ]Д0М тоЛЬК0 на г~ ПИ-регулятор, соединенный с фазоопережакицим звеном
П, И и Д — обозначения различных частей регулятора.
рис. 8.5, в, разница в параметрах регулятора минимальная, если он настроен по входному сигналу или по возмущениям процесса.
Различные структуры, показанные на рис. 8.5, можно пере-
писать в общем виде (рис. 8.6):
R (q) и (kh) = Т (q) ис (kh) -S(q)y (kh),
где многочлены Т и S зависят от конкретной структуры. Все три многочлена имеют порядок, равный двум, а
R (q) = (q + v) (q — 1)
во всех случаях. Из (8.6) можно получить следующее уравнение:
у (kh) — AR + BS ис (kh) + AR + BS w (kh).
Полюса замкнутой системы можно сделать одинаковыми для всех структур. Это означает, что все четыре регулятора можно
Рис. 8.6. Общая форма ПИД-регуляторов, изображенных иа рис. 8.5.
настроить так, что замкнутые системы будут иметь одинаковые импульсные передаточные функции — от возмущений процесса к выходу. Однако многочлен Т зависит от формы регулятора и добавляет два нуля к передаточной функции iic-^У- Значения нулей зависят от регулятора и многочленов R п S. Для структур, изображенных на рис. 8.5, Т имеет два корня, не равные нулю, тогда как у структуры, изображенной на рис. 8.5, в, один корень совпадает с началом координат, а другой отличен от нуля. Используя в случае структуры, представленной на рис. 8.5, в, в интегральной части такой же фильтр, как в дифференциальной, можно получить многочлен Т с двумя корнями в начале координат. Такая структура удобна, когда настройка параметров регулятора основана на методе размещения полюсов.
Функциональный подход
При создании регуляторов существен не только их нормальный режим работы, но и другие функциональные режимы, такие, как переключение между ручным и автоматическим управле
нием. Разработчики ПЦУ-пакетов реализуют свои ПИД-алго-ритмы различными способами, и в частности, в зависимости от того, как они решают эти вопросы. Если проанализировать эти алгоритмы, то часто оказывается, что они представляют собой либо интегральное, либо дифференциальное описание структур, изображенных на рис. 8.5.
В коммерческие ПЦУ-пакеты нередко включаются версии ПИД-регуляюров с различными нелинейностями, например с пропорциональной частью К|е| -е вместо К-е.
Плавный переходный режим. Так как регулятор является динамической системой, необходимо гарантировать удовлетворительное поведение системы при переключениях между ручным и автоматическим режимами регулирования. Когда система находится в ручном режиме, регулятор вырабатывает управляющий сигнал, который может отличаться от сигнала, задаваемого оператором. Таким образом, необходимо удостовериться в том, что интегратор вырабатывает правильные значения в моменты переключения. Такой режим называется плавным переходным режимом.
Дифференциальный алгоритм не нуждается в инициализации при переключении с ручного режима на автоматический. Перед переходом в автоматический режим оператор обычно устанавливает исполнительный механизм в нужное положение, которое не меняется, пока не произойдет ошибка. В интегральном алгоритме для получения плавного переходного режима значение выхода необходимо инициализировать. Это реализуется несколькими способами: один из них — ввод обратной связи по положению исполнительного механизма.
Другой способ гладкого перехода иллюстрируется следующим примером.
Пример 8.3. ПИ-регулятор с плавным переходным режимом
Плавный переходный режим для ПИ-регулятора можно реализовать следующим образом:
и (kh) — Ke (kh) + b (kh).
b (kh) = b (kh — h) -J- а [и' (kh — h) — b (kh — /г)].
Как правило, и'(kh) есть не что иное, как u(kli), хотя это может быть и действием оператора. Для пояснения принципа действия регулятора приводится его блок-схема (рис. 8.7). Если регулятор находится в ручном режиме, то выход равен сигналу, задаваемому вручную в установившемся состоянии, так как фильтр на блок-схеме имеет единичное усиление. Связь между выходом регулятора и ошибкой при u'(kh) = u(kh) имеет вид
и (kh) — Ke (kh) 4-- ”---г- и (kh),
или
и (kh) = к j~—е [i + е &h),
Т. е. это есть ПИ-регулятор.
Борьба с насыщением. Регулятор с интегрирующим звеном — это, вообще говоря, неустойчивая система. Его потенциальная неустойчивость при определенных обстоятельствах может привести к серьезным неприятностям. «Залипание» или насыщение интегратора может произойти, если выход достиг верхней границы, а регулятор продолжает интегрировать ошибку. В этом случае сигнал на выходе интегратора может принять очень большое значение и потребуется много времени, чтобы
Рис. 8.7. Способ реализации гладкой передачи с помощью позиционной формы регулятора.
u'(kh) Д Ручной
’^Автоматический
u(kh)
вернуть его в нормальное положение. Такая проблема не возникает, если используется дифференциальный алгоритм, так как при постоянном выходе интегрирование автоматически прекращается. Если все же необходим интегральный алгоритм, то следует проявлять определенную осторожность. Один из возмож
Рис. 8.8. Выход и вход процесса, когда электромотор (см. пример 8.4) управляется различными ПИ-регуляторами с k = 0,4, Н = 5 и h = 0,5.
1 — ограничений на управляющий сигнал нет; 2 — управляющий сигнал ограничен в диапазоне ± 0,2 без возврата в регуляторе; 3—управляющий сигнал ограничен в диапазоне ^0,2 с использованием ацтирасьнцения, описанного программой dpiaw язьще §imnopr
ных способов — это отключить интегратор при насыщении выхода. Другой способ состоит в использовании условного интегрирования, в котором интегральная часть регулятора задействована при условии, что ошибка достаточно мала.
Пример 8.4. ПИ-регулятор с антинасыщением
Программа на языке Simnon для дискретного ПИ-регулятора с антинасыщением записывается как
discrete system dpiaw
’’Дискретный ПИ-регулятор с антинасыщением input у ис
output и
state i
new ni
time t tsamp ts
e = uc — у v = k * e + i
u = if v < ulow then ulow else if v < uhigh then v else uhigh ni = i + k * h/ti * e + u — v
ts = t + h h: 0.5 k: 0.4 ti:5 ulow0.2 uhigh: 0.2 end
’’период квантования
’’пропорциональное усиление
’’время возврата
’’нижний предел выхода
’’верхний предел выхода
Если выход достиг границы, то интегральная часть принимает значение ulow или uhigh соответственно
Рассмотрим электродвигатель (рис. 8.3) и допустим, что Н(г)—это ПИ-регулятор с ограничением на выходной сигнал. На рис. 8.8 показаны выходы и входы процесса при использовании различных регуляторов.
Ошибки интегратора. Интегральная часть цифрового ПИД-регулятора аппроксимируется суммой. При ее вычислении вследствие конечной точности представления данных в ЭВМ могут возникнуть такие проблемы, как, например, «.холостой ход» интегратора. Предположим, что существует ошибка e{kh). Тогда Knh интегрирующий член увеличивается на -=т—e(kh) за каждый пе-' ю
риод квантования [см. (8.15)]. Предположим, что усиление мало, или время возврата больше времени квантования. Тогда изменение выходного сигнала может быть меньше шага квантования по уровню в ЦА-преобразователе. Например, 12-разряд-ный ЦА-преобразователь, т. е. имеющий точность 1 /4096, дает достаточно хорошее разрешение для целей управления. Даже если KD — h = \ и 7Д> = 3600, то любое рассогласование, меньшее 90 % шага ЦА-преобразователя, дает приращение интеграла меньше шага квантования по уровню. Если точность вычислений
в интегральной части и в ЦА-преобразователе одинакова, выход преобразователя не изменится. Один из способов обойти эту трудность состоит в использовании более высокой точности при вычислениях в интегральной части. Другой заключается в округлении в большую и меньшую стороны результатов всех вычислений, которые меньше уровня выходного сигнала. Часто, чтобы избежать этого эффекта, в интегральной части используют 24-разрядное представление чисел.
Правила настройки
Достоинством дискретных ПИД-регуляторов является то, что их поведение и свойства при малом периоде квантования подобны непрерывным ПИД-регуляторам. Поэтому при преобразовании регулятора к дискретному виду проблем почти не возникает— для его настройки можно использовать те же эвристические правила, что и в непрерывном случае. В 1942 г. была опубликована работа [9], в которой рассматривались два метода
j
/ -Наклон R
/ Рис. 8.9. Способ измерения по единичной
/ переходной характеристике разомкнутой
системы переменных R и L в методе пе-
/ j реходиого режима.
настройки: один из них — метод переходного режима, а другой — метод предельной чувствительности. В обоих случаях предполагалось, что регулятор описывается уравнением (8.15); при этом рекомендовалась структура «вход только на И» (рис. 8.5, в).
Метод переходного режима. В этом методе сначала по единичной переходной характеристике определяют наибольший на-
Табмща 8.1 Параметры регулятора при использовании метода переходного режима
Кд TDD
р 1 RL
PI 0,9 RL 3L
PID 1,2 RL 2L 0,5L
клон R и время задержки L (рис. 8.9), а затем из табл. 8.1 находят параметры ПИД-регулятора.
Метод предельной чувствительности. В этом методе для управления системой используется простой П-регулятор. Измеряются его коэффициент усиления Ктах и промежуток времени, в течение которого замкнутая система находится на границе устойчивости. Параметры регулятора получают из табл. 8.2.
Таблица 8.2. Параметры регулятора при использовании метода предельной чувствительности
i^D ^ID
р 0,5/(max
Тр
Р1 0,45Kmax 1,2
Тр
PID 0,6 Кот ах 2
ТР
♦♦♦ Приведенные методы должны использоваться только для получения первого приближения. Окончательная настройка осуществляется вручную. Кроме того, существует еще несколько методов настройки ПИД-регуляторов. Некоторые из них включают компенсацию длины периода квантования.
Выбор периода квантования
При появлении первых ПЦУ-сйстем ЭВМ были не так мощны, как сегодня. Поэтому во многих контурах управления приходилось выбирать большие периоды квантования. Ниже приводятся рекомендуемые значения периода квантования для наиболее типичных переменных технологического процесса в случае ПЦ-управления.
Тип переменной Период квантования, с
Поток 1 —3
Уровень 5—10
Давление 1—5
Температура 10—20
Коммерческие цифровые регуляторы для небольшого числа контуров имеют малый фиксированный период квантования порядка 200 мс. Это означает, что их можно считать непрерывными и настраивать, как обыкновенный аналоговый регулятор.
Существует несколько правил выбора периода квантования с учетом времени упреждения. Обычно рекомендуется выбирать интервал квантования так, чтобы
~ 0,1 - 0,5.
' DD
В случае метода Циглера — Николса это означает, что А ~ 0,2- 1,0,
или
»» 0,01-0,05.
1 р
Таким образом, небольшое экспериментирование с объектом управления позволяет оценить правильность выбора периода квантования.
Предиктор Смита (разд. 7.4)
Одним из недостатков непрерывного аналога предиктора Смита является то, что он содержит временную задержку. При цифровой реализации, проблем подобного рода не возникает, так как задержка представляется в виде вектора, который сдвигается каждый раз, как только происходит квантование.
Пример 8.5. Предиктор Смита
Процесс с временным запаздыванием (пример А. 4) может быть рассмотрен, например, применительно к машине, производящей бумагу. Предположим, что процесс с передаточной функцией (А. 9) имеет задержку, равную
Рис. 8.10. ПИ-управление процессом, описанным в примере 8.5, без временного запаздывания.
2 единицам времени, и что период квантования равен 1. Тогда система описывается следующей моделью:
у (k + 1) = 0.37z/ (/г) + 0,63u (k — 2)
(пример 3.6). Если бы временное запаздывание отсутствовало, то ПИ-регулятор с усилением 0,4 и временем интегрирования Ti = 0,4 позволил бы получить хорошее качество управления (рис. 8.10). Поскольку, однако, контрольная точка изменена в момент i — 0, а скачок на выходе появляется при t = 20, такой ПИ-регулятор не годится для управления процессом с временным запаздыванием. Хороший ПИ-регулятор должен иметь усиление 0,1 и время интегрирования 0,5. Сравнивая его характеристику (рис. 8.11) с характеристикой, изображенной на рис. 8.10, можно заметить, что его реакция оказывается замедленной из-за меньшего коэффициента усиления.
о
-I
30
20
Рис. 8.11. ПИ-управление (прерывистая линия) и управление с предиктором Смита (сплошная линия) процессом, описанным в примере 8.5 с временным запаздыванием.
40
Если ПИ-регулятор есть Gr, а дискретная модель — Gp, то регулятор можно описать следующей программой на языке Simnon:
Discrete system Smith
"Предиктор Смита для системы "первого порядка с запаздыванием input у ис output и state i ul ym yml ym2 new ni nul nym nyml nym2 time t tsamp ts
e = uc — у + ym2 — ym u = k* (e + e* h/ti + i)
ni = i 4- e * h/ti
nym = am * ym 4- bml * u + bm2* ul nul — u nyml = ym nym2 = yml ts = t + h
h: 1 ti: 0.4 k: 0.4 am: 0.37 bml : 0.63 bm2:0
модель процесса
период квантования ’время интегрирования 'коэффициент усиления
"параметры процесса и
end
♦♦♦ Заметим, что реализация предиктора Смита в цифровом управлении чрезвычайно проста. Рис. 8.11 демонстрирует преимущества характеристики замкнутой системы, полученной на основе предиктора Смита, по сравнению с ПИ-управлением. Видно, что на первом шаге управляющий сигнал предиктора Смита идентичен управляющему сигналу ПИ-регулятора для процесса без временного запаздывания.
8.3. МОДИФИКАЦИЯ СИНТЕЗА ОБРАТНОЙ СВЯЗИ ПО СОСТОЯНИЮ
Этот раздел посвящен построению дискретных аналогов непрерывных регуляторов с обратной связью по состоянию. Регуляторы с обратной связью по состоянию можно рассматривать как общую форму П-регуляторов. В постановке задачи предполагается, что процесс описывается уравнениями
где все состояния считаются наблюдаемыми. Используя управление
u(t) = Muc(f) — Lx(t), (8.17)
можно произвольно разместить полюса замкнутой системы, если система управляема. Управление (8.17) можно реализовать в цифровой форме, квантуя состояния и восстанавливая управляющий сигнал с нулевым порядком приближения. Точно так же управление осуществлялось в примере 1.3. При увеличении периода квантования поведение замкнутой системы ухудшается, однако дело можно поправить, несколько модифицировав регулятор. Пусть дискретный регулятор имеет вид
и (kh) — Мис (kh) — Lx (kh). (8.18)
Один из способов решения этой задачи заключается в построении регулятора (8.18) методами дискретной теории (гл. 9). Здесь же для приведения регулятора (8.18) к дискретному виду используется приближенный метод.
Применение непрерывного регулятора (8.17) для управления системой (8.16) дает замкнутую систему следующего вида:
х — (Д — BL) х + ВМис — Асх + ВМис, у = Сх.
Если uc(t) постоянно в течение периода квантования, то это уравнение можно проинтегрировать. В результате получим
х (kh + h) = Фсх (kh) + Г qMUq (kh), (8.19)
где
Фс = ехр(Лсй), h
Гс = ехр (Лсх> В ds.
о
Если дискретный регулятор (8.18): используется для управления системой (8.18), то
х (kh + А) = (Ф - Г£) х (kh) + ГМис (kh), (8.20)
где Ф и Г — матрицы системы, полученные при квантовании (8.16). Вообще говоря, невозможно выбрать £ так, чтобы
Фс = Ф — Г£.
Однако обе части этого уравнения можно разложить в ряд и приравнять члены с одинаковыми степенями h. Предположим, что
£ = £0 + £1А/2, тогда
Фе « / + (Л - BL) h + [Л2 - BLA - ABL - (BL)2] h2/2 + ...
и
Ф - Г£ ~ / 4- (Л - ВЦ) h + (A2 — ABLq - ABL{) h2 + ....
Полюса систем (8.19) и (8.20) совпадают вплоть до порядка h2 включительно, если
I = L [/ + (Л - BL) А/2]. (8.21)
Без каких-либо изменений матрицы L полюса систем одинаковы до порядка h включительно.
Новая матрица М определяется в предположении, что установившиеся состояния для систем (8.19) и (8.20) равны. Пусть задающее значение постоянно, и установившееся значение состояния есть х°. Тогда
Фсх° = Г сМис и
[/ — (Ф - ГТ)] х° = ГМис.
Разложения в ряд левых частей двух предыдущих уравнений совпадают до членов порядка h? включительно. Поэтому определим М таким образом, чтобы и разложения правых частей совпадали до членов порядка А2. Пусть М имеет вид
М = Мо -J- M'h/2, тогда
. ГСЛ4 ~ BMh 4- (Л - BL) BMh2/2 4- ... и
ГЛ1 « BMQh 4- (ВМ{ 4- ABMJ h2!2+
Рис 8 12. Цифровое управление двойным интегратором с использованием управления (8.23) при h — 0,5.
ус—непрерывная характеристика.
Откуда имеем
M = (I — LBhl2)M. (8.22)
Выражения (8.21) и (8.22) легко вычисляются из уравнений непрерывной системы и непрерывного регулятора.
Пример 8.6
Система, описанная в примере 1.3, представляет собой интегратор второго порядка, т. е. она определяется матрицами
Но 3 Н>] " С“н П
Пусть непрерывный регулятор задан соотношением
« (/) = ис(П — [ 1 1 | х (t).
На рис. 8.12 показано поведение системы при использовании дискретного регулятора
и (kh) = ис (kh) — [1 1 ] х (kh) (8.23)
при h = 0,5. Формулы (8.21) и (8.22) дают следующий результат:
1 = (1—0.5Л 1],
(8.24)
М = 1 — 0,5Л
Рис. 8.13 иллюстрирует поведение системы управления с модифицированным регулятором для h — 0,5. Заметно явное улучшение- качества регулирования по сравнению с немодифипированным регулятором. Однако период
Рис. 8.13. Управление двойным интегратором с помощью преобразованного регулятора (8.24) при h = 0,5.
Ус—непрерывная характеристика.
квантования больше увеличивать нельзя, так как поведение замкнутой системы начнет ухудшаться даже в случае применения модифицированного регулятора.
8.4. МЕТОДЫ ПРОЕКТИРОВАНИЯ
ПО ЧАСТОТНОЙ ХАРАКТЕРИСТИКЕ
До сих пор рассматривались методы построения дискретных аналогов непрерывных регуляторов. Данный раздел посвящен применению классических непрерывных частотных методов для создания дискретных регуляторов.
Частотные методы проектирования, основанные на диаграммах Боде и Николса, полезны при создании компенсаторов для систем, описываемых передаточными функциями. Эффективность их применения зависит от простоты вычерчивания диаграммы Боде и эмпирических правил выбора компенсаторов. Вычерчивание диаграммы Боде—несложная задача, так как передаточные функции, вообще говоря, есть рациональные функции от /о, за исключением чистых временных запаздываний.
Графическое воспроизведение частотных характеристик дискретных систем значительно труднее, потому что импульсная передаточная функция является рациональной от ехр(щ>/г), а не от iw. Это затруднение можно обойти с помощью метода w-npe-
образования, предусматривающего выполнение следующих операций:
1. Квантование непрерывной системы, которая должна управляться с помощью цепи приближения нулевого порядка. Это дает H(z);
2 г__1
2. Введение переменной w — -^ } [ср. с (8.6)]. Преобра-
зование импульсной передаточной функции процесса на o’-плоскость позволяет получить
Н' (w) = Н (z)\ , l+wft/2.
Тогда для z = е&р (zco/i) имеем
2 w = i -fr - tg ((о/г/2) = iv
(ср. с предварительной частотной коррекцией, разд. 8.1). Преобразованная передаточная функция H'(iv)—рациональная функция от iv;
3. Вычерчивание диаграммы Боде функции H'(iv) и применение общепринятых методов проектирования компенсатора Нг (iv), имеющего заданные частотные свойства. При этом необходимо учитывать искажение частотной шкалы при переходе между v и о), например в случае определения частоты среза и полосы пропускания;
4. Преобразование компенсатора обратно на z-плоскость и реализация Hr (z) как дискретной системы.
Преимуществом метода w-преобразования является возможность использования распространенных приемов работы с диаграммой Боде. Единственная трудность заключается в учете искажения частотной шкалы и выборе периода квантования.
ВЫВОДЫ
Различные способы преобразования аналоговых систем управления в цифровые представляют интерес с точки зрения не только установления связей между непрерывными и дискретными системами, но и отыскания управления дискретного аналога непрерывной системы управления. Метод его отыскания оказывается чрезвычайно простым: алгоритм, который необходимо запрограммировать в ЭВМ, описывается импульсной передаточной функцией, получаемой заменой аргумента s непрерывной передаточной функции по формулам (8.4) — (8.6) или (8.8). Аппроксимация Тустена дает достаточно хорошее решение, но не исчерпывает всех возможностей. Цифровые системы, построенные таким способом, всегда (немного) хуже аналоговых, так как им в принципе присуще временное запаздывание, вызываемое цепью восстановления. Это запаздывание приблизительно равно /г/2.
Изложенные методы достаточно эффективны, если период квантования мал. Хорошим ориентиром для выбора периода квантования является тот факт, что дополнительное временное запаздывание уменьшает запас по фазе на <iiChl2 рад или на 180° (Oc/a>s, где <вс — частота среза.
ЗАДАЧИ
8.2. Определите, как левая s-полуплоскость отображается на z-плоскость при преобразованиях (8.4) — (8.6).
8.2. Аппроксимируйте передаточную функцию G(s) = a/(s -|- а) с помощью метода Эйлера, аппроксимации Тустена, аппроксимации Тустена с предварительной коррекцией для g>i = а рад/с. 8.3. Фазоопережающее звено, описываемое уравнением (8.10), дает опережение фазы на 20° на частоте а>с == 1,6 рад/с. Аппроксимируйте его с й = 0,25 по методу Эйлера; обратных разностей; по методу Тустена; по методу Тустена с предварительной коррекцией, используя (01 = (ос в качестве заданной частоты; квантования нулевого порядка.
Определите фазу аппроксимированной цепи при z — exp (t(oc/i). 8.4. Проверьте вычисления, на основании которых выведены эмпирические правила выбора периода квантования в разд. 8.1. 8.5. Покажите, что уравнение (8.14) получено из уравнения (8.12) аппроксимацией интегральной части методом Эйлера, а дифференциальной — методом обратных разностей. Рассмотрите преимущества и недостатки каждого из следующих случаев: интегральная часть аппроксимирована с помощью обратных разностей; дифференциальная часть аппроксимирована методом Эйлера. (Ключ: рассмотрите случай, когда То мало.)
8.6. Непрерывный ПИ-регулятор задан передаточной функцией
*('+v)-
Используя билинейную аппроксимацию для отыскания его дискретного представления, найдите связь между непрерывными параметрами К и Tt и их дискретными аналогами в уравнении (8 15).
8.7. Имеется резервуарная система (задача 3.10). Допустим, что к замкнутой системе предъявляются следующие требования:
• установившаяся ошибка после ступенчатого изменения задающего значения равна нулю;
• частота среза компенсированной системы равна 0,025 рад/с; запас по фазе приблизительно равен 50°.
Постройте ПИ-регулятор так, чтобы эти требования выполнялись. Определите полюса и нули замкнутой системы. Какое затухание соответствует комплексным полюсам? Выберите подходящий интервал квантования и аппроксимируйте непрерывный
регулятор методом Тустена с коррекцией. Используйте частоту среза в качестве частоты коррекции.
Промоделируйте систему с квантованным регулятором. Сравните полученный результат с желаемым, т. е. при использовании непрерывного регулятора.
8.8. Предложите аппроксимацию, аналогичную (8.21) и (8.22) и такую, чтобы преобразование имело силу до члена с h3 включительно.
8.9. Описание нормализованного электродвигателя задано в пространстве состояний уравнением (А.5). Управление
и (Z) — Мис (?) — Lx (/)
при М = 4 и L~ = [2 4] позволяет получить передаточную функцию Uc-+ у вида
4
s2 + 3s + 4 ’ что соответствует £ = 0,75 и ojq = 2.
а. Постройте дискретную реализацию этого регулятора; б. Преобразуйте закон управления с помощью (8.21) и (8.22); в. Промоделируйте регуляторы, полученные в заданиях (а) и (б), для различных периодов квантования и сравните с непрерывным регулятором.
8.10. Дана непрерывная система:
f/=[l 0]х.
а. Постройте непрерывный регулятор с обратной связью по состоянию u(t) = —Lx (Г) так, чтобы характеристический многочлен замкнутой системы был равен s2 + 8s + 32. Затем используйте ЭВМ для реализации регулятора вида u(kh) = = —Lx(kh). б. Преобразуйте регулятор с помощью (8.21). Промоделируйте регуляторы (а) и (б) и подберите подходящие интервалы квантования. (Возьмите х(0) = [1 0]г.)
8.11. Используйте метод w-плоскости для построения компенсатора для электродвигателя из примера 8.2, если h =0.25. Компенсатор должен быть таким, чтобы преобразованная система имела частоту среза, соответствующую 1,4 рад/с, и запас по фазе 50°. Сравните с непрерывной реализацией и дискретной аппроксимацией примера 8.2. Исследуйте, какой длины могут быть периоды квантования, используемые в методе ш-плоскости.
ЛИТЕРАТУРА
Задача синтеза цифровых фильтров, приближенно реализующих непрерывные передаточные функции
1. Rabiner L. R., Gold (1975): Theory and Application of Digital Signal Processing. Englewood Cliffs, N. J.: Prentice-Hall, Inc,
2. Oppenheim A. V., Schafer R. W. (1975). Digital Signal Processing. Englewood Cliffs, N. J.: Prentice-Hall, Inc.
3. Antonicru A. (1979): Digital Filters: Analysis and Design. New York: McGraw-Hill.
Интересный взгляд на сходство и различие между цифровой обработкой сигналов и теорией управления
4. Willsky A. S. (1979): Digital Signal Processing and Control and Estimation Theory. Cambridge, Mass.: MIT Press.' '»
Различные приближения, ориентированные на системы управления
5. F anklin G. F., Powell J. D. (1980): Digital Control of Dynamic Systems. Reading Mass.: Addison-Wesley.
Цифровые ПИД-регуляторы и их функции
6. Bristol Е. Н. (1977): “Design and Programming Control Algorithms for DDC Systems”, Control Engineering, January, 24-26.
7. Shinskey F. G. (1979): Process Control Systems (2nd ed.). New York: McGraw-Hill.
Руководство по настройке ПИД-регулятора
8. Ziegler J. G., Nichols N K. (1942): “Optimum Settings for Automatic Controllers”, Trans. ASME, 64, 759-68.
Правила Циглера и Николса, учитывающие интервал квантования
9. Takahashi Y., Chan С. S., Auslander D. М. (1971): “Parameterinstellung bei linearen DDC-Algorithmen”, Regelungstechnik and Prozess-Datenverarbei-tung, 19. 237-44.
Предиктор Смита был впервые описан в работе:
10. Smith О. J. М. (1957): “Closer Control of Loops with Deadtime’, Chem. Eng. Progr., 53, 217-19.
Перепроектирование обратной связи no состоянию
11. Kuo В. С. (1980): Digital Control Systems. Tokyo: Holt-Saunders.
Проектирование.
Методы пространства состояний
Построение методов проектирования, основанных на представлениях пространства состояний
ВВЕДЕНИЕ
В данной главе описываются методы проектирования, основанные на внутренних моделях систем. Придерживаясь понятий, введенных в гл. 7, можно сказать, что эти методы относятся к решению специфических, идеализированных задач управления. Тем не менее они позволяют глубже понять сущность задач оптимального управления. При использовании излагаемых здесь методов неизбежен определенный субъективизм. Формально он находит отражение в так называемых параметрах, значения которых выбирает проектировщик, исходя из своих собственных соображений.
9.1. УПРАВЛЕНИЕ, ОСНОВАННОЕ НА РАЗМЕЩЕНИИ ПОЛЮСОВ ПУТЕМ ВВЕДЕНИЯ ОБРАТНОЙ СВЯЗИ ПО СОСТОЯНИЮ
На примере простой задачи регулирования продемонстрируем возможности одного из фундаментальных методов проектирования систем управления — метода размещения полюсов. Его можно рассматривать как обобщение классического метода корневого годографа. Этот метод позволяет построить такую обратную связь, при которой полюса замкнутой системы принимают заданные значения. Задача решается при довольно сильном допущении о том, что все переменные состояния могут быть непосредственно измерены.
Постановка задачи
Для точной постановки задачи проектирования необходимо описать регулируемый процесс, возмущения, критерий качества и допустимые управляющие сигналы.
Процесс. Предположим, что регулируемый процесс описывается следующей моделью:
Ах + Ви, (9.1)
di
где и — вектор управлений, х— вектор переменных состояния, а А и В — постоянные матрицы. Здесь, однако, рассматривается скалярная система с одним входом и одним выходом. Поскольку речь идет о цифровом управлении, управляющий сигнал предполагается постоянным на интервалах квантования постоянной длины. Квантование системы (9.1) приводит к системе с дискретным временем: ' -»
х(/гЛ-|-Л) = Фх(/гЛ) + Vu(kh), (9.2)
где матрицы Ф и Г определяются выражениями
ф == eAh,
Г = ( ( eAs ds IВ
(см. разд. 3.1).
Возмущения. Предполагается, что возмущения представляют собой импульсы, поступающие в нерегулярные моменты времени. Однако промежутки между этими моментами настолько велики, что система успевает отработать одно возмущение до поступления следующего. Поскольку действие подобного возмущения сводится лишь к изменению состояния системы, возмущение можно трактовать как результат изменения начального состояния системы.
Критерий качества. Данная задача представляет собой задачу регулирования, целью которой является приведение системы в начало после возмущения начального состояния. В методе размещения полюсов скорость изменения переменных состояния задается неявно путем фиксации полюсов замкнутой системы.
Допустимые управляющие сигналы (управления). Поскольку целью является отыскание закона оптимального управления, необходимо уточнить информацию, которой можно пользоваться для построения управления. Так как свойства системы определяются расположением полюсов замкнутой системы, эта система должна быть линейной, как и обратная связь. По предположению все переменные состояния могут быть измерены непосредственно, поэтому допустимые управления можно записать в виде линейного закона обратной связи:
и (kh) — — Lx (kh). (9.3)
Параметры. В формальной постановке задачи проектными параметрами являются период квантования и желаемое расположение полюсов. Редко бывает так, чтобы тот, для кого предназначена система управления, смог выразить свои пожелания, оперируя этими параметрами. Поэтому конструктор системы управления должен уметь «привязать» эти параметры к пока
зателям, которые более понятны заказчику. Для этого часто бывает полезно проанализировать предысторию переменных состояния и управления. Особенно полезно проанализировать связь между величиной управляющих сигналов и скоростью отработки возмущений (разд. 7.5).
Для пояснения метода проектирования и иллюстрации влияния проектных параметров рассмотрим сначала частный случай.
Пример 9.1. Размещение полюсов интегратора второго порядка
Дискретное описание объекта имеет вид
[1 h 1 Г h2f2 1
I х (kh) + I I и (kh).
О 1 J L h J
(9.4)
В общей форме линейный закон управления в виде обратной связи по состоянию может быть записан как
И — — ^iXi — ^2^-2*
(9.5)
Подставляя это уравнение в (9.4), получаем следующее описание замкнутой системы: •
Г1 —/,йг/2 h — l2h2/21
Х(йй + й)= ’ ' ' \x(kh).
L — lth 1 — l2h J
Характеристическое уравнение замкнутой системы имеет вид
^+(^- + l2h-2^Z+(^--l2h+l')=0.
Предположим, что искомое характеристическое уравнение имеет внд
г2 + piz -|- р2 = 0.
(9.7)
Приравнивая коэффициенты при одинаковых степенях h, получаем следующую систему уравнений относительно It и /г:
1 h2
±£- + l2h-2 = pt,
Ith2
2
l2h + 1 = р2.
Решением этой системы будет
h — (1 + Pi + Рг).
^2= (3 + Pi — Рг).
(9.8)
Общий случай
Перейдем теперь к решению задачи размещения полюсов в общем случае систем с одним входом.
Пусть система описывается уравнением (9.2), где и — скаляр. Предположим, что квантованная система достижима. Тогда си
стему (9.2) можно привести ляемой форме:
f
к следующей канонической управ^
где z" + Giz"-1 + ... 4-ап — характеристический многочлен матрицы Ф. Когда уравнения системы записаны в таком виде, задачу размещения полюсов решить легко. Предположим, что нашей целью является построение замкнутой системы с характеристическим многочленом
Р(г) = гп + р^~' + ... +рп. (9.10)
Из (9.9) вытекает, что оптимальное управление
и — — Lz, (9.11)
где
L = [pj —ah р2~а2....... Рп~ап], (9.12)
дает замкнутую систему с заданным характеристическим многочленом. Оптимальное управление можно записать как
и = — Lx = — LTx = — Lx,
где Т—матрица преобразования х в z. Остается построить эту матрицу. Пусть Wc и — матрицы управляемости из (9.2) и (9.9). Эти матрицы связаны соотношением
Далее
WC = TWC.
1 G, •
0 1 • • а„_2
\V-' = •
•
• а
о 0 - •. 1
(9.13)
(ср. с разд. 5.3 и примером 5.6). Матрицу преобразования Т можно представить в виде
T = WcWcl. (9.14)
Используя (9.10), получаем матричный многочлен
Р(ф)==ф^ + Р1ф^-‘+ ... +Рп1 =
= (Pi — Gi) Ф"'1 + • • • + (Рп — ап) I,
где Ф — матрица преобразованной системы (9.9). Второе уравнение получено с помощью теоремы Гамильтона — Кэли. Последняя строка матрицы Ф* равна нулю, за исключением (и— /г)-го столбца, в котором стоит 1. Поэтому из (9.12) получаем
£ = [0 ... О 1]Р(Ф).
Однако
ф = Т'ФТ-1, поэтому
£ = £7’ = [0 ... О 1] Р (ТФТ~1) Т = [0 ... О 1]7’Р(Ф).
Матрица Т определяется из (9.14). Более того, из (9.13) следует, что
[О ... О 1]№с = [0 ... О 1], поэтому справедлива формула
L = LWcWc' = [0 ... О 1]ГС-1Р(Ф), (9.15)
которую иногда называют формулой Акермана. Сформулируем этот результат в виде теоремы.
Теорема 9.1. Рассмотрим систему с одним входом, описываемую уравнением (9.2). Задача синтеза оптимального управления с заданным расположением полюсов, удовлетворяющих уравнению P(z) = 0, имеет решение тогда и только тогда, когда квантованная система достижима. Оптимальное управление в этом случае определяется выражением
и (kh) = — Lx (kh), где
L=LWcWc' = [0 ... О 1]ГГ'Р(Ф),
L определяется выражением (9.12), a Wc и Wc— матрицы управляемости систем (9.2) и (9.9) соответственно.
Замечание 1. Задачу размещения полюсов можно сформулировать в виде следующей абстрактной задачи. Пусть даны матрицы Ф и Г. Требуется найти матрицу L, такую что матрица Ф — Г£ имеет заданные собственные значения.
Замечание 2. Из (9.13), (9.14) и определения Wc вытекает, что
Г-' = [Г ФГ + ^Г ... ФП-1Г + щф^г + ... +а„_,г].
Пример 9.2
Рассмотрим объект управления, представленный в примере 9.1. Пусть требуемый характеристический многочлен задается выражением (9.7). Тогда
Г h2/2 ЗЛг/2 1
Wc = [Г фГ] = '
1 Л h J
и характеристический многочлен матрицы Ф имеет вид
, г2 —2z+l-
Таким образом,
1 = r-l/^ 1.5/ЛТ
с L 1/Л2 —0.5/Л _Г Далее
Р(Ф)_Ф-+р,Ф+р,/-Г1+'’>^ 1.
L 0 1 + Pi + р2 J
Тогда, принимая во внимание (9.15), имеем
4 = [0 1] W-' Р (Ф) = [ 1/Л2 —0,5/А] Р (Ф) =
[1 + Pl + Р2 3 + Pl — Р2~] h2 2h J’ что совпадает с выражением, полученным непосредственными вычислениями [пример 9.1; ср. (9.8)].
Практические аспекты
Задача синтеза системы управления с заданным расположением полюсов легко решается аналитически.
♦♦♦ Заметим, что необходимым и достаточным условием существования решения этой задачи является достижимость.
Для применения метода синтеза на практике необходимо хорошо понимать, какое влияние на свойства замкнутой системы оказывают проектные параметры — полюса замкнутой системы и период квантования.
Пример 9.3
Рассмотрим еще раз интегратор второго порядка. Вместо параметров р\ и р2 в (9 7) введем два других параметра, имеющие более ясный физический смысл. Если дискретная система получена квантованием системы второго порядка, го ______
Pi — —2е~^и/1 cos (сой дЛ — С2),
p2 = e~^h,
где со — собственная частота, а £ — относительный коэффициент затухания (пример 3.13). Параметр £ влияет на относительное затухание реакции, а со характеризует ее скорость.
Чтобы проанализировать величину управляющего сигнала, предположим, что начальное положение и начальная скорость системы есть Хц и соответственно. В этом случае начальное значение управления будет равно.
и (0) = — Цхо — l2v0.
Если период квантования мал, то выражения для pi и р2 можно разложить в ряд. Тогда из (9.3) и (9.8) получаем
и (0) ~ — со2х0 4- 2£соа0-
Это выражение ясно показывает, что величина управляющего сигнала растет с частотой со. Следовательно, чтобы скорость реакции системы возросла, необходимо увеличить управляющий сигнал. Если границы управления и типичные возмущения известны, то можно оценить разумную величину со. Последствия выбора различных значений со для хо = 1 и = 0 показаны на рис. 9.1.
2.
Рис. 9.1. Реакция замкнутой системы, описанной в примере 9.3, при различных значениях /о.
(oh=0,44 и £=0,7С7.
Если значения £ и <о фиксированы, то период квантования все еще требуется определить.
От величины периода квантования зависит, насколько быстро будет обнаружено присутствие возмущений. Он также влияет на вид функции реакции системы. В разд. 3.6 обсуждался выбор периода квантования для разомкнутых систем. Те же самые рассуждения можно использовать и в данном случае. Период квантования можно выбирать таким, чтобы
Nr я» 2 - 4,
где Nr — число дискрет за время разгона замкнутой системы. Это означает, что выбор периода квантования должен быть связан с желаемым поведением
Рис. 9.2. Реакция системы, описанной в примере 9.3, при <о = 1 и £ = 0,707 для различных периодов квантования.
замкнутой системы. Кроме того, величина этого периода должна быть связана с частотой апериодических колебаний замкнутой системы. Удобно ввести следующий безразмерный параметр Л':
2л
w/г V1 —
(9.16)
характеризующий отношение периода апериодических колебаний и периода квантования. Последствия выбора различных значений /V в данном конкретном случае показаны на рис. 9.2. Видно, что при /V > 10 различия функций реакции очень малы, а для /V > 50 они практически неразличимы
Вполне разумное эмпирическое правило дает /V порядка 20. При этом <ой « 0,44 при t, = 0,707. Значение N = 2 4- 4 соответствует N т 10 -=-20 для t = 0,707.
Апериодическое управление
Если в задаче синтеза все полюса замкнутой системы должны лежать в начале координат, то ее характеристическое уравнение
Таблица 9.1. Управляющие сигналы при апериодическом управлении объектом второго порядка для х (0) = (1,1) и различных периодов квантования
h 100 10 1 0.1 0,01
«(0) —0,0151 —0,16 -2,5 -115 — 10150
«(Л) 0,0051 0,06 1,5 105 10050
принимает вид: zn = 0. Тогда из теоремы Гамильтона — Кэли следует, что матрица Фс = Ф — ГЛ замкнутой системы удовлетворяет уравнению Ф" = 0. Такая стратегия приводит все состояния в нуль не более чем за п шагов квантования после импульсного возмущения состояния и называется апериодическим управлением {демпфированием).
При апериодическом управлении имеется только один параметр — период квантования. Поскольку ошибка сходится к нулю не более чем за п шагов, время восстановления не превышает nh.
Вместе с тем величина периода квантования существенно влияет на величину управляющего сигнала: с уменьшением периода квантования величина сигнала резко возрастает. Это свойство апериодического управления и является причиной его незаслуженно плохой «репутации». По этой причине при использовании апериодического управления к выбору периода квантования следует относиться особенно внимательно.
Возможность апериодического управления является отличительной особенностью дискретных систем, поскольку аналога для непрерывных систем не существует. Свойства апериодического управления иллюстрируются следующим примером:
Рис. 9.3. Моделирование апериодического управления объектом второго порядка.
Начальное условие: х (0)={1, 1].
Пример 9.4. Апериодическое управление системой второго порядка
Рассмотрим объект управления второго порядка. Из (9.8) вытекас-, что апериодическое управление определяется формулой (9.5), где
1
Л2 ’
/. =
3
2Л ‘
Если начальное состояние процесса х(0) = [хо, оо], то и (0) = - - 3^
W Л2 2Л ’
— Л2 + 2Л ’
Значения управляющих сигналов для х0 = 1 и см = 1 приведены в табл. 9.1, а графическое изображение управления и выходного сигнала дано на рис. 9.3.
Возмущения более общего вида
Обобщение задачи размещения полюсов может быть выполнено различными способами. На практике важно уметь отрабатывать возмущения более общего вида, чем последовательность случайных импульсов. Один из возможных способов решения подобных задач описан в гл. 6, где возмущение трактуется как импульс, прошедший через линейную систему.
Предположим, например, что система описывается следую щим уравнением:
// V
-ТТ- = Ах -|- Ви + V, at ’
где v — возмущение, удовлетворяющее системе уравнений
в
dt
V = cvl
с заданными начальными условиями. Предположим, кроме того, что величина § может быть измерена. Вводя расширенный вектор состояния
систему можно описать уравнением
л L । J_ L о a J L Н + L о J “
19.17)
Таким образом, задача сводится к виду, в котором записывается основная задача размещения полюсов. Отметим, однако, одно существенное отличие: система (9.17) не вполне достижима. Расположение полюсов, отвечающих введенному возмущению (т. е. определяемых собственными значениями матрицы Ас), не зависит от выбора обратной связи и это вполне естественно.
При квантовании системы получается следующая система разностных уравнений:
Г х (kh + h) | ГФ Фх„ I Г х (kh) I Г Г 1
+ = l О Ф„ _11ё(/г/г) ] + [ о J W(&Л)-
В общем виде синтез оптимального управления имеет вид u(kh) — — Lx (kh) — Lv£, (kh). (9.18)
Поэтому замкнутая система описывается уравнениями х (kh + h) — [Ф — ГЛ] х (kh) + [Фхи — ГЛ„] g (kh), %(kh + h)==®vt,(kh).
Если пара (Ф, Г) достижима, то матрицу L можно выбрать такой, что матрица Ф- ГЛ будет иметь заданные собственные значения. Тем не менее матрица Фи не зависит от выбора обратной связи. Для уменьшения влияния возмущений целесообразно выбирать матрицу Ли так, чтобы норма матрицы Фли — ГЛИ была малой и влияние члена, описывающего возмущение, было незначительным.
♦♦♦ Заметим, что управление (9.18) можно интерпретировать как комбинацию членов, описывающих обратную связь по состоянию Lx и возмущение Ясно поэтому, что для построения решения и х и g должны быть непосредственно измеряемы.
Вычислительные аспекты
Для простых систем невысокого порядка часто проще всего найти обратную связь по состоянию, как это сделано в примере 9.1. Общая схема решения состоит во введении общей линейной формулы для синтеза управления с неизвестными коэффициентами, построении характеристического уравнения и приравнивании коэффициентов этого уравнения и желаемого характеристического уравнения. В результате получается система линейных уравнений относительно неизвестных коэффициентов, входящих в закон управления. Такая система всегда имеет решение, если система достижима.
Для синтеза оптимального управления можно воспользоваться и общей формулой (9.15), которую легко запрограммировать. ♦♦♦ Заметим, что эта формула не очень хороша, если требуется высокая точность вычислений. Как правило, не следует пользоваться численными алгоритмами, включающими вычисление степеней матриц 1). В частности, для вычисления матрицы L существуют другие способы, более подходящие для численных расчетов.
9.2. НАБЛЮДАТЕЛИ
Предположение о том, что все состояния системы и все возмущения могут быть непосредственно измерены, часто оказывается нереальным. Если имеется математическая модель системы, то можно попытаться вычислить состояние системы по наблюдаемым входам и выходам. Такой подход может быть реализован существенно различными способами.
Пусть система описывается следующей дискретной моделью:
( х (k 4- 1) = Фх (k) + Г и (k),
I y(k) = Cx(k). (9Л9)
Рассмотрим задачу определения x(k) по последовательностям входов и выходов y(k), y(k—1), ..., u(k), u(k—1).......
Для того чтобы это можно было сделать, система должна быть полностью наблюдаемой (ср. с разд. 5.3). Существует много способов определения состояния и его прогнозирования. Ниже рассматриваются возможные подходы, основанные на непосред-
11 При возведении матрицы в степень число обусловленности также возводится в ту же степень. В результате задача становится плохо обусловленной, а соответствующий метод численно неустойчивым. — Прим. ред.
ственных вычислениях с помощью динамических моделей и наблюдателях Люенбергера. Выбор оптимального метода для конкретной системы зависит от природы возмущений и шума при измерениях.
Если модели этих двух факторов известны, то можно построить оптимальные наблюдатели и пр'ёдикторы (гл. 11).
Непосредственное вычисление переменных состояния
Начнем с непосредственного вычисления вектора состояния по данным входам и выходам. В общем случае скалярного выхода из (9.19) вытекает, что
y(k — п+ l) = Cx(k — n+ 1),
у (k - п + 2) = СФх (k — и + 1) + CVu (k — п + 1).
у(1г) — СФп~1х(1г — п-\- 1) + СФп~’Фи(1г - п + 1) + ...
... -|- СГи (k — 1).
Эти уравнения можно записать в виде
’у(к - п + 1)
у(к — п + 2)
и(к — п + 1)' и(к - п + 2)
= Wox(k — п + 1) + П
Я*)
х* - О
где IV'o—матрица наблюдаемости
СФ
/9.20)
СФи-,_
и
„(ЭД гГ СФ^Т • • CfJ
Если система (9.19) наблюдаема, то вектор состояния x(k — n-J-4- 1) можно найти из уравнения
у(к—'П-\- 1) и(к — п 4- 1)~
у(к — п + 2) и(к — п 4- 2)
х(к - п 4- 1) = WV • - •
_У(к) Лк - О _
Последовательно применяя (9.19), получаем
х(Л) = ф-ЧЕ0-» ~у(к — л 4- 1) у(к — и 4- 2) 4-'Р ~и(к — п 4- 1)~ и(к — п 4- 2) (9.21)
• Лк) и(к - 1)
где
=[ф"-2г фп-3г ... г] - ф^-’Го-’п.
Таким образом, вектор состояния определяется как линейная комбинация y(k), y(k—1), ...,y{k — и4~1) и u(k—1), u(k — 2), ..., u{k — и 4-1). Уравнение (9.21) можно записать в виде
х (k) = F (?->) у (k) 4- G (q~l) и (k - 1), (9.22)
где F и G — векторные многочлены степени п—1 и п — 2 соответственно.
Уравнения (9.21) и (9.22) показывают, что после воздействия возмущения точная оценка состояния может быть получена не более чем за п шагов. По этой причине формулу (9.22) можно назвать апериодическим наблюдателем. Этот результат можно сформулировать в виде следующей теоремы:
Теорема 9.2. Рассмотрим систему (9.19). Если она полностью наблюдаема, то вектор состояния определяется по формуле (9.21).
Пример 9.5. Интегратор второго порядка
Для интегратора второго порядка можно записать
Матрица наблюдаемости определяется как
Г1 °1 1_ 1 Г h 01 Г I 0 1
0 L1 h\ И ° h L -1 1 J L -1/Л 1/Л J
Таким образом, из уравнения (9.21) вытекает, что
Г ° x(AA) = L-i/a
Hy(kh-h)l Г О Я
1 + 1 I и (kh — h)~
У (kh.) J L/z/2j
= | * 14/ (kh) — Г ° 1 у (kh — h) + Г ° 1 и (kh — h).
L l/h J L l/h J L h/2 J
Первая компонента вектора состояния x(kh) равна y(kh), а вторая определяется по формуле
х2 {kh) = V(kh)-y^(kh-h) + h_.u(kh_ Л).
Как и ожидалось, х2-+у при Однако в этом случае непосредственные вычисления оказываются значительно проще, чем расчеты по общей формуле.
Восстановление с помощью динамической системы
Непосредственное вычисление вектора состояния дает то преимущество, что состояние определяется не более чем за п шагов. Этот метод, однако, может быть очень чувствительным к возмущениям, поэтому желательно иметь какой-либо альтернативный подход.
Рассмотрим систему (9.19) и предположим, что вектор х можно аппроксимировать состоянием х следующей модели:
;?(&+1) = Фх(/г) +Ги(/г), (9.23)
которая имеет тот же вход, что и система (9.19). Если модель (9.23) является идеальной аппроксимацией системы (9.19) в том смысле, что их параметры и начальные состояния идентичны, то состояния х и х также совпадают. Если же начальные условия для систем (9.19) и (9.23) различны, то х сходится к х только, если система (9.19) асимптотически устойчива.
Отметим, что при восстановлении (9.23) не используется измеряемый выход. Качество восстановления можно улучшить, если ввести в модель разность измеренного выхода и его оценки, У — Сх, в виде обратной связи:
Л(& + 1 |/г) = Ф£(/г|/г—1) + Ги(/г) +
+ K[y(k)-C£(k\k- 1)]. (9.24)
Здесь через К обозначена некоторая матрица, элементы которой должны подбираться соответствующим образом. Обозначение х(& + 1|/г) показывает, что эта величина является оценкой (или прогнозом) величины х(/г-]-1), основанной на значениях, измеренных в момент k. Введем ошибку восстановления:
х = х — х. (9.25)
Вычитая (9.24) из (9.19), получаем
х(/Н- 1 |^) = Фх (Хг |Лг — 1) — K[y{k)-Cx{k\k- 1)] =
„ = [Ф - /СС] х (k | k - 1). (9.26)
Ясно, что если К выбрана так, что (9.26) асимптотически устойчива, то ошибка восстановления будет стремиться к нулю. Таким образом, вводя обратную связь в модель восстановления, можно нивелировать ошибку, даже если система (9.19) неустойчива. Система (9.24) называется наблюдателем системы (9.19), поскольку она восстанавливает состояние управляемой системы на основании измерений ее входов и выходов.
Изложенный метод допускает различные вариации. Модель (9.24) включает запаздывание, поскольку х(/г|/г—1) зависит только от измерений, сделанных до момента времени k—1. Чтобы избавиться от запаздывания, можно воспользоваться следующей моделью:
£(А:|&) = Ф£(/г- 1 |6-1) + Ги(6-1) +
+ К \У (k) - С {Ф£ (k - 1 | k - 1) + Ги (k - !)}] =
= [/ - КС] [Фх (k - 11 k - 1) + Ги (k - 1)] 4- Ку (k). (9.27)
Ошибка восстановления для этой модели равна
x(k\k) = x(k)-£(k |/г) = (Ф-КСФ)х(/г- 1 \k— 1).
Это уравнение аналогично (9.26), и из определения матрицы наблюдаемости Wo вытекает, что пара (Ф, СФ) наблюдаема, если наблюдаема пара (Ф, С), откуда следует, что соответствующим выбором матрицы К можно получить произвольные собственные значения матрицы Ф — КСФ. Далее
^(fe) —С£(Ш) = Сх(/г|/г) = (СФ —СКСФ)х(/г— 1 |/г — 1) = = (/ -СК)СФх(к — 1|/г - 1).
Если система имеет р выходов, то матрица I—СК имеет размер рХр- Матрицу К можно выбрать так, что СК — I, если rank(C) = р, откуда вытекает, что Cx(k\k) — y(k), т. е. выходы системы восстанавливаются точно. Поэтому из (9.27) можно исключить р уравнений и тем самым понизить порядок системы. Модели пониженного порядка подобного типа иногда называют наблюдателями Люенбергера.
Условие существования подходящей матрицы К
Теперь остается найти подходящий способ выбора матрицы К так, чтобы система (9.26) была устойчивой, т. е. требуется решить следующую задачу: для заданных матриц Ф и С найти матрицу К, такую что матрица Ф — КС имеет заданные собственные значения. Поскольку собственные значения матрицы и ее транспонированной совпадают, то эта задача эквивалентна задаче отыскания матрицы Кт, такой что матрица Фг—СТКТ имеет заданные собственные значения. Эта задача, однако, уже была решена в разд. 9.1, где рассматривалась задача размещения полюсов. Используя полученные здесь результаты, найдем, что наша задача разрешима, если матрица
wT0=[cT Фтст ... (Фп~1Уст]
имеет полный ранг. Отметим, что IV7 о является транспонированной матрицей наблюдаемости для системы (9.19). Этот результат можно сформулировать в виде следующей теоремы.
Теорема 9.3. Если система (9.19) полностью наблюдаема, то можно найти матрицу К, такую что наблюдатель (9.24) имеет характеристический многочлен (9.10).
Построение матрицы К
Задача отыскания подходящей матрицы К для модели (9.24) в математическом плане эквивалентна определению матрицы обратной связи L в задаче размещения полюсов. Выбор нужного расположения полюсов — это поиск разумного компромиссного решения с учетом двух противоположных целей: огрубления чувствительности к ошибкам измерения и сокращения времени отработки начальных ошибок.
Обычно построение матрицы К сводится к выбору рационального размещения полюсов и построению матрицы К, приводящей к выбранному размещению. В простых задачах легче всего ввести некоторую неизвестную матрицу К и записать условие равенства собственных значений матрицы Ф — КС заданным величинам в виде системы уравнений относительно ее элементов.
Ранее было показано, что выбор К тесно связан с выбором матрицы L в задаче размещения полюсов. Матрицу К можно найти, воспользовавшись теоремой 9.1 и изменив обозначения следующим образом:
L->KT, WC-*WTQ, Ф^ФТ.
Из (9.15) следует, что К определяется выражением
Кг = [о ... о 1](и^)-1Р(ф),
или
/< = Р(ф)Ц7о“,[О ... О if. (9.28)
Тогда характеристический многочлен матрицы Ф — КС есть P(z), определяемый формулой (9.10). Из двойственности задач вытекает также, что К определяется особенно просто, когда система записана в наблюдаемой форме.
Пример 9.6. Наблюдатель полного порядка для интегратора второго порядка Рассмотрим интегратор второго порядка, для которого матрица Ф — КС имеет вид
Г 1 Л1 Г "I Г 1 — *1 Л 1
Фо = Ф - КС = - ’ [1 0] = ‘ .
4 L о 1 J l fts J L — /зд i J
Характеристическое уравнение, таким образом, есть
z2 — (2 — kt) z -|- 1 — k, + k2h = 0.
Если уравнение г2 + ptz 4- р2 = 0 есть характеристическое уравнение системы (9.24), то справедливы уравнения
2 — k} = — р1,
1 — kt -р k2h = р2,
решение которых имеет вид
k\ = 2 + pt,
Лг = (1 + Pi + Рг)/Л-
Пример 9.7. Наблюдатель пониженного порядка для интегратора второго порядка
Модель (9.27) для интегратора второго порядка дает систему уравнений:
Г1 — kt ft(l—ft,)T
*(ft|ft) = . , 'k(ft-l|ft-l) +
L — k2 1 — hk2 J
Г (1 - kt) h*/2 1 p'l гм
+ ... .. /OM u(k — 0 + I у (ft).
L h (1 — ftft2/2) J L k2 J
Если I — СК = 0, т. е. если kt = 1, то первое уравнение сводится к jti(ft|ft) = у (ft). Таким образом, модель определяется вторым уравнением, имеющим вид
Х2 (k | k) = (1 — hk2) Sc2 (k — 1 I k — 1) +
+ k2ly(k)-y (k- 1)] +ft (1 — ftft2/2) u (ft — 1)
Выбирая ftz, можно получить произвольное собственное значение. Если, например, выбрать ft2 = 1/ft (т. е. апериодическая реакция), то получим тот же самый результат, что и в случае непосредственного вычисления (пример 9.5).
9.3. ОБРАТНАЯ СВЯЗЬ ПО ВЫХОДУ
Решение задачи размещения полюсов для системы управления с двумя контурами обратной связи (рис. 9.4) можно получить, объединяя результаты, полученные в разд. 9.2 и 9.3. В резуль-
тате получим следующую систему уравнений: х (k -f- 1) — Фх (k) + Ги (/г), У (k) = Сх (k).
(9.29)
Здесь требуется синтезировать линейный,.закон управления, связывающий и и у таким образом, чтобы замкнутая система обладала заданными полюсами. Предполагается, что возмущения
Рис. 9.4. Блок-схема регулятора, включающего обратную связь, и наблюдатель.
носят импульсный характер, или, что эквивалентно, являются некоторыми неизвестными начальными состояниями.
Допустимое управление таково, что и(k) является функцией y(k—I), y(k — 2), .... u(k—1), и (k — 2), ... . Если все переменные состояния измеряемы, то, как показано в разд. 9.1, управление u(k) — —Lx(k) дает заданное расположение полюсов. Если состояние не может быть измерено, то интуитивно кажется разумным искать управление в виде
и(/г) = — L£(k\k — 1), (9.30)
где оценка х получается из модели
х(/г+ 1 \k) = <$£(k\k— 1)4- Vu(k) + K[y(k) — Cx(k\k — 1)]. (9.31)
Таким образом, получаем динамическую систему, причем динамика обусловлена динамической природой модели (9.31). Блок-схема системы управления показана на рис. 9.4.
Динамическую систему (9.30) — (9.31) можно описать импульсной передаточной функцией у-+и п-го порядка:
Gr (z) = -- L [zl - Ф 4- ГЕ 4- КСГ1 /(.
Анализ замкнутой системы
Чтобы показать, что построенная таким образом замкнутая система обладает нужными свойствами, введем ошибку х — х — х. Используя (9.29) — (9.31), замкнутую систему можно представить в виде
f х(Е4- 1) = [Ф-Г{,]х(Е)4-ГЕх(£|£-1),
{ х(/гф- 1 |/г) = [Ф-КС]х(/г|/г— 1), (9,32)
Рис. 9.5. Управление объектом второго порядка по оценкам состояния. а—наблюдатель второго порядка; б — наблюдатель пониженного порядка.
и порядок ее будет равен 2п. Собственные значения такой системы есть объединение собственных значений матриц Ф — ГД и Ф — КС.
Отметим, что собственные значения этих матриц есть полюса замкнутой системы, полученные в разд. 9.1, и полюса модели, полученные в разд. 9.2, соответственно.
Пример 9.8. Обратная связь по выходу в интеграторе второго порядка
Рассмотрим интегратор второго порядка. Пусть матрица (здесь вектор) обратной связи L определяется, как в примерах 9.2 и 9.3 с собственной частотой замкнутой системы to = 1, коэффициентом затухания £ = 0,7 и h = = 0,44. Тогда L = [0,73; 1,21]. Предположим, что модель такая же, как в примере 9.6 с полюсами в точке г = 0,75.
Действительное состояние н его оценка, используемая в законе управления, показаны на рис. 9.5, а. На рнс. 9.5, б показан тот же случай, но с использованием редуцированной модели нз примера 9.7. Здесь также полюс есть в z = 0,75.
Обобщения
Рассматриваемую задачу можно обобщить на случай возмущений более общего вида, вводя соответствующие модели возмущений, действующих на процесс, и ошибок измерения. Тогда модель системы можно записать в виде (ср. с разд. 9.1)
х (/г + 1) = фх (k) + ФХД (k) + Г и (/г),
^+1) = Ф^)>
п(/г+1) = Ф№д(/г), Г ’
у (/г) = Сх (/г) + CJj (k).
В этом случае управление определяется формулой
и (k) = - Lx (k) - Lvt (k) - Lwri (k), (9.34)
где
~х(к + 1) fa + 1)
+ 1)_
ф ф 0 х(кУ 'Г' К '
0 ф 0 fa) + 0 К. е(к)
о 0 ф * Л(Л). о К„.
(9.35)
e(/c) = y(k) - Cx(k) - Cjj(k)
♦♦♦ 3 аметим, что (9.34) представляет собой типичный при-
мер комбинации обратной и прямой связи.
9.4. СЕРВОРЕГУЛИРОВАНИЕ
До сих пор мы рассматривали задачу регулирования, где целью управления была отработка импульсных возмущений и приведение фазовых координат системы в начало координат. Не менее важной задачей является задача серворегулирования. В этом случае цель управления состоит в отслеживании заданной траектории по выходным переменным и состоянию.
Рассмотрим следующую задачу: как добиться того, чтобы система отслеживала командные сигналы, и при этом решалась задача регулирования. Решение поставленной задачи строится следующим образом. Сначала методом размещения полюсов решается задача регулирования, а затем путем введения нулей в характеристическое уравнение замкнутой системы синтезируется решение задачи серворегулирования.
Интерпретация полюсов и нулей
Прежде чем начать обсуждение командных сигналов, дадим физическую интерпретацию полюсов и нулей управляемой системы. Полюса, или собственные значения характеристического уравнения линейной системы, отражают характер внутренних связей в системе. Они показывают, как система ведет себя без связи с внешним миром. Нули же показывают характер связей системы с ее окружением.
По существу, введение в систему командных сигналов означает установление ее связей с окружающим миром. Очевидно, что при этом происходят какие-то действия с нулями передаточной функции. Для качественного анализа влияния способа введения командных сигналов на распределение нулей рассмотрим диаграмму для системы с одним входом и одним выходом (рис. 9.6). Коэффициенты характеристического многочлена, определяющие расположение полюсов системы, обозначены через ai, а коэффициенты многочлена, определяющего расположение нулей, — через bi.
Из рис. 9.6,6 следует, что расположение полюсов можно изменить, введя обратную связь. Аналогично из рис. 9.6, а следует, что введением «прямой связи» по всем переменным состояния можно воздействовать на расположение нулей системы.
Вообще говоря, изменить структуру прямых связей по фазовым переменным довольно сложно, так как фактически на процесс можно воздействовать только через управляющие переменные. Для непосредственного воздействия на все переменные состояния необходимо иметь полный набор исполнительных механизмов. Вместе с тем на фазовые переменные, связанные с компенсатором, можно воздействовать непосредственно и изменять тем самым расположение некоторых нулей.
Структура регулятора
Задачу серворегулирования естественно формулировать в терминах некоторой модели, описывающей идеализированную реакцию системы на командные сигналы. Пусть квантованная модель описывается следующей системой n-го порядка:
Хт (k + 1) = Фтхт (k) + Гтис (k),
Ут (k) = Стхт (k). (9.36)
Эту систему естественно представить блок-схемой, показанной на рис. 9.7. Введем прежде всего модель обратного процесса, выход которой обозначим через ит. Сигнал, исходящий из этой модели, поступает на вход процесса. Чтобы обратная связь L не противодействовала желаемой реакции системы, на вход звена обратной связи необходимо подавать разность х— хт. Если ит определяется точно, то при отсутствии возмущений выход процесса будет вести себя желаемым образом. При этом
Рис. 9.7. Введение командных сигналов в систему с обратной связью по выходной переменной.
обратная связь L будет нивелировать возможные отклонения от заданной опорной траектории.
Даже если обратная модель непричинная, то комбинация ее с исходной моделью может оказаться причинной. В том случае, когда процесс таков, что обратный к нему неустойчив, можно использовать устойчивую аппроксимацию обратного процесса.
Модель можно использовать для введения полюсов и нулей в импульсную передаточную функцию ис->у. Это позволяет строить различные импульсные передаточные функции, описывающие реакцию системы на отклонения от опорной траектории и возмущения.
Анализ модели
Замкнутая система описывается следующей системой уравнений:
х (k + 1) = Фх (/г) + Ги (/г), u(k) = L [хт (k) — х (/г)] + ит (k), (9.37)
. x(k+ 1 |£) = Фх(Ш~ 1 Е V„'k) + K[y(k)-Ct(k\k- !)].
Введя обозначения
х = х — х, йс(/г) = ит(&) + £хт(/г),
(9.38)
эту систему можно переписать в виде
х (£ + 1) = [ф - ГЛ] х (k) + Г Lx (k | k - 1) -f- Гй£ (k)
x(k+ 1 |/г) = [Ф-КС]х(£|А~ 1)
x (k) = - Lx (k) + йс (k). (9.39)
Из (9.39) вытекает, что управляющие сигналы не влияют на ошибки наблюдателя. Это вполне естественно, поскольку было бы неразумно вводить командные сигналы таким образом,
Рнс. 9.8. Блок-схема системы, состоящей из регулятора и серворегулятора.
чтобы они порождали ошибки. По этой причине полюса наблюдателя не входят в передаточную функцию, связывающую выход с командным сигналом (рис. 9.8).
Отметим, что регулятор можно описать следущим соотношением типа «вход-выход»:
и = - L [ql - Ф + TL + КС]-1 [Гйс + Ку] + йс. (9.40) В случае скалярных измерений это уравнение можно переписать в виде
R(q)u(k) — T(q)u (k) - S (q) у (k), (9.41)
где R, S и T — некоторые многочлены.
Введение интеграторов
В методах, описанных в данной главе, используется вся имеющаяся информация о системе. Это означает, что моделируются все возмущения и сами модели являются точными. Вместе с тем часто требуется, чтобы система была слабо чувствительной по отношению к малым погрешностям в модели процесса. Так, например, может ставиться задача отыскания управления, переводящего систему в заданное установившееся состояние. Один из способов нивелирования влияния возмущений состоит в их оценке и введении прямой связи по оценке возмущений (разд. 9.3). Классический прием отработки ошибки в установившемся состоянии состоит во введении интеграторов (это можно сделать и в терминах размещения полюсов).
Пусть система описывается уравнениями (9.29). Предположим для простоты, что имеется один вход и один выход. Обозначим через ис желаемое установившееся состояние для у. Интегратор можно ввести, например, используя новую переменную состояния, являющуюся интегралом (суммой) ошибок
Рис. 9.9. Блок-схема, иллюстрирующая введение регулятора в методе размещения полюсов.
Uc — y, Т. е. Xn+\(k + 1) = х«+1(/г) + u, (k)— Cx(k). Расширенная таким образом система описывается следующим уравнением:
х(/г + 1) 1 xn+i(k+ 1)1
Для новой системы можно решить задачу размещения полюсов. Если система достижима, то xn+i->0 при ис — const. При этом оптимальное управление имеет вид
и (k) = — Lx (k) — 1п+[Хп+1 (/г) -f- lcuc (/г),
где последний член можно трактовать как прямую связь по измеряемому возмущению (рис. 9.9). Если полюса расширенной замкнутой системы устойчивы, то в установившемся состоянии у = ис. Поскольку собственные значения матрицы являются непрерывной функцией ее элементов, то ошибка в установившемся состоянии будет нулевой, если замкнутая система устойчива — даже при наличии малых погрешностей в модели процесса.
ВЫВОДЫ «
Было показано, как с помощью размещения полюсов и наблюдателей можно синтезировать оптимальное управление в задачах регулирования и серворегулирования. Решение таких задач содержит три основных компонента: матрицу обратной связи L, наблюдателя и модель реакции. Матрица L выбирается так,
чтобы возмущения затухали соответствующим образом, а наблюдатель строится по измерениям возмущений и оценкам шума измерений. Главным моментом является нахождение компромиссного решения между быстротой сходимости и слабой чувствительностью к ошибкам измерений. Качество регулирования при этом определяется выбором матрицы L и наблюдателя. Модель реакции системы и модель обратного процесса используются для решения задачи серворегулирования.
Задача размещения полюсов решалась для случая одного входа и одного выхода. Если система достижима, то, варьируя п параметров в звене обратной связи, можно разместить п полюсов произвольным образом. В многомерном случае степеней свободы больше, поэтому здесь можно определить не только полюса, но и некоторые собственные векторы замкнутой системы. Более подробное изложение вопросов можно найти в литературе, приводимой в конце главы.
ЗАДАЧИ
9.1. В общем виде дискретную систему второго порядка можно описать следующей системой уравнений:
Г аП а12 1 Г 61 1 х(/г+1)= х(6)+ / п(/г),
L «21 а22 J L 62 J y(k) = [ci c2]x(k).
Постройте управление вида п(/г) = —Lx(k) с характеристическим уравнением замкнутой системы: гг + p\Z -f- Pi = 0. Используя этот результат, докажите справедливость формул для апериодического регулятора, описанного в примере 9.4.
9.2. Для системы, описываемой уравнениями
Г 1,0 0,11 г 11
*<*+ » = 1о,Б 0,1 Р« + 1о]“<«
j/(*)-[l l]x(fe),
постройте линейный регулятор п(/?) =—Lx(k) с полюсами замкнутой системы в точках 0,1 и 0,25.
9.3. Постройте апериодический регулятор для электродвигателя (пример А.2) с начальным состоянием х(0) —[1 1]г. Найдите такой интервал квантования, чтобы необходимый управляющий сигнал не превосходил единицы. Здесь можно предполагать, что максимум u(kh) достигается при k — 0.
9.4. Квантование системы, рассмотренной в задаче 8.10, с периодом h — 0,2 дает
Г 0,55 0,12 1 Г 0,011
+ = [ 0 о,б7 + l о,15
Постройте синтез управления с обратной связью по состоянию с характеристическим многочленом
z2 = 0,63z+ 0,21.
(Это соответствует значениям параметров в задаче 8.10.) Постройте модель замкнутой системы и сравните с предыдущим результатом.
9.5. Система уравнений
Г 0,78 ОТ Г 0,22 1
x(k+ 1)=[ 0,22 1 ] Х^ + [о,Оз]“^’
f/(A) = [O 1]х(А)
описывает поведение электродвигателя с h = 0,25. Постройте наблюдатели для х(А) каждым из следующих способов: непосредственным вычислением по формуле (9.21); с помощью модели (9.24); редуцированной модели (9 27).
Ограничьтесь случаем апериодического регулирования, т. е. считайте, что полюса находятся в начале координат.
9.6. Основываясь иа модели (9.24), постройте полный наблюдатель для системы резервуаров, рассмотренной в упражнении 3.10.
9.7. Рассмотрим модель (9.27). Пусть управление задано формулой u(k) =—Lx(k\k).
Покажите, что регулятор описывается уравнениями
£(А + 1) = Фоё(А) + Г0^(А), и (А) = С£ (k) + Doy (А), где
Фо = (/ - КС) (Ф - ГА), Го = (/ - КС) (Ф - ГА) К,
C— — L, D0= — LK-
9.8. Имеется дискретная система:
Г 0,5 1 1 Г 0,2 1 Г 1 ] х (А + 1) = х (А) + « (А) + »(А),
I v,O U, i J |_ U J
г/(А) = [1 0]х(А),
где v — постоянное возмущение. Постройте регуляторы, нивелирующие влияние v в установившемся состоянии для каждого из следующих способов:
а) Состояние и v измеряемы.
б) Измеряемо только состояние.
в) Измеряем только выход.
9.9. Имеется система двух резервуаров с h — 12 с (задача 3.10). а) Постройте регулятор, введя обратную связь по состоянию так, чтобы полюса замкнутой системы удовлетворяли характери
стическому уравнению: z2—1,55z + 0,64 = 0. (Этот случай соответствует значениям £ = 0,7 и со =0,027 1/с.)
б) Введите управляющий сигнал и постройте регулятор такой, чтобы рассогласование в установившемся состоянии между командным сигналом и выходом было равно нулю. Иными словами, введите в систему интегратор.
в) Промоделируйте поведение системы при наличии регуляторов (а) и (б). Сравните полученные результаты с результатами задачи 8.7.
9.10. Рассмотрим интегратор второго порядка при наличии возмущения, действующего на входе процесса и представляющего собой синусоиду с частотой соо, но с неизвестной амплитудой и начальной фазой.
Постройте регулятор, введя обратную связь по состоянию, и наблюдатель, нивелирующие рассогласование в установившемся состоянии при синусоидальном возмущении.
ЛИТЕРАТУРА
Задача размещения полюсов была одним из первых приложений подхода, основанного на понятии пространства состояний. Одно из первых решений этой задачи принадлежит Дж. Бертраму (1959). Первая публикация на эту тему
1. Rissanen J. (1960): “Control System Synthesis by Analogue Computer Based on 'Generalized Linear Feedback’ Concept”, Proceedings of the Symposium on Analog Computation Applied to the Study of Chemical Processes, Brussels, November 21-23, 1-13.
Многомерный случай задачи размещения полюсов
2. Rosenbrock Н. Н. (1970): State-Space and Multivariable Theory. London: Nelson.
3. Wolowich W. A. (1974): Linear Multivariable Systems. New York: Springer-Verlag.
4. Kailath T. (1980): Linear Systems. Englewood Cliffs, N. J.: Prentice-Hall, Inc.
В этих же книгах рассматриваются наблюдатели. Наблюдатели пониженного порядка впервые были введены в диссертации Люенбергера. См. также
5. Luenberger D. G. (1964): “Observing the State of a Linear System”, IEEE Trans. Mil. Electron., MIL-8, 74-80.
6. Luenberger D. G. (1971): “An Introduction to Observers", IEEE Trans. Autom. Control, AC-16, 596-603.
Численные методы расчета обратной связи по состоянию и усиления наблюдателя
7. Miminis G. S., Paige С. С. (1982): “An Algorithm for Pole Assignment of Time Invariant Linear Systems”, Int. Journal Control, 35, No. 2, 341-54.
10
Размещение полюсов, основанное на моделях тйпа «вход-выход»
Решение задачи размещения полюсов с помощью обратной связи по выходным переменным
ВВЕДЕНИЕ
В данной главе задача серворегулирования решается с помощью моделей типа «вход-выход». Процесс нахождения решения сводится к конструированию характеристических многочленов с нужными свойствами и осуществляется следующим образом. Сначала в общем виде выписываются уравнения для линейного регулятора, и затем подбираются параметры этих уравнений так, чтобы замкнутая система обладала требуемыми свойствами. При этом задача формулируется как задача размещения полюсов. Такой подход оказывается простым как для понимания, так и для реализации. Кроме того, он позволяет учитывать различные ограничения, например требование того, чтобы усиление на определенных частотах было большим, а на других — малым.
10.1. ПОСТАНОВКА ЗАДАЧИ
Задача аналитического конструирования регулятора ставится обычным образом: вводится модель системы, критерий качества и допустимые управления. Здесь рассматривается задача серворегулирования, которая формулируется как задача отслеживания некоторой опорной траектории. Таким образом, требуется синтезировать регулятор, гарантирующий соответствующую реакцию на командные сигналы. В такой формулировке задача размещения полюсов является частным случаем. Таким образом, одновременно дается еще одно решение задачи аналитического конструирования (разд. 9.5).
Динамика процесса
Предположим, что процесс имеет один вход и и один выход у, связь между которыми определяется импульсной передаточной функцией
Я(г) = В(г)/Л(2), ' (10.1)
гдеД(х) иВ(г) — некоторые многочлены.
♦♦♦ Заметим, что импульсная передаточная функция полностью описывает динамику процесса, включая цепи задержки, исполнительный механизм, датчик и частотный фильтр.
Будем предполагать, что многочлены Л и В не имеют общих делителей. Напомним (разд. 3.1), что модель (10.1) можно трактовать как дискретную модель непрерывной системы с рациональной передаточной функцией и произвольной временной задержкой.
Критерий качества
Параметры серворегулятора выражаются через модель, описывающую желаемую реакцию на командные сигналы. Искомая импульсная передаточная функция замкнутой системы определяется как
Hm(z) = Bm(z)/Am(z), (10.2)
где многочлен^ Вт и Ат не имеют общих делителей. Вообще говоря, для полного описания процесса знания одной лишь функции Нт недостаточно. Если имеется обратная связь по выходной переменной, возможны дополнительные динамические эффекты, не вызванные командными сигналами. Согласно результатам, полученным в разд. 9.3, для полного описания процесса необходимо определить динамику наблюдателя, для чего достаточно построить его характеристический многочлен Ло.
Возмущения
Как уже отмечалось (разд. 6.2), возмущения делятся на три класса: возмущения нагрузки, ошибки измерений и неопределенности самого объекта. В случае серворегулирования может оказаться полезным уточнить динамику командных сигналов.
Метод конструирования регуляторов путем размещения полюсов не предусматривает применения конкретных моделей возмущений. Возмущения учитываются неявно путем введения ограничений на модель Нт, многочлен наблюдателя Ло и допустимые управления
Модельная передаточная функция Нт влияет на чувствительность замкнутой системы к ошибкам моделирования и высокочастотному шуму измерений. При этом, как уже отмечалось, требование слабой чувствительности противоречит требованию быстроты реакции системы на управляющие сигналы. Кроме того, на чувствительность к возмущениям нагрузки и шуму измерений сильно влияет вид многочлена наблюдателя.
Допустимые управления
Рассматриваемый регулятор имеет один выход и и два входа — командный сигнал ис и измеряемый выход у. Общая структура
такого регулятора может быть описана выражением
' <10-3)
где /?i, Rz, 7\ и Si — многочлены относительно оператора прямого сдвига q. Управление (10.3) можно переписать в виде
R (q) u(k) — T (q) ис (k) - S (q) у (k), (10.4)
где R = R1R2, T = T\Rz и S — SiR\. Здесь предполагается, что многочлен R записан в приведенном виде, т. е. коэффициент при старшем члене равен единице. Управление (10.4) представляет собой комбинацию прямой связи по командному сигналу ис с импульсной передаточной функцией
Hff(z) = T(z)lR(z) (10.5)
и обратной связи по измеряемому выходу у с импульсной передаточной функцией
Hfb(z) = S(z)lR(z). (10.6)
Ниже перечисляются некоторые требования, которым должны удовлетворять допустимые управления.
П ричинностъ. Условия
deg Я > deg Г, (10.7)
deg R^ deg S (10.8)
гарантируют, что передаточные функции Hff(z) и Hfb{z} причинны. Если время, необходимое для машинного вычисления управляющего сигнала, мало по сравнению с периодом квантования, то естественно потребовать, чтобы выполнялось равенство deg R — deg Т = deg S, (10.9)
которое означает, что в регуляторе нет временного запаздывания.
Если время вычисления сравнимо с периодом квантования, то аналогом (10.9) будет
deg/?= 1 + deg 7= 1 + degS, (10.10)
что означает, что временное запаздывание в управлении равно одному периоду квантования.
Обычно используется условие (10.9), поскольку возможное запаздывание, вызванное процессом вычислений, можно включить в модель процесса, а не в регулятор (разд. 3.1).
Возмущения и неопределенность в объекте. Учет возмущений осуществляется введением дополнительных ограничений на управление, которые удобно записать через коэффициент усиления по контуру
Чтобы уменьшить ошибки, порождаемые низкочастотными возмущениями, коэффициент усиления /7/й(ехр tw) на этих частотах должен быть большим. Этого можно добиться, выбрав многочлен R в виде
/? (г) = (г - I)'/?;(?) (10.12)
с соответствующим выбором I. Это классический принцип интегрального управления. Данное условие, кроме того, гарантирует, что замкнутая система будет нечувствительна к неопределенностям, влияющим на прохождение низкочастотных сигналов.
Влияние неопределенностей в случае высокочастотной динамики процесса и высокочастотных шумов измерений можно ослабить, выбрав S и R таким образом, чтобы коэффициент усиления быстро падал с ростом частоты (см. теорему 5.2). Отметим, что в этом отношении квантование играет очень важную роль, поскольку комбинация частотного фильтра и цепи восстановления снижает коэффициент передачи сигнала на частотах, превышающих частоту Найквиста. Таким образом, выбор периода квантования оказывает сильное влияние на чувствительность системы к высокочастотным возмущениям и ошибкам моделирования.
Возможны случаи, когда коэффициент усиления должен быть мал на некоторых частотах, лежащих ниже полосы пропускания серворегулятора. Подобная ситуация может возникать при наличии очень больших периодических возмущений, которые серворегулятор не может отработать, или при быстрых фазовых изменениях при передаче сигнала. Типичными примерами такого рода являются возмущения, вызванные волнением моря на морских плавучих буровых площадках, или низкочастотные изгибающие деформации в летательных аппаратах. Обычно такие возмущения подавляются «фильтрами-пробками», блокирующими прохождение определенных частот. В терминах размещения полюсов того же результата можно добиться, введя соответствующий множитель в многочлен S.
10.2. РЕШЕНИЕ ЗАДАЧИ
Задачу конструирования регулятора, поставленную в предыдущем разделе, можно сформулировать следующим образом. Пусть модель процесса описывается следующим соотношением:
A(q)y{k) = B(q)u(k), (10.13)
где и — управляющий сигнал (или управление), а у — измеряемый выходной сигнал. Требуется найти допустимое управление вида (10.4), такое, что замкнутая система описывается соотношением типа «вход-выход» с передаточной функцией (10.2) и наблюдателем с характеристическим многочленом Л0(г).
Блок-схема замкнутой системы приведена на рис. 10.1, где также показаны возмущения Для упрощения записи в приводимых ниже выражениях опущены аргументы в многочленах и функциях. Связь вход-выход для замкнутой системы получается исключением «из уравнений (10.4) и (10.13):
(AR + BS) у = ВТис<
Условие эквивалентности (10.14) и (10.2) дает
ВТ _ Вт AR + BS Ат
(10.15)
Таким образом, задача нию многочленов R, S и
конструирования сводится к отыска-Т, удовлетворяющих соотношению
Рис. 10.1. Блок-схема замкнутой системы.
(10.15) и дополнительным ограничениям допустимости управления.
В выборе многочленов R, S и Т имеется большая свобода, что иллюстрируется следующими примерами.
Пример 10.1. Решение без введения обратной связи
Легко проверить, что многочлены R — BAm, S = 0 и Т = АВт удовлетворяют уравнению (10.15). При таком выборе передаточная функция звена обратной связи и прямой связи соответственно имеет вид
Hfb = S/R = 0,
Hff=T/R = (BmA)/(AmB)
Таким образом, регулятор представляет собой чистый компенсатор без обратной связи. Такой компенсатор просто подавляет динамику процесса и вводит требуемую динамику. Хотя это решение и удовлетворяет (10.15), оно не удовлетворяет другим условиям допустимости управления. Поскольку обратной связи нет, условие того, что коэффициент усиления должен быть большим на низких частотах, очевидно, не выполняется. Так как все полюса и нули процесса компенсируются, система будет неустойчивой, если процесс имеет нули или полюса вне единичного круга.
Пример 10.2. Обратная связь по ошибке
Если многочлены S и Т совпадают, то управление (10.4) можно записать в виде •
Ru = S (uc — «/) = Se, где е — ошибка управления. Это означает, что управление строится только на основе обратной связи по ошибке. Легко проверить, что многочлены
R = В (Ат — Вт), - S = Т = АВт
удовлетворяют (10.15). Такой выбор представляет собой синтез оптимального управления. При этом, однако, не гарантируется, что коэффициент усиления звена обратной связи будет большим иа низких частотах.
♦ ♦♦ Заметим, что все полюса и нули процесса компенсируются. Зам-
кнутая система будет неустойчивой, если имеются нули или полюса вне единичного круга. Необходимость компенсации полюсов и нулей диктуется ограничениями, налагаемыми обратной связью по ошибке.
Приведенные примеры показывают, что возможен широкий выбор многочленов /?, S и Т, удовлетворяющих (10.15).
Компенсация полюсов и нулей
Из (10.15) следует, что полюса замкнутой системы удовлетворяют характеристическому уравнению
Л/? + В5 = 0. (10.16)
Нули замкнутой системы совпадают с корнями многочленов В и Т. Обычно порядок замкнутой системы выше порядка модели, поэтому, для того чтобы удовлетворялось условие (10.15), полюса и нули Должны компенсироваться.
Рассмотрим сначала нули разомкнутой системы, т. е. нули многочлена В. Если некоторый делитель В не является делителем В1П, то он должен быть делителем AR + BS, и поэтому он компенсируется некоторым полюсом замкнутой системы. Поскольку эта система должна быть устойчивой, то могут быть скомпенсированы только устойчивые нули. Разложим В на множители следующим образом:
В=В+В~, (10.17)
где все корни В~ лежат вне единичного круга, а все корни В+—внутри него. Для того чтобы разложение (10.17) было единственным, положим коэффициент при старшем члене В+ равным единице; такой многочлен называют приведенным. Поскольку В~ не может быть делителем AR -|- BS, он должен быть делителем R, т. е.
Вт = В~Вт, (10.18)
откуда следует, что неустойчивые нули процесса нельзя изменить— их следует включить в Вт. Так как В+ является делителем AR -|- BS, он является одновременно и делителем R, поэтому
R = B+R'. (10.19)
Уравнение (10.15) можно переписать в виде В+В~Т в~Р'т
В+ (AR' + B~S) ~ Ат ’ что сводится к уравнению
Т _ В'т
AR' -1- B~S Ат ’
откуда вытекает, что Ат является делителем AR' -|- BS. Далее, как следует из разд. 9.4, характеристический многочлен наблюдателя исключается из передаточной функции, связывающей опорный сигнал с выходным. Поэтому До является множителем AR + BS и, следовательно, имеют место следующие условия:
AR' + B~S = А0А^ (10.20)
Т = в;Л0. (10.21)
Характеристическое уравнение замкнутой системы принимает вид
Д7? + В5 = Б+Д0Дга. (10.22)
Таким образом, полюса замкнутой системы включают компенсированные устойчивые нули процесса В+, полюса модели Ат и полюса наблюдателя До.
♦♦♦ Заметим, что может возникнуть необходимость компенсации устойчивых полюсов процесса. Тогда они включаются в До, который в этом случае уже нельзя интерпретировать как характеристический многочлен наблюдателя. Из (10.20) и (10.21) вытекает, что компенсированные полюса образуют общий делитель многочленов S и Т.
Практические ограничения
На практике бывает полезно иметь более строгие ограничения на компенсацию полюсов и нулей; иногда компенсация может
к 1т
Рис. 10.2.
Область D, такая что принадлежащие ей точки имеют минимальное относительное и абсолютное демпфирование.
быть вообще нежелательной. В других случаях целесообразно компенсировать достаточно хорошо демпфированные нули. Формально эти ограничения можно описать, введя область D в комплексной плоскости, содержащую режимы с достаточным абсолютным или относительным демпфированием. Тогда можно ком
пенсировать лишь полюса, принадлежащие области D (рис. 10.2). Напомним (разд. 3.6), что кривые с постоянным относительным демпфированием являются логарифмическими спиралями в z-плоскости, а с постоянным абсолютным демпфированием — окружностями.
Итак, задача размещения полюсов свелась к отысканию многочленов R' и S, удовлетворяющих уравнению (10.20) и таких, что В = В+В~. Все корни приведенного многочлена В^ лежат внутри области D, а корни В~ — вне ее. Наконец, В~ должен быть множителем Вт, а многочлены R и Т должны удовлетворять соотношениям (10.19) и (10.21).
10.3. АЛГЕБРАИЧЕСКИЙ ПОДХОД
Некоторые принципы выбора многочленов /?, S и Т были сформулированы в разд. 10.2. Теперь надо решить еще одну задачу, а именно задачу отыскания двух многочленов R’ и S, удовлетворяющих (10.20) и другим требованиям допустимости управления. В математической постановке задача сводится к отысканию двух многочленов X и У, удовлетворяющих линейному уравнению
АХ+ВУ = С, (10.23)
где А, В и С — заданные многочлены. Это классическая задача элементарной алгебры.
Отступление
Уравнение (10.23) на первый взгляд может показаться довольно странным, поскольку оно содержит два неизвестных. Поясним, в чем тут дело с помощью более простой, но связанной с предыдущей задачей.
Пример 10.3. Диофантовы уравнения
Рассмотрим уравнение
Зх + 2«/ = 5, (10.24)
где х и у — целые числа. Это уравнение относится к классу диофантовых уравнений, названных так по имени древнегреческого математика Диофанта, жившего приблизительно в 300-е годы до н. э., — одного из основателей алгебры.
Очевидно, что решением (10.24) является х — у = 1. Еще одно решение можно получить, увеличив х на 2 и уменьшим у на 3. Если и у0 удовлетворяют уравнению (10.24), то любое решение системы
х = х0 + 2/г,
У — Уо — Зп, (10.25)
где п — целое, также удовлетворяет (10.24). Вот несколько таких решений: х: — 5 — 3 — 1 1 3 5 7
у. 10 7 4 1 —2 —5 —8
Из (10.25) вытекает, что если известно решение хо, у о, то можно добавлять или вычитать из Хо двойку до тех пор, пока не получится единственное реше
ние, удовлетворяющее условию 0 х < 2. Аналогично существует единственное решение, такое, что
1 0<У<3.
Уравнение (10.24) тесно связано с уравнением (10.23),поскольку целые числа и многочлены с действительными коэффициентами подчиняются одним и тем же алгебраическим правилам (и те и другие можно перемножать и складывать или вычитать по обычным правилам). Однако частное от деления двух целых чисел (или многочленов) вовсе не обязательно является целым числом (или многочленом). В алгебраической терминологии это означает, что целые числа (или многочлены с действительными коэффициентами) образуют кольцо.
Другой пример показывает, что уравнение типа (10.24) может и не иметь решения.
Пример 10.4
Рассмотрим уравнение
4х + бу = 1,
где х и у — целые числа. Поскольку левая часть уравнения при любых целых х и у является четным числом, а правая — нечетным, то ясно, что это уравнение в целых числах неразрешимо. Все дело в том, что 4 и 6 имеют общий делитель — двойку, которая не является делителем правой части.
Основной результат
Примеры 10.3 и 10.4 вскрывают алгебраическую сущность уравнения (10.23), поэтому остается лишь провести его формальный анализ. Основной результат можно сформулировать в виде следующей теоремы.
Теорема 10.1. Пусть А, В и С — заданные многочлены с действительными коэффициентами. Тогда уравнение (10.23) имеет решение тогда и только тогда, когда наибольший общий делитель А и В является делителем С.
Доказательство приводится в приложении D.
Из (10.23) вытекает, что если Хо, Уо— решение, то
X = X0 + QB,
Y = Y0 — QA, (10.26)
где Q — произвольный многочлен, также является решением уравнения (10.23). Если существует хотя бы одно решение, то можно построить сколь угодно много решений, добавляя или вычитая из него многочлены Л и В с одинаковым полиномиальным множителем.
Следствие. Существует единственное решение уравнения (10.23), удовлетворяющее условию
deg Х< deg В . (10.27)
или условию
deg У < deg Д. (10.28)
10.4. ПРОЦЕДУРА АНАЛИТИЧЕСКОГО КОНСТРУИРОВАНИЯ
Более глубокое понимание алгебраических свойств уравнения (10.23) позволяет вернуться к задаче размещения полюсов на другом уровне абстракции. Управление, удовлетворяющее уравнению (10.4), однозначно определяется многочленами Я, S и Т. В разд. 10.2 было показано, что Г определяется формулой (10.21), a R' и S должны удовлетворять уравнению (10.20). Поскольку многочлены А и В не имеют общих делителей, из теоремы 10.1 вытекает, что существуют многочлены R' и S, удовлетворяющие (10.20), и таких многочленов бесконечно много. При этом все они дают одинаковую импульсную передаточную функцию, связывающую выходной и командный сигналы. Ниже рассматривается возможность существования решений, удовлетворяющих и другим ограничениям, налагаемым на допустимые управления.
Причинность
Если неравенства (10.7) и (10.8) выполняются, то управление, удовлетворяющее уравнению (10.4), причинно. Конструктивный смысл этих ограничений устанавливается следующей теоремой.
Теорема 10.2. Если выполняются неравенства
deg Am — deg Bm > deg A — deg В (10.29)
и
deg 2 deg A — deg Am — degB+ — 1, (10.30)
то задача аналитического конструирования имеет причинное решение. .
Доказательство. Из уравнений (10.19) и (10.20) вытекает, что
AR + BS = B+A0Am.
Поскольку degS deg В и deg В < deg Л, то
deg ЛВ = deg (AR + BS) = deg B+A0Am, поэтому
deg R = deg Ло + deg Am + deg B+ — deg A.
Более того, из (10.21) следует, что
deg Т = deg Ао + deg B'm.
Далее, из (10.7) получаем, что
deg Ло + deg Am + aeg B.+ — deg A > deg Ло + deg B'm,
поэтому • :
deg Am — deg Bm Xdeg A - deg B+-
Вычитая deg В~ из обеих частей последнего неравенства, с учетом (10.18) ролучаем (10.29). Из следствия теоремы 10.1 вытекает, что существует решение уравнения (10.20), такое что
degS < deg Л.
Тогда, положив degS = deg/l— 1, с учетом (10.8) имеем
deg До + deg Ат -ф deg В+ — deg А > deg А — 1.
Приводя подобные члены, получим неравенство (10.30).
Замечание 1. Условие (10.29) интуитивно ясно. Оно просто означает, что задержка в модели Нт должна быть не менее задержки в системе И.
Замечание 2. Из условия (10.30) вытекает, что для получения причинного управления степень многочлена Ло должна быть достаточно большой.
Большое усиление на низких частотах
Чтобы система была нечувствительна к «низкочастотным» ошибкам моделирования и низкочастотным возмущениям, надо обеспечить большое усиление в контуре обратной связи на низких частотах. Для этого достаточно выбрать многочлен R с делителем (z— 1)г. Введя обозначение
7? = (z~ 1/^, (10.31)
перепишем уравнение (10.20) в виде
A(z- Y)1 R'{ +B~S = A0Am. (10.32)
Непосредственной проверкой можно убедиться в том, что если (10.29) выполняется и имеет место неравенство
deg zl0>2degX — deg Ат — degS+ -ф/ — I, (10.33)
то условия причинности (10.7) и (10.8) выполняются. Таким образом, по сравнению с (10.30) степень многочлена наблюдателя должна быть увеличена на I по сравнению с (10.30).
Алгоритм аналитического конструирования
Полученные результаты можно записать в виде следующей простой процедуры.
Алгоритм 10.1. Аналитическое конструирование регулятора методом размещения полюсов.
Исходные данные. Необходимая исходная информация включает модель процесса, определяемую импульсной передаточной функцией В/A, характеристический многочлен Ло и параметры требуемой импульсной передаточной функции Вт/Ат замкнутой
системы. Кроме того, должна быть описана область устойчи-вости.
Условия. Предполагается, что исходные данные удовлетворяют (10.18), (10.29), (10.33).
Шаг 1. Разложить В и Вт на множители:
В = В В+, Вщ^^В Вт,
где В+ — приведенный многочлен, все корни которого лежат внутри области устойчивости D, а корни В~—вне ее.
Шаг 2. Решить уравнение
J (z-V)1 AR\ + B-S = A0Am
относительно /?' и S и выбрать решение, удовлетворяющее неравенствам
degS < I + deg Л и
•deg R\ = deg Ло + deg Ат — deg А — I.
Шаг 3. Искомое управление имеет вид
Ru = Tuc — Sy, где
R = B+R', Т = В'тА0, R' = (z—1/ r'i.
♦♦♦ Заметим, что из тождественного равенства многочленов вытекает, что R', а следовательно, и R имеют приведенную форму.
Решение линейных полиномиальных уравнений
Чтобы продолжить решение задачи аналитического конструирования, необходимо решить линейное полиномиальное уравнение, что можно сделать несколькими способами. Один из них заключается во введении многочленов R' и S заданной степени с неопределенными коэффициентами и приравнивании коэффициентов при одинаковых степенях г. В результате получается система линейных алгебраических уравнений. Из теоремы 10.1 вытекает, что рассматриваемое полиномиальное уравнение имеет решение, если А и В~ не имеют общих делителей. Отметим, что полученная таким образом линейная система существенно упрощается, если А и В представлены в виде произведений. Этот метод иллюстрируется следующими примерами.
Пример 10.5. Электродвигатель с компенсацией нулей процесса
Импульсную передаточную функцию электродвигателя постоянного тока можно записать в виде (см. пример А. 2)
Я (г) = . К v, (10.34)
(г — И (г — а} '
K^e~h -1 + h, a = e~h, b = 1 - --e-^-
e~h- \ +h
ффф Заметим, что b < 0, т. e. нуль находится на отрицательной действительной полуоси.
Предположим, что требуемая замкнутая система описывается импульсной передаточной функцией вида
Hm(z) = Р| + Рг)-. (10.35)
г2 + Piz + р2
Импульсная передаточная функция Н имеет нуль в точке z = b, которая не входит в Нт. При данных условиях необходимо исключить нуль в точке z = Ь.
Разложим В на множители
B+=z — b,
В~ = К.
Тогда
п' __ Вт z (1 + р1 + рг)
т К К '
Степень многочлена До определяется неравенством (10.30), откуда следует, что deg До 0. Положим До (г) — 1,. тогда степени многочленов R' и S определяются выражениями
deg R' = deg До + deg Ат — deg Д = 0, deg S = deg A — 1 = 1.
Введем R' и S как многочлены нулевого и первого порядка в основное уравнение. Тогда имеем следующее полиномиальное тождество:
(z — 1) (z — а) г0 + К (soz -f- ®|) = z2 + p,z + p2.
Приравнивая коэффициенты при одинаковых степенях, получим систему уравнений
г0 = I,
— (1 + a) ro + Ksq = pt,
+ KSt — Pi, решение которой имеет вид
г0= 1.
о 1+a + pi
_Р2-а |_ к •
Из уравнения (10.21) следует, что
Т (г) = До(z) В'т (z) = *0+?+?*) =
Окончательное искомое управление (шаг 3 алгоритма 10.1) можно записать в виде
и (k) = teuc (k) — soy (k) — s,y (k — 1) + bu (k — 1). (10.36)
Результат моделирования реакции системы на ступенчатое возмущение показан на рис. 10.3,
h^0,25
О /О
Время
Рис. 10.3. Реакция электромотора на единичную ступеньку.
£=0,7 и Периоды квантования Л=0,25 и h»l. Нули процесса скомпенсированы.
♦♦♦ Заметим, что в управляющем сигнале наблюдается «дрожание» или «рябь», вызванная компенсацией нуля, лежащего на отрицательной полуоси. В моменты квантования эта рябь не видна, однако в промежутках между точками квантования она проявляется в выходном сигнале. Амплитуда этого колебания зависит от периода квантования и быстро убывает с уменьшением его величины.
Пример 10.6. Электродвигатель без компенсации нулей
Рассмотрим тот же электродвигатель, что и в примере 10.5, и предположим, что требуемая передаточная функция замкнутой системы имеет вид
Нт (г) = 1 + Р' + Р2 Z ~ . (10.37)
1 — Ь Z2 + ptZ + рг
♦♦♦ Заметим, что нуль, лежащий на отрицательной действительной полуоси, одновременно является нулем требуемой передаточной функции замкнутой системы. Это означает, что этот нуль не обязательно компенсировать при регулировании.
Разложим В на множители
В+ = 1,
S“ = A(z-Z>).
Тогда
д' _ 1 ~F~ Pi + Рг т K(l-b) ’
Степень многочлена Ао определяется из соотношения
deg Ао > 2 deg А — deg Ат — deg В+ — 1 = 1,
т. е. она должна быть не меньше единицы. Таким образом, можно ввести следующий апериодический наблюдатель: Ao(z) = z. Минимальные степени многочленов 7? и S определяются равенствами: .
deg В = deg А + deg Ао — deg Ат = 1,
deg S = deg А — 1 = 1.
Рис. 10.4. Реакция электромотора иа единичную ступеньку при h = ОД
Нули процесса не скомпенсированы. £—0.7, ®=1.
Уравнение (10.20) можно записать в виде
(2 — 1) (z — а) (2 + п) + К (z — b) (soz + Sj) = 23 + Piz2 + p2z. (10.38)
Для определения rt положим z = b в (10.38). Тогда
(6 — 1) (b — a) (b + г,) = b3 + ptb2 + p2b.
Откуда
______________. , b (b2 + р^Ь + Pa) r‘_____(b — I) (b — a) '
Положив z = 1 и z = а в (10.38), получим
К (1 — b) (s0 + Si) = 1 + Pi + Pa.
К (a — b) (soa + sj) = a3 + p.a2 + p2a,
откуда можно определить значения s0 и si. Из уравнения (10.21) вытекает т — л п' — 1 + Pl + Рг _____________________________/ ,
т (г) АуВт z к (1 ________Zoz-
Тогда оптимальное управление определяется выражением
и (k) = tQuc (/г) — soy (k) — s,p (k — 1) — rtu (k — 1).
♦♦♦ Заметим, что это выражение имеет тот же вид, что и (10.36), однако коэффициенты этих выражений не совпадают. Модель реакции иа ступенчатое воздействие показана на рис. 10.4. Сравнивая рис. 10.3 и 10.4, можно видеть, что закон управления в последнем случае имеет более «гладкий» вид, и здесь нет «ряби» в выходной переменной. Кроме того, нарастание реакции в начальный момент идет не так быстро, так как степень Ао здесь выше, чем в примере 10.5.
10.5. ЧУВСТВИТЕЛЬНОСТЬ К ОШИБКАМ МОДЕЛИРОВАНИЯ
Совершенно нереально, чтобы модель процесса, используемая при конструировании регулятора, была абсолютно точной. Поэтому необходимо иметь представление о том, как неточности
моделирования влияют на поведение управляемо замкнутой системы. Рассмотрим этот вопрос, предполагая, что конструирование строится на модели Н — В/А, которая является некоторой аппроксимацией точной модели Н° = В°/Ас.
Устойчивость
Необходимое условие устойчивости замкнутой системы по отношению к погрешностям моделирования устанавливается следующей теоремой.
Теорема 10.3. Рассмотрим задачу аналитического конструирования регулятора, используя следующую приближенную модель:
Н = В! А.
Пусть Н° — импульсная передаточная функция регулируемой системы. Предположим, что И и Н° имеют одинаковое число полюсов, расположенных вне единичного круга, и что Нт устойчива. Тогда замкнутая система, связанная с Я°(г), устойчива,
если
| Н (z) - Н° (z) | <
H(z)T(z) | _| Я(?)
(2) Hfb^>
(10.39)
при |z| = 1, где Hff и Hfb определяются соотношениями (10.5) и (10.6).
Доказательство основывается на общих результатах теории устойчивости, приведенных в разд. 5.1.
Введем следующий коэффициент усиления:
= (10.40)
Из (10.22) вытекает, что
1 , AR + BS в+а»^
1 A-nlg—iAR — AR — AR
Из (10.21) следует, что
Л т тв~ тв~ в' в'в~ вт mm m
поэтому
, , L, B+B~TAm _ BAmT НТ
1 A-nts ARBm ABmR HmR .
Умножая (10.39) на S/R, получаем
|4й-4я01<|тет1=11 + н'.| или
Утверждение теоремы теперь следует из теоремы 5.2.
Замечание 1. Условие (10.39) легко использовать на практике. В процессе проектирования правая часть (10.39) легко вычисляется для z = exp(i’o>/i) и не зависит от истинной импульсной передаточной функции. Тогда необходимые условия корректности модели можно сформулировать в виде некоторых ограничений на частотные характеристики.. ж
Рис. 10.5. Диаграмма Боде для Н = Hw
По этой диаграмме легко найти отношение Н/Я , входящее в (10.39).
Замечание 2. Отметим, что (10.39) автоматически выполняется, если
3
и
№1-1^1 <1-
Таким образом, условие (10.39) достаточно проверять лишь для тех частот, на которых коэффициент усиления больше 1/3.
Замечание 3. Относительная погрешность моделирования определяется как
IН (г) - Д° (г) |
I Н (г) |
1
Hjf И
\нт^\ Hfb& '
Условие (10.39) имеет прозрачный физический смысл. Рассмотрим сначала отношение Н/Нт- Обычно импульсная передаточная функция процесса Н велика на низких частотах и убывает с частотой (рис. 10.5) в то время, как требуемая импульсная передаточная функция замкнутой системы Нт на низких частотах, как правило, равна единице. Вблизи точки пересечения кривых Н и Нт функция имеет слабо выраженный максимум н далее с ростом частоты убывает (рис. 7.9). Отношение Н/Нт можно получить, воспользовавшись рис. 10.5. Легко видеть, что высокая точность модели существенна лишь в определенном диапазоне частот, при этом несложно оценить последствия изменения частотной полосы проектируемой системы. С уменьшением полосы замкнутой системы требования к точности модели ослаб
ляются и повышаются, если полоса расширяется. Отношение
\Hff/Hfb\ = \T/S\
есть отношение передаточных функций прямой и обратной связи, й оно равно единице, если используется только обратная связь по ошибке. На частотах, где усиление прямой связи выше, чем обратной, требования к точности модели ниже.
Точность аппроксимации передаточной функции замкнутой системы
Можно показать, что импульсная передаточная функция замкнутой системы имеет вид
В°Т _ T/R
Пс1 — дор + бо$ — до/Во + S/R ~~
~ l + (1 °-41)
»
где Ао — многочлен наблюдателя. Из (10.41) следует, каким образом неточности модели трансформируются в погрешности импульсной передаточной функции замкнутой системы: эти погрешности малы, когда передаточные функции разомкнутой системы Н и Я® велики.
10.6. СВЯЗЬ С ДРУГИМИ МЕТОДАМИ КОНСТРУИРОВАНИЯ
Размещение полюсов — это общая схема аналитического конструирования регуляторов с одним входом и одним выходом, в которую укладываются многие известные методы.
Корневой годограф
Метод корневого годографа является одним из классических методов аналитического конструирования систем управления и основан на размещении полюсов замкнутой системы в заданных точках. Таким образом, его аналогия с общим методом размещения полюсов очевидна. В этом методе сначала выбираются многочлены S = K и /? = 1, реализующие пропорциональное регулирование. Затем варьируется усиление К и исследуется расположение корней характеристического уравнения
Л + /(В = 0. (10.42)
Зависимость корней этого уравнения от К довольно легко изобразить графически. Если оказывается, что невозможно получить приемлемого расположения корней, то по определенным эвристическим правилам увеличивают степени многочленов R и S. Далее процедура повторяется.
Очевидно, что процедура размещения полюсов, описанная в разд. 10.4, проще в реализации, чем метод корневого годографа, поскольку все полюса размещаются одновременно. Вместе с тем в методе корневого годографа строится наиболее простой регулятор, решающий данную задачу, в то время как в общем методе сложность регулятора определяется сложностью используемой модели регулируемого процесса/'
Дипольная компенсация
В классической задаче серворегулирования с помощью звена обратной связи по рассогласованию, как правило, в передаточную функцию замкнутой системы вводится диполь — полюс и нуль, близко расположенные один относительно другого и относительно начала координат. Влияние такого диполя на передачу высокочастотных сигналов практически незаметно в отличие от низкочастотных сигналов. Интуитивно ясно, для чего надо вводить в регулятор динамический режим, которого практически «не существует», т. е. он почти недостижим или ненаблюдаем. Дипольную компенсацию можно интерпретировать в терминах размещения полюсов, а динамику, порождаемую диполем, можно трактовать как динамику наблюдателя.
Если используется только обратная связь по рассогласованию, то невозможно добиться, чтобы ошибка наблюдателя не зависела от командных сигналов. Поэтому в передаточной функции «командный сигнал — выход» будет проявляться динамика наблюдателя. Излагаемый метод конструирования позволяет полностью избежать появления режимов, связанных с наблюдателем путем введения другой импульсной передаточной функции прямой связи. При этом диполь полностью исчезает из импульсной передаточной функции, связывающей выход процесса с командным сигналом.
Предиктор Смита
Предиктор Смита уже упоминался в разд. 7.4. Это некий специфический регулятор, предложенный для систем с временным запаздыванием.
Рассмотрим процесс с импульсной передаточной функцией вида
Я(2) = Ц-Н'(г) = ^М-. (10.43)
где deg А' = deg В'. Число d, таким образом, описывает временное запаздывание в системе. Введем сначала обратную связь Hfb (z) = •Ц77~г> которая гарантирует заданные свойства при от-сутствии запаздывания. Для систем с запаздыванием управление в предикторе Смита определяется из выражения
и (k) = Hfb [ис (k) - у (k)] - H'Hfb(l - z~*) и (k). (10.44)
Тогда импульсная передаточная функция замкнутой системы имеет вид
Формулу (10.44) легко получить, используя общий метод размещения полюсов. Пусть процесс описывается функцией (10.43), а требуемая модель — формулой (10.45). Предположим, что в регуляторе используется только обратная связь по рассогласованию. Отметим, что в модели сохраняются нули процесса. Учитывая это ограничение и используя пример 10.2, получаем, что искомое управление определяется выражением
«(Л) = 4 К (k) - у (k)] = К (*) - у (*)]•
Таким образом, регулятор имеет вид
S zdA's' _ Hfb
~R~~ z41 (A'R' + B'S') - B'S' ~ 1 + H'Hfb (1 - z~d) или
« (k) = Hfb luc (k) - у (&)] - H'Hib (1 - z-d) и (k),
что совпадает с (10.44). Поскольку используется только обратная связь по рассогласованию, необходимо скомпенсировать все полюса процесса. Однако из (10.44) неочевидно, что полюса компенсируются. Конечно же, используя более общую комбинированную структуру (10.4), можно получить и другие управления, аналогичные предиктору Смита, в которых нет необходимости компенсации полюсов процесса.
Отслеживание модели
Управление, полученное методом размещения полюсов, можно интерпретировать как следящую систему регулирования. Чтобы убедиться в этом, используем условия (10.20) и (10.21) в общей формуле (10.4). Из (10.21) следует, что
Т _ A0B'm AtiAmB'm (AR'+ В-S)B'm _
R B+R' AmB+R' AmB+R'
_ AB'm B~B'mS = AB'mB~ B~B'mS _ ABm В
B+Am AmB+R' B~B+Am + AmB+R' BAm + AmR ’
Подставив последнее равенство в (10.4), получим
Т S АВт . SBm S АВт S ,
U RUc Ry ВАт RAm Uc Ry~ ВАт Uc ^У~Ут)-
(10.46)
Первый член в правой части можно интерпретировать, как прямую, а второй —как обратную связь. Первый член при этом
представляет собой комбинацию желаемой реакции и модели обратного процесса, а второй член содержит импульсную пере-
Рис. 10.6. Блок-схема системы с законом управления (10.46).
даточную функцию S/R. Сигнал обратной связи строится по разности реального выхода и желаемого выхода ут, где
Ут == НmUc = —j. Uc.
Блок-схема регулятора (10.46) показана на рис. 10.6 (ср. с рис. 9.7).
Алгоритм Далина — Хигема
Метод Далина — Хигема был весьма популярен на раннем этапе развития методов конструирования систем цифрового регулирования благодаря его вычислительной простоте. В основе метода лежит предположение о том, что динамика процесса описывается передаточной функцией (10.43). На первом этапе строится регулятор, нивелирующий многочлены А' и В' Тогда динамика процесса описывается чистым звеном задержки
H"(z) — z~d.
Для отработки рассогласования в установившемся состоянии необходимо введение интегрального воздействия, что достигается, если положить / =1 в (10.31). В этом случае искомая передаточная функция модели принимает вид
’ zd~l(z — a)
Регулятор строится, как в примере 10.2, т. е. с помощью обратной связи по рассогласованию, и может интерпретироваться как регулятор с предиктором Смита. Поскольку алгоритм основан на компенсации всех полюсов и нулей процесса, он не должен иметь полюсов или нулей вне единичного круга.
*’ То есть компенсируются полюса и нули. — Прим, перев.
♦♦♦ Заметим, что здесь возможны проблемы осцилляций («рябь»), вызываемые компенсацией устойчивых, но слабо демпфированных нулей (рис. 10.3).
Алгоритмическое управление по модели
Это один из довольно распространенных методов аналитического конструирования, который можно интерпретировать как метод размещения полюсов с передаточными функциями
Н (г) = z~d В (г) и
Таким образом, процесс моделируется функцией реакции на конечное импульсное воздействие.
10.7. ПРАКТИЧЕСКИЕ АСПЕКТЫ
Если известны модель Н, требуемая импульсная передаточная функция замкнутой системы Нт и характеристический многочлен наблюдателя До, то метод размещения полюсов становится простой и ясной процедурой аналитического конструирования регулятора. Однако не так легко найти параметры конструирования Нт и Ао, удовлетворяющие заданным физическим условиям.
Чтобы получить более-менее конкретные рекомендации относительно использования метода размещения полюсов, рассмотрим характер влияния этих условий на величину управляющих сигналов, чувствительность к возмущениям нагрузки, ошибки измерений и неточность моделирования.
Качество сервооегулирования
Качество серворегулирования определяется импульсной передаточной функцией замкнутой системы Нт. Результаты, полученные в разд. 10.2, показывают, что неустойчивые или слабо демпфированные нули процесса связаны с делителями многочлена Вт. Если данный факт не принимать во внимание, то, как следует из рис. 10.2 и алгоритма Далина — Хигема, это может привести к нежелательным осцилляциям выходного сигнала. Таким образом, весьма важно знать нули неустойчивого процесса. Частое квантование непрерывных систем с эксцессом полюсов, большим двух, всегда приводит к возникновению неустойчивых нулей (разд. 3.5), поэтому необходимо знать величину временного запаздывания и расположение неустойчивых нулей объекта.
♦♦♦ За метим, что динамику высокого порядка часто
можно аппроксимировать временным запаздыванием.
Для фиксации всех полюсов и нулей систем высокого порядка требуется вводить довольно много параметров, в то время как на практике часто сложно получить большой объем необходимых данных. Гораздо разумней было бы получить некоторые глобальные характеристики управляемой системы такие, как, скажем, частотная полоса и положение резонансного пика (рис. 7.9). В случае дискретных систем'’это можно сделать, зафиксировав доминирующие полюса. В колебательных системах достаточно определить множитель второго порядка
Р (г) = г2 + p{z + р2, (10.47)
где ______
Pi — — 2e~^ah cos (и/г д/1 — С2)>
р2 —
Здесь £ обозначает желаемый коэффициент относительного демпфирования, а со — собственную частоту.
Для систем без перерегулирования можно ограничиться множителем первого порядка:
P(z) = z — а, (10.48)
где а = ехр(—h/T), а Т — нужная постоянная времени.
Остальные полюса замкнутой системы в дискретном случае можно расположить в начале координат. Таким образом, нужная динамика замкнутой системы будет иметь следующий типичный вид:
<10-49>
где В~ включает неустойчивые или слабо демпфированные нули, am — некоторое число, отражающее временное запаздывание и динамику высокого порядка разомкнутой системы.
Величина управляющих сигналов
Интуитивно ясно, что для регулирования широкополосной системы величина управляющих сигналов должна быть большой. Этому выводу можно дать количественную оценку. Пренебрегая возмущениями, из (10.1) и (10.2) получаем
Pjn ГТ В _ ,
У Ат НтЧс И У== д == Н
откуда
и=^~ис. (10.50)
Формула (10.50) однозначно определяет величину управляющих сигналов, порождаемых заданными командными сигналами. (Отношение Нт/Н уже встречалось ранее при анализе робастности и в теореме 10.3.)
Порядок величины управляющих сигналов легко оценить, воспользовавшись диаграммой Боде для импульсных передаточных функций Н и Нт. Как показано в разд. 4.3, для этих целей в качестве достаточно хорошей аппроксимации (хотя бы при частом квантовании) можно воспользоваться диаграммами Боде для непрерывных систем, возможно включающих цепи восстановления. Как следует из рис. 10.5, по этим диаграммам довольно легко можно оценить величину \Нт/Н\, а также степень влияния ширины полосы замкнутой системы на величину управляющего сигнала. Если, скажем, угол наклона кривых в области высоких частот равен —20 dlog/дек., то при удвоении полосы величина управляющего сигнала должна увеличиться вчетверо. Таким образом, величина управляющего сигнала может оказаться весьма чувствительной к вариациям полосы.
Чувствительность к возмущениям
Блок-схема системы, включающей возмущения и погрешности измерений, показана на рис. 10.1; с помощью этой схемы после несложных преобразований получаем
ВГ , BR _ BS
Х~~ AR +BS Uc~r AR +BS V AR + BS е~
где х — выход процесса, a Hie — коэффициент усиления по замкнутому контуру, определяемый формулой (10.11). Отметим сходство импульсных передаточных функций, связывающих х с ис, v к е. Единственное отличие состоит в том, что в числителях стоят многочлены Т, R и S соответственно. Все многочлены R и S, удовлетворяющие уравнению (10.20), оказывают одинаковое влияние на прохождение сигнала от ис к х. Произвол в решении (10.20) можно использовать для уменьшения влияния возмущений нагрузки и ошибок измерений.
Из (10.51) вытекает, что в системе с единичным усилением могут распространяться низкочастотные ошибки измерений, поскольку они возникают при измерении выходного сигнала и через цепь обратной связи воздействуют на выход процесса. Высокочастотные ошибки, однако, не распространяются, так как они подавляются динамикой регулятора. Из (10.51) также следует, что прохождение сигналов на определенных частотах можно заблокировать, сделав S(expicoft) малым на этих частотах. Так, например, потребовав, чтобы выражение
Q(z) = z2— 2ze~ah cos coft + 1 (10.52)
было делителем многочлена S, можно получить фильтр-пробку.
Из (10.51), кроме того, вытекает, что низкочастотные возмущения нагрузки можно ослабить на частотах, где усиление об
ратной связи Hfb велико, или значение многочлена R мало. Типичным примером такого рода будет подавление рассогласования в установившемся состоянии, возникающего из-за возмущения нагрузки, выбором 7?(1) = 0, что эквивалентно действию интегрального компенсатора. Для подавления возмущения нагрузки с частотой со можно потребовать, чтобы Q(z) [определяемый формулой (10.52)] был делителем многочлена R.
В том случае, когда для получения фильтра-пробки или интегрального регулирования вводится требование, чтобы R и S имели некоторые специальные делители, степень многочлена До должна быть увеличена. Выбор До также определенным образом влияет на прохождение сигнала, так как R и S связаны с До соотношением (10.20).
Роль характеристического многочлена наблюдателя
Влияние характеристического многочлена До на распространение возмущений иллюстрируется следующими примерами.
Пример 10.7
Рассмотрим систему с импульсной передаточной функцией
Н & = (10-53)
Предположим, что желаемая импульсная передаточная функция имеет внд
Нт = z — 0,8 ‘
Легко проверить, что Ле = 1; поэтому, используя пропорциональную обратную связь
u (fe) = 2 [uc (fe) — у (fe)J,
получаем требуемую передаточную функцию замкнутой системы. Тогда для выхода процесса х получается следующее выражение:
0,2 . 0,1 0,2
х = v ~ T^oJе-
Диаграммы Боде для распространения возмущений нагрузки и ошибок измерений показаны на рис. 10.7.
Согласно рис. 10.7, пропорциональная обратная связь приводит к высокой чувствительности замкнутой системы к возмущениям нагрузки. Менее чувствительную систему можно получить, введя многочлен До более высокой степени и добавив некоторые ограничения на многочлен R.
Пример 10.8
Рассмотрим снова ту же систему и ту же передаточную функцию, что и в примере 10.7. Пусть многочлен Ло имеет вид Л0(г) = z — а, тогда уравнение (10.20) принимает вид
(z — 1) (z + rt) + 0,1 (soz + sO = (z — a) (z — 0,8).
Рис. 10.7. Диаграмма Боде для распространения возмущений нагрузки и шумов измерений для системы, описанной в примере 10.7.
Приравнивая коэффициенты при одинаковых степенях г, получаем
— 1 + Г1 + 0, ls0 = — а — 0,8,
— И + 0,lsi = 0,8а.
Поскольку имеются два линейных уравнения с тремя неизвестными, можно ввести дополнительное условие. Выберем rt = —1, чтобы гарантировать, что
Рис. 10.8. Диаграмма Боде для коэффициента передачи возмущения нагрузки и шумов измерения при различных многочленах наблюдателя для регулятора, описанного в примере 10.8.
7?(1) =0 (интегральный компенсатор). Тогда s0 = 12 — 10а, Si = 8а — 10,
и выход процесса х описывается следующим выражением:
_ 0,2 0,1 (z — 1) _ (1,2 —а) г — 1 + 0,8а
Х г — 0,2 Uc (z — а) (z — 0,8) V (z — a) (z — 0,8) Ha рис. 10.8 показаны соответствующие диаграммы Боде.
Выбор интервала квантования
Проблема выбора интервала квантования для случая задачи аналитического конструирования с обратной связью по состоянию (синтез) рассматривалась в разд. 9.1. Аналогичные рассуждения можно провести и для метода, излагаемого в настоящей главе. Это означает, что длину интервала квантования следует выбирать исходя из желаемого поведения замкнутой системы.
При этом можно воспользоваться эмпирическим правилом: для замкнутой ^системы на отрезке разгона должны укладываться 2—4 интервала квантования или 8—16 выборок на период.
Пример 10.9
Рассмотрим ту же систему, что в примере 10.6. Пусть £ = 0,7 и w = 1.
Эмпирическое правило дает h х 0,5 — 1,0. НаЛрис. 10.9 показан выход си-
Рис. 10.9. Влияние длины интервала квантования на поведение электромотора постоянного тока.
£=0,8 и е>-1.
стемы при различных периодах квантования. Видно, что система слабо чувствительна к выбору этой величины.
10.8. ПРИМЕР АНАЛИТИЧЕСКОГО КОНСТРУИРОВАНИЯ РЕГУЛЯТОРА
Проиллюстрируем применение полиномиального метода конструирования на более сложном примере.
Процесс
Рассмотрим электродвигатель, . вращающий нагрузку, состоящую из двух масс, связанных пружиной с коэффициентом же-
Рис. 10.10. Объект, состоящий из двух масс, связанных демпфирующей пружиной.
сткости k (рис. 10.10). Управляющим сигналом является ток / в обмотке двигателя. Обозначим через coi, со2, и <р2 угловые скорости и углы поворота масс, а через J\ и /2— их моменты инерции. Предположим, что коэффициент затухания свободных колебаний пружины есть d и что на первую массу может воздействовать вращающий момент v. Выходом процесса будем считать СКОРОСТЬ <1)2-
Введем следующие переменные состояния:
xi — Ф1 Фг>
Х2 = И1/Ц)>
Х3 = (В2/(В0,
где <в0 = -yjk Ui + 72)/(7i72) • Тогда процесс описывается следующими уравнениями:
dx
Л “ "°
1
~0i
02
-1 '
0.
~02.
Го
О' 3 о
v (10.54)
У = [0
0 со0]х
О
а — 1
а
У
О
где а = /,/(/, + 72), ₽ j = с//(71<»о)» ₽2 = W2®о). V = k 1/(Л<в0). д = 1/(72<в0).
В примере приняты следующие численные значения параметров: (в0 = 1, 71=10/9,72=10, Л=1, d = 0,1 и ki=l. При этих
Рнс. 10.11. Диаграмма Боде для процесса (2) и фильтра (/).
Рис. 10.12. Импульсная реакция процесса.
значениях имеются три полюса: pi = 0, р2 з = —0,05 ± 0,999i и один нуль Z\=—10. Коэффициент затухания комплексных полюсов ер = 0,05, а частота ар = 1 рад/с. Диаграмма Боде данного процесса показана на рис. 10.11, а импульсная реакция — на рис. 10.12.
Характеристики проектируемой системы
Реакция замкнутой системы на опорный сигнал должна быть такой, чтобы частота доминирующих режимов ат равнялась 0,5 рад/с, а коэффициент затухания е составлял 0,7.
Аналитическое конструирование
Выбор интервала квантования. Частота колебаний проектируемой системы должна быть равна 0,5 рад/с. Эмпирическое правило, приведенное в разд. 9.1, дает для приемлемой величины интервала квантования значение h =0,5 с, откуда получаем частоту Найквиста: (aN = n/h ~ 6 рад/с.
Чтобы избавиться от явления захвата частоты, необходимо ввести фильтр, в качестве которого выберем
S2 -р -р (£>?
с частотой <0f=2 рад/с и усилением порядка 0,1 на частоте Найквиста.
Квантование процесса. Поскольку частоты <вр и ор одного порядка, необходимо ввести фильтр, предотвращающий захват частоты. Квантование процесса и фильтра с h == 0,5 приводит к следующей дискретной модели:
где
А (</) = (^ + 1,7125^ + 0,9513) (92 + 0,7497<7 + 0,2432) (<? - 1) фильтр процесс
В (q) = 0,1417 (q + 12,1127) (q + 1,3395) (q + 0,2227) (q — 0,0024).
Полюса и нули этой системы показаны на рис. 10.13.
Расчет фильтра-пробки. Частота механического резонанса системы Юр = 1 близка к заданной собственной частоте замкнутой системы (вт = 0,5, поэтому при расчете регулятора необходимо учесть возможность механического резонанса. Классический метод борьбы с резонансом состоит во введении компенсирующей цепочки, которая гасит возможное возбуждение колебательных полюсов процесса. Полученный фильтр обычно называют фильтром-пробкой-, на диаграмме Боде ему соответствует «зубец» на подавляемой частоте. Такое решение гарантирует, что при воздействии командных сигналов колебательные режимы возникать не будут, однако оно не обеспечивает подавления колебательных режимов вообще 9. Это означает, что система будет реагировать на возбуждение колебательных режимов так же, как неуправ-
*’ Например, колебательных режимов, вызываемых возмущениямр. -— Прцм. ред.
ляемая система. Для построения фильтра-пробки воспользуемся описанным ранее методом конструирования характеристических многочленов.
Рассмотрим характеристический многочлен замкнутой, управляемой системы. Желательно, чтобы он имел делителями Ат и До- Кроме того, он должен иметь делителем и многочлен Ап, соответствующий колебательным режимам, поскольку они остаются в управляемой системе и не подвержены влиянию обратной
Рис. 10.13. Диаграмма расположения полюсов и нулей для процесса и фильтра с частотой квантования h = 0,5.
связи. Предположим, что никакие нули процесса не компенсируются. Тогда тождество (10.22) принимает вид
AR + BS = АтАпА0. (10.55)
Поскольку Ап является делителем А, но не является делителем В, то он является делителем S. Таким образом, нули регулятора лежат в колебательных полюсах.
Многочлен Ат строится по заданным ®т и t,m. При этом два полюса выбираются так, чтобы получить желаемые значения этих параметров, а остальные три помещаются в начало координат, где по предположению будут лежать также все полюса До.
Из теоремы 10.2 вытекает, что должны выполняться равенства:
deg R = 4, degS = 4, deg40 = 2.
Многочлены R и S получаются из тождества (10.22), порядок которого в данном случае равен 9. Импульсная передаточная функция замкнутой системы имеет вид
ВТ t В
AR + BS ~ ‘о Ат ’
где t _ -4m (1)
^~~bWT-
Таким образом, многочлен Т есть
Т —
При таком выборе Т коэффициент усиления замкнутой системы равен единице, причем Ап является делителем S и Т. На рис. 10.14 показана реакция управляемой системы с таким фильтром-пробкой; опорным сигналом является ступенька в точке
Рис. 10.14. Реакция замкнутой системы с заграждающим фильтром.
/ = 0, а возмущение представляет собой импульс в точке f = 25 высотой, равной 5, и длительностью 0,1 с.
Управляющий или опорный сигнал не возбуждает слабо подавленные колебательных режимов, однако при импульсном возмущении они возникают и вызывают колебания на выходе. Отметим, что эти колебания не влекут за собой каких-либо управляющих воздействий.
Активное подавление колебательных режимов. Регулятор с фильтром-пробкой не делает попыток подавить колебательные режимы. Рассмотрим теперь другое решение, при котором поведение серворегулятора остается прежним, но при этом подавляются колебательные режимы. Предположим, что подавление, или демпфирование, колебательных режимов должно быть таким, что коэффициент затухания изменится от 0,05 до 0,707. Будем, кроме того, считать, что подавляемая частота остается прежней. Полюса непрерывной системы теперь имеют виц
Pi 2 = — 0,707 ± 0,999/.
. Обозначим соответствующий многочлен для дискретной системы через Ad. В дальнейшем процедура будет такой же, как и ранее, с той лишь разницей, что вместо (10.55) будет исполь
зоваться тождество
+ (10.56)
где Ат и Ло — те же многочлены, что и ранее. Теперь реакция управляемой системы имеет вид, показанный на рис. 10.15.
Рис. 10.15. Реакция замкнутой системы с регулятором с активным демпфированием.
Сравнивая с рис. 10.14, видим, что серворегулятор ведет себя, как и раньше, но при этом еще подавляет колебательные режимы.
Сравнение двух подходов
Выше были рассмотрены два различных подхода к конструированию серворегулятора—с использованием фильтра-пробки и с активным подавлением колебательных режимов.
Для сравнения этих двух методов воспользуемся уравнением (10.51). Переменная х (рис. 10.1) связана с опорным сигналом и возмущениями следующим образом:
,,, ВТ . BR ... BS . .
Х ~~ AR+ BS Uc + AR + BS V ~ AR + BS е откуда следует, что фильтр-пробка не подавляет колебательных режимов, поскольку А„ является делителем знаменателя передаточной функции по возмущению v, но не по е 1). В случае же активного подавления делителем знаменателя является Д</, а не Ап, поэтому колебания подавляются сильней. Эффект подавления возмущений можно оценить, рассмотрев разность между выходным сигналом и тем же сигналом, прошедшим по всей цепочке обратной связи. Из рис. 10.1 следует, что эта воз-
*> Так как Ап является делителем S, но не R. — Прим. ред.
вратная разность равна
I । BS _ AR + BS
1 ' AR AR
и с учетом (10.55) и (10.56) имеет вид
Ат (z) Ап (z) До (2>;
A (z) R (z)
для фильтра-пробки и
Ат W)Ad(z) Ad(z)
A(z)R(z)
для случая активного подавления колебательных режимов. Ка чественная картина зависимости этой разности от частоты
Рис. 10.16. Величина возвратных разностей.
обоих случаев показана на рис. 10.16. Вообще говоря, эта j ность характеризует ослабление возмущений типа шумов ш рений на пути от точки их появления до выхода системы (10.!
Рис. 10.17. Диаграмма Боде для отношения AmT/(t0BmS), определяющего относительную точность модели, необходимую для устойчивости регулирования.
рад/с
Следовательно, метод активного подавления позволяет задемпфировать колебательные режимы.
Теорема 10.3 позволяет дать оценку необходимой точности модели. Относительная погрешность определяется выражением
1 I _| Ат(г)Т(г) Prall "fb '
На рис. 10.17 эта функция показана для |г| = 1. Видно, что метод активного подавления менее чувствителен к ошибкам моделирования, чем метод с фильтром-пробкой, который довольно остро реагирует на эти ошибки в окрестности резонансной частоты Ор.
Рассмотренный пример показывает, что метод конструирования характеристических многочленов является довольно гибким и полезным инструментом разработки регуляторов. Тем не менее при его реализации следует проявлять определенную осторожность, поскольку для систем высокого порядка (выше четырех) могут возникнуть осложнения вычислительного характера. А именно, возможны вычислительные трудности при решении полиномиального тождества (10.22).
ВЫВОДЫ
Рассмотрен метод размещения полюсов, основанный на алгебраических операциях над характеристическими многочленами. Процедура решения начинается с построения модели процесса Н, модели управляемой системы Нт и характеристического многочлена наблюдателя Ао. Алгоритм 10.1 приводит к регулятору, включающему обратную связь по измеряемому выходу и прямое воздействие трансформированного командного сигнала. При этом оказывается, что выбор модели управляемой системы и характеристического многочлена Ао сильно зависит от заданных физических параметров объекта.
ЗАДАЧИ
10.1. Методом Эвклида (см. приложение D) найдите наибольший общий делитель многочленов
В (z) = z3 - 2z2 + 1,45z - 0,35,
А (г) = 24 - 2,6г3 + 2,25г2 - 0,8г + 0,1.
10.2. Пусть задана импульсная передаточная функция = = 1/(9 + а) и передаточная функция управляемой системы /М?) = (1 + «)/(? + «)•
Пользуясь алгоритмом 10.1, постройте регулятор вида (10.4). Найдите характеристический многочлен управляемой системы. 10.3. Имеется система, заданная импульсной передаточной
функцией
rj z \ __ z + 0,7
П ~ z2—l,8z + 0,81 '
Постройте регулятор, такой что. характеристический многочлен управляемой системы имеет вид
г2- 1,5г+ 0,7. л
Пусть многочлен Ао имеет минимально возможную степень, а все его полюса лежат в начале координат. Рассмотрите два случая: нуль процесса компенсируется и нуль процесса не компенсируется. Промоделируйте оба случая и сравните регуляторы между собой. Какой из них следует предпочесть?
10.4. Предположим, что в системе (задача 10.2) имеется лишь обратная связь по ошибке, т. е. регулятор имеет вид
«(^) = -|-К(^) —
Найдите S/R, такое что при этом реализуется заданная система. Постройте характеристическое уравнение управляемой системы и сравните результат с результатом задачи 10.2. Рассмотрите, например, случай |а|> 1.
10.5. Имеется система, аналогичная рассмотренной в задаче 10.2. Предположим, что управляемая система должна подавлять ступенчатое возмущение на входе процесса, т. е. v на рис. 10 1 есть ступенька.
Проанализируйте, что будет происходить, если используется регулятор из задачи 10.2.
Постройте регулятор, решающий данную задачу.
10.6. Докажите равенство (10.41).
10.7. Имеется система с параметрами а = —0,9 и а = —0,5 (задача 10.2).
Непосредственными вычислениями определите чувствительность к ошибкам моделирования. Пусть регулятор построен для а =.—0,9. Исследуйте устойчивость управляемой системы, если полюс процесса лежит в точке а°.
Исследуйте влияние ошибок моделирования с помощью теоремы 10.3. Что будет происходить при уменьшении а?
10.8. Имеется система, аналогичная рассмотренной в задаче 10.2. Пользуясь соотношением (10.50), найдите максимальное значение управляющего сигнала как функцию от а и а при условии, что командный сигнал есть ступень.
10.9. В примере 10.6 рассмотрена задача конструирования регулятора для электродвигателя. Промоделируйте поведение системы и исследуйте чувствительность данного метода конструирования к выбору интервала квантования. Для определенности считайте, что параметры управляемой системы- соответствуют непрерывной системе второго порядка с коэффициентом затуха
ния £ = 0,7 и собственной частотой со = 1 рад/с. Сравните результат с рис. 10.9.
10.10. Имеется система, описываемая уравнениями:
Д (q) z (k) = В{ (q) и (k), Л (?) у (k) = В2 (?) z (k).
Пусть z(k) —управляемая переменная, a y(k) —измеряемый выход. Предположим, кроме того, что все корни Д2 лежат внутри единичного круга.
Постройте регулятор вида (10.4), такой что управляемая система будет иметь вид
(q)z(k) = Bm(q)uc(k).
При каких ограничениях это возможно? Как неопределенности в А2 и В2 влияют на импульсную передаточную функцию управляемой системы?
10.11. Имеется система из двух резервуаров (задача 3.10) при h = 12 с.
Пусть требуемое характеристическое уравнение управляемой системы имеет вид
z2 — l,55z +0,64 = 0,
что соответствует = 0,7 и со =0,027 рад/с.
Постройте соответствующий регулятор с интегратором. Постройте аналогичные регуляторы для других значений со и исследуйте зависимость величины управляющего сигнала от со.
10.12. Рассмотрите задачу регулирования электродвигателя (пример А.2). Покажите, что е помощью размещения полюсов можно построить регулятор с обратной связью по скорости вращения. (Ключ-, сначала введите только обратную связь по углу поворота, а затем покажите, что управление можно записать в виде комбинации обратной связи по углу и по скорости.)
10.13. Обобщите результат, полученный при решении задачи 10.12, на случай общего процесса с несколькими выходами.
ЛИТЕРАТУРА
Полиномиальный подход к задаче размещения полюсов
1. Kucera V. (1979): Discrete Linear Control. Prague: Academia.
2. Wolowich W. A. (1975): Linear Multivariable Systems. New York: Sprkiger-Verlag.
3. Pernebo L. (1981): "An Algebraic Theory for the Design of Controllers for Multivariable Systems — Part I: Structure Matrices and Feedforward Design and Part II: Feedback Realizations and Feedback Design. IEEE Trans. Autom. Control, AC-26, 171-82 and 183-94.
Метод, рассмотренный в данной главе, обсуждался в связи с адаптивными алгоритмами размещения полюсов в статье.
4. Astrom К. J., Wittenmark В. (1980): “Self-tuning Controllers Based on Pole-Zero Placement”, Proc. IEE, Part D, 127, 120-30.
f
Алгоритм Далина-Хигема был независимо предложен в работах
5. Dahlin Е. В. (1968): “Designing and Tuning Digital Controllers”, Instruments & Control Systems, 41, No. 6, 77-83.
6. Higham J. R. (1968): “'Single-Term' Control of First- and Second-Order Processes with Dead Time”, Control, February, .136,-40.
Модельный алгоритмический регулятор
7. Richalet J., Rault A., Testud J. L., Papon J. (1978): “Model Predictive Heuristic Control: Applications to Industrial Proeesses”, Automatica, 14, 413-28.
Методы построения оптимальных регуляторов
Построение оптимальных методов конструирования систем управления и решение задачи прогнозирования и фильтрации для систем, описываемых линейными уравнениями состояния с квадратичным критерием качества
ВВЕДЕНИЕ
В двух предыдущих главах задача синтеза управления решалась с помощью методов размещения полюсов. При этом в основном варьировалось расположение полюсов управляемой системы с одним входом и одним выходом. В данной главе рассматривается более общая задача оптимального управления. Предполагается, что процесс по-прежнему линеен, однако теперь он может быть нестационарным и иметь несколько входов и выходов. Кроме того, в рассматриваемых моделях учитывается зашумленность процесса и ошибки измерений. Задача синтеза оптимального управления ставится как задача минимизации критерия качества, являющегося квадратичной функцией переменных состояния и управления. Полученный в результате решения регулятор также является линейным. Такая задача, формальная постановка которой приводится ниже, называется линейно-квадратичной (ЛК) задачей оптимального управления, или линейно-квадратичной гауссовой (ЛКГ) задачей, — если в модель процесса входят стохастические возмущения с нормальной функцией распределения. Стационарное решение ЛК-задачи для стационарных систем приводит к оптимальному управлению с той же структурой, что и регулятор с обратной связью по состоянию (гл. 9). Такой ЛК регулятор также можно интерпретировать как регулятор, построенный методом размещения полюсов, Лишние степени свободы регулятора в многомерном случае «замораживаются» минимизацией функции потерь (критерия качества), а не фиксацией полюсов и собственных векторов управляемой системы, как это делалось в гл. 9.
ЛК-задаче оптимального управления посвящена обширная литература, поэтому в данной главе приводится лишь краткий обзор основных идей и полученных результатов.
Решение задачи основывается на теореме разделения или принципе эквивалентности определенности, сущность которого
состоит в том, что оптимальная стратегия управления разделяется на двр части: получение наилучших оценок переменных состояния по наблюдаемым выходам и синтез линейного оптимального управления по полученной оценке состояния. Построенный таким образом линейный регулятор имеет тот же вид, что и регулятор для случая отсутствия каких-либо возмущений в системе.
Постановка задачи
Для постановки задачи аналитического конструирования оптимального регулятора необходимо описать процесс, критерий качества и допустимые управления.
Процесс. Предположим, что регулируемый процесс описывается следующей непрерывной моделью:
dx = Ах dt + Ви dt + dvc, (11.1)
где А и В — некоторые матрицы, возможно зависящие от времени. Процесс имеет нулевое среднее и некоррелированные приращения. Дифференциальная ковариация vc есть R^cdt (разд. 6.5). Квантование модели (11.1) производится так же, как и в разд. 6.6, хотя здесь необходимы определенные модификации, поскольку система может быть нестационарной. Считая вход постоянным на интервале квантования, решение (11.1) для случая отсутствия шумов можно записать в виде
х (/) ф (t, kh) х (kh) + Г (t, kh) и (kh), (11.2)
где Q(t,kh)—фундаментальная матрица системы (11.1), удовлетворяющая уравнению
-^-Ф(/, kh)^=A(f)<T>(t, kh)-, ®(kh,kh) = I, (11.3)
а матрица Г(£, kh) определяется как
t
Г(/, kh) — ^Ф(/, s)B(s)ds. (П.4)
kh
Опуская временной аргумент у матриц, перепишем дискретную модель в виде
х (kh -ф h) = Фх (kh) + Ги (kh) + v (kh),
у (kh) = Cx (kh) -j- e (kh), (11.5)
где v и e — дискретный, гауссовский белый шум со следующими характеристиками:
Ev (kh) vT(kh) = Rb
Ev (kh) er (kh) — /?12, Ee(kh)eT(kh) = R^
Элементы ковариационных матриц определяются формулой (6.50). Кроме того, предполагается, что начальное состояние х(0) имеет нормальное распределение с £х(0)= т0 и cov[x(0)] = /?0.
Матрицы Ro, Ri и /?2 неотрицательно определены и могут зависеть от времени. Предполагается, что модель (11.5) достижима и наблюдаема.
Как отмечалось в гл. 9, увеличивая размерность пространства состояний, можно ввести в модель разные типы возмущений и учесть таким образом различные формы воздействия на систему окружающей среды.
Критерий качества. Цель управления состоит в минимизации функции потерь
NH
J = E
[хТ (t) Qlcx (0 + 2хТ (0 Q12cu (0 + иТ (0 Q2cu (0] dt +
+ xr(^)Qo^(W}.
(11.6)
где матрицы QOc, Qic и Q2c симметричны и положительно определены и могут зависеть от времени.
Допустимые управления. Важно четко определить структуру данных, на основании которых строится управление. Прежде всего предполагается, что производится периодическое квантование и сигнал управления остается постоянным на протяжении периода квантования.
Если С — единичная матрица и e(kh) в (11.5) равно нулю, то все фазовые переменные доступны для наблюдения. В этом случае допустимое управление может быть функцией фазовых координат для моментов времени до kh включительно. В подобной ситуации говорят о полной информации о состоянии. В большинстве случаев фазовые координаты, как правило, точно не известны, т. е. имеется неполная информация о состоянии. В таких ситуациях допустимое управление в момент времени kh может быть лишь функцией входных и выходных переменных для моментов времени до kh — h включительно.
Постановка задачи. Задача оптимального управления ставится как задача отыскания допустимого управления, минимизирующего функцию потерь (11.6) для процесса, описываемого моделью (11.1) или эквивалентной моделью (11.5). Параметрами, которые могут варьироваться при решении, являются матрицы, входящие в функцию потерь, и период квантования.
Квантование функции потерь
Функцию потерь в (11.6), записанную в непрерывном времени, прежде всего необходимо представить в дискретной форме. Разбив весь временной интервал на участки длиной h, перепи-
тем (Н-6) в виде
г (М-1 )
J = E< Z J(k) + xT(Nh)QOcx(Nh) (11.7)
I fe=O )
где
kh+h
l(k) = $ + (H.8)
kh
Подставляя (11.2) в (11.8) и учитывая постоянство u(t) на интервале квантования, получаем
/ (k) = хт (kh) QiX (kh) + 2хг (kh) Ql2u (kh) + uT (kh) Q2u (kh),
где
' kh+h
qi== J Фт(8, kh)Qic®(s, kh)ds, (11.9)
kh
kh+h
Qi2= jj ®r(s. kh)[Q[cr(s, kh) + Ql2c]ds, (11.10)
kh
kh+h
Q2 = J [rr(s, kh)Qlcr(s, kh) + 2£T(s, khjQ^ + Q^ds. (11.11) kh
Таким образом, если u(kh) постоянна на интервале квантования, то минимизация функции потерь (11.6) эквивалентна минимизации дискретной функции потерь:
{N-1
£ [хг (kh) Q^ (kh) + 2хт (kh) Ql2u (kh) + ur (kh) Q2u (kh)] + k=0
+ xT (N h) QqX (N h)}. (11.12)
Матрицы Qi, Qi 2 и Qi определяются выражениями (11.9) — (H.ll) соответственно, a Qo = Qoc- Ниже предполагается, что Qi неотрицательно определена, a Q2 положительно определена. Кроме того, предполагается, что Qi 2 = 0 (как это сделать, показано ниже).
В стохастическом случае к (11.12) добавляется дополнительный член, зависящий от шума, однако он не зависит от управления, и поэтому при минимизации его можно не учитывать.
Итак, задача оптимального управления сведена к дискретной задаче минимизации функции потерь (11.12) для процесса, описываемого системой уравнений (11.5). Для упрощения записи предполагается, что длина периода квантования выбрана в качестве единицы измерения времени, т. е. h = 1.
Преобразование функции потерь
Для упрощения записи представим функцию потерь в иной форме, для чего введем новое управление:
й = и + Мтх,
где М — Q12Q21 •
Система (11.5) принимает вид
х (k 4- 1) = Фх (k) 4- Гй (k) 4- v (k),
, y(k) = Cx(k) + e(k),
где Ф == Ф — Г Мт.
Функцию потерь (11.12) можно записать как
( М-1
J = Е | £ [х7 (й) Qix (й) 4- йг (й) 02й (й)] 4- хт (N) Qox (N)
(11.13) где
ф = ф — ГЛ17.
Таким образом, в преобразованной системе перекрестное произведение состояний и управлений исчезает, поэтому ограничимся случаем Q12 = 0.
Среднее значение квадратичной формы
Вычислим выражение вида ExrSx, где х — нормально распределенная случайная переменная со средним значением, равным т, и ковариационной матрицей R. Имеем
ExTSx = Е(х — т)т S(x — т) + EmTSx 4- ExTSm —
— EmTSm = Е(х — т)Т S (х — т) 4- nflSm.
Далее,
Е (х — т)Т S (х — т) = Е tr (х — т)Т S (х — т) =
— £ tr S (х — т) (х — т)г = tr SE (х — т) (х — т)Т = tr SR,
где tr SR — след матрицы S/?. Таким образом, ExTSx = tnTStn 4- tr SR. ' (11.14)
Выделение полного квадрата
В дальнейшем нам часто придется определять минимальное значение квадратичной формы. Один из часто применяемых методов решения этой задачи — метод выделения полного квадрата. Рассмотрим функцию
Е (и) = uTSu -J- гти 4- итг.
где S — симметричная положительно определенная матрица размера пХдга и и г — n-векторы Минимальное значение функции F(u) можно найти, переписав ее в следующем виде:
F (и) = uTSu 4- гти + итг —
— иSu гти 4- итг 4- rTS^lr — rTS~lr =
= (и 4- S_|r)r S (и 4- S-1r) - rrS-1r.
Поскольку по определению первый член всегда неотрицателен, минимум F(u) достигается при
п = —S~’r (11.15)
и его значение есть
/?rain = -r* * S * 7’S-1r. (11.16)
11.1. ЛИНЕЙНО-КВАДРАТИЧНОЕ УПРАВЛЕНИЕ
В данном разделе методом динамического программирования решается задача оптимального управления с полной информацией о состоянии системы.
Детерминированный случай
Рассмотрим сначала детерминированный случай, где в (11.5) v(k) = 0 и e(fe) = 0. Тогда система описывается уравнением
x(k+ 1) = Фх(й)4-Г«(й) (11.17)
с заданным начальным условием х(0). Задача состоит в отыскании последовательности и(0), «(1), ..., u(N—1), минимизирующей функцию потерь (11.12). Решение задачи дается следующей теоремой.
Теорема 11.1. Рассмотрим систему (11.17). Пусть u(k) яв-
ляется функцией от x(k), x(k— 1)...Введем процесс
S (k) = Ф75 (k 4- 1) Ф 4- Qi - LT (k) [Q2 4- (k 4- 1) Г] L (k) =
= [Ф — Г£]г5 (fe 4- 1) Ф 4-Q, =
= [Ф - r£]rS (k 4- 1) [Ф - Г£] 4- Q1 4- LTQ2L, (11.18) где матрица L определяется как
L(k) = (Q2 + VrS(k+ l)!TlFTS(k+ 1)Ф, (11.19)
а условие на правом конце имеет вид S(N)= Qo. Предположим, что S(k) имеет неотрицательно определенное решение и матрица Q2 4- r7S (/?) Г положительно определена. Тогда существует единственное допустимое управление
u(k)=-L(k)x(k), (11.20)
минимизирующее функцию потерь (11.12) при Qi 2 = 0. Величина минимума при этом равна
minZ = Vo = xr(0)S (0) х (0). (11.21)
Доказательство. Для доказательства теоремы воспользуемся методом динамического программирования. Введем величину Vk = min ЕIX' W (0 Qi (xi) + ит (i) Q2u (/)] + xT (N) Qox (AT))
и для k = N положим по определению Vn = xT(N)S(N)x{N), где S (N) = Qn.
Тогда для k = N — 1 имеем
min {xT(N- l)QlX(N- l) + uT(N- l)Q,u(N - 1)+VW). u(W-l)
(11.22)
Используя (11.5), получаем
И„_1== min \xT(N-l)Qlx(N-l) + uT(N-i)Q2u(N~i) + u(W-l)
+ [Ox((V- l) + r«(W- l)FS(W)[(Dx(W- 1) + Vu(N- 1)]} =
= min {xT(N— 1)[Q, + <l>TS(N)®]x(N - 1) + u(tf-l)
+ xT(N- l)®TS(N)ru(N-l) + u^N-l)rrS(N)®x(M - I) +
+ (N - 1) [Гг£ (N) Г + Q2] u (N - 1)}.
С учетом равенств (11.15) и (11.16) получаем, что управление
u(N — 1)= — L(N— l)x(W — 1)
дает минимальное значение функции потерь, равное
= хт (N — 1)S(N —l)x(W- 1), где
S(^-l) = ФтS(N)Ф + Ql-Lт{N-\)(Q2 + ГтS(^)Г)L(N-l) и
L (N - 1) = [Q2 + rrS (N) Г]"1 Гг5 (N) Ф.
Повторяя те же рассуждения, имеем
VN_2= min {хт (N — 2)QiX(N — 2)
+ ит (N - 2) Q2u (N - 2) + Kjv-,}.
Это выражение совпадает с (11.22) с той лишь разницей, что их аргументы отличаются на единицу. Повторяя обратный проход до конца, получаем значение Йо, равное искомому минимуму J.
Замечание 1. Отметим, что требование положительной определенности fQ2 не является необходимым; достаточно положительной определенности матрицы Q2 ф- ГГ£(Е)Г.
Замечание 2. Если в функции потерь присутствует перекрестное произведение, как в (11.12), то матрица усиления записывается в виде L (k) — [Q2 ф- Гг5 (k ф- I ) ГД-1 [rrS (k ф- 1) Ф ф- Qi\ ], и уравнение (11.8) принимает вид
S (k) = Фг5 (k ф- 1) Ф ф- Q, - U (Q2 ф- Гг5Г) L =
= (Ф - Г£)г S (fe Ф- 1) Ф + Q, - £rQ[2 =
= (Ф - ГЕ)г S (k ф- 1) (Ф - ГЕ) ф- Q, - ErQ[2 - Qi2L ф- LTQ2L.
Замечание 3. Вычисления, необходимые для построения ЛК-регулятора, можно провести вручную только для весьма небольших задач. На практике же необходимо иметь интерактивные пакеты программ, позволяющих вычислять оптимальное управление и моделировать поведение системы.
Уравнение Риккати
Уравнение (11.18) называется дискретным уравнением Риккати. Это уравнение можно записать в виде
S (/г) = [ф — ГЕ (kW S (k ф- 1) [Ф - ГЕ (fe)J ф- Qj ф- U (k) Q2L (fe).
(11.23)
Поскольку матрицы S(N)=Q0 и Qi по предположению симметричны и неотрицательно определены, S (k) также симметрична и неотрицательно определена.
Пользуясь уравнением Риккати, для функции потерь (11.12) без перекрестного произведения (т. е. Qi 2 = 0) можно доказать следующую теорему.
Теорема 11.2. Предположим, что уравнение Риккати (11.18) имеет решение, неотрицательно определенное на интервале 0
k N. Тогда
М-1
хт (У) Qox (У) ф- X [хг (k) Q,x (k) ф- ит(k) Q2u (fe)] = хт(0) S (0) х (0) ф-fe=0
М-1
+ Z [и (k) ф- Е (k) х (k)]T [rs (k ф- 1) Г + Q2] [и (k) ф- Е (k) х (k)] ф-fe=0
M-l
+ E {vT(k)S(k+ 1)[Фх(й)ф-Г«(й)] ф-
k=0
/V-l
ф- [Фх (k) ф- Ги (k)]T S (k Ф- 1) v (fe)) Ф- £ vT (k) S (k ф- 1) v (k),
(11.24) гдех(йф-1) определяется соотношениями (11.5).
Доказательство. Имеет место тождество
хт (N) Qox (N) = хт (N) S (N) х (JV) = хт (0) S (0) х (0) +
N—1
+ Е [xr(fe+ l)S(fe+ l)x(fe + 1) — хт (k) S (k) х (k)]. (11.25) k=0
Рассмотрим отдельные члены в правой части (11.25) и воспользуемся соотношениями (11.5) и (11.18). Тогда
xT(k+ i)S(k+i)x(k + l) = [®x(k) + Vu(k) + v (k)]T X
XS(k+ 1)[Фх(/г) + Ги(/г) + v\k)] (11.26)
И ’
xT (k) S (fe) x (fe) = xT (k) {Фг5 (fe + 1) Ф + Qi -
- LT (k) [TrS (k + 1) Г + Q2] L(k)}x(k). (11.27)
Подставляя (11.26) и (11.27) в (11.25), получаем
хт (TV) Qox (N) =*= хт (0) S (0) х (0) + Z {[Фх (k) +
+ Ги (fe)]J S (k + 1) v (k) + vT (k) S (k + 1) [Фх (k) + Г« (fe)J +
+ vT (k) S (k + 1) v (k)} + Z {uT (k) [TTS (k + 1) Г + Q2] u (k) +
+ uT (k) VTS (k + 1) Фх (fe) + xT (k) ®TS (k + 1) Г и (k) +
+ xT (k) LT (k) [Гг5 (k + 1) Г + Q2] L (fe) x (fe) —
— xT (k) Q[X (k) — uT (k) Q2u (k)},
где к последней сумме был добавлен и вычтен член uTQ2u. Приведение подобных членов и группировка завершают доказательство.
Полная информация о состоянии
Предположим, что v(k)=0 в (11.5), но начальное состояние включает некоторую неопределенность. Из теоремы 11.2 следует, что
(N~' 1
J = E] Е [x^t^Q.x^ + u^k^Q^ik^ + x^NjQoxtN)^
6=0 N 1
= Е {хт (0) S (0) х (0)} + ЕI Z ‘ [u (k) + L (k) х (k)]T X
I. k=0
X [rrS (k + 1) Г + Q2] [u (k) + L (k) x (k)] }.
Поскольку S(k) неотрицательно определена, второй член неотрицателен, и так как S(k) не зависит от u(k), то с учетом (11.14) получаем
J > Ехт (0) S (0) х (0) = m'S (0) mQ + tr S (0) 7?0, (11.28)
где равенство достигается при выполнении (11.20). Теоремы 11.2 и (11.28) д'ают альтернативный способ доказательства теоремы 11.1.
Предположим теперь, что на систему действуют стохастические возмущения и весь вектор состояний по-прежнему измерим. Используя теорему 11.2 и тот фдкт, что v(k) не зависит от u(k) и x(k), получаем
г М-1
J = e\ xT(Q)S(Q)x(Q)+ S vT(k)S(k + l)v(k) + 1. fe=0
+ z' [«(k) + L (k) X (k)]T [rs (k + 1) Г + Q2] [u (fe) + L(k) X (fe)J}. k=0
(11.29)
С учетом (11.14) имеем следующую оценку: м-i
J>m£S(0)mo + trS(O)flo+I, tr S (k + 1) /?,, (11.30)
где равенство достигается на допустимом управлении (11.20). При этом различие оптимальных значений функционалов (11.28) и (11.30) вызвано наличием возмущения v(k). Таким образом, оптимальное управление (11.20) минимизирует функцию потерь в случае наличия полной информации о состоянии процесса.
Решение ЛК-задачи дает нестационарный регулятор. При этом матрица обратной связи не зависит от х и может быть вычислена заранее для k, изменяющегося от N до 0, и записана в память ЭВМ. Обычно, однако, используются стационарные регуляторы, т. е. «предельные» регуляторы, построенные для случая неограниченно возрастающего временного диапазона регулирования. Дело в том, что для процессов и функций потерь, инвариантных по времени, матрица S(k) при довольно слабых предположениях стремится к постоянной при неограниченном возрастании временного диапазона регулирования. Вообще говоря, решение этой задачи неединственно. Если, однако, система (11.17) достижима, а пара (Ф, U)—наблюдаема, где
Q}=UT[Jt (11.31)
то существует единственное симметрическое и неотрицательно определенное решение уравнения Риккати. В том случае,' когда функция потерь содержит ненулевой перекрестный член Qi 2 #= =# 0, следует рассматривать матрицы Ф и Qi.
Пример 11.1. Л К-регулятор для интегратора второго порядка
Рассмотрим интегратор второго порядка (пример А. 1) с интервалом квантования h = 1. Пусть весовые матрицы в (11.12) имеют вид
Г 1 °1
Qi = |_0 oj и (22 = [р]-
profile
p=D,05
Рис. 11.1. Линейно-квадратичное управление объектом второго порядка при различных весовых коэффициентах управляющего сигнала.
Начальное значение состояния (сплошная линия) есть х [01^=[1, 0].
Управляющий сигнал показан пунктиром.
Рассмотрим их влияние на решение задачи, для чего вычислим установившийся вектор обратной связи при различных значениях р. На рис. 11.1 показаны состояния и управления процесса для некоторых значений р. Когда р — 0 (т. е. штрафуется только выход), оптимальный регулятор совпадает с апериодическим регулятором (разд. 5.3); при возрастании р величина управляющего сигнала уменьшается.
Свойства Л К-регулятора
Регулятор, построенный в разд. 9.1 методом размещения полюсов, и стационарный ЛК-регулятор имеют одинаковую структуру. Однако принципы их построения различны, и как следствие, их свойства несколько отличаются.
Линейный регулятор (11.20) с обратной связью по фазовым переменным имеет п параметров. Вообще говоря, довольно сложно непосредственно подобрать значения этих параметров так, чтобы обеспечить хорошее поведение управляемой системы. Вместо этого можно применить другую процедуру «настройки» параметров, а именно сначала выбрать п собственных значений замкнутой управляемой системы и затем использовать процедуру аналитического конструирования, описанную в разд. 9.1. Такой прием удобен для систем с одним входом и одним выходом. Однако здесь трудно найти приемлемый компромисс между реакцией системы управления и величиной управляющих сигналов.
ЛК-регулятор обладает рядом привлекательных свойств. Прежде всего его можно использовать в случае многомерных и нестационарных систем. Кроме того, варьируя относительную величину элементов весовых матриц, можно сбалансировать скорости отработки возмущений и величину управляющих сигналов. Более того, при определенных, ограничениях на систему (достижимость) и функцию потерь (симметричность и положительная определенность) ЛК-регулятор всегда приводит к устойчивой регулируемой системе.
Теорема об устойчивости регулируемой системы. Предположим, что система (11.5) стационарна, а функция потерь (11.12) такова, что Qi и Q2 положительно определены и Qi 2 = 0. Предположим, что существует положительно определенное установившееся решение S уравнения (11.18). Тогда установившееся оптимальное управление
и (k) = - Lx (k) = — (Q2 + ГГ$Г)~' Г75Фх (k) дает асимптотически устойчивую управляемую систему x(k + 1) = (Ф- TL)x(k).
Доказательство. Для доказательства асимптотической устойчивости воспользуемся теоремой 5.6. Необходимо показать, что функция V[x(k)] = xT(k)Sx(k) является функцией Ляпунова. По определению функция V положительно определена, поэтому в силу (11.23) имеем
ДК [х (fe)] = хт (k + I) Sx (k + 1) - хт (fe) Sx (k) =
= xT (k) [Ф —- Г£]г S [Ф — Г£] x (k) — xT (k) Sx (k) =
= -x7(fe)[Qi + L'rQ2L]^(fe).
Поскольку Qi 4- LTQ?L положительно определена, ДК отрицательно определена, поэтому замкнутая система асимптотически устойчива.
Полюса замкнутой системы можно найти несколькими способами. Например, после решения задачи полюса можно найти, решая уравнение det (М — Ф-|-Г£) = 0. Можно показать, что полюсами являются п устойчивых корней следующей обобщенной задачи на собственные значения:
ЧК Lb-Г “гсг'г1)=». (п.32) UQ1 ФЧ 1.0 / JJ
Уравнение (11.32) называется уравнением Эйлера для ЛК-ре-гулятора.
Теорема об определении полюсов управляемой системы с одним входом и одним выходом. Рассмотрим стационарную систему со скалярным входом и выходом и предположим, что известен синтез оптимального управления для установившегося состояния. Предположим, кроме того, что функция потерь штрафует только выходной и управляющий сигналы, т. е. Qi = СТС, Q2 = Р- Тогда полюса замкнутой системы совпадают с п корнями уравнения 2п-го порядка
р + H(z~l)H(z) = 0, (11.33)
лежащими внутри единичного круга, где
H(z) — C(zl -Ф)~* Г.
(Доказательство приводится в разд. 12.5.)
Пример 11.2. ЛК-регулятор для интегратора второго порядка
Для иллюстрации зависимости весовых матриц от полюсов замкнутой системы рассмотри^ еще раз пример 11.1. На рис. 11.2 показаны полюса за-
Рис. 11.2. Полюса замкнутой системы, удовлетворяющие уравнению (11.33), когда объект второго порядка управляется оптимальным регулятором.
р изменяется от U до w
мкнутой системы для различных значений р. При р = 0 годограф начинается в точках z = —1 и z = 0. С увеличением р корни сдвигаются по направлению к полюсам H(z), т. е. к z = 1.
Предельное усиление Л К-регулятора
Теорема об устойчивости регулируемой системы утверждает, что замкнутая система с ЛК-регулятором всегда устойчива. Помимо устойчивости можно определить и предельное усиление в замкнутой системе. Рассмотрим систему (11.5) с v(k) = e(k) = 0. Импульсная передаточная функция разомкнутой системы имеет вид
//(z) = C(z/ —Ф)-1 Г.
Предположим, что в функцию потерь (11.12) входят лишь входы и выходы, т. е. Qi = СТС, и что Qi 2 = 0. Пусть система
управляется установившимся Л К-регулятором с обратной связью по состоянию. Тогда регулятор описывается уравнениями
S = ФГ5Ф -Ь Q, — LTRL,
L = R~'VTSfo, (11.34)
r = rTsr + Q2. л
Матричное уравнение Риккати можно переписать в виде Q1 = (z~4 - Ф)т s(zl - Ф) + (z~'l - Ф)Г5Ф + Фг5(г/ - <ty+LTRL и воспользоваться им для вывода уравнения, аналогичного (11.33) и определяющего расположение полюсов замкнутой системы:
Q2 + Нт (z~l) Н (z) = Q2 + Гг (г~Ч - Ф)~ГСТС (zl — Ф)-1 Г —
= Q-2 + Гг {S + ХФ (zl - Ф)-1 + (z~4 - ф)~г ФГХ +
+ (г~Ч - Ф)“Г LTRL (zl — Ф)~'} Г =
— R + RL (zl - Ф)-1 Г + Гг (2' 7 - Ф)“г LTR +
+ Гг(2-7 - Ф)~г LJRL (zl - Ф)-1 Г =
= [/ + L (z~4 - Ф)"1 Г Г R [/ + L (zl - ФГ1 Г] =
= [/ +Я, (?-•)] W + (11.35)
где Ну (z) = L(zl — Ф)-1 Г.
Уравнение (11.35) определяет спектральное разложение матрицы Q2Нт (z~l) Н (z).
Рассмотрим случай с одним входом и одним выходом. Тогда H(z) = C(zl — Ф)-1Г — В(г)/Л (г), и замкнутая система имеет следующую передаточную функцию:
Н2 (z) = С [2/ - (Ф - Г£)]-1 Г = В (z)/P (z).
Далее, разность прямого и усиленного (прошедшего через контур обратной связи) выходных сигналов в системе с ЛК-регулятором есть
1 + £(///-Ф)_,Т = 4Й--
1 w ' А (г)
Следовательно, Ну (z) = Р
A (Z)
Предположим теперь, что вместо (11.20) используется уравнение
u(k) = — p£x(fe), (11.36)
где р — положительный скаляр. Тогда эта разность принимает вид
1 + $Hy(z).
Таким образом, устойчивость замкнутой системы с регулятором (11.36) определяется корнями уравнения
A (z) + р [Р (z) - A (z)J = О,
(11.37)
откуда можно получить предельное усиление, воспользовавшись методом корневого годографа или критерием Найквиста для (Р — А)/А. Поскольку А и Р — приведенные многочлены и deg Л = deg Р, то deg(P — Л)^ п— 1. Отсюда следует, что корневой годограф (11.37) по р имеет хотя бы одну наклонную асимптоту. По этой причине усиление дискретного ЛК-регуля-тора ограниченно в отличие от непрерывного, для которого такой конечной границы не существует.
В скалярном случае (11.35) можно переписать в виде
рЛ(2-1)Л(2)+ B(z~l) B(z) — rP(z~1)P(z), (11.38)
где г = ГГ5Г 4; Р- Используя (11.35), можно получить оценку для случая | z| = 1
11 + -P(--W(z-' |2=11+Hi {z) |2 р/г-
Таким образом,
Н + ряд^^р |j--i H-i + ^jz)^
>р||у- 11 — I 1 Ч- 771(г;)|| >0.
Последнее неравенство выполняется, когда ----------------------1 -------------— — . 1 + Vp/r 1 — Vp/r
(11.39)
Уравнение (11.39) дает оценку диапазона изменений значений р, при которых уравнение (11.37) имеет устойчивые корни.
Выбор весовых матриц
В приложениях теории оптимизации функция потерь в идеале должна определяться на основе физических рассуждений. Тогда в рамках ЛКГ-теории линейные уравнения состояния и квадратичный критерий качества можно трактовать как линейную аппроксимацию уравнений движения объекта и квадратичную аппроксимацию нелинейной функции потерь соответственно. К сожалению, такое упрощение возможно лишь в редких случаях, один из которых иллюстрируется следующим примером.
Пример 11.3. Управление судном
Линеаризованные уравнения, описывающие движение управляемого судна, можно записать в следующем виде:
d dt
«и
Й21 О
012
й22
1
(11.40)
где 6 — угол поворота руля, Ч*1 — угол разворота судна относительно продольной составляющей скорости, г — угловая скорость разворота, a v — скорость в направлении разворота. Относительная величина сноса, вызванного поворотом руля, описывается приближенным выражением
т
= hvr+p62]<H. (11.41)
A 1 J
О
Первый член в подынтегральном выражении представляет собой силу Кориолиса, а второй — величину сноса, вызванную поворотом руля.
Довольно часто построение естественной квадратичной функции потерь вызывает значительные трудности — даже в таких случаях ЛК-теория оказывается весьма полезной. В подобной ситуации вначале выбирают некоторую квадратичную функцию потерь достаточно произвольного вида. Затем, решая уравнение Риккати, получают синтез оптимального управления для выбранного критерия. После этого исследуют свойства полученной таким образом замкнутой системы: переходные режимы, частотные характеристики, робастность и т. д. Далее корректируют элементы функции потерь и повторяют всю процедуру до тех пор, пока не будут достигнуты требуемые свойства. Такой способ использования оптимизационных методов может показаться несколько странным. Не ясно, почему нельзя было бы воспользоваться, скажем, прямой регулировкой усиления обратной связи или методом размещения полюсов. Однако опыт показывает, что описанная итеративная процедура весьма удобна, поскольку она гарантирует устойчивость замкнутой системы в довольно широком диапазоне. Нередко выбор весовой матрицы, нужным образом влияющей на характеристики замкнутой системы, не вызывает затруднений. Вначале выбираются переменные г,, соответствующие важнейшим физическим показателям, и затем величины z2. с соответствующими весами вводятся в функцию потерь. При этом слабой реакции соответствуют большие весовые коэффициенты. Далее оценивается реакция замкнутой системы на типичные возмущения. Некоторую трудность вызывает определение относительных весов фазовых и управляющих переменных, что обычно делается методом проб и ошибок. Иногда вводятся ограничения на максимально допустимую дисперсию фазовых1) и управляющих координат при заданном воз-
11 Наличие фазовых ограничений резко усложняет задачу. — Прим, ред.
мущении. Одно из эмпирических правил решения такой задачи состоит в выборе диагональных элементов матрицы 5 в (11.16), равных обратным величинам значений допустимых дисперсий. Другой подход состоит в том, чтобы учитывать лишь ограничения на управления, а ограничения на переменные состояния вводить в критерий качества в виде штрафа. Если ограничения на управления квадратичные, то применение метода множителей Лагранжа приводит к критерию вида (11.12).
11.2. ТЕОРИЯ ПРОГНОЗИРОВАНИЯ И ФИЛЬТРАЦИИ
Для построения ЛК-регулятора весь вектор состояния должен быть наблюдаем. В данном разделе обсуждается проблема оценивания состояний системы (11.5) по измерениям выходных переменных. Однако вектор коэффициентов усиления теперь определяется иначе, чем в разд. 9.2, и задача ставится как задача параметрической оптимизации, в которой минимизируется автокорреляция ошибки оценивания.
Прогнозирование, фильтрация и сглаживание
На основании имеющихся измерений можно построить различные оценки фазовых переменных модели (11.5). Предположим,
Рис. 11.3. Сглаживание, фильтрация и прогнозирование.
что известны следующие данные: Yk={y(i),u(i)/i^.k}. Цель состоит в получении оценки x(k-\-m) по известным Yk. Возможны три случая (рис. 11.3):
• сглаживание (т<0).
• фильтрация (т = 0).
• прогнозирование (т>0).
Независимо от того, какая из последних двух задач прогнозирования или фильтрации решается, получающаяся динамическая система называется фильтром,
Фильтр Калмана
Рассмотрим' задачу прогнозирования на один шаг вперед и предположим, что процесс описывается системой уравнений (11.5) с h = 1. Предположим для простоты, что Pi 2 = 0. Пусть оценка состояния вычисляется по уравнению
х(/г + 1|Л) = Фх(/г|/г- I) + Tu(k)+ 'K(k)[y (k) - Сх (k\k - 1)].
(11.42)
Ошибка восстановления х = х — х удовлетворяет уравнению x(k+ l) — ®x(k) + v(k) — K(k)[y(k) — Cx(k\k — 1)] =
= [Ф - К (k) С] х (k) + v (/?) - К (k) е (k). (11.43)
В разд. 9.2 для получения нужных значений корней этого уравнения варьировались элементы матрицы К; Здесь же принят иной подход, при котором учитываются свойства шума, и критерий качества состоит в минимизации дисперсии ошибки оценивания P(k)'.
P(k) — E [х (k) — Ex (&)] [х (/г) - Ex (/?)]т.
Среднее значение х получается из (11.43):
Ex (k + 1) = [Ф - К (k) С] Ex (k).
Поскольку Ех(О)=то, то независимо от Р среднее значение ошибки восстановления равно -нулю для всех k 0, если Ех(0)= то. Из уравнения (11.43) теперь получаем
P(k+ l) = Ex(k+ l)x(k+ 1)г =
= [Ф - К (k) С) Р (fe) [Ф - К (/г) СГ + Ri + К (k) R2R (k)T, (11.44) так как x(k), v(k) и e(k) независимы. Далее, P(0)=Ro. Из (11.44) следует, что если P(k) неотрицательно определена, то и P(k~y 1) неотрицательно определена. Предполагается, что критерий качества состоит в минимизации скаляра aTP(k-[- 1)а (здесь а — произвольный вектор). Кроме того, предполагается, что вплоть до момента времени k — 1 использовался оптимальный вектор усиления К. Тогда из уравнения (11.44) следует аТР (k + 1) а = аг {ФР (/?) Фг + R, - К (k) СР (/?) Фт -
- ФР (k) СТКТ (k) + к (/г) [R, 4- СР (k) Сг] Кт (/г)) а. (11.45)
Усиление K{k) можно найти из (11.45) выделением полного квадрата:
атР (k + 1) а = ат {фР (*) Ф7, + Rt -
- ФР (k) Ст [Р2 + СР (k) СТ' СР (/г) ФГ) а +
4- {К (k) - ФР (/г) ст (R2 + СР (k) cq-4 fp2 + СР (k) cq X
X [к (/г) - ФР (k) С‘ (Р2 + СР (k) cq-'f} а. (11.46)
Правая часть (11.46) содержит два слагаемых: первое не зависит от К, а второе неотрицательно, поскольку матрица Р2 + СРСТ положительно определена. Таким образом, минимум достигается, если К. выбрано таким образом, что второе слагаемое обращается в нуль. Тогда
К (/?) = ФР (/г) Ст [Р2 + СР (/г) С2]-’ (11 -47)
Р(/г+ 1) = ФР(/г)ФГ + Р1 -
- ФР (/г) Ст [Р2 + СР (/г) СГ]"1 СР (k) Фт. (11.48)
♦♦♦ Заметим, что К не зависит от а и что (11.44) выполняется и при оптимальном K(k). Восстановление, определяемое выражениями (11.42), (11.47) и (11.48), называется фильтром Колмана. Изложенное выше можно сформулировать в виде следующей теоремы.
Теорема 113. Фильтр Калмана. Рассмотрим процесс (11.5). Восстановление состояния с помощью модели (11.42) оптимально в смысле минимума ошибки восстановления, если матрица Р2 + CP(k)CT положительно определена, а матрица усиления удовлетворяет (11.47) и (11.48). При этом дисперсия ошибки восстановления определяется выражением (11.48).
Замечание 1. Структура оператора оценивания (11.42) позволяет свести задачу восстановления к параметрической задаче оптимизации. На самом деле эта структура оптимальна для гауссовских возмущений. Критерий качества можно еще интерпретировать как минимизацию ошибки оценивания линейной комбинации состояний.
Замечание 2. Традиционное обозначение Р(/г) для дисперсии лучше заменить на P(k\k — 1), явно показывающее, что используются наблюдения вплоть до момента времени k — 1. Члены уравнения (11.48) можно интерпретировать следующим образом: член ФРФГ описывает изменение дисперсии при изменениях динамических характеристик системы; Pi отражает увеличение дисперсии с увеличением шума v [ср. с (6.20)]; последний член описывает уменьшение дисперсии по мере появления новой информации в результате измерений.
Отметим, что P(k) не зависит от наблюдений, поэтому усиление можно рассчитать заранее и записать в память ЭВМ.
Замечание 3. Фильтр Калмана можно также интерпретировать как условное среднее состояния в момент k -ф- 1 при заданном Yk, т. е.
x(k + 1 \k) = E{x(k+ 1) |Kfe),
Р (k + 1) = Е {[х (k + 1) - х (k + 11 fe)] [x (k + l)-x (k+1 | k)]T | Yk}'
Замечание 4. Если Ri 2 ¥= 0, то уравнения (11.47) — (11.48) принимают в,ид
K(k) = [ФР (k) Ст + Р12] [СР (k) ст + Р2]-’
Р (k + 1) = ФР (/?) Фг + Р1 - К (k) [СР (k) Ст + Р2] кт (k).
Остальные уравнения при этом остаются неизменными.
Замечание 5. Предиктор в (11.42) обладает тем свойством, что состояние в момент k восстанавливается по известным y(k—1), y{k — 2) ... . Можно построить фильтр, в котором для оценивания x(k) используется и y(k). Соответствующее уравнение при этом имеет вид
£ (k + 1 | k + 1) = Фх (k | k) + Ги (k) + K(k -f- 1) [y (k + 1) —
-С(Фх(6|/г)Ч-Ги(/г))], (11.49)
где
к (k) = p (k । k -1) cqp2 + cp (k । k -1) cq-1, p(k\k—1) = ФР(1?—l\k — 1)ФГ + Р1;
P(k\k) = P(k\k- l)-K(k)CP(k\k- 1), ( L5U)
P(0|O) = Po.
Здесь P(k) заменено на P(k\k — 1) для явного обозначения имеющихся данных; P(k\k) при этом можно интерпретировать как дисперсию ошибки оценивания в момент k при известном Yk-
Пример 11.4
Рассмотрим скалярную систему
X (k + 1) — X (fe),
У (fe) = х (fe) + е (k).
Пусть о — стандартное отклонение шума е, а среднее и дисперсия равны —2 и 0,5 соответственно. Состояние постоянно и должно быть восстановлено из зашумленных наблюдений. Фильтр Калмана определяется следующими уравнениями:
X (k + 1 I k) = X (k | k - 1) + К (fe) [у (fe) - X (k I k - 1)], (11.51)
К (fe) = P (fe)/[o2 + P (fe)], (11.52)
P (k + 1) = o2P (fe)/[o2 + P (fe)].
Дисперсия и усиление убывают со временем. На рис: 11.4 показана динамика ошибки оценивания при использовании фильтра Калмана и уравнения (11.51) с постоянным усилением. При большом постоянном усилении ошибка быстро убывает, однако в установившемся состоянии дисперсия довольно велика. При небольшом постоянном усилении ошибка убывает медленно, но в установившемся состоянии качество управления лучше.
Пример 11.5
Рассмотрим систему первого порядка
y(k) + ay(k— l)=e(k) + ce(k- 1) (11.53)
Рис. 11.4. Ошибка оценивания для системы описанной в примере 11.4, при о=1.
а — К=0,01; б—К==0.08; в — оптимальное усиление (11.52).
со стандартным отклонением шума е, равным о, и |с| < 1. В фазовом пространстве система описывается уравнениями
х (k + 1) = — ах (k) + е (fe),
(k) = (с — а) х (/г) + е (k).
Легко проверить, что фильтр Калмана в установившемся состоянии характеризуется равенствами Р — 0 и К — 1. Одношаговый предиктор для х имеет вид
Т (fe + 1 | k) = — ox! (k | k — 1) + у (k) — (c — a) x (k | k — 1) = = - cSt (k | k - 1) + у (k)
Одношаговый предиктор для выхода в установившемся состоянии дается уравнением
$ (fe + 11 k) = (с - a) + 1 | k) = y(k).
L -j- cq
Частотные свойства фильтра Калмана
При конструировании регуляторов оптимизационными методами моделирование играет особо важную роль, поскольку оптимальный регулятор, или оптимальный фильтр, является просто не
которым преобразованием модели. В связи с этим полезно иметь представление о свойствах этого преобразования. Для лучшего понимания методики построения фильтров Калмана исследуем их частотные характеристики.
Рассмотрим задачу оценивания состояния системы
х(&+ 1) = Ф1* (&) + 'О (k)
по зашумленным наблюдениям
y(k) = Clx(k) + n{k),
где шум п удовлетворяет уравнениям
п (k) = C2z (k) + е (fe), z (k + 1) = ФоЗ (k) + w (k).
В этих моделях {u(fe)}, {e(fe)} и {w(k)}—последовательности некоррелированных случайных переменных. Фильтр Калмана для предсказания х на шаг вперед в установившемся состоянии имеет вид
Г*(/г+1)1 Гф1 0 1 Г *11 г
L*+о Н о ®J L <J+u f м~с'* <«-««
или
Г t(k + 1) 1 = Г Ф! - К1С, -К,С2 ipm Lz(fe + i)J L -ка ф2-к2с2JU(fe)J +
(11.54)
Таким образом, фильтр Калмана определяется импульсной передаточной функцией
zl - Ф, + КД KtC2 1-‘ Г Ki j K2t>i zl — Ф2 -|- К2С2 J L К2 J
(11.55)
описывающей усиление фильтра на разных частотах. При проектировании фильтра Калмана полезно построить для него функцию частотного отклика. Хотя эта функция, вообще говоря, довольно сложным образом зависит от модели, ее некоторые свойства общего характера можно получить без детального анализа.
Г 1 У {k).
L Д2 J
#(£) = [/ 0][
Лемма 11.1. Нули импульсной передаточной функции (11.55) стационарного фильтра Калмана являются корнями уравнения det [zl — Ф2] = 0.
Доказательство. Нуль передаточной функции есть комплексное число z, такое что входной сигнал вида zkyo порождает нулевой выходной сигнал. Для системы (11.54) это означает, что
z(k)=zozk, где —oo < k < oo, » y0 ф 0, так что
К । Уо — 0,
(zl — Ф2 + KzC2) z0 — К2У0 = 0,
или
KA zl — Ф2 + K2C2
-Ki
-K2
I
-a
Это условие, очевидно, выполняется, если у0 =£ 0 и z0 =# 0 для тех z, которые являются собственными значениями матрицы Фг-
Таким образом, нули фильтра Калмана располагаются в полюсах модели шума, поэтому для получения фильтра Калмана, блокирующего определенные частоты (заграждающий фильтр или фильтр-пробка), достаточно выбрать модель шума, имеющую полюса на этих частотах. Подавление фильтром Калмана определенных частот увеличивается, если на этих частотах возрастает интенсивность шума.
11 .3. ЛИНЕЙНО-КВАДРАТИЧНОЕ ГАУССОВСКОЕ УПРАВЛЕНИЕ
В ЛКГ-задаче предполагается, что система удовлетворяет уравнениям (11.5), а функция потерь определяется выражением (11.12) с <212=0. Предполагается также, что допустимые управления таковы, что u(k) является функцией Yk-i. Это означает, что в системе имеется временная задержка в один интервал квантования.
Теорема 11.2 и равенство (11.29) остаются в силе и в случае неполной информации о состоянии. Поскольку (11.20) не является допустимым управлением, третий член в (11.29) нельзя сделать равным нулю. Решение этой задачи дается следующей теоремой, приводимой здесь без доказательства.
Теорема 11.6 (теорема о разделении). Рассмотрим систему (11.5). Пусть допустимое управление таково, что u(k) есть функция от Ул-ь Предположим, что (11.18) с начальным условием S(N)=Qo имеет неотрицательно определенное решение S(k) и матрица TTS (fe) Г + <2г положительно определена. Тогда существует единственная допустимая стратегия управления
u{k) = — L(k) x(k\k — 1), (11.56)
Рис. 11.5. Теорема о разделении.
минимизирующая функцию потерь (11.12) при Q12 —0. Минимум функции потерь дается выражением
лг-1
] = m^S (0) т0 + tr S (0) Ro + £ tr 5 (k + 1) R> +
k= 0
N-1
+ X tr P (k) U (k) [PS (k +1) г + Q2] l (k).
(11.57)
Замечание 1. Различие минимальных значений функций потерь (11.30) и (11.57) обусловлено тем, что в последнем случае производится оценивание фазовых координат.
Замечание 2. Теорему 11.6 можно распространить на другие допустимые стратегии управления, например на случай, когда u(k) является функцией Yk-i и y(k).
Одним из следствий теоремы о разделении является тот факт, что задачу синтеза можно разделить на две части и решить каждую из них по отдельности. Первая задача — это детерминированная задача оптимального управления, решение которой дает L(k), а вторая — задача оценивания состояния с помощью фильтра Калмана. Блок-схема системы оптимального управления показана на рис. 11.5,
Двойственность
Решения ЛК-задачи оптимального управления и задачи оценивания состояния во многом аналогичны. Можно даже показать, что эти задачи эквивалентны. Их эквивалентность демонстрируется следующей таблицей, показывающей замену переменных, необходимую для преобразования задачи оптимального управления в задачу оценивания состояния:
Задача оптимального управления Задача оценивания состояния Задача оптимального управления Задача оценивания состояния
k Э N — k Qi я,
ф ФГ Q1 2 Я1 2
г Ст S р
Qo Яо L кт
Свойства замкнутой системы
Замкнутая система ЛКГ-управления имеет вид
х (k + 1) = Фх (/г) + Ги (k) + v (/г),
у (k) = Сх (k) + е (/г),
и (fe) = — Lx (k | k — 1),
х(/г + 1 |/г) = Фх (/г |/г — 1) + Ги(/г) + Я [у (/г) - Сх (61 Ai - 1)]. Вводя х и х = х — х, эти уравнения можно записать в виде р(6+ 1)1 ГФ —ГЛ ГЛ T Г л: (Аг) ] Г/]
lx(fe + l)J L О Ф-ЯСЛхШ +Ь.Г(/г) +
Динамика замкнутой системы определяется матрицами Ф — ГЛ и Ф — КС, т. е. динамикой соответствующей детерминированной ЛК-задачи и динамикой оптимального фильтра (ср. с разд. 9.3).
Задача серворегулирования
Эта задача обсуждалась в разд. 9.4 для регулятора с обратной связью по состоянию. В ЛКГ-задаче также можно ввести опорный сигнал аналогично тому, как это сделано на рис. 9.7. Единственная разница состоит в том, что здесь матрица обратной связи получается минимизацией квадратичной функции потерь.
11. 4. ПРАКТИЧЕСКИЕ АСПЕКТЫ
В предыдущих разделах было показано, как строятся решения ЛК- и ЛКГ-задач оптимального управления, однако при практической реализации этих решений возникает ряд трудностей.
Одна из них связана с выбором параметров регулятора — весов в функции потерь и интервала квантования. Другая порождается сложностью построения хорошей модели процесса и шума. Еще одна трудность возникает при реализации необходимых вычислений.
Сложность модели •"
Одним из недостатков ЛК-управления является необходимость построения точной модели полного порядка для управляемого процесса. Хотя большинство физических процессов описывается моделями высокого порядка, для целей управления часто можно ограничиться приближением более низкого порядка. (Способы построения таких моделей описываются в гл. 13.)
Снижение чувствительности к ошибкам моделирования может быть достигнуто за счет сужения полосы пропускания замкнутой системы путем подбора весовых коэффициентов функции потерь (см. также разд. 5.1, где обсуждается робастность систем). Другой способ сводится к введению искусственного шума так, что ковариации шума, используемые при построении фильтра Калмана, превосходят их фактические значения.
Решение уравнения Риккати
Во многих случаях используются только предельные оптимальные регуляторы, т. е. такие, в которых реализуются лишь установившиеся решения уравнений Риккати (11.18) и (11.48). Существует несколько способов численной реализации такого подхода. В одном из них значения S или Р предполагаются постоянными и решаются алгебраические уравнения Риккати. Затем эти уравнения решаются итеративно до тех пор, пока не будет получено установившееся решение. При этом, однако, важно проводить вычисления таким образом, чтобы решение было симметричным и положительно определенным. Для решения уравнения Риккати были разработаны специальные численные методы, такие, как метод квадратного корня и метод удвоения. В методе квадратного корня используется квадратный корень из S или из Р, что улучшает численную устойчивость алгоритма. В методах удвоения, или быстрых методах, по известному решению для момента k строится решение для момента времени 2k. Численным методам решения уравнения Риккати посвящено много книг и статей.
Выбор периода квантования
Выбор периода квантования зависит от того, как сформулированы требования к системе управления. Рассмотрим два случая.
Предположим сначала, что требуется построить регулятор, гарантирующий заданный коэффициент относительного демпфирования и реакцию замкнутой системы без чрезмерно боль
ших управляющих сигналов. В этом случае естественно строить регулятор, подбирая весовые коэффициенты функции потерь (11.12). Для этого вначале на основе заданных параметров выбирают ориентировочное значение периода квантования (разд. 9.1), а затем итеративно корректируют эту величину, наблюдая динамику получающейся замкнутой системы.
Допустим теперь, что требования к регулятору заданы в терминах непрерывной функции потерь (11.6). В этом случае функция потерь минимизируется непрерывным ЛК-регулятором. Поскольку при малых значениях периода квантования h потери возрастают квадратично в зависимости от h, существует некоторый практический предел, ниже которого уменьшать период квантования уже не имеет смысла. Можно получить приближенную зависимость величины потерь от длины интервала квантования. Если имеется хорошая интерактивная программа расчета регуляторов, то нетрудно прикинуть возможные значения потерь и оценить качество регулирования для нескольких различных периодов квантования.
ВЫВОДЫ
В данной главе рассматривались методы конструирования регуляторов, основанные на идеях пространства состояний. Описанные здесь ЛК-регуляторы и фильтры Калмана обладают множеством полезных свойств, рассмотренных лишь в общих чертах. Основная проблема, связанная с реализацией ЛК-управ-ления, состоит в построении функции потерь, учитывающей заданные требования к системе управления. Обычно построение этой функции сводится к итеративной процедуре, для реализации которой нужны хорошие интерактивные программы.
ЗАДАЧИ
11.1. Имеется система первого порядка: х =—ах 4- Ьи. Предположим, что требуется минимизировать функцию потерь (11.6) С Qi с = 1 И Q2-c = р. Постройте соответствующую дискретную функцию потерь (11.12).
11.2. Имеется непрерывный интегратор второго порядка (пример А. 1). Пусть требуется минимизировать функцию потерь (11.6), где
Г 1 °1
Qic== | q j J и Qzc==
Найдите Qi, Qi2 и Q2 для соответствующей функции потерь (11.12). 11.3. Имеется система x(k ф- 1) = ax(k) + bulk) с функцией по-
Пусть допустимая стратегия управления такова, что u(k) есть функция от х. Найдите стратегию управления, минимизирующую потери.
11.4. Рассмотрим систему из задачи 11.3. Найдите стратегию управления, минимизирующую потери, если допустимая стратегия управления такова, что u(k) есть функция от x(k—1). 11.5. Имеется модель снабжения (пример А.5), описываемая уравнениями
Г1 11 ГО 1
х(/г-|-1) = ^0 0 ]х(/г) + [ j J«(A!),
#(/г) = [1 0]х(/г).
а) Постройте предельный ЛК-регулятор при Qi = I и Q2 = р. б) Найдите полюса замкнутой системы и исследуйте их зависимость от весового коэффициента при управляющем сигнале р. в) Промоделируйте поведение системы, управляемой регулятором из (а), положив х(0)г = [1 1] и исследовав выходной и управляющий сигналы при различных значениях р.
11.6. Имеется система двух резервуаров с импульсной передаточной функцией, приведенной в задаче 3.10(6). На основе уравнения (11.33) постройте корневой годограф, описывающий полюса замкнутой системы, если она управляется предельным ЛК-регулятором с функцией потерь
оо
7 = Е[г/(/г)2 + р« (&)2]-*=о
11.7. Покажите, что апериодический регулятор (регулятор, для которого все собственные значения матрицы Ф — YL равны нулю) можно получить путем дискретной оптимизации при Q2 = 0, Qi = 0 и Qo = /.
11.8. Рассмотрите задачу управления судном, описываемую моделью (11.40) с функцией потерь (11.41). Пусть «ц = —0,454, «12 = —0,433, «2, = —4,005, «2 2 = —0,807, Ь, = 0,097, Ь2 = =—0,807, а = 0,014 и р = 0,08. Постройте оптимальный синтез, если h — 5 с.
11.9. Задачу управления судном иногда записывают в еще более простой форме, используя модель второго порядка:
dt [ г
и следующую аппроксимацию функции потерь:
т
7= lim-И [Ф2 + рб2]Л.
1 *'яТ о
Постройте синтез оптимального дискретного управления для следующих значений параметров: а = 0,001, k = 0,0005, р = = 0,08 и h = 5 с.
11.10. В случае ЛК-регулятора, описанного в задаче 11.5, найдите с помощью (11.39) оценку диапазона усиления замкнутой системы. Определите из уравнения (11.37) точные границы усиления и сравните с полученной оценкой.
11.11. Стохастический процесс описывается следующими уравнениями:
х (k 4- 1) = 0,5х (/г) 4- v (/г)
У (k) = х (k) 4- е (/г),
где v и е — некоррелированные случайные процессы типа белого шума с ковариациями г\ и г2 соответственно. Пусть х(0) нормально распределена с нулевым средним и стандартом о.
Постройте для данной системы фильтр Калмана. Определите усиление в установившемся состоянии, найдите полюс предельного фильтра ц сравните его с полюсом системы.
11.12. Интегратор второго порядка для зашумленного процесса можно описать следующей системой уравнений:
Г 1 1 1 г 0,5 1 Г 0 1 х(/г4-1) = [0 1J-v(fe)4-[ j ] « (k) 4- [ j J v (k)
y{k) = [l 0]x(k),
где v(k)—последовательность независимых нормально распределенных случайных переменных с нулевым средним и единичной дисперсией. Пусть х(0) нормально распределена со средним, равным Ех(0) = [1 1]т и единичной ковариационной матрицей.
Выведите уравнения для ковариационной матрицы ошибки восстановления и вектора усиления фильтра Калмана. Исследуйте скорость сходимости решений этих уравнений к установившимся значениям и найдите эти значения.
11.13. Пусть в предыдущей задаче выход описывается уравнением
y(k) = [l 0]x(k) + v(k).
Найдите уравнения для ковариационной матрицы ошибки восстановления и вектора усиления фильтра Калмана. Исследуйте скорость сходимости решений этих уравнений к установившимся значениям и найдите эти значения.
11.14. Имеется система
Г 1 Ч Г 0 1 Г 0,5 I х(/г4-1) = [0 j Jx(fe)4- [ j J v(fe)4- [ ! J г/(/г) = [1 0]x(fe),
где v(k)—белый шум с нулевым средним и стандартом 0,1. Предположим, что известно точное значение х(0).
Найдите оценку х(&4~3) при заданном y(k), минимизирующую ошибку прогнозирования. С помощью этой оценки найдите наилучшую оценку у(3) и его дисперсии.
11.15. Сигнал x(k) описывается системой«уравнений
х (k + 1) = ах (k) 4- v (k) y(k) = x (k) + e (k), где v и e—независимые процессы типа белого шума с нулевым средним и дисперсиями 1 и о соответственно. Сигнал х оценивается с помощью экспоненциального сглаживания:
x(k\k) = ax(k — 1 \k- 1) + (1 -a)y(k).
Найдите зависимость дисперсии ошибки оценивания от параметров а и о. Сравните полученное выражение с предельным оптимальным фильтром Калмана.
11.16. Покажите, что теорему 11.5 можно обобщить на случай, когда возмущения e(k) и v(k) имеют постоянные, но неизвестные средние значения (ср. с разд. 9.3).
11.17. Постоянная переменная х измеряется двумя различными датчиками, однако измерения зашумленные и производятся с различной погрешностью. Пусть система описывается уравнениями
x(k + l) = x(fe) у(/г) = Сх(/г) + е(/г),
где Ст = [ 1 1], a e(k) —вектор белого шума с нулевым средним и ковариационной матрицей
Г 1 01
Ио 9 ]’
а х оценивается следующим образом:
х (/г) = a,#! (fe) 4- а2у2 (k).
Подберите константы ai и а2 таким образом, чтобы среднее значение ошибки прогнозирования было равным нулю, а ее дисперсия минимальна. Сравните минимальную дисперсию со случаем, когда используется только один датчик. Сравните полученный результат с фильтром Калмана.
11.18. Докажите, что оценки (11.49) и (11.50) дают оптимальный фильтр в смысле минимизации дисперсии ошибки оценивания.
11.19. Конструирование фильтра Калмана осуществляется для оценки скорости вращения электродвигателя по измерениям угла поворота вала. Основная динамическая характеристика
двигателя, связывающая угол поворота с силой тока, дается выражением
G(s) = , ‘
V ’ S (s + 1)
Предположим, что имеются низкочастотные возмущения (трение), описываемые уравнением Zi (k + h) = Zi (fe) + w} (k). Предположим также, что требуется отфильтровать эти возмущения в связи с возможностью механического резонанса на частоте со. Этот сигнал моделируется как управляющий сигнал для системы с передаточной функцией
G (s) ‘ -z , ™—v—г » ' 7 sz + 2g(os + со2
и белым шумом.
Постройте диаграммы Боде для фильтра Калмана при £ = = 0,05; со = 0,1; со = 2 и периоде квантования 0,05 с. Сравните по порядку величины влияние низкочастотных возмущений и возмущений, лежащих в ограниченном частотном диапазоне.
ЛИТЕРАТУРА
ЛКГ-управление и оптимальные фильтры
1. Kwakernaak Н., Sivan R. (1972): Linear Optimal Control Systems. New York: Wiley-Interscience.
2. Anderson B. D. O., Moore J. B. (1971): Linear Optimal Control. Englewood Cliffs, N. J.: Prentice-Hall, Inc.
3. Astrom K. J. (1970): Introduction to Stochastic Control Theory. New York: Academic Press.
4. Anderson B. D. O., Moore J. B. (1979): Optimal Filtering. Englewood Cliffs, N. J.: Prentice-Hall, Inc.
Теория рекурсивных оптимальных фильтров
5. Kalman R. E. (1960) “A New Approach to Linear Filtering and Prediction Problems”, Jornal Basic Eng., 82, March, 34-45.
6. Kalman R. E., Bucy R. S. (1961): “New Results in Linear Filtering and Prediction Theory”, Trans. ASME, Ser. D, Journal Basic Eng., 83, December, 95-107.
7. Bucy R. S. (1959): “Optimum Finite Time Filters for a Special Nonsta-tionary Class of Inputs”, Internal memorandum BBD-600, John Hopkins University. Applied Physics Lab.
Численные алгоритмы решения уравнения Риккати
8. Bierman G. (1977): Factorization Methods for Discrete Estimation. New York: Academic Press.
9. Pappas T., Laub A. J., Sandell N. R., Jr. (1980): “On the Numerical Solution of the Discrete Time Riccati Equation”. IEEE Trans. Autom. Contr., AC-25, August, 631-41.
10. Van Doorsen P. (1981): “A Generalized Eigenvalue Approach for Solving Riccati Equations”, SIAM Journal Sci. Stat. Comp., 2, 121-35.
Выбор интервала квантования для ЛК-регуляторов
11. Astrom К. J. (1963): “On the Choice of Sampling Rates in Optimal Linear Systems”, Internal Report IBM San Jose Research Laboratory.
12. Melzer S. M., Kuo В. C. (1971): “Sampling Period Sensitivity ot the Optimal Sampled Data Linear Regulator", Automatica, 7, 367-70.
Теорема о разделении
13 Simon Н. А (1956): “Dynamic Programming under Uncertainty with a Quadratic Criterion Function’’, Ecorometrica, 24, 74.
Дискретный вариант теоремы о разделении
14. Gunkel III Т. L., Franklin G. F. (1963): “A General Solution for Linear Sampled Data Control”, Trans. ASME Journal Basic Eng. 85-D, 197-201.
Диапазон усиления дискретных ЛК-регуляторов
15. Safonov М. G. (1980): Stability and Robustness of Multivariable Feedback Systems. Cambridge, Mass.: /AIT Press.
Робастность Л КГ-регуляторов
16. Doyle J. C., Stein G. (1980): “Multivariable Feedback Design: Concepts for a Classical/Modern Synthesis”, JEEE Trans. Autom. Contr., AC-26, Feb., 4-16.
Методы оптимального конструирования
Применение методов построения оптимальных регуляторов на основе моделей типа «вход-выход» для решения задач оптимального прогнозирования, Л КГ-управления и управления с минимальной дисперсией
ВВЕДЕНИЕ
В данной главе рассматриваются методы оптимального конструирования, основанные на линейных моделях типа «вход-выход» с квадратичным критерием качества. Такие методы позволяют получить более детальное представление о существе задачи и построить возможные численные алгоритмы.
Помимо общей модели, включающей три многочлена, рассматривается простая модель, демонстрирующая тесную связь задач оптимального управления и фильтрации. Кроме того, анализируется задача прогнозирования и дается ее решение в виде комбинации отношений некоторых многочленов. Приводится явное выражение для передаточной функции оптимального предиктора. Выводится также оптимальный закон управления, минимизирующий дисперсию. Для систем с устойчивыми обратными этот, закон выражается через многочлены, соответствующие оптимальному предиктору. Для систем с неустойчивыми обратными решение получается в результате решения полиномиального диофантова уравнения типа рассмотренного в гл. 10. Таким образом, задачу управления с минимизацией дисперсии можно интерпретировать как задачу размещения полюсов. Такой подход позволяет лучше понять принципы выбора полюсов замкнутой системы и наблюдателя при решении задачи размещения полюсов. Показано, что решение задачи ЛКГ-управления можно получить путем спектрального разложения и решения некоторого диофантова уравнения.
12.1. ПОСТАНОВКА ЗАДАЧИ
Рассматривается задача регулирования установившегося состояния управляемого процесса, который по предположению является линейным и автономным с одним входом и и одним выходом у. Динамика процесса определяется комбинацией временной за-
держки и рациональной передаточной функции. Кроме того, предполагается, что возмущения представляют собой отфильтрованный белый шум. При этом критерий качества состоит в минимизации среднеквадратических отклонений управляющего и выходных сигналов. В приводимой ниже формальной постановке задачи модель процесса и критерий предполагаются дискретными [ср. с разд. 3.1 и 11.1]. ' ’
Динамика процесса
Пусть динамика процесса описывается уравнением
x(/0 = ^-«(£), (12.1)
где Ai (q) и Bi (q) —многочлены относительно оператора сдвига.
Возмущения
Предположим, что влияние внешней среды на процесс описывается возмущениями, представляющими собой стохастические процессы. Поскольку система линейна, то можно воспользоваться принципом суперпозиции и свести все возмущения к одному эквивалентному возмущению v на выходе системы. Тогда выход системы определяется как
у (k) = х (k) + v (k). (12.2)
Предположим далее, что возмущение v можно представить как выход линейной системы с белым шумом на входе, т. е.
^)=-^ga(£), (12.3)
где С](<7) и A2(q) —многочлены относительно оператора сдвига, а {е(/г)}—последовательность независимых или некоррелированных случайных переменных с нулевым средним и стандартным отклонением о. При этом возмущение v может быть стационарным случайным процессом, возможно с дрейфом, поскольку многочлен A2(q) может быть и неустойчивым. Модель процесса и внешней среды можно привести к некоторому стандартному виду. Исключая v и х из (12.1) —(12.3) и вводя обозначения
А :==: ^1^2» В = HjAg» б? = (12.4)
получаем следующую модель:
A{q-)y{k) = B (q) u(k) + C (q) e (k). (12.5)
Эта каноническая модель будет основой для конструирования системы управления. Отметим, что в частном ..случае отсутствия возмущений эта модель сводится к простой импульсной передаточной функции (разд. 3.5). В отсутствие управляю
щего сигнала модель (12.5) описывает стохастический процесс с рациональной спектральной плотностью или АРСС-процесс (разд. 6.4).
Уравнение (12.5) можно нормализовать таким образом, чтобы старшие коэффициенты многочленов A(<y) и C(q) были равны единице — такие многочлены называются приведенными. Многочлен С можно умножить на произвольную степень q, поскольку при этом не меняется корреляционная структура C(q)e(t). Это позволяет нормализовать С таким образом, чтобы степень С была равной степени А или на единицу меньше. Нули многочленов A (q) и B(q) могут лежать как внутри, так и вне единичного Kpjy'a в то время, как нули C(q) по предположению лежат внутри единичного круга. Дело в том, что с помощью спектрального разложения (Теорема о спектральной факторизации) многочлен C(q) можно трансформировать таким образом, чтобы все его нули лежали внутри или на границе единичного круга.
Пример 12.1. Трансформация многочлена С
Рассмотрим многочлен
С (z) = z + 2,
нуль которого z — —2 лежит вне единичного круга. Пусть сигнал имеет вид: n(k) = C(q)e(k), где {е(й)}—последовательность некоррелированных случайных переменных с нулевым средним и единичной дисперсией. Спектральная плотность п определяется выражением
ф (е™Л) = J- С (elah) С (e~ie>h).
Поскольку
С (z) С (2-*) = (г+ 2) (z~‘ + 2) = (1 + 2г"1) (1 + 2г) =
= (2z + 1) (2г-1 + 1) = 4 (z + 0,5) (z“ 1 + 0,5), сигнал п можно записать в виде n(k) = C*(q)e(k), где C*(z) = 2z + 1 (см. разд. 3.2).
Если нули многочлена С (q), вычисленного по формуле (12.4), лежат внутри единичного круга, то С можно представить в виде произведения С = С+С~, где С- содержит все сомножители с нулями вне единичного круга. Тогда многочлен С можно заменить многочленом С+С~*.
♦♦♦ Заметим, что термин «гауссовское» в линейно-квадратичном гауссовском (ЛКГ) управлении несколько некорректен. Можно показать, что вид функции распределения вероятностей не существен, если случайные переменные {е(А)} независимы.
Критерий качества
При регулировании установившегося состояния целесообразно ввести критерий в терминах установившихся отклонений управляющей переменной и выхода процесса. Для систем с одним
выходом таким критерием может быть минимизация дисперсии выходного уигнала:
Jmv = Ey\k), (12.6)
где точки отсчета выбраны так, что у = 0 является заданным установочным значением. Управление, ..минимизирующее функционал (12.6), называется управлением с минимальной дисперсией. Критерий качества можно задать иначе:
N
lim Е~ У y2{k).
Такой критерий является аппроксимацией непрерывной функции потерь т
Jc= lim ^Aif(f)dt. (12.7)
7->оо 1 J
О
Свойства управляющего сигнала при таком критерии качества очень сильно зависят от выбора периода квантования: чем короче период квантования, тем больше дисперсия управляющего сигнала, и наоборот. В некоторых случаях желательно найти некоторый компромисс между дисперсиями управляющего и выходного сигналов. Этого можно добиться, введя функцию потерь вида
Jlq = E[y2(k) + pu2{k)]. (12.8)
Управление, минимизирующее этот функционал, называется линейно-квадратичным.
Допустимые управления
Предполагается, что u(k), т. е. значение управляющего сигнала в момент времени k, является функцией y(k), y(k—1), ... и u(k—1), u(k — 2)....... Таким образом, вычислительная за-
держка пренебрежимо мала по сравнению с периодом квантования. Тем не менее при необходимости эту задержку легко можно учесть.
Имеются два подхода к построению теории оптимального управления для задач данного класса. Можно заранее постулировать линейный закон управления. Тогда для доказательства оптимальности достаточно предположить некоррелированность возмущений е{1) и е(/) при i=£j. Если же, напротив, предположить зависимость возмущений e(i) и e(j), то можно показать, что оптимальное управление является линейным. Выражения оптимального управления в обоих случаях оказываются идентичными.-
Частный случай
Рассмотрим решение задачи оптимального управления, т. е. при наличии модели (12.5) и критерия качества (12.6) в одном частном случае. Решение этой задачи позволяет понять, почему были сделаны те или иные предположения. Кроме того, оно позволяет наметить схему решения задачи в общем случае.
Рассмотрим систему первого порядка:
y(k + 1) + ay (А) = bu (k) + e(k + 1) + ce(k), (12.9)
где |с| < 1, а {е(А)} —последовательность независимых случайных переменных с единичной дисперсией.
Проанализируем ситуацию, возникающую в момент времени k, когда имеются измеренные значения выхода y(k), y(k—1), ... . Требуется найти управление и (А), такое чтобы u(k) было как можно ближе к нулю. Из (12.9) следует, что соответствующим выбором u(k) значение y(k + 1) можно сделать произвольным. Так как e(k -j- 1) не зависит от у (k) и членов в правой чйсти (12.9), то можно записать
var y(k -|- l)i> vare(A + 1)= 1. (12.10)
Член e(k) можно выразить через известные данные y(k), y(k — 1), ... и u(k — 1), u(k — 2), ... . Если переменные у (А) и e(k) известны, то управление
u(k) = [ay(k) — ce(k)]/b (12.11)
приводит к равенству
y(k+l) = e(k+V>, (12.12)
соответствующему нижней границе неравенства (12.10). Если управление (12.11) используется на каждом шаге, то уравнение (12.12) выполняется для всех k. По этой причине вычисление e(k) по данным, имеющимся в момент k, становится тривиальным, и управление (12.11) принимает вид
u(k) = y(k). (12.13)
Следовательно, оптимальное управление представляет собой просто пропорциональную обратную связь с усилением (а — с)/Ь.
Для анализа поведения замкнутой системы с данным оптимальным управлением исключим и из (12.9) и (12.13). Тогда у(А + 1)+ cy(k) = e(fi + 1)+ ce(k).
Заметим, что характеристический многочлен замкнутой системы имеет вид C(z)=z + c. Таким образом становится очевидной важность предположения об устойчивости многочлена С (г).
Разностное уравнение (12.13) имеет следующее решение;
У (£) - е (k) + (- o)k~k* [// (Ao) - е («„)].
Поскольку с < I, последний член стремится к нулю при k — ^о->-оог и, следовательно, полученное оптимальное управление минимизирует дисперсию выходного сигнала в установившемся состоянии.
Величину —ay(k)-\-bu(k)-\-ce{k) можно интерпретировать как наилучшую оценку y(k 1) по .данным, имеющимся в момент времени k. Величина e(k -ф 1) представляет собой ошибку прогнозирования. Из (12 13) вытекает, что прогнозируемое значение равно установочному (в данном случае — нулю) Таким образом, ошибка управления равна ошибке прогнозирования.
Итак, решение задачи управления с минимальной дисперсией тесно связано с решением задачи прогнозирования. Поэтому, прежде чем перейти к обшей задаче управления с минимальной дисперсией, рассмотрим решение задачи прогнозирования.
12.2. ОПТИМАЛЬНОЕ ПРОГНОЗИРОВАНИЕ
В основе теории прогнозирования могут лежать различные предположения относительно процесса, критерия качества и структуры предиктора. В данном случае были сделаны следующие предположения:
• прогнозируемый процесс генерируется отфильтрованным гауссовским белым шумом;
• наилучшим является предиктор, минимизирующий среднеквадратическую ошибку прогнозирования;
* допустимый га-шаговый предиктор для y(kA-m) является произвольной функцией от y(k), y(k — 1), ... .
Рассмотрим сначала построение предиктора, основанное на интуитивных рассуждениях, а затем сформулируем полученный результат более строго.
Эвристические рассуждения
Рассмотрим сигнал у, генерируемый моделью
= = (12.14)
A (q ‘)
где А* и С* — многочлены, обратные Л и С, a q~'—оператор обратного сдвига. Здесь удобно ввести именно этот оператор, поскольку все рассуждения основаны на принципе причинности. Пусть многочлены А и С имеют порядок п.
Проанализируем ситуацию в момент k, когда известны значения y(k), y(k— 1), ... и требуется спрогнозировать значение y(k -р т) Формальное разложение С*/А* по степеням q~' дает у (k + т) - е (k + т) =
= {а (А -р т} -р f \в (k -р tn — 1)4- ... -р -р 1)} 4"
+ [fme(k) 4 f Ltle(k — 1) -ф ... j. (12.15)
Все члены в правой части (12.15) независимы, поскольку {а(Л)}—последовательность независимых случайных переменных. Из модели (12.14) следует, что если многочлен С устойчив, то e(t) можно вычислить точно по значениям y(i), y{i— 1), ... .
Таким образом, члены в квадратных скобках являются известными функциями данных, имеющихся в момент k, а члены в фигурных скобках не зависят от этих данных. Тогда оптимальный предиктор имеет вид
$ (k + т \ k) — fme (fe) -Т fm+\e {k — 1) + fm+?e (k — 2) + ... ,
а ошибка предсказания равна
у (k -T tn | k) — e (k -J- tri) f^e (k -J- m — 1) -|- ... -]- fm—(в (k -)- I).
Для формального доказательства полученного результата необходимо вычислить коэффициенты ft по А и С и найти зависимость e(k) от ’данных, имеющихся в момент времени tn < k.
Основной результат можно сформулировать в виде следующей теоремы.
Теорема 12.1. Оптимальное предсказание. Пусть {y(k)} — случайный процесс, порождаемый моделью (12.14), где все нули многочлена C(z) лежат внутри единичного кпуга, а {е(А)} — последовательность независимых случайных переменных. Тогда т — шаговый предиктор с минимальной дисперсией дается выражением
G = ^kA-tn\k}^^^-y(k)=^f^ry{k), (12.16)
С С \q )
где многочлены F и G являются частным и остатком от деления <7т-1С на А соответственно, т. е.
q^C(q) = A(q)F(q) + G(q). (12.17)
При этом ошибка предсказания есть скользящее среднее
у (k -f- т | k) = у (k + т) — у (k 4- т | k) = F (q) е (k + 1)
(12.18) с нулевым средним значением и дисперсией, равной
Еу = (k + m| fe)2 = [ 1 + П + . .. + ft.,] о2. (12.19)
Доказательство. Степень многочлена F равна m — 1, а степень многочлена G меньше п, поэтому
F (9) = «у—1 + 2 + ... + f,„_!
и
G (q) = goQ"-1 + giqn~2 + • • • + gn-ь
Введем многочлены
' F* (?-')= 1 + + • • +
и
G* (?-*) = g) + £i?-1 + • • • + gn-iq~n+l.
Из (12.17) вытекает, что .«
C(q-l) = A*(q-')F4q-') + g~mG4q-1), (12.20)
поэтому уравнение (12.15) можно переписать в виде
У& + e(fe + m) = f’(9-l)e(/e + m) + -^r^rq e(k)..
Используя (12.14), последний член можно выразить через данные, имеющиеся в момент времени k. Тогда .
y(k + m)^F\q-^e{k+m)+^^-y{k). (12.21)
Первый член в правой части является линейной функцией от е(&4-1), e(k -|- 2), ..., e(k + tri), не зависящих от данных y(k), y(k — 1), y(k — 2), ..., имеющихся в момент времени k. Последний же член зависит от этих данных. Пусть у — произвольная функция от y(k), y(k — 1), ..., тогда
Е [у (k + т) — у]2 = E[F* (q~l)e(k-)- т)]2 +
+ Е [ gjjry У (k) - р]2 + 2Е [Г («у-1) е (k + tri)] X х[|^-//(А)-р]. (12.22)
Последнее слагаемое в правой части равно нулю, поскольку e(k-)-m), e(k-\-m— 1), ... и e(k^~ 1) имеют нулевые средние значения и не зависят от y(k), y(k—1), ... . Таким образом, предиктор, минимизирующий среднеквадратическую ошибку предсказания, определяется выражением (12.16), а ошибка — выражением (12.18). Для завершения доказательства достаточно вычислить среднее значение квадрата ошибки предсказания (12.18), что приводит к (12.19).
Замечание 1. Оптимальный предиктор линеен, однако линейность не является прямым следствием «квадратичности» критерия оптимальности. Если плотность распределения вероятностей {y(k)} симметрична, то предиктор (12.16) оптимален для всех критериев вида Eg[(y(k + tn) — у)2] при симметричной g.
Замечание 2. Предположение о независимости e(i) и e(j) при i =/= j предопределяет равенство нулю последнего слагаемого в (12.22). Если же эти переменные не коррелируют, то
он также обращается в нуль при условии, что предиктор (/ предполагается линейным 1>.
Замечание 3. Из (12.18) следует, что
у (k + 11 /г) = y{k + 1) - g(k + 11 /г) = е(/г + 1),
поэтому случайные переменные {е(/г)} можно интерпретировать, как новацию процесса {у(/г)} (разд. 6.4).
Замечание 4. Функция
/(m) = a2[l+f2+...+^_il
является дисперсией ошибки предсказания на временном интервале mh. При т-^-оо величина J (т) стремится к дисперсии у, поэтому по зависимости J можно судить о том, насколько хорошим может быть прогноз при различных горизонтах предсказания.
Замечание 5. Предиктор, описанный в данном разделе, эквивалентен установившемуся предиктору, полученному в разд. 11.2 с помощью фильтра Калмана [пример 11.5].
Расчет оптимального предиктора
Могочлены F и G получаются в результате деления, и для их коэффициентов можно получить явные формулы. Приравнивая коэффициенты при одинаковых степенях q в (12.17), получаем следующую систему уравнений:
ci — ai + fl,
с2 = а2 4- njj + fo,
Cm-i — ат-\4- am-if\ + ... 4- aifm-2 + fm-i,
Cm = a.m-]- am-if । -j- . . . 4- arfm_i 4- go, (12.23)
Gn+i = am+i 4- amf । 4- ... 4" Ozfm—i + gi,
Cn — an-\- an-}f I 4- . . . 4- an-m+ifm-l 4“ gn-m,
0 = anfi 4- TZn-ifs 4- . . . 4" O-n-m-nfm-l 4~ gn-m+l,
0 -— anftn-i 4" gn-i,
которая легко решается прямой подстановкой.
о Поскольку отсутствие корреляции означает отсутствие линейной зависимости переменных. — Прим ред
Случай, когда С имеет нули на единичной окружности
Предиктор (12.16) является динамической системой с характеристическим многочленом С (г), поэтому предположение о том, что все нули С лежат внутри единичного круга, гарантирует устойчивость предиктора в установившемся состоянии. Начальные условия при этом не играют роли, поскольку их влияние экспоненциально затухает. Из спектрального разложения следует, что С можно выбрать так, чтобы все его нули лежали внутри или на границе единичного круга. Тогда остается рассмотреть только случай, когда С имеет нули, лежащие на единичной окружности.
Пример 12.2
Рассмотрим процесс
(й) = е (й) — е (k — 1). (12.24)
В данном случае многочлен С (z) = z — 1 имеет нуль, лежащий на единичной окружности. Формальное применение методов, изложенных выше, дает одношаговый предиктор:
0(k+ 1|й) = -е(й)
Выражая e(k) через y(k), y(k— 1), ..., получаем
k
е (k) = е (k0 — 1) + У y(i) = е (k0 — 1) + z (k). (12.25)
i=feo
Присутствие неубывающего члена e(ko—1) при йо^-—oo демонстрирует последствия неустойчивости С. Тем не менее фильтр Калмана и в этом случае позволяет построить оптимальный предиктор. Сигнал, определяемый равенством (12.24), можно записать в виде
х (k + 1) = е (й),
У (k) = — х (k) + е (k),
где Р, = R2 — R12 = о2 в обозначениях из разд. 11.2. Фильтр Калмана имеет вид
-С (й + 1 | й) = К (k) [у (k) + £ (k | k - 1)],
K{k} Р(й)+о2 с начальными условиями
(ko I Йо — 1) = 0, P (Йо) = о2.
Предиктор выходного сигнала имеет вид
S(k+ 1 |Й) = -*(Й + 1 | й) = - К (й) [«/(й) -0(й| k - 1)].
После простых преобразований получаем k — k(j
У (k + 1 | k) = - (n + +
Таким образом, оптимальный предиктор является нестационарной системой, зависящей от времени.
♦♦♦ Заметим, что вклад от начального условия y(ko) убывает со скоростью 1/(к + 2 — й0), т.е. гораздо медленнее, чем в случае устойчивых многочленов.
Приведенный выше пример свидетельствует о том, что если многочлен С имеет нули, лежащие на единичной окружности, то оптимальный предиктор является нестационарной системой. По этой причине в тех случаях, когда требуется построить стационарный предиктор, таких моделей следует избегать. К сожалению, на это обстоятельство не всегда обращают внимание, что приводит к случаям, подобным описанному ниже.
Пример 12.3. Моделирование сигналов со смещением
Модель вида
А (?) у (й) = С (q) е (й) + Ь,
(здесь b — неизвестная постоянная) описывает сигнал со смещением. Постоянную b можно исключить, если перейти к разностям, поэтому
’ (<? — 1) A (q) у (й) = (q — 1) С (q) е (й).
От общего множителя q — 1 можно избавиться, если выходом считать величину Д{/(й) = (q— 1)г/(й), т. е. перейти к модели
A (q) Ay (k) = (q — 1) C (?) e (й) = C (q) e (й).
Очевидно, что в данной модели многочлен С имеет нуль на единичной окружности. Эта модель, однако, не очень хороша, так как оптимальный предиктор является нестационарной системой. Было бы гораздо лучше моделировать смещение как винеровский процесс и прийти к модели процесса с А(1)=0 — неустойчивой модели со стационарным предиктором.
12.3. УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ
ДИСПЕРСИЕЙ
Для отыскания управления, минимизирующего дисперсию ошиб ки *>, рассмотрим частный случай, когда многочлен В (12.5) устойчив. Это означает, что передаточный оператор процесса имеет устойчивый обратный2*. В этом частном случае задача управления имеет очень простое решение.
Системы с устойчивыми обратными
Введя оператор обратного сдвига д~\ модель (12.5) можно переписать в виде
B(q) ... . С (q) B^q-') _d ... . C* (q~ ’) ...
У {fe) “ A (q) Ы (fe) + A (q) еМ ~ A* (q~ ') 4 “ + A* (q~ *) & '
__________ (12.26)
*> Более строго следовало бы говорить о минимизации среднеквадратической ошибки, а не дисперсии. — Прим. ред.
2) Этот случай называют минимально-фазовым, поскольку все нули импульсной передаточной функции лежат внутри единичного круга
где через J = degZ— deg В обозначен эксцесс полюсов системы (разд. ,3.3). Далее, degX=degC=n. Для большей ясности изложения вопросов, связанных с причинностью, введем обратные многочлены. Из (12.26) следует, что
у <*+=ЯЯ ‘{k++ЯЯ?w “
= F* (<7- ') е (k + d) + е (fe) + U (k). (12.27)
Второе равенство получается из (12.17), если положить т — d. Первый член правой части не зависит от данных, имеющихся в момент k, а поэтому он не связан со вторым и третьим слагаемыми. Второй член можно явно выразить через данные, имеющиеся в момент k. Для этого решим (12.26) относительно е e(k) = -^ y(k) — q~d (k),
где для простоты записи у многочленов опущены аргументы. Используя последнее равенство, перепишем (12.27) в виде у (k + d) = F'e (k + d) -j- -g у (k) - (]-“ и (k) +
4- -J и (k) = F'e (k + d) + у (k) 4- и (k). (12.28)
Пусть теперь u(k) есть произвольная функция от y(k), y(k—l), ..., и u(k — 1), u(k — 2)....Тогда
Ey2 (k + d) = E [F*e (k 4- d)]2 + E[^y(k)+ и (ktf.
(12.29)
Перекрестные члены исчезают, так как e(k-}-d), .... e(k 4- 1) не зависят от y(k), y(k—- 1), ... и u(k), u(k— 1), ... . Поскольку последний член в (12.29) неотрицателен, получаем
Ey2(k 4- d)> [1 4- f* + • •. + /L.l °2. (’ 2.30)
причем равенство достигается при
... Сг(д~1) ... G(q) ...
ll(k) =----—7 Г— у (k) -------------— у (k),
B(q)F(q)yKh
(12.31)
что и является искомым управлением, минимизирующим дисперсию ошибки. ПоЛученный результат можно сформулировать в виде следующей теоремы.
Теорема 12.2. Рассмотрим процесс (12.5), где {е(&)} есть последовательность независимых случайных переменных с ну
левыми средними значениями и стандартным отклонением о. Пусть все нули многочленов В и С лежат внутри единичного круга. Тогда управление, минимизирующее дисперсию ошибки, дается формулой (12.31), где многочлены F* и G* определяются выражением (12.17). При этом выход в установившемся состоянии имеет вид
y(fe) = r(9->)e(fe) =
= е (k) + Ле (k - 1) + ... + fd-,e (k - d + 1). (12.32)
Замечание 1. В предположении линейности управления теорема остается справедливой и при замене условия независимости e(i) и e(j) 11ри i^=j условием их некоррелированности.
Замечание 2. Этот результат тесно связан с решением задачи предсказания (теорема 12.1). В обоих случаях используется тождество (12.17). Последние два члена (12.28) можно интерпретировать как d-шаговое предсказание выхода. Таким образом, минимизация дисперсии осуществляется предсказанием выхода на d шаТов вперед и выбором управления, при котором этот выход становится равным заданному.
Таким образом, задача стохастического управления разделяется на две задачи — стохастическую задачу предсказания и детерминированную задачу управления. По этой причине теорема 12.2 называется теоремой о разделении.
Замечание 3. Ошибка предсказания при оптимальном управлении является скользящим средним d — 1-го порядка. Таким образом, ковариационная функция ошибки регулирования обращается в нуль для аргументов, больших d — 1. Этот факт можно использовать, если нужно определить, используется ли управление, минимизирующее дисперсию ошибки.
Замечание 4. При использовании управления (12.31) все нули процесса компенсируются. Последствия этого явления обсуждаются ниже.
Как показано в следующем примере, для моделей типа (12.5) построение управления с минимальной дисперсией является довольно простой задачей.
Пример 12.4
Рассмотрим систему (12.5), где
A(q) = q3- 1.7?2 -Ь 0,7?;
В (?) = q + 0,5; С (?) = ?3 - 0,9?2.
Эксцесс полюсов d равен 2. Разделив ?d-1C(?) на А(?), получим
F (?) = ? + 0,8.
G (q) = 0,66?2 — 0,56?.
Таким образом, оптимальное управление имеет вид
? (0,66? — 0,56)
“ * “ (? + 0,5) (? + 0,8) У
Интерпретация решения в терминах размещения полюсов
Управление с минимальной дисперсией ошибки тесно связано с задачей размещения полюсов, рассмотренной в гл. 10. Для выявления этой связи рассмотрим замкнутую систему, полученную применением управления (12.31) к процессу (12.5). Уравнения (12.5) и (12.31) можно записать'^ виде
Г Л (?) - В (?) 1 Г У № т г С (q) 1
Lo(?) F(?)B(?) JL«wJ L 0 Je(fe)- (12.33)
Характеристическое уравнение замкнутой системы получается приравниванием определителя матрицы левой части (12.33) нулю. Поэтому
А (?) F (?) В (?) + G (?) В (?) = В (?) [Л (?) F (?) + G (?)] =
= ?‘*-‘В(?)С(?) = 0, (12.34)
где второе равенство получено с учетом (12.17) с т — d. Замкнутая система, таким образом, имеет 2п — d полюсов в нулях В и С и, кроме того, d — 1 полюсов в начале координат.
Управление с минимальной дисперсией ошибки можно интерпретировать как размещение полюсов, когда полюса помещаются в нули уравнения (12.34). Сходство с задачей размещения полюсов становится еще более явным, если управление (12.31) записать в виде u(k) = — у (k),
где S = G и R = FB [ср. с уравнением (10.4)]. Умножая (12.17) на В, получаем
?d-1C (?) В (?) — Л (?) F (?) В (?) + G (?) В (?) =
= Л (?)/?(?) +В (?)S(?).
Это уравнение является частным случаем диофантова уравне-; ния (10.22), где В+ = В, Ат — qd~l и Ло = С.
Системы с неустойчивыми обратными
Согласно замечанию 4 к теореме 12.2, в управлении, построенном в соответствии с этой теоремой, все нули процесса компенсируются. Если имеются нули процесса, лежащие вне единичного круга, то в замкнутой системе возможны ненаблюдаемые неустойчивые режимы. Рассмотрим сначала, к чему это приводит, а затем обсудим другие законы управления, в которых не требуется, чтобы все нули лежали внутри единичного круга.
Решая уравнение (12.33) относительно у и и, получаем
У (k) е (k)
?
и
u(k) —
G(q) qd~lB(q)
e(k).
Из этих равенств явно видна необходимость предположения об устойчивости В. Если В неустойчив, то в системе имеются неустойчивые режимы, которые возбуждаются возмущениями. Поскольку такие режимы связаны с управляющим сигналом, управление возрастает экспоненциально. Тем не менее выходной сигнал остается ограниченным, так как неустойчивые режимы не связаны с выходом.
Пример 12.5 s
Рассмотрим систему, описываемую следующими многочленами:
A(z) = (z- I) (z — 0,7);
В (z) = 0,9z + 1;
C(z) = z(z — 0,7).
Нуль B(z) есть г — —10/9, т. е. он лежит вне единичного круга. Результаты моделирования поведения системы при управлении с минимальной дисперсией
Рис. 12.1. Моделирование системы из примера 12.5. В управлении, построенном в соответствии с теоремой 12.2, компенсируются неустойчивые нули процесса.
показаны на рис. 12.1. Наличие неустойчивого режима явно проявляется в динамике управляющего сигнала и никак не выражается в форме выхода системы. Если продолжить процесс, то управляющий сигнал в конце концов станет настолько большим, что произойдет прерывание исполнения программы по переполнению. На практике, однако, сигнал так быстро возрастает, что линейная аппроксимация уже неадекватна. В результате эффект от неустойчивого режима проявится и на выходе.
Распространение управления с минимальной дисперсией ошибки на случай, когда В имеет нули, лежащие вне единичного круга, дается следующей теоремой.
Теорема 12.3. Рассмотрим систему (12.5) и разложим B(z) на полиномиальные множители
B(2) = B+(z)B"(z), (12.35)
такие что все нули В+(г) лежат внутри единичного круга, а все нули В~(г) —вне его или на его границе. Предположим, что все нули многочлена С (г) лежат внутри единичного круга и что многочлены А (г) и В~(г) не имеют общих множителей. Тогда управление с минимальной дисперсией ошибки определяется как
u^ = --^TTF7Ty^’ (12.36)
(9) F (<7)
где F(z) и G(z)—многочлены, удовлетворяющие диофантову уравнению
q^C (?) В"’ (?) = А (?) F (?) + В- (?) G (?), (12.37)
а степень F(z) равна d-\~ deg В-1— 1.
Доказательство основано на искусственном приеме, предложенном Винером. Рассмотрим оператор
1
q + а ’
где |а|> 1- Этот оператор обычно интерпретируют как причинный неустойчивый (неограниченный) оператор. Поскольку |й|> 1 й норма оператора сдвига ||?|| равна 1, следующее разложение в ряд по степеням:
1 1 1 1 П 9 92 ]
q + а а 1 + qfa a L а ' а2 ‘ " J
сходится. Таким образом, оператор (? + «)-1 можно интерпретировать как непричинный устойчивый оператор, т. е.
7^ЛЧ=4[»И-4</(4+0 + ^!/№ + 2)-...].
Тогда
(<?+у w]=у
Доказательство теоремы удобно провести, введя оператор обратного сдвига; Из модели процесса (12.5) следует, что
®№+d) “№)+Ягт *+‘°-
Введем величину
где l/B~*(q~l)—непричинный устойчивый оператор. Сигналы у и w имеют одинаковую дисперсию в установившемся состоянии, поскольку В~ и В~* взаимно обратны и
В- | . .
Допустимое управление, минимизирующее дисперсию w, также минимизирует дисперсию у, поэтому
В+* (?“ ’) В~ (q~ ’) /£л । с* *) В~ (q~ *)
W(fe + rf)— д.^-1) Ы(^+ A*(q-l)B-*(q-') e(k + d)'
(12.38)
Предположение о том, что А (г) и B~(z) не имеют общих множителей, гарантирует существование решения уравнения (12.37).
Из (12.37) вытекает, что
Г (q~ *) В- {q- >) = A* (q~ 9 F (q~ *) + q-*B~’ (q~ >) G* (q~ >)•
Разделив это равенство на А*В~*, получим выражение
С*(д- ‘) В- Gr1) F*(q~l) d С* (q~ ') A* (g-*) В~* (g~ *) B-*(q-i)^q A*(g-1) ’
подстановка которого в (12.38) дает
w (k + d) = e (k + d) + ?5п(Г1) и (k) +
в (q *) A*(<7 *)
+ ЙЙЯ’' <12-39>
Оператор l/B-*^-1)—по предположению ограниченный непричинный оператор и deg F* — d -p deg — 1, to
g (fe + d) = <zie (fe + 1) + a2e (fe + 2) + ... . В (q *)
Все члены в правой части не зависят от последних двух слагаемых в (12.39). Проводя рассуждения так же, как в доказательстве теоремы 12.2, получим, что оптимальным управление будет в том случае, когда два последние члена в (12.39) становятся равными нулю. Таким образом,
И
w ,4> - е w е (k}-
(12.41)
Исключая e(k) из (12.40) и (12.41), получаем
<12-42)
Поскольку числитель и знаменатель имеют одинаковые степени, искомое управление можно переписать в-виде (12.36).
Замечание 1. Устойчивые нули процесса компенсируются оптимальным управлением.
Замечание 2. Из доказательств теорем 12.2 и 12.3 следует, что дисперсия выхода систем типа (12.5) может иметь несколько локальных минимумов, если многочлен B(z) имеет нули, лежащие вне единичного круга. Однако в силу теоремы 12.2 существует единственный глобальный минимум, который порождает бесконечно большой управляющий сигнал. Локальный минимум, определяемый теоремой 12.3, является наибольшим из всех локальных минимумов, и он порождает ограниченный управляющий сигнал.
Замечание 3. В разложении (12.35) есть определенный произвол, поскольку В+ можно умножить на некоторое число, а В~ разделить на это число. Эти множители удобно выбирать так, чтобы многочлен B~*(q) был приведенным.
Пример 12.6
Рассмотрим систему, описанную в примере 12.5, где d — 1 и
В+ (z) = 1,
В- (г) = В (г),
(г) = z + 0,9.
Уравнение (12.37) принимает вид г (г - 0,7) (г + 0,9) = (z - 1) (z - 0,7) (1 + f,z) + (0,9z + 1) (goz + g,).
Полагая последовательно г = 0,7; z = 1 и г = —10/9, получаем O,7go + gi = 0, go + gi = 0,3.
л = 1.
Таким образом, оптимальное управление принимает вид
G (<7) ... <7-0,7
В+ (q) F (<?) У{ fl + 1 У (k)
Выход процесса равен
У (fe) == F^} -е (k + d - 1) = g + 1 e (fe) = e (fe) + —0,1 e (k),
B~ (?) <7 + 0,9 <7 + 0,9
и (/г) = —
0,1
а его дисперсия
£У = [1 -I-
o,i2 1
l - 0,92 j
8 20 2
° 19 ° '
100
Время
О 50 100 Рис. 12.2. Моделирование
Время системы из примера 12.6.
что примерно на 5 % больше, чем при использовании регулятора из примера 12.4. Результаты моделирования процесса показаны на рис. 12.2, из которого следует, что регулятор ведет себя довольно хорошо. Эффект от компенсации неустойчивых нулей становится очевидным, если этот рисунок сравнить
с рис. 12.1.
Связь с размещением полюсов
Легко показать, что характеристическое уравнение замкнутой системы, полученной из (12.5) и (12.36), имеет вид
zd~'B+ (z) В-* (z) С (z) = 0.
(12.43)
Таким образом, (12.36) можно интерпретировать как регулятор, построенный методом размещения полюсов с заданным характеристическим уравнением (12.43).
Умножая (12.37) на В+, получаем
А (г) R(z) + B (z) S (z) = zd-'B+ (z) B~* (z)C(z), (12.44)
где R (z) — B+(z) F (z) и S(z)= G(z). Это то же самое диофантово уравнение, которое использовалось при проектировании методом размещения полюсов [ср. с уравнением (10.22) |. Замкнутая система имеет полюса, соответствующие динамике наблюдателя, устойчивым нулям процесса и отображению неустойчивых нулей на единичный круг.
♦♦♦ Заметим, что относительно передаточной функции справедливо предположение, согласно которому она имеет d — 1 = deg Л — deg В — 1 нулей в бесконечности. Отображения этих нулей на внутренность единичного круга также проявляются как полюса замкнутой системы.
12.4. ЛКГ-УПРАВЛЕНИЕ
Рассмотрим 'теперь задачу оптимального управления для системы (12.5) с критерием качества (12.8).
Как было показано в разд. 12.3, управление с минимальной дисперсией можно получить как решение некоторого полиномиального уравнения. Точно так же моя$но подойти и к решению задачи ЛКГ-управления, хотя здесь используются два полиномиальных уравнения.
Спектральное разложение
В разд. 11.1 решение задачи ЛК-управления на основе пространства состояний было сведено к решению установившегося уравнения Риккати. Из уравнения Риккати следует, что
rP (z) Р (z—1) = рЛ (г) А (г-*) + В (г) В (г"1), (12.45)
где приведенный многочлен P(z) является характеристическим многочленом замкнутой системы [см. уравнение (11.38)]. Характеристический многочлен замкнутой системы можно получить, решив уравнение Риккати для установившегося состояния. Один из возможных подходов состоит в непосредственном построении многочлена P(z), удовлетворяющего уравнению (12.45). Обратную связь, гарантирующую желаемое расположение полюсов, можно найти путем размещения полюсов. Задача построения многочлена Р(г), удовлетворяющего (12.45), называется спектральным разложением.
Рассмотрим вначале многочлен вида *>
F(z) = ftiz2n + fiz2n-1 + ... + fn-iZn+i +
+ fnZn + fn-lZ”-1 f \Z + fo
совпадающий с обратным ему, поскольку
F* (z) = z2r,F (z~ — F (z).
По этой причине, если z = a является корнем F(z), то z = = \/а также его корень. Более того, если коэффициенты fi действительны, то z = a и z=\la также являются корнями. Докажем следующую лемму.
Лемма 12.1
Пусть действительные многочлены А (г) и B{z) взаимно просты и deg A (z) > deg В (г). Тогда существует единственный многочлен P(z), такой что deg P(z)— deg A (z)= п, и все нули которого лежат внутри или на границе единичного круга так, что выполняется (12.45). Если р > О, то P(z) не имеет нулей на единичной окружности.
*> То есть возвратный многочлен. — Прим. ред.
Доказательство. Возвратный многочлен можно получить, умножая правую часть (12.45) на г". В этом случае нули правой части являются зеркальным отображением относительно единичной окружности. Поскольку коэффициенты действительны, нули симметричны относительно действительной оси. Правая часть (12.45) не может иметь нулей на единичной окружности, так как если z = е1ы— такой корень, то
рЛ (а',ш) Л (е~ to) + В (е‘“) В (е~1а) = р | Л (е1М) |2 + | В (е‘“) |2 = 0.
Поскольку р > 0, то это означает, что г = ехр(йв) одновременно является корнем Л(г) и B(z), что противоречит предположению о том, что они относительно просты. Условие degP(z)—n необходимо для того, чтобы гарантировать единственность Р(г), так как если P(z) удовлетворяет (12.45), то zkP(z) также удовлетворяет (12.45) при произвольном k 0.
Замечание. Введя обратные многочлены, уравнение (12.45) можно переписать в виде
rP* (z) Р (г) = рЛ (z) Л* (z) + zdB (z) В’ (z). (12.46)
Так как deg Р (г) — deg Л (z) = d + deg В (z),
deg P" (z) = max [deg A* (z), deg B*(z)]. (12.47)
Задачу спектрального разложения можно решить, вычислив корни правой части (12.45) и отсортировав их, хотя для ее решения существуют эффективные рекуррентные алгоритмы.
Диофантово уравнение
Характеристический’многочлен Р(г) для ЛК-задачи определяется спектральным разложением в то время, как для ЛКГ-задачи необходимо знать и характеристический многочлен наблюдателя °. Как показано в разд. 12.2, С (z) является многочленом наблюдателя для модели (12.5). Из решения задачи размещения полюсов можно предположить, что оптимальное управление определяется выражением
«(fe) = -4§y^(fe)> О2-48)
где R(z) и S(z) —решения диофантова уравнения
Р (z) С (г) = А (г) Я (z) + В (z) S (г). (12.49)
Это утверждение действительно имеет место, однако, поскольку (12.49) имеет бесконечно много решений, необходимо выбрать из них корректное решение. Выбор нужного решения
*> В дальнейшем просто «многочлен наблюдателя». — Прим. ред.
основывается на некоторых алгебраических свойствах уравнений (12.45) и (12.49).
Без потери общности можно предположить, что deg A (г) = = deg C(z) = deg P(z) = n. Предположим далее, что A(z) и B(z) относительно просты и deg A (z) deg B{z). Тогда из следствия теоремы 10.1 вытекает, что уравнение (12.49) имеет единственное решение, удовлетворяющее'условиям deg S(z)</г и deg R (г) = п. Это решение соответствует управлению (12.48) с временной задержкой по крайней мере в один период квантования.
Если требуется построить управление без временной задержки, то степени многочленов R(z) и S(z) должны быть одинаковыми. Поскольку таких решений может быть множество, для получения единственного решения необходимо решить задачу оптимального управления. Прежде чем обсуждать этот вопрос, приведем вспомогательный алгебраический результат. Если степени многочленов R(z) и S(z) равны и, то из (12.49) следует, что
Л* (2) Я* (2) + ZdB' (z) S* (z) = P* (z) C* (z), где
d — deg A (z) — deg В (z).
Справедлива следующая лемма:
Лемма 12.2
Пусть A(z), C(z), P(z), R(z) и S (z) — многочлены степени n. Если многочлены R(z), S(z) и P(z) удовлетворяют (12.45) и (12.49), то существует многочлен Х(г), такой что
Л’ (z) X (2) + rP (z) S* (г) = В (z) С (z) (12.50)
и
Р* (z) X (г) + рЛ (2) S’ (z) = R* (г) В (z). (12.51)
Доказательство. Рассмотрим цепочку равенств
Л’(2) [/?’ (2) В (2) - РЛ (2) S’ (2)] =
= Л* (2) R* (2) В (2) - S’ (2) [rP (Z) P’ (z) - ZdB (z) B’ (2)] -
= В (z) [Л* (z) P* (Z) + ZdB* (Z) S’ (z)J - Г S’ (Z) P (2) P’ (2) =
= В (z) P* (2) C’ (z) - rS* (2) P (2) P* (z) =
= P* (z) [B (2) C (2) - rS* (2) P (2)]. (12.52)
Здесь первое равенство следует из (12.46), а третье — из (12.49).
Предположим, что A (z) и B(z), а также P(z) и А (г) относительно просты. Тогда Л* (z) является множителем многочлена В (z) С* (z) — rS* (z) Р (z), a P*(z)—множителем P*(z)B(z) —
— рД (z)S* (z). Кроме того, существует многочлен Х(г), такой что
В (z) С* (z) - rS’ (г) Р (z) = Д* (г) X (z) и
Я’ (z) В (z) - р Д (z) S* (z) = Р* (z) X (г), откуда вытекает справедливость (12.50) и (12.51).
Рассмотрим теперь случай, когда Д(г) и В (г) имеют общие множители. Пусть A?(z)—наибольший общий делитель Д(г) и B(z). Из (12.45) следует, что A?(z) также является делителем многочлена P(z). Разделив (12.52) на A?(z) и повторив предыдущие рассуждения, получим требуемый результат. Отметим, что в этом случае A2(z) является также делителем Х(г).
Основной результат
Решение ЛКГ-задачи дается следующей теоремой.
Теорема 12.4. Рассмотрим систему (12.5) с deg/l(-z) = = deg C(z)=n. Предположим, что все нули многочлена С (г) лежат внутри единичного круга, что совокупность многочленов Д(г), B(z) и C(z) не имеет общих делителей, а нули возможных общих делителей многочленов Д(г) и B(z) лежат внутри единичного круга. Пусть приведенный многочлен В (г), все нули которого лежат внутри единичного круга, является решением уравнения (12.45) и degP(z)=n Допустимое управление, минимизирующее критерий качества (12.8), определяется выражением
y(k\ (12.53)
где многочлены /?(z) и S(z) определяются как
S{z) = zn~A^ s"S* (z-1),
R(z) = zn-A^R'P' (z~\ (12l54)
а многочлен S*(z) является единственным решением (12.50), таким что degX(z)<n. Многочлен /?*(г) удовлетворяет (12.51), а многочлены R(z) и S(z)—уравнению (12.49).
При управлении (12.53) выход системы есть
y(k) = ^e(k), (12.55)
а управляющий сигнал равен
(12-56)
Минимальное значение функции потерь равно
+ (12.57)
Доказательство. Введем новую переменную а = v + у,
(12.58)
которую можно рассматривать, как преобразованную управляющую переменную. Из (12.5) и (12.49) получаем
BRv + CRe BRv + CRe' _* BR R V— AR+ BS ~ PC ~ PC V ‘ P e'
Тогда в силу (12.58) можно записать
SBv + SCe PC — BS S u v PC ~ PC v P e
(12.59)
^v-^e. (12.60)
Функцию потерь можно записать в виде
/ = £Lva + p«2l = f + теТ+
+ рВ[^-о-4е]’ = Л + 2Л + /э, (12.61)
где
'2=4(4П(4<)-р(4Н(4*)]-/.=4(£0’+р(7<Л-
Проанализируем каждое из этих выражений по отдельности. Из замечания 1 к теореме 6.2 и равенства (12.45) следует, что , _ B{q)R(q) В (q-')R(q-') + pA{q) R{q) A (q-')R(q-') \ 1 _
Л~£|Л P(q)P(q-')C(q)C(q-') VJVJ —
- р[( В(д)Р(д-‘)гР(д)Р(д-') Ч 1 _
1Л Р(д)Р(д-')С(д)С(д~<) —
=Е\(гс^с^ ^21-
1л с (д)С(д ') 7 J L \ С (д) ) J
Далее
1 — IY в (4) R (?) R (?~’) - рЛ (д) R (д) S (д~') ч 1 _
1,2 ~1Л Р(д)С(д)Р(д-') иГ1~
_ р Г С R (?) [Д (9) R (?~‘) — Р-4 (д) s (<?-)] ч 1
-С|Л P(g)C(q)P(g-<) V)e\‘
Однако из леммы 12.2 вытекает, что
R (у) [В (у) R (у~1) - РА (у) S (у~1)] = R(y)P (y~l) X (у), поэтому
“И-
<12-е2>
По условию теоремы P(z) и C(z) устойчивы. Поскольку X(z)— решение (12.50), и deg X (z) < deg Р (z) = п, deg/?(z) = = degC(z)=n, то степень R(z)X(z) меньше степени P(z)C(z). Таким образом, член
является функцией v(k — 1), v(k — 2).....Так как все эти
члены не зависят от e(k), величина /2 обращается в нуль.
Таким образом, функцию потерь можно записать в виде
/ = Е(4о)2 + £(4в)2 + Р£(Я2.
где Р и С — устойчивые многочлены. Следовательно, функция потерь достигает минимума (12.57) при и =0, что соответствует управлению (12.53). Уравнения (12.55) и (12.56) вытекают из (12.59) и (12.60), а формула (12.57) следует из теорем 6.2 и 6.4. * В
Замечание" 1. Управление с минимальной дисперсией ошибки вытекает из теоремы 12.4 как частный случай с р = 0.
Замечание 2. Поскольку degX(z)< degP(z), из (12.51) следует, что deg/?*(z)<n, если р=0, и deg S*(z)<n, если р > 0.
Замечание 3. Если допустимое управление может иметь временную задержку в один период квантования, то управление определяется выражением (12.53), где R(z) и S(z)—единственное решение уравнения (12.49), удовлетворяющее условию deg S (z) < п. В этом случае
Л* (z) R” (z) + zd+'B* (z)S’ (z) = Г (z) C* (z). (12.63)
Теорема 12.4 определяет удобный способ построения ЛК-управления для систем с одним входом и одним выходом. Вначале в результате решения задачи спектрального разложения (12.45) строится многочлен Р. Если А и В имеют устойчивый общий множитель А2, то удобно разложить Л и В на множители А — А\А2, В — В\В2 и решить следующую задачу спектрального разложения:
rPt (z) Pi (z~‘) = рД (z) A, (z-1) + Bt (z) B{ (z”1). (12.64)
В этом случае многочлен Р вычисляется как ДД- Многочлены 7?(z) и S(z) можно вычислить разными способами: многочлен S(z) можно найти из (12.50) и (12.54) и затем вычислить R или из (12.51) и (12.54), или из (12.49). Можно поступить иначе и сначала определить степень многочлена, используя (12.50), а затем найти R(z) и S(z) из (12.49).
Теорема 12.4 устанавливает связь между методами проектирования регуляторов, основанных на размещении полюсов и решении задачи ЛКГ-управления. Задачу ЛКГ-управления мож-
но трактовать как задачу размещения полюсов, в которой полюса замкнутой системы помещаются в нули многочленов P(z) и C(z).
♦♦♦ Заметим, что решение ЛКГ-задачи позволяет получить характеристический многочлен наблюдателя и частное решение диофантова уравнения (12.49).
Пример 12.7
Рассмотрим систему (12.5), в которой
A (z) = z + а,
В (z) = Ь,
С (z) = z + с.
Для отыскания управления, минимизирующего критерий качества (12.8), вначале решается задача спектрального разложения. Запишем уравнение (12.45) в виде
г (г + pi) (z~' 4- pi) = р (z + a) (z~' + а) + b2.
Приравнивая коэффициенты при одинаковых степенях г, получаем систему уравнений относительно г и р(
гр, = ра,
r(l + pf) = Р (1 + а2) + Ь2,
решение которой имеет вид
Г=_Р£_
Pi и
р (1+ а2) + Ь2 - д/р2 (1 - а2)2 + + 2р&2 (1 + а2)
Р'~ 2^ :---------•
Радикал взят с отрицательным знаком, чтобы гарантировать, что корень P(z) лежит внутри единичного круга. Уравнение (12.50) принимает вид
(1 4- аг) хв 4- г (г 4- р,) s0 = b (1 4- cz), поэтому
S* (z) = So = _^£2Z£Lt
г(1 - ар.)
Х(2) = х0 = -ЦЦ^-.
1 api
Таким образом, многочлены X(z) и S(z) имеют нулевую Степень, поскольку deg) P(z) = 1. Многочлен R* определяется из (12.51) Предположим, что
В («) = го (z) 4- г,.
Тогда, учитывая, что rpi = ра, получаем
го= 1.
Другой подход к решению задачи совпадает с описанным до того момента, когда становится ясно, что degS*(z)=0. Далее используется уравнение (12.49), которое в данном случае принимает вид
(г 4- р,) (z4- с) = (z 4-a) (roz 4-гО 4- bsoz.
Полагая z = —а, имеем
(р, — а) (а — с)
*0
ab
Положив в (12.45) z = —р,, получим равенство
Ьгр, Pi — а = —т------Гт-.
р(ар, — 1)
Таким образом, получаем то же значение so, что и ранее. Приравнивая постоянные члены (12.49), получаем
р,с — аг, или
г0= 1-
Управление, таким образом, принимает вид
и {k)=_ 414 у (k)=_ —±— у (k).
. R (<7) ab q + р,с/а у '
ab
Неуправляемые и неустойчивые режимы
В практических приложениях важную роль играют модели, в которых многочлены A (z) и В (г) имеют общий множитель, не являющийся множителем C(z). Подобные модели возникают в тех случаях, когда существуют режимы, возбуждаемые возмущениями и неуправляемые по входу. Поскольку такие режимы не управляемы, регулирование с помощью обратной связи оказывается неэффективным.
Теорема 12.4 применима тогда, когда общие множители устойчивы, в противном случае она не имеет силы. Вместе с тем, случай неустойчивых общих множителей представляет практический интерес, поскольку он является одним из способов построения регуляторов интегрального действия.
Для анализа этой ситуации предположим, что А2 — наибольший общий делитель А и В, а А2 — множитель А2, нули которого лежат вне или на границе единичного круга. Пусть управление имеет вид
где R(z) и S(z) —относительно простые многочлены. Из (12.5) следует, что
У A (q) R (q) + В (q) S (q) e^’ (12.65)
U = ~ A (q) R (q) + B(q) S (q) 6 <12‘66)
Неустойчивый множитель A2 (z) является делителем знаменателей в правой части (12.65) и (12.66), поэтому как у, так и
и будут неограниченными, если /?(z) и S(z) не выбрать специальным образом. Сигнал у будет ограниченным, если /?(z) делится на ДГ (г), а и ограниченно, если S(z) делится на А-Г (z). Поскольку R(z) и S(z) относительно просты, то одновременная ограниченность у и и невозможна. Это вполне естественно, поскольку для компенсации бесконечно больших возмущений требуется бесконечно большое управление.
Чтобы сформулировать задачу такого рода как задачу оптимизации, имеющую какой-то смысл, необходимо модифицировать критерий качества (12.8). Один из способов состоит во введении новой переменной
w(k) — q~mA2 (q)u(k), (12.67)
где tn — deg А2 (z), и нового критерия качества:
4 = £W) + P®W (12.68)
Можно доказать следующую теорему:
Теорема 12.5. Рассмотрим систему (12.5). Пусть степень многочленов A (z) и C(z) равна п. Предположим, что все нули C(z) лежат внутри единичного круга и что не существует многочлена, являющегося общим делителем A(z), B(z) и C(z). Пусть A2(z)—наибольший общий делитель А (г) и В (г), а А2 (z)— делитель A2(z), все корни которого лежат вне или на границе единичного круга. Тогда допустимое управление, минимизирующее (12.68), определяется выражением (12.53), где
P(z) = Pl(z)A2(z)zm. (12.69)
Pi(z) определяется из (12.64), а т = deg ДГ (г). При этом решение (12.49) должно выбираться так, чтобы выполнялись следующие условия:
1. deg R (s) — deg S (z) = n + tn.
2. ДГ (z) является делителем /?(z).
3. deg S* (z) < n, если p > 0, и
deg R* (z) < n -f- m, если p = 0.
Доказательство. Введем сигнал w, определяемый формулой (12.67). Поскольку
В (z) = Вх (z) Д2+ (г) ДГ (z) = В (г) z~mA2 (г), где
В (z) = Вг (z) Д2+ (z) zm, (12.70)
модель (12.5) можно переписать в виде
Л (?) у (k) = В (q) w (/г) + С (?) е (k). (12.71)
Многочлены A(q) и B{q) не имеют общих множителей с корнями, лежащими внутри или на границе единичного круга, и теорема 12.4 применима к системе (12.71) с критерием качества (12.68). Поэтому управление определяется выражением
w(k) = -^-y(k), (12.72)
где
Р (z) С (z) = А (г) R (г) + В (z) S (z) (12.73)
и
P(z) = P1(z) At (г). nJ
Здесь deg S* (z) < п, если р > 0, и deg R* (z) < п, если р = 0. Из уравнений (12.67) и (12.72) вытекает
« W = — У
где
^(z) = ^(z)B(z),
S(z) = zmS(z). 1 ‘ J
Следовательно,
/?‘(z) = Ar’(z)B‘(2), S’(z) = S*.
Отметим, что deg ЛГ* (z) = т, поскольку все нули лежат вне единичного круга.
Умножая (12.73) на Д7 (z), получаем (12.49), поскольку из (12.71) и (12.74) следует, что
В (z) A? (z) = (z) At (z) A2 (z) z'n = В (z) zm.
Замечание. Удобный способ построения оптимального управления состоит в предварительном отыскании наибольшего общего делителя (НОД) А2 многочленов А и В и вычислении Ai — Д/НОД(Л, В) и Bi — В/НОД(Л, В). Тем самым решается задача спектрального разложения (12.64). Кроме того, при этом определяется решение диофантова уравнения
PiC = Aj А> Ri -(- BiSi (12.75)
для deg Ri = deg S = п. Степень многочлена S* (z) меньше п, если р > 0, а степень R*(z) меньше п, если р = 0. Тогда R(z) и S (z) определяются как
R(z) — Az(z)Ri(z), S\z) — z Si
(12.76)
Сравнение с подходом на основе пространства состояний
Задачи, рассматриваемые в данной главе, можно решать и методами, основанными на идеях пространства состояний, описанных в гл. 11. Для сравнения различных подходов рассмотрим представление модели (12.5) в терминах пространства состояний. Предположим, что модель нормализована, т. е. deg C(z)— deg A (z). Тогда (12.5) можно записать в виде
х (А> + 1) = Фх (k) + Гн (k) + Ke (fe),
y(k) = Cx(k) + e(k), (12.77)
где
с=[1 о ... 0]
(12.78)
Поскольку это новационное представление, легко убедиться, что фильтр Калмана имеет вид
jc(fe+ 1 |/?) = Фх(^|/г- 1) + Гн(/г)+ K[y(k)-C£(k\k- 1)] (12.79)
с характеристическим многочленом
det [zZ - (Ф - КС)] = C(z). (12.80)
При получении управления, рассмотренного в гл. 11, предполагалось наличие временной задержки в один период квантования, поэтому оптимальное управление имеет вид
н(/г) = — Lx(k\k — 1).
Передаточная функция оптимального регулятора есть
ZZr(z) = - £(z/- Ф + КС+ГТ)"1 К = -,
где S(z) и Z?(z)—решение уравнения (12.49), удовлетворяющее условиям: degS(z)<n и deg/?(z)=n. Теперь легко проверить, что
Z? (z) = det (zZ —- Ф 4-КС + Г£) (12.81)
и
Р (z) = det (z/ - Ф + Г£). (12.82)
Командные сигналы
Рассмотрим теперь задачу слежения (серворегулирования), подробно обсуждавшуюся в гл. 10. Основным моментом в этой задаче является построение командных сигналов, не вызывающих нежелательных ошибок восстановления. Это достигается выбором управления вида
(?) и (/г) = С (?) ис (k) — S(q)y (k).
Из (12.5) при этом следует, что выход системы есть
. y^) = ^uc(k) + -^e(k).
Импульсная передаточная функция по командному сигналу равна B(z)/P(z), и ей можно придать нужный вид, включив ее последовательно с компенсатором с произвольной устойчивой передаточной функцией Hp(z). Тогда управление принимает вид
U(k) = ^Hp{q)uAk)-^y{k). (12.83)
Откуда
y^ = ^Hp(q)uc(k) + ^e(k}. (12.84)
Поскольку многочлен Р устойчив, его нули можно скомпенсировать компенсатором. Таким образом, передаточные функции для возмущений и командных сигналов можно строить раздельно. А именно, вначале можно построить обратную связь S/R, гарантирующую нужную обработку возмущений, и затем подобрать компенсатор Нр, обеспечивающий заданную реакцию на командные сигналы.
12.5. ПРАКТИЧЕСКИЕ АСПЕКТЫ
При формулировке задач конструирования регуляторов в виде задач оптимизации на первый взгляд почти полностью исключается возможный произвол в выборе параметров регулятора. Задав модель и критерий качества, можно однозначно получить оптимальное управление, если решить задачу оптимизации. Однако эта простота обманчива, так как при такой постановке проблемы возможного выбора просто переносятся в область выбора модели и критерия качества. Успех применения данного подхода определяется ясностью понимания зависимости качественных характеристик управления от свойств модели и критерия. При этом нужно знать ответы на вопросы типа: Какова должна быть модель, чтобы получить регулятор интегрального действия? Как нужно ставить задачу оптимизации, чтобы, решив ее, получить ПИД-регулятор, и т. д.? Некоторые вопросы подобного рода рассматриваются в настоящем разделе. Обсу
ждаются также некоторые важные свойства оптимального управления, в частности такие, которые можно рассматривать как определенные правила проектирования регуляторов.
Среди вопросов, представляющих прикладной интерес, внимания заслуживают такие, как флуктуации функции потерь между моментами квантования и проблемы выбора периода квантования. •' -•
Свойства оптимального регулятора
Алгебраические свойства модели процесса оказывают определяющее влияние на вид оптимального управления и его свойства. В данной главе изучается модель процесса, описывающаяся уравнением вида (12.5), т. е.
A (q) y(k) = B (q) u(k) + C (q) e (fe). (12.85)
Отношение В/A представляет собой импульсную передаточную функцию процесса, а С/А — импульсную передаточную функцию, порождающую возмущения на выходе. Многочлены А, В и С могут иметь общие множители, которые отражают характер связи между управляющим сигналом, возмущениями и процессом. Однако предполагается, что не существует множителей, общих для всех трех многочленов (ср. с разд. 12.1). Рассмотрим влияние попарных общих множителей на свойства регуляторов.
Принцип внутренней модели. Общие делители многочленов А и В соответствуют таким режимам, когда возмущения нерегулируемы управлением и. Такие режимы проявляются как множители Р. Пусть
Л2 = НОД(Л, В) (12.86)
есть наибольший делитель многочленов А и В. Если Д2 устойчив, то из теоремы 12.4 следует, что Л2 является делителем Р. Если А2 имеет множитель А2 , все нули которого лежат вне единичного круга, соответствующий результат следует из теоремы 12.5. В этом случае, кроме того, из теоремы вытекает, что А2 является делителем Р. Этот факт называют принципом внутренней модели. Он, по существу, означает, что для управления системой с неустойчивыми возмущениями динамика возмущений должна присутствовать в динамике регулятора.
Пример 12,8. Интегральный регулятор
Регулятор является интегральным, если R(z) делится на z—1. Из теоремы 12.5 и принципа внутренней модели следует, что это имеет место, если z — 1 одновременно является делителем А и В, т. е. что модель имеет следующий вид:
А, (<?) (q - 1) У (k) = В. (9) (9 - В « (k) + C(q)e (k). (12.87)
Это означает, что в системе имеется дрейфующее возмущение.
Пример 12.9. Компенсация синусоидального возмущения
Узкочастотное синусоидальное возмущение с несущей частотой со можно описать как белый шум, прошедший через систему, числитель передаточной
функции которой имеет вид
D (q) = q2 — 2q cos ah + 1.
Если полюса передаточной функции системы не совпадают с нулями D, то модель можно записать в виде
А, (?) D (?) у (k) = Bt (?) D (?) и (k) + С (?) е (k). (12.88)
Таким образом, в оптимальном регуляторе D(z) является делителем R(z).
Компенсация полюсов процесса. Общий делитель многочленов А и С соответствует управляемым режимам,- которые не возбуждаются возмущениями. Пусть Д2— наибольший общий делитель А и’ С. Многочлен <42 устойчив, так как С устойчив; кроме того, он не является делителем В, поскольку тройка А, В и С не имеет общих делителей. Из (12.49) вытекает, что А2 является делителем S — числителя передаточной функции регулятора. Таким образом, устойчивые полюса процесса, не возбуждаемые возмущениями, можно скомпенсировать.
Компенсация нулей процесса. Общие множители многочленов В и С соответствуют нулям передаточной функции, блокирующим прохождение как сигналов управления и, так и возмущения е. Пусть В2— наибольший общий делитель В и С. Многочлен В2 устойчив и не является делителем А, поэтому из (12.49) следует, что он является делителем R. Это означает, что нули, соответствующие В2 = 0, компенсируются регулятором. По этой причине нули процесса, которые одновременно являются нулями передаточной функции по возмущению С, компенсируются регулятором.
Для управления с минимальной дисперсией из (12.46) следует при р — О, что
P = qdB+B^,
а из (12.49) вытекает, что R делится на В+. Таким образом, при таком управлении компенсируются все устойчивые нули.
Итак, анализ свойств оптимального управления позволяет дать хотя бы частичный ответ на классическую проблему компенсации.
Чувствительность и робастность
Система управления должна быть нечувствительной или робастной к ошибкам измерений, действующим на объект, возмущениям и погрешностям моделирования. Анализ робастности можно провести теми же методами, что использовались при рассмотрении задачи размещения полюсов (разд. 10.6), а именно через усиление по контуру Hig:
(12.89)
или через возвратную разность Hrd-.
Н 1 4- 55 + BS __ PC ,. „ qm
Hrd—l+^p— ar—AR- (12-Уи)
Усиление по контуру /ДДехр tra/i) обычно велико на низких частотах и мало на высоких. Наименьшая частота, на которой
|Wzg(e^h)| = l,
является частотой среза wc. На тех частотах, где Htg(exp lath) мало, замкнутая система нечувствительна к возмущениям в объекте; чтобы система обладала слабой чувствительностью к погрешностям моделирования высокочастотной динамики объекта, усиление по контуру должно быстро убывать после частоты среза (см. задачи 12.8 и 12.9); таким образом, можно получить низкое усиление на определенных частотах. Для оценки чувствительности можно воспользоваться зависимостями типа изображенных на рис. 10.5. Хорошо спроектированная дискретная система имеет специальные фильтры для гашения сигналов с частотой, превосходящей частоту Найквиста. Выбор небольшой частоты квантования является одним из способов получения низкого усиления на определенных частотах.
♦♦♦ Заметим, что частотные зависимости усиления и возвратной разности не дают полного представления о чувствительности системы, поскольку они не отражают возможную компенсацию нулей и полюсов. В подобных случаях проводится анализ характеристических уравнений. Для этого предполагают, что система описывается уравнением
А° (q) у (k) = Д’ (q) и (k) + С° (q) е (k) (12.91)
в то время, как регулятор представляется уравнением (12.85). Регуляторы, построенные в соответствии с теоремами 12.4 и 12.5, дают замкнутую систему с характеристическим многочленом А° R + B°S = A°R — AR + B°S — BS+AR+ BS =
= PCA-(A°-A)R + (B°-B)S. (12.92)
Когда модель (12.85) совпадает с (12.91), то, как и следовало ожидать, характеристический многочлен есть PC = PiA2C. По непрерывности малые изменения параметров системы вызывают малые изменения полюсов замкнутой системы. При этом система оказывается чувствительной к изменениям параметров, если многочлен Pi или С имеет нули, лежащие близко к единичной окружности.
Для гарантирования низкой чувствительности системы необходимо ввести дополнительные ограничения. Напомним, что как С, так и Р\ получены в результате решения задачи спектральной факторизации.
Замкнутые системы с гарантированной экспоненциальной устойчивостью
Управления, определяемые теоремами 12.2—12.5, дают замкнутые системы с полюсами, лежащими внутри единичного круга. Иногда возникает необходимость в таких управлениях, для которых полюса замкнутой системы лежат внутри круга радиуса г. Сформулируем оптимизационную задачу, решение которой дает управление с указанным свойством.
Введем критерий качества
. / = е[(1)2\^) + Р«2 (£))]• (12.93)
Если существует управление, минимизирующее этот критерий, то переменные y(k) и u(fe) с ростом k должны убывать не медленнее, чем rk. Для этого модель (12.5) должна быть такой, что ковариация e(k) также будет убывать как гк.
Введем новые переменные т), ц и е:
u(k) = rkn(k), (12.94)
е (k) = rke (k).
Поскольку
qly (k) = ql [rfcT] (/?)] = rk+lt] (k + I) = rk (rq)1 t] (k),
TO
A (q) y(k)=A (q) [A] (k)] = rkA (rq) 7] (k).
Введем следующие обозначения: A(z) = A(rz), B(z)=B(rz), C(z) = C(rz) и перепишем (12.5) в виде
A (q) т] (k) = В (q) т] (k) + C (q) e (fe). (12.95)
Аналогично (12.93) принимает вид
J = E[rf(k) + PlxW (12.96)
Тогда управление, минимизирующее (12.96) для системы (12.95), дается теоремой 12.4. Это управление таково, что все корни характеристического уравнения
P(z)C(z) = 0
замкнутой системы лежат внутри единичного круга. Возвращаясь к старым переменным, получим характеристическое уравнение
P(z)C(z) = p(-|)c(4) = 0,
все корни которого лежат внутри круга радиуса |z| = г.
Ослабление возмущений
Возвратная "разность равна
г, Z.A 1 I ГТ I -Л II "4/? + BS
нrd (z) 1 Н- Нlg (z) 1 Н- Др
Величина, обратная возвратной разности, является мерой того, насколько эффективно замкнутая система подавляет возмущения.
Рассмотрим модель (12.85). Без управления выход равен
С
Vol д
а в случае ЛК-управления имеем
R
Vlqg р е‘
Исключая е из двух предыдущих уравнений, получаем
111
Vlqg == pc Vol == pc Vol == pg Vol Vol- (12.97) ~AR 1
Импульсная передаточная функция
<12-98>
таким образом показывает, как подавляются возмущения на разных частотах.
Выбор периода квантования
Управление с минимальной дисперсией (разд. 12.3) и ЛКГ-управление (разд. 12.4) имеют существенно разную чувствительность к величине периода квантования. В первом случае выбор периода квантования играет важную роль: при коротком периоде имеем узкополосную систему, которая быстро приходит в установившееся состояние. При этом управление оказывается довольно большим по величине, и в этом отношении оно аналогично апериодическому управлению (разд. 9.2). Во втором случае выбор периода квантования менее критичен. Как показано в разд. 11.4. ЛКГ-управление стремится к непрерывному при й->0. Кроме того, разность между значениями непрерывной и дискретной функциями потерь также квадратична по /г.
Вариации дисперсии выхода между моментами квантования
Управление с минимальной дисперсией минимизирует дисперсию выхода в моменты квантования. Между тем главной целью управления может быть минимизация непрерывной функции потерь (12.7). Последней можно добиться, сначала проквантовав
непрерывную функцию потерь, и затем вычислив минимум полученной дискретной функции. Такой подход приводит к более сложной процедуре проектирования регулятора, поэтому во многих случаях управление с минимальной дисперсией принимают как достаточно хорошее приближение. При этом полезно исследовать вариации дисперсии функции потерь между моментами квантования.
Пример 12.10. Вариации функции потерь между моментами квантования
Рассмотрим непрерывную систему
dx = и dt + dv, (12.99)
где {o(f)} •—виДеровский процесс с дифференциальной ковариацией csvdt. Предположим, что выход наблюдается в моменты tk — kh, где h — период квантования. Тогда
У Uk) = х (k) + е (Zfe).
Здесь {e(ft)}—последовательность независимых случайных переменных с нулевым средним и дисперсией о2- Квантованная система имеет вид
х (kh + h) = x (kh) + hu (kh) 4- v (kh + h) — v (kh), у (kh) = x (kh) + e (kh), поэтому
(kh + h) = у (kh) + hu (kh) + v (kh + h) + e (kh + h) —
— e (kh) + v (kh + h) — v (kh).
Возмущение в правой части можно представить в виде w (kh + h) — e (kh + h) + ce (kh), где {e(kh)} — последовательность независимых случайных переменных с нулевым средним и стандартом о.
В результате простых вычислений получаем
а2 = --у-. (12.101)
Управление с минимальной дисперсией для данной системы имеет вид 1 4- с и (kh) =--------------------------------— у (kh).
При этом стандарт выхода и стандарт переменной состояния соответственно равны
Ey2(t) = o2, t = h, 2h, ...,
ЕхА (t) = о2 — о2, t = h, 2h, ... .
Интегрируя уравнение (12.99), получаем дисперсию переменной состояния на интервале между двумя соседними моментами квантования х (kh + s) = х (kh) + su (kh) 4- v (kh + s) — о (kh) =
= (1 — as) x (kh) — ase (kh) + v (kh + s) — v (kh), где a= (1 + с)/й.
Рис. 12.3. Вариации дисперсии выхода для примера 12.10 с различными периодами квантования для разных регуляторов.
Вводя обозначение P(s) = Ex2(kh + s), можно записать Р (s) = (1 — as)2 (a2 — a2) + (as)2 a2 + so2.
Функция P(s) показана на рис. 12.3. Заметим, что max [Р (0) — Р (s)j = Л2о2/2.
Таким образом, дисперсия Р на интервале квантования убывает с уменьшением h.
В общем случае рассуждения остаются теми же с той лишь разницей, что для вычисления ковариации состояния используется теорема 6.3.
Влияние величины интервала квантования на управление с минимальной дисперсией
Для устойчивых систем с устойчивой обратной, где временное запаздывание кратно периоду квантования, минимальная дис-
Рис. 12.4. Зависимость дисперсии ошибки предсказания от длины периода квантования.
персия является ошибкой предсказания выхода на время, равное сумме запаздывания и периода квантования. Таким образом, зная зависимость ошибки предсказания от горизонта прогнозирования, можно оценить влияние длины периода квантования на величину дисперсии (рис. 12.4). Если процесс или обратный процесс неустойчивы, то минимальная дисперсия будет
больше ошибки предсказания. Поскольку устойчивость обратной системы (процесса) может зависеть от величины периода квантования, связь дисперсии и периода квантования может оказаться весьма сложной. Еще одна трудность возникает в том случае, когда запаздывание не кратно периоду квантования. Рассмотрим, например, систему с временным запаздыванием,
Рис. 12.5. Зависимость минимальной дисперсии от длины периода квантования для системы из примера 12.11.
равным единице. Если период квантования h равен 0,52, то горизонт прогнозирования должен быть равен двум, а если h — = 0,48, то трем. Ясно, что зависимость такого рода описать довольно сложно, хотя в конкретных ситуациях это может быть и не так уж сложно.
Пример 12.11. Зависимость минимальной дисперсии от периода квантования Рассмотрим систему
dx (/) = и (t — 1) dt + dv. у {kh} — х (kh) + е (kh), /г = 0, 1,2,... .
где {у (/)} — винеровский процесс с дифференциальной ковариацией o^dt, а {е (kh)} — последовательность независимых случайных переменных с нулевым средним и дисперсией Квантование системы с периодом h дает
у (kh + h) = у (kh) + bou (kh — dh + h) + btu (kh — dh) +
+ e (kh + h) 4- ce (kh), где 1 = (d—1) h + t'. bv = h —-r', bi — x'.
Число с определяется формулой (12.100), а дисперсия о2 переменной е —формулой (12.101). Применяя теорему 12.3, получаем
min Еу2 = f (h).
где
/ 1 + (d - i) (i + с)2, т'сй/г,
Нй) = | I + (rf _ 1) (1 + с)2 + Ц + с)2 (2^ - h) , т/>Л/2
Зависимость / приведена на рис. 12.5. Отметим, что участки кривой с отрицательным наклоном соответствуют значениям периода квантования, при ко
торых обратная система неустойчива. Этот пример иллюстрирует сложность связи минимальной дисперсии и периода квантования.
Для апериодических регуляторов или регуляторов с минимальной дисперсией дисперсия управляющих сигналов растет с уменьшением периода квантования. При выборе периода квантования в таких системах полезно построить
Рис. 12.6. Зависимость дисперсии выхода от ковариации входного сигнала для регулятора с минимальной дисперсией из примера 12.11.
зависимость дисперсий входа и выхода с периодом квантования в качестве параметра (рис 12.6; кстати, эта зависимость справедлива н для системы, рассмотренной в примере 12.11).
Вычислительные аспекты
ЛК-упрявление можно получить, решив задачу спектральной факторизации и линейное диофантово уравнение. При этом, однако, следует помнить о фундаментальных трудностях вычислительного характера, связанных с плохой обусловленностью полиномиальных уравнений (разд. 15.6)
ВЫВОДЫ
В данной главе рассмотрено решение задачи оптимального управления для систем, которые описываются с помощью моделей типа «вход-выход». Рассмотрение ограничивается случаем с одним входом и одним выходом. Вначале была получена каноническая модель (12.5) такой системы, характеризующаяся тремя многочленами А, В и С. Исходную непрерывную модель можно представить как комбинацию системы с рациональной передаточной функцией и временного запаздывания. Возмущения при этом можно трактовать как фильтрованный белый шум. Подобные модели оказываются пригодными для описания многих физических систем.
Получено решение задачи оптимального управления с квадратичной функцией потерь: сначала для частного случая, когда
эта функция есть не. что иное, как дисперсия выхода, а затем для общего, когда функция потерь включает штраф на величину управления. Обе задачи тесно связаны с задачей прогнозирования случайного процесса с рациональной спектральной плотностью. При решении этой задачи обсуждались различные практические аспекты, например проблема выбора величины периода квантования.
Решение задачи оптимального управления дает средство для конструирования регуляторов и позволяет лучше понять свойства оптимального управления. В частности, выясняется, что оптимальный регулятор всегда компенсирует устойчивые нули процесса, являющиеся одновременно и нулями возмущений, действующих на процесс. При этом устойчивые нули компенсируются только в том случае, когда они не возбуждаются возмущениями. Полученные результаты помогают уяснить связь различных методов конструирования между собой. Так, ЛКГ-управление можно интерпретировать как регуляторы с заданным расположением полюсов, в которых полюса процесса и наблюдателя выбраны некоторым специальным образом.
Вычисление оптимального управления сведено к решению задачи спектральной факторизации многочленов и решению полиномиальных диофантовых уравнений.
ЗАДАЧИ
12.1. Имеется процесс
где e(k) —белый шум с нулевым средним и единичной дисперсией. Постройте оптимальный m-шаговый предиктор и найдите дисперсию ошибки предсказания для т — 1, 2, 3.
12.2. Постройте m-шаговый предиктор для процесса
у (k) + ay{k — \) = e(k) 4- ce(k — 1).
Найдите дисперсию ошибки предсказания как функцию от т.. 12.3. Стохастический процесс описывается уравнением
y{k) — 0,9г/ (Аг — 1) = e(k) + 5e(fe — 1).
Постройте эквивалентное описание, такое что корень соответствующего многочлена С лежит внутри единичного круга. Постройте 2-шаговый предиктор и найдите дисперсию ошибки предсказания.
12.4. Предположим, что спрос на продукт z(k), имеющийся на складе, описывается уравнением
z(fe) = 300+ 10fe + у (k),
где время измеряется в месяцах, a y(k) удовлетворяет урав нению
у (k) - 0,7у (k - 1) — 0,\у (k - 2) = 5е (k).
Здесь e(k)— белый шум с нулевым средним и единичной дне Персией. Постройте прогноз спроса на август — ноябрь на осно вании следующих данных: “
Месяц k z(fe)
Январь 1 320
Февраль 2 320
Март 3 325
Апрель 4 330
Май 5 350
Июнь 6 370
Июль 7 375
Найдите дисперсию ошибки прогнозирования.
12.5. Имеется процесс
«/(fe)-//(fc-l) + 0,5y(fe-2) =
= и (k - 2) + 0,5« (А — 3) + 0,5 [е (k) + 0,8г? (k — 1) + 0,25е (k -2)]
Постройте регулятор с минимальной дисперсией и найдите ми нимально возможную дисперсию.
12.6. Постройте регулятор с минимальной дисперсией для си стемы
у (k) — 0,5 у (k— 1) = и (k — 2) + е (k) — 0,7е (k — 1),
где e(k) —белый шум со средним, равным 2, и единичной дис Персией.
12.7. Имеется процесс
y(k) + ay(k~ 1) = u{k — 2) + e(k) + ce(k — 1).
Постройте регулятор с минимальной дисперсией. Что будет, есл а =0?
12.8. Имеется система
y(k)— i,7y(k- 1) + 0,7#(/г-2) = и(/г-й) +
-hO,5«(fe-d- 1)4-е(А>) + l,5e(fe- 1)4-0,9е(А:-2
Постройте регулятор с минимальной дисперсией и найдите Дис Персию ошибки для d — 1 и d = 2. Промоделируйте поведени разомкнутой системы и системы с регулятором и сравните вь ходные сигналы,
12.9. Имеется процесс:
Спектральная плотность возмущения г равна
ЧРг(®) 2л 1,36 + 1,2 cos <о
Найдите импульсную передаточную функцию Н(г), порождающую выход со спектральной плотностью <рг при белом шуме с нулевым среднцм и единичной дисперсией на входе. Чему равна дисперсия у в установившемся состоянии, если
u(k) — — Ky(k)
при К = 1? Чему равна минимальная дисперсия для пропорционального регулятора и каково соответствующее значение К? Какова минимальная дисперсия при использовании регулятора с минимальной дисперсией?
12.10. Имеется система
у (k) — 0,25t/ (k — 1) -f- 0,5t/ (k — 2) = u(k — 1) + e(k) + 0,5e(& — 1)
где e(k) —белый шум с единичной дисперсией. Пусть процесс управляется пропорциональным регулятором
u(k) = — Ky(k).
Покажите, что дисперсия выхода равна
2,125 — К
0,5 (1,75-/С) (1,25 +/С)
и что управление с минимальной дисперсией (равной 4/3) достигается при К=1. Дисперсия обращается в нуль при К = = 2,125. Объясните этот парадокс.
12.11. Имеется процесс
у (/г) — 1,5у (k — 1) + 0,7у (k — 2) = u(k — 2) —- 0,5tz (k — 3) +- v (k).
Постройте апериодический регулятор для случая v(k) — 0.
Пусть v(k) — e(k) — 0,2е(/г — 1), где e(k)—белый шум. Найдите управление, минимизирующее дисперсию ошибки. Чему равна дисперсия у в установившемся состоянии для апериодического регулятора и регулятора с минимальной дисперсией?
Промоделируйте поведение системы для этих регуляторов Исследуйте величину выходов и накопленной ошибки, т. е. суммы квадратов выходов.
12.12. Имеется динамическая система
где e(k) — белый шум. Пусть многочлены А, С и D — приведенные. Постройте регулятор с минимальной дисперсией.
12.13. Используйте предыдущий результат для построения аналогичного регулятора для системы
У = 1-K^i-u (fe) + с1 + ^"')е
12.14. Рассмотрите процесс, описанный в задаче 12.13. Пусть период квантования увеличен вдвое, т. е. управляющий сигнал можно менять только в каждый второй момент времени. Постройте регулятор с минимальной дисперсией и сравните с предыдущим случаем.
12.15. Имеется система, где е — белый шум с нулевым средним и единичной дисперсией. Пусть A (q) =q — 0,7, B(q) — q,
C(q)= 1 — 0,5?, а= —0,8. Постройте регулятор, минимизирующий дисперсию yi, и найдите значения дисперсий щ и у2. Постройте регулятор, минимизирующий дисперсию у2, если измеримо только i/2. и найдите дисперсии у\ и у2. Постройте регулятор, минимизирующий дисперсию у2, если измеряемы у\ и у2, и найдите дисперсии у\ и у2.
12.16. Имеется процесс
A (q) y(k) — B (q) u(k) + C (q) e (k) + D (?) v (k),
где v(k) —известное возмущение. Постройте регулятор с минимальной дисперсией, если deg В — deg О.
12.17. Используя теорему 12.4, постройте ЛКГ-регулятор для процесса
(1 — 0,9?~‘) у (k) = «(&) + (! — 0,5?~') в (/г)
при р = 1. Найдите дисперсию входа и выхода для различных значений р.
12.18. Имеется система с устойчивой обратной. Постройте регулятор с минимальной дисперсией, где допустимое управление u(k) может быть функциейy(k—\),y(k—2), .... u(k—1), ... . Найти характеристическое уравнение замкнутой системы.
12.19. Покажите, что импульсная передаточная функция е->1/ для (12.5) и (12.56) определяется формулой (12.55). С помощью
(12.45) выведите регулятор с минимальной дисперсией для системы, в которой
А (9) = <72— 1,59 + 0,7,
B(q) = q + 0,5,
C(q) = q2-q + 0,24.
Сравните с регулятором, построенным на основании тождества (12.17).
12.20. Определите, для каких систем цифровой ПИД-регулятор имеет ту же структуру, что и оптимальный регулятор с минимальной дисперсией.
12.21. Имеется «система, описываемая уравнением
У № = -~а ^Ъи + е (*)1 + w (й)
(здесь е и w — процессы типа белого шума с нулевым средним и стандартом ое и ога).
Приведите цистему к стандартной форме и постройте регулятор с минимальной дисперсией. Рассматривая этот регулятор как ПИ-регулятор, найдите усиление и время возврата как функцию сг'щ/сг2.
12.22. Рассмотрите управление с минимальной дисперсией (12.36) для системы с неустойчивой обратной. Выход замкне-той системы определяется выражением
q(k)= e(k>-
Покажите, что разложение F/B~* в ряд имеет вид = qQ~l + hqd~2 + - - • + fd-i +
В (9)
degF2(?) < deg В-*,
Fi(q) = qd-i + flqd-2+ ••• +fd-i
В- (9)
где а
есть отношение qd~lC(q) и A(q). Предложите удобный способ вычисления F2. Используйте этот результат для определения увеличения минимальной дисперсии, вызванного наличием неустойчивых нулей системы.
12.23. Найдите осцилляции функции потерь между периодами квантования, если процесс
dx} = х2 dt,
dx2 = udt + dv,
y(tk) = x(tk) + e(tk)
управляется регулятором с минимальной дисперсией. Процесс {и(0} — винеровский процесс с дифференциальной ковариацией
a^dt, a {e(^)}~ белый шум измерений с нулевым средним и дисперсией, сф
12.24. В случае процесса, описанного в задаче 12.10, найдите управление с периодом квантования h, минимизирующее функционал
т
lim Е 4- [у2 (s) ds т^°° о
и сравните его с управлением с минимальной дисперсией.
12.25. Имеется процесс, на который действует возмущение в виде винеровского процесса с дифференциальной ковариацией dt. Найдите ошибку предсказания минимальной дисперсии для двух случаев: процесс имеет неустойчивый нуль г = b > 1, процесс имеет неустойчивый полюс z = а > 1.
Рассмотрите разные горизонты прогнозирования и периоды квантования.
12.26. Имеется система (задача 12.23) с дополнительной временной задержкой 1 с. Найдите минимальную дисперсию как функцию периода квантования.
12.27. Имеется система (задача 12.23). Для различных периодов квантования найдите зависимость дисперсии выхода от ковариации входа.
12.28. Имеется система
У = q — 0,999 U + q — G,l 6
Найдите управление с минимальной дисперсией. Сравните полученное решение с пропорциональной обратной связью с той же реакцией. Сравните относительные достоинства этих двух решений, вычислив их усиления по контуру. Объясните, почему управление с минимальной дисперсией в данном случае хуже. (Ключ-, плохо обусловленная оптимизационная задача приводит к плохому «оптимальному» регулятору.)
ЛИТЕРАТУРА
Анализ ЛК-задач в духе работ Винера
1. Wiener N. (1949): Extrapolation, Interpolation & Smoothing of Stationary Time Series. Cambridge, Mass.: MIT Press.
2. Newton G. C., Gould L. A. Kaiser J. F. (1957): Analytical Design of Linear Feedback Controls. New York: John Wiley.
3. Youla D. C., Bongiorno J. J. Jr., Jabr H. A. (1976): “Modern Wiener-Hopf Design of Optimal Controllers. Part I: The Single-Input-Single-Output Case; Part II: The Multivariable Case”, IEEE. Trans. Autorn. Control, AC-21, 3-13 and 319-38.
Задачи предсказания и управления с минимальной дисперсией
4. Astrom К. J. (1970): Introduction to Stochastic Control Theory. New York: Academic Press.
5. Astrom К. J (1965): Notes on the Regulation Problem, Report CT211, IBM Nordic Laboratory.
6. Astrom K. J. (1967): “Computer Control of a Paper Machine: An Application of Linear Stochastic Control Theory”, IBM Journal Res. Develop, II, 389-405.
Аналогичный подход к задачам стохастического управления -
7. Box G. Е. Р., Jenkins G. М. (1970): Time Series Analysis, Forecasting, and Control, San Francisco: Holden-Day. [Имеется перевод: Бокс Дж., Дженкинс Дж.: Анализ временных рядов, предсказание и управление. — М.: Мир, 1976.]
Теорема об управлении с минимальной дисперсией для систем с неустойчивыми обратными впервые опубликована в работе
8. Peterka V.., (1972): “On Steady-State Minimum Variance Control Strategy”, Kibernetika, 8, 219 32.
Алгебраический подход к многомерным ЛК-задачам и задачам управления с минимальной дисперсией
9 Kucera V. (1979): Discrete Linear Control. Prague: Academia.
Выбор интервала квантозания
10. MacGregor J. F. (1976): “Optimal Choice of the Sampling Interval for Discrete Process Control”, Technomeirics, 18, No. 2, 151-60.
13
Идентификация
Построение модели процесса по экспериментальным данным-, описание метода наименьших квадратов
ВВЕДЕНИЕ
Понятие математической модели играет фундаментальную роль в науке и технике, поскольку модель представляет собой простой, компактный и очень удобный способ описания рассматриваемого процесса. Кроме того, модель является весьма эффективным средством обучения и своеобразным языком для обмена данными об изучаемом явлении. В методах аналитического конструирования систем управления, представленных в предыдущих главах, предполагалось наличие моделей процесса и возмущений. Иногда модели рассматриваемых процессов являются прямым результатом приложения основных законов физики. Построение же моделей, описывающих возмущения, не столь просто, хотя роль их не менее важна.
Модели, необходимые для методов конструирования систем управления, обсуждаемых в данной книге, относятся к одному из двух классов — моделям, описывающим процесс в терминах пространства состояний (внутренние модели), или моделям типа «вход-выход» (внешние модели). В первом случае модели строятся как динамические системы с белым шумом; во втором случае модели определяются в терминах спектральной плотности и корреляционных функций. Эти модели, однако, редко можно получить, пользуясь лишь элементарными законами физики — зачастую единственным средством их построения является анализ экспериментальных данных.
Для адекватного описания процесса необходима определенная иерархия моделей, включающая как большие и подробные имитационные модели, так и простые модели, которые легко исследовать чисто аналитическими методами. Последние часто используют для получения общего представления о характере поведения системы, в то время как сложные — для точной оценки качества системы управления. Построение детальных и сложных моделей — это длительный и трудоемкий процесс. Вместе с тем степень сложности модели в каждом конкретном слу
чае должна соответствовать целям решаемой задачи. Именно в умении выбрать нужную модель для данной ситуации и заключается искусство конструктора системы.
Пример 13.1
Для полного описания паротурбинной силовой установки могут потребоваться несколько различных моделей. Так, для планирования отдачи и регулирования частоты напряжения достаточно двух-трех фазовых переменных, описывающих объем накопленной тепловой энергии пара и нагревателей. Для построения системы регулирования и безопасности может потребоваться модель с 20—50 фазовыми переменными. Наконец, для моделирования температурных изменений и механических напряжений в турбине может потребоваться несколько сотен переменных состояния.
Вообще говоря, существуют два источника информации, необходимой для построения модели: ранее накопленные знания, т. е. известные законы природы, и экспериментальные данные. При моделировании конкретных систем часто полезно использовать оба источника.
13.1. 'ПОСТРОЕНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ
Какой-либо стандартной схемы построения математической модели, пригодной для каждого конкретного случая, не существует, поскольку любой процесс или задача обладают собственными специфическими характеристиками. Однако можно сформулировать некоторые общие принципы моделирования. Для построения моделей на основе физических законов необходимо также достаточно глубокое понимание существа изучаемого процесса.
Основная трудность при построении математической модели состоит в выборе переменных состояния (фазовых переменных) системы. Фазовые переменные описывают величину какого-либо параметра, накопленного в системе к данному моменту времени, например массы или энергии. Типичными фазовыми переменными могут быть такие, как положение или скорость (в механике), напряжение или ток (в электрических цепях), уровень или поток (в гидравлических системах), температура, давление или плотность (в тепловых системах). Связь между фазовыми переменными описывается уравнениями баланса для сил, моментов, массы, энергии и другими уравнениями описательного характера.
Преимуществом моделирования на основе физических законов является то, что они позволяют глубже понять физику процесса, не говоря уже о том, что различные параметры и переменные в этом случае имеют ясный физический смысл. К недостаткам данного подхода прежде всего следует отнести то, что такой подход весьма нетривиален и требует времени, в частности, поэтому математическое моделирование, как прави
ло, дополняют экспериментированием. Более подробное обсуждение эти* вопросов можно найти в литературе, приведенной в конце главы.
13.2. ИДЕНТИФИКАЦИЯ СИСТЕМ
Идентификация систем представляет собой экспериментальный подход к моделированию и включает: планирование эксперимента; выбор структуры модели; оценку параметров; верификацию модели.
На практике процесс идентификации проводится итеративно. При исследовании процесса с недостаточной априорной информацией имеет смысл начать с анализа его переходных характеристик или частотной реакции, чтобы иметь хотя бы грубое представление о динамике системы и характере влияния возмущений. Полученные данные могут быть использованы для планирования последующих экспериментов, результаты которых позволят оценить неизвестные параметры процесса. Затем осуществляется корректировка структуры модели и процедура при необходимости повторяется.
Планирование эксперимента
Эксперименты с производственными процессами часто сложны и дорогостоящи. По этой причине желательно иметь методы идентификации, не требующие наличия входных сигналов специального вида. Многие «классические» методы основаны на использовании входных сигналов строго заданного вида, например синусоиды или прямоугольных импульсов. Другие методы работают с любыми входными сигналами, правда ценой повышенной сложности вычислений. Одно из требований к входным сигналам состоит в том, что они должны возбуждать все режимы, возможные при эксплуатации системы. Таким образом, хороший метод идентификации должен быть нечувствительным к характеристикам входного сигнала.
Иногда оказывается возможным идентифицировать параметры системы по данным, полученным в результате анализа поведения замкнутой управляемой системы, и во многих отношениях такой подход оказывается полезным на практике. Так, например, адаптивные регуляторы, как правило, строятся именно таким образом. Основная трудность, возникающая при использовании такого метода, состоит в том, что при этом может оказаться невозможным идентифицировать все параметры системы. Иными словами, замкнутая система может быть «неиден-тифицируемой», даже если все параметры разомкнутой системы идентифицируются. Эту трудность можно преодолеть, введя достаточно сложную обратную связь, скажем нелинейную и нестационарную, или же варьируя установочные значения.
Структура модели
Структура модели определяется по имеющейся информации о процессе и возмущениях. В некоторых случаях вся эта информация сводится лишь к тому, что известно, что в определенном диапазоне процесс можно описать линейной моделью. В такой ситуации естественно воспользоваться общим представлением линейных систем, которые иногда называют моделью типа «черный ящик». Типичным примером является модель в виде разностного уравнения
А (?) у (k) = В (?) и (k) + С (?) е (k), (13.1)
где и — вход,j?— выход, а е—возмущение, принимаемое как белый шум. Как параметры модели, так и порядок уравнения считаются неизвестными.
Иногда можно использовать известные физические законы и построить модели, включающие небольшое число неизвестных параметров. Такие модели могут иметь вид
x — f(x, и, v, 6),
' (13.2)
У = g (х, и, в, 6),
где 0—вектор неизвестных параметров, х — состояние системы, a v и е — возмущения.
Критерии качества
При формулировке задачи идентификации вводится некоторый критерий, показывающий, насколько хорошо модель аппроксимирует экспериментальные данные. Этот критерий можно либо постулировать, либо построить на основании некоторых вероятностных характеристик, если имеются какие-либо оправданные статистические гипотезы. Для дискретных систем критерии качества часто представляют в виде
/(6)= Lie tk)], s=i
где е — ошибка на входе, выходе или некоторая обобщенная ошибка, например ошибка прогнозирования. Функцию g часто выбирают квадратичной, хотя возможны многие другие формы.
Впервые постановка задачи идентификации, ее решение и первое практическое приложение были даны Гауссом в его знаменитой работе, посвященной расчету орбиты астероида Переса. Гаусс сформулировал задачу идентификации как оптимизационную задачу и ввел принцип наименьших квадратов — метод, основанный на минимизации суммы квадратов ошибок.
Метод наименьших квадратов очень прост и совершенно прозрачен. В некоторых случаях он дает оценки с неправильными средними значениями (смещенные оценки), однако эта неприят
ность легко преодолевается различными способами. Вообще же говоря, область применения этого метода ограничивается моделями, линейными по неизвестным параметрам.
Когда возмущения, действующие на процесс, представляются некоторым стохастическим процессом, задачу идентификации можно сформулировать как статистическую задачу оценки параметров. В этом случае можно воспользоваться, например, методом максимума правдоподобия, обладающим рядом привлекательных статистических свойств. Его можно интерпретировать как метод наименьших квадратов, если под критерием качества понимать сумму квадратов ошибок прогнозирования. Метод максимума правдоподобия — очень общий прием, применимый к моделям самых различных классов.
Методы оценки параметров
Для решения задачи оценивания параметров необходимо вначале определить входные и выходные данные процесса, класс модели, критерий качества. Тогда задачу оценки параметров можно сформулировать как задачу оптимизации; при этом наилучшей моделью будет та, которая лучше всего аппроксимирует экспериментальные данные в смысле выбранного критерия качества.
Полученные оценки параметров зависят от постановки задачи. Так, например, численные значения параметров модели зависят от амплитуды и частотного спектра входного сигнала. Кроме того, возможны различные комбинации экспериментальных данных, классов моделей и критериев качества, не говоря уже о существовании большого разнообразия вычислительных методов. Все это позволяет построить множество различных методов идентификации. Последние грубо можно разделить на методы, работающие в реальном масштабе времени и все остальные, или неадаптивные* 2). Первые работают рекурсивно по мере поступления результатов измерений и часто являются единственно возможными, если идентифицируются параметры адаптивного регулятора или если управляемый процесс нестационарен. Что касается вторых, то они часто дают более точные оценки и оказываются более надежными, например в смысле сходимости к оптимальному решению.
Большое разнообразие методов идентификации существенно осложняет задачу инженеру-практику, которому требуется только одно — иметь подходящий инструмент для построения нужной ему модели. В этой связи делались попытки сравнить между собой различные методы идентификации, однако они оказались неконструктивными в том смысле, что просто не суще
*’ В оригинале on-line. — Прим. ред.
2) В оригинале off-line. — Прим. ред.
ствует метода, который был бы лучше других во всех мыслимых случаях. К счастью, выбор метода идентификации не является определяющим, поэтому можно рекомендовать классические методы (анализ частотных характеристик и переходных режимов, корреляционный и спектральный анализ), метод наименьших квадратов и его обобщения и метод максимума правдоподобия.
Верификация модели
Если модель строится по экспериментальным данным, то необходимо проверить ее соответствие реальному процессу, чтобы исключить неадекватность. Для верификации модели полезно определить eej реакцию на ступенчатое воздействие и импульсную реакцию, найти ее полюса и нули, выявить ощибки моделирования и прогнозирования. Поскольку целью верификации модели является тщательный анализ ее адекватности изучаемому процессу, имеет смысл предельно тщательно исследовать поведение параметров, особенно чувствительных к изменениям модели.
13.3. МЕТОД НАИМЕНЬШИХ КВАДРАТОВ
Согласно Гауссу, принцип наименьших квадратов состоит в том, что неизвестные параметры модели должны быть выбраны так, чтобы сумма квадратов разностей между фактически измеренными и вычисленными параметрами, умноженных на числа, являющиеся некоторой мерой точности, была минимальной.
Для получения аналитического решения этой задачи вычисленные значения должны быть линейными функциями неизвестных параметров. В рамках общей постановки задачи идентификации, приведенной в предыдущих разделах, класс допустимых моделей включает модели, выход которых является линейной функцией параметров, а критерием качества — квадратичная функция.
Общая задача
В общей задаче наименьших квадратов предполагается, что «вычисленная переменная» у (в терминологии Гаусса) определяется следующей моделью:
g = 61Ф, (%) + е2<р2 (х) + ... +enq>n(x), (1з.з)
где ф1. ф2, •••. фл известные функции, а 0Ь 02, , 6п — неизвестные параметры. Пары наблюдений {(х(-, yi), i = 1,2, ..., N} получают экспериментально. Задача сводится к определению таких значений параметров, чтобы значения у,, вычисленные по формуле (13.3) для различных значений х,, были бы максимально близки к измеренным значениям yt. В предположении, что все измерения выполняются с одинаковой точностью, в соответствии с принципом наименьших квадратов параметры 0г должны быть
N
такими, чтобы функция потерь /(0) = 1/2 У, еЯ была минималь-' i=i
ной, гле ei = yi—yt^=yi—Bicfi(xl)— ... — 6п<р„(х£), i = 1, 2, ...
..., N. Для упрощения записи введем следующие векторные обозначения:
<р = [pi фг • • ’
0 = [01 е2 ••• е.У
У = [Т1 У г уД1
е. = [б! •••
Теперь задачу можно представить в следующей компактной форме: для заданной функции потерь
J (0) = I/2eTe = 1/2 II81|2, (13.4)
где е = У — У и р = ф0, (13.5)
найти вектор 6, минимизирующий ||е||2.
Решение этой задачи находится с помощью следующей теоремы.
Теорема 13.1. Функция (13.4) минимальна, если вектор 6 удовлетворяет уравнению:
ФГФ0 = Ф^. (13.6)
Если матрица ФГФ не вырождена, то решение единственно и определяется как
0 = (фгф)-1 фту = ф+у. (13.7)
Доказательство. Функцию потерь (13.4) можно записать в виде
2J (0) = еД = \у - Ф0]т [у - Ф0] =
= УТУ - Ут<№ - ЬтФту + 0гф7фО. Поскольку матрица фгф всегда неотрицательно определена, то функция 1 имеет ограниченный минимум. Выделяя полный квадрат (11.15), получаем, что минимум достигается при 0 = 0 = = (ФгФ)-1Фгп.
Замечание 1. Уравнение (13.6) называется нормальным.
Замечание 2. Матрица Ф+ = (фгф) 1 Фг называется псевдо-обратной к Ф, если матрица ФГФ не вырождена.
Идентификация системы
Метод наименьших квадратов можно использовать и для идентификации параметров динамических систем. Пусть система описывается уравнением (13.1) с C(q) — 1. Предположим, что А и В имеют порядок п и п — 1 соответственно. Предположим также, что в систему поступают входы {и(1), п(2), ..., u(N)}, порождающие последовательность наблюдаемых выходов {у(1), т/(2), ..., y(N)}. Тогда вектор неизвестных параметров имеет вид
6 = ап Ьх ... Ьп]т. (13.8)
Далее имеем, что
<р(/г + 1) = [— y(k) ... — y{k — /1+ 1) u{k) ... u(k — n+ 1)]
(13.9) и
<p(n 4- 1)
,p(M)
В этом случае метод наименьших квадратов дает оценку, определяемую формулой (13.7), если ФГФ не вырождена. Нестрого говоря, последнее условие выполняется, если, скажем, спектр входного сигнала достаточно богат
Пример 13.2
Найдем оценки параметров а и b модели y(k) = —ay(k — 1) + bu (k — 1),
N
обеспечивающих минимум критерия качества I (а, Ь) = 1/2 £ е (k)2, где fe=2
е (k) = у (k) — f) (k) = у (k) + ay (k — — bu(k — \) = у (k) — у (k) 6.
Сравнивая с общим случаем, получаем
у ~У(2) -У(3) , Ф = ~-Я1) -Х2) «(1) «(2) , £ = “f (2) " f(3)
_-y(/V - 1) «(W - 1)_ Ж
и 6 = [afef.
Следовательно,
фтф =
ф7> =
"ъ У<№ -Ъу(к)и(к) Л-i Л=1
-s' у(к)и(к) "£ u(k)i _ Л=1 к = 1. # (
- Ё у(1< + ОХ*) к 1
Ё У(к + 1) «(*) _*=i _
Если матрица ФГФ не вырождена, то с помощью формулы (13.7) легко получить оценку параметров а и Ь. Матрица Ф'Ф будет невырожденной, если на входной сигнал наложены определенные ограничения (например, достаточно богатый спектр).
Статистическая интерпретация
Для анализа свойств полученной таким образом оценки необходимо сделать некоторые предположения. Пусть данные генерируются следующим способом:
г/ = Ф60 + е, (13.10)
где 0о — вектор «истинных» значений параметров, а е — вектор белого шума с нулевым средним. Приведем без доказательства следующую теорему.
Теорема 13.2. Рассмотрим оценку (13.7) и предположим, что данные генерируются процессом (13.10), где е — белый шум с дисперсией о2. Тогда, если п — число параметров 0 и 0О, а /V — число данных, выполняются следующие условия:
1. £0 = 0О.
2. var 0 = о2(ФгФ)-1.
3. sz = 2/(0)/(/V —/1) — несмещенная оценка о2.
Из .теоремы 13.2 вытекает, что можно получить несмещенные оценки параметров (13.1), если C(q)=qn. Если C(q)=/=qn, то оценки будут смещенными из-за корреляции между шумом C*(q~l)e(k) и данными в <р(А).
Обобщения метода наименьших квадратов
Метод наименьших квадратов дает несмещенные оценки параметров модели (13.1) только тогда, когда C(q)=qn, а метод
максимума правдоподобия применим и в общем случае. Можно показать, что максимизация функции правдоподобия эквивалентна минимизации функции потерь (13.4), где невязки е связаны со входом и выходом уравнением
C(q)e(k) = A(q)y(k)-B(q)u(k).
Эти невязки можно интерпретировать как ошибки прогнозирования на один шаг, однако функция потерь нелинейна и для ее минимизации, вообще говоря, необходимо прибегать к численным методам. Для этого можно воспользоваться, например, градиентным методом Ньютона — Рафсона. Однако он предусматривает вычисление градиента функции J по параметрам и матрицы вторых частных производных и, следовательно, не является адаптивным. Вместе с тем метод максимума правдоподобия можно аппроксимировать таким образом, чтобы построить адаптивную процедуру вычисления параметров модели (13.1). К таким методам относятся расширенный и обобщенный методы наименьших квадратов и рекурсивный метод максимума правдоподобия.
13.4. РЕКУРСИВНЫЕ ВЫЧИСЛЕНИЯ
Во многих случаях результаты наблюдений получают последовательно, поэтому желательно уметь находить среднеквадратические оценки для различных значений параметров. Если известны оценки для наблюдений, то, наверное, было бы нерационально вновь проводить все расчеты для получения еще одной точки. Поэтому имеет смысл попытаться построить вычислительную процедуру, в которой для получения оценок для N 1 наблюдений можно было бы эффективно использовать оценки, полученные для N предыдущих наблюдений. Аналогичная задача решается и в случае, когда число параметров заранее неизвестно, — здесь нужно знать среднеквадратические оценки для различного числа параметров.
Рекурсия по числу наблюдений
Для случая последовательных наблюдений можно вывести рекуррентные уравнения; соответствующая процедура называется рекурсивной идентификацией. Чтобы получить рекуррентные уравнения, запишем решение (13.7) в ином виде. Обозначим через й(М) среднеквадратическую оценку, полученную для /V наблюдений. Для вывода уравнений введем N в качестве фор-
мального параметра т. е. запишем
Ф(У) =
ХЮ =
Предположим, что матрица ФГФ не вырождена при всех N. Тогда среднеквадратическая оценка 6(/V) определяется формулой (13.7)
ё(^) = [ф7'(^ф(^]-1 ®r(N)y(N).
При поступлении данных еще от одного наблюдения к матрице ф добавляется одна строка, а к вектору у — один элемент:
Г 1 Г y(N) 1
°(/V+1) = It(/V+1)J’ ^(7V+I) = L(7V + dJ-
Оценку 6(W + 1) в силу (13.7) можно записать в виде
6(W+ 1) = [фг(М + 1)Ф(/У+ 1)Г ФГ(^ + 1)y(N + 1) =
= [ФТ(ЛО Ф(Д0 -Н Ч- l)<p(7V+ I)]-1 X
X[<tf(N)y(N) + <fT(N+ l)^+i]. (13.12)
Решение задачи получают с помощью следующей теоремы.
Теорема о рекурсивном методе наименьших квадратов. Предположим, что матрица ФГ(^)Ф(ЛГ) положительно определена. Тогда среднеквадратическая оценка 6 удовлетворяет рекуррентному уравнению
Q(N+ 1) = в(М) +KN[yN+i~<p(N + 1)ё(Л% (13.13)
где
K(N) = P(N + 1)<рг^+ 1) =
— P(N)qr(N + 1)[1 + <p(N 4- 1) Р(Л<)срг (TV + Dl"1 (13.14)
и P(W+1) = [/-.К(Л0(р(М+1)]Р(Л0. (13.15)
Для доказательства теоремы используем лемму об обращении матрицы.
Лемма об обращении матрицы.
Пусть А, С и С”1 + DA~lB— квадратные невырожденные матрицы.
Тогда
[Л + BCD]-' = А-' - А~'в [С-1 + ДД-'в]-1 DA~'.
Доказательство. Умножив предыдущее равенство на [А BCD], получим
[Д + BCD] {Д-1 — Д-1В [с-1 + da~'b]~' ОД-1} =
= I + BCDA~' — В[С-1 + ОД-1В]-1 £)Д-1 —
- bcda-'b[С-1 + ОД-,В]-1 ОД-1 = 1 + BCDA~' -
— вс [с-1 - da~1b\ [с-1 + од_,в]-1 DA~' =
= / + BCDA~l +. ВСОД'1 = I.
Доказательство теоремы о рекурсивном методе наименьших квадратов. Для упрощения записи опустим аргумент /V у Ф(М) и y(N) и N + 1 У Ф (N + 1) • Запишем уравнение (13.12) в виде ё(лг + 1) = [фгф + фгф] 1 [фту + ч>ту„+ ] =
= (фгф)-1 ФТу + [(фгф + фГф)“! - (Ф^Ф)-1] Фту +
4-(ф7’ф + фгф)“1фг^+1. (13.16) Заметим, что
ё(7У) = (фгф)-1 фту
[(ФГФ + ф^ф)-1 - (ФГФ)-1] Фгу = (ФГФ + фгф)-1 X
X (ФГФ - ФГФ - фгф) (ФГФ)-1 Фту = - (фгф + фгф)-1 X
X ФГФ (Ф^Ф)’1 ФТУ = - (ФГФ + Ф^Ф)’1 ФТФ8.
Тогда уравнение (13.16) можно переписать в виде
0(w+ 1) = ё(^ + к^)[^+1-ф^+ 1)ё(АО], где
Я(Л0 = [ф7’(У)Ф(Л0 + ф7' (7V+ 1)ф(М+ 1)|-1 фГ(М+ 1) = = [ФГ(ЛГ+ 1)Ф(М+ I)]’1 ФГ^+ 1).
Чтобы получить рекуррентное уравнение для весового множителя /((/V), удобно ввести матрицу Р, определяемую как
Р(Д4 = [фг (Д^)ф(^]-1
и пропорциональную ковариационной матрице ошибок (ср. с теоремой 13.2). Применив к P(N + 1) лемму об обращении матрицы, получим
P(W+ 1) = [ф7’^+ 1)Ф(М+ 1)]-' = [фгф +фГф]-: =
= (ФГФ)-' _(ФГФ)-' фг[/ + ф(фгф)”' фТ1 фСф^ф)-’.
Следовательно,
P(N+ 1) = Д(7У)-Р(^ф7’ (W+ 1)X
х[/ + ?(Л' + 1)Р(Л')фг(Л' + 1)]-'<р(Л'+1)Р(Л').
Простые вычисления дают
K(7V) = P(7V+ 1)ФГ(^ + 1) =
+ P^)(p7’(7V+ l)[/ + <p(W+ 1)Р(Л0фГ (W-f-I)]-*.
Заметим, что для вычисления Р необходима операция обращения матрицы, размер которой равен числу измерений, т. е. для систем с одним выходом это скаляр.
Замечание 1. Уравнение (13.13) интуитивно кажется вполне естественным. Оценка б(М + 1) получается добавлением к предыдущей оценке б(М) некоторой поправки, пропорциональной yN+i — <p(7V + 1)0 (М), где последний член можно интерпретировать как прогноз значения у в момент TV —|- 1 по модели (13.3). Таким образом, поправка пропорциональна разности измеренной величины yN+\ и ее прогноза, основанного на предыдущих оценках параметров. Элементы вектора К(М) являются весовыми коэффициентами, показывающими, каким образом должны объединяться предыдущее значение и поправка. Отметим также, что Ki(N) пропорционально ф,(М + 1).
Замечание 2. Среднеквадратическую оценку можно интерпретировать как фильтр Калмана для процесса
0(fe+ l) = 6(fe), г/(/г) = ф(/г)б(/г) + e(k) (разд. 11.2).
Заметим, что матрица P(N) существует только при условии, что ФГ(ЛЗФ(М) не вырождена. Поскольку
ФГ (N) Ф (N) = Г (рТ (/г) <р (/г), fe=i
то Ф7Ф всегда вырождена при достаточно малых /V. Для получения начального условия для определения Р необходимо выбрать такое N = No, что ФГ(ЛГО)Ф(М>) не вырождена, и найти ₽ГО = |Ф^о)Ф№)]"1> e(N0) = P(N0)®T(N0)y(N0).
Далее можно воспользоваться рекуррентными уравнениями для N Часто, однако, бывает удобно пользоваться рекуррентными- уравнениями на каждом шаге. Если начальное условие
имеет вид Р(0) — Ро (где Ро положительно определена), то P(N) = [Ро-1 + ФГ (/V) Ф (ЛОГ1-
Это выражение можно сделать сколь угодно близким к Фг (Л/)Ф(М), выбрав достаточно большое Ро.
Статистическая интерпретация метода наименьших квадратов (МНК) показывает, что такой выбор начального условия для рекурсивного оценивания соответствует ситуации, когда априорная ковариационная матрица пропорциональна Ро.
Нестационарные системы
В функции потерь (13.4) все параметры имеют одинаковый вес. Однако если параметры меняются во времени, то необходимо каким-то образом учесть «старение» их значений. Это можно сделать, введя, например, в функцию потерь-экспоненциальные весовые коэффициенты:
• J (6) + z [у (k) - е<р (fe)]2. (13.17)
fe-i
Здесь X — «фактор забывания», являющийся мерой того, насколько быстро «забываются» старые значения. Среднеквадратическая оценка параметров с функцией потерь (13.17) дается выражениями
ё (fe + 1) = 0 (6) + К (k) [yk+, - ср (k + 1) 6 (6)],
К(6) = Р(6)срГ(6 + 1) [Л + qp(fe + DP(k)<p\k+ I)]"1, (13.18)
P (k + 1) = [J-K (k) <p (k + 1)] P (6)/X.
Изменение параметров системы во времени можно моделировать с помощью марковского процесса 0(6 4~ 1)= Ф0(/г) + -ф и (6) и затем использовать фильтр Калмана для оценки ё. (См. замечание 2 к теореме о рекурсивном методе наименьших квадратов.)
Рекурсия по числу параметров
При введении новых параметров к вектору в добавляются новые компоненты, а в матрице Ф появляются дополнительные строки. Необходимые вычисления и в этом случае можно организовать в виде рекуррентной процедуры по числу параметров модели. Такая процедура в качестве основной вычислительной задачи включает обращение матрицы, размерность которой равна числу вновь вводимых параметров.
(//^-разложение ковариационной матрицы
Система (13.18) представляет собой лишь один из возможных способов рекуррентного пересчета оценок и ковариационной матрицы. К сожалению, эти уравнения с вычислительной точки
зрения плохо обусловлены, поэтому предпочтительней пересчитывать не cafoiy матрицу Р, а ее положительный квадратный корень. Другой вычислительный метод — это метод f/D-разложе-ния Бирмана — Торнтона, основанный на разложении Р в произведения сомножителей, т. е. Р = UDUT, где D — диагональная, a U — верхняя треугольная матрицы1'. Этот метод относится к так называемому классу методов квадратного корня, поскольку UD^ есть квадратный корень из Р. На самом деле, однако, метод LD-разложения не использует операции вычисления квадратных корней, и поэтому его можно использовать на машинах с короткой разрядной сеткой и небольшим быстродействием. Подробное описание алгоритма можно найти в литературе в конце главы.
Ниже приводится листинг программы на языке Паскаль для вычисления среднеквадратичных оценок параметров процесса y{k) + aiy(k— 1)+ ... + апау (k — па) =
= bvu(k — 1) + ... + bnbu(k — nb) + e{k) (13.19) методом t/D-разложения.
Листинг 13.1. Программа на языке Паскаль вычисления среднеквадратической оценки процесса (13.19) с помощью ПО-разложения
const праг = 10; {максимальное число оцениваемых параметров) noff = 45; {noff = праг * (праг — 1 )/2)
type vecl = array [l..npar] of real;
vec2= array [l..noff] of real; estpartyp = record n, na : integer;
theta: vecl;
fi: vecl;
diag: vecl;
offdiag: vec2;
end;
var y,u,lambda : real;
eststate: estpartyp;
Procedure LS (u,y,lambda : real; var eststate: estpartyp);
{Вычисление среднеквадратической оценки методом ПО-разложения Бирмана и Торнтона) var kf,ku,i,j, : integer;
perr,fj,vj,alphaj,ajlast,pj,w: real;
k: vecl;
begin
with eststate do {Вычисление ошибки предсказания) begin
регг := у;
11 С единицами на главной диагонали. — Прим. ред.
for i := 1 to n do perr := perr — theta [I] * fi [if;
{Вычисление усилия и ковариации методом (УО-разложения) fj :=« [И;
vj := diag [1] * fj;
k [1] := vj;
alphaj := 1.0 + vj * vj;
diag [1] := diag [l]/alphaj/lambda;
if n > 1 then
begin
kf := 0;
ku := 0;
for j2. to n do
begin
fi := fi [j];
for i := 1 to j — 1 do
begin {f = fi * U)
kf :=kf+ 1;
fj;=Jj + fi [i] * offdiag [kf]
end; {i}
vj := f j * diag [j|; {v = D * f)
k [j] := vj;
ajlast := alphaj;
alphaj := ajlast + vj * fj;
diag [j] := diag [j] * ajlast/alphaj/latnbda;
pj := — f j/ajlast;
for i := 1 to j — 1 do
begin
{kj + 1 := kj + vj * uj)
{uj := uj + pj * kj)
ku := ku + 1;
w := offdiag [ku] + k [i] * pj;
k [i] := k [i] + offdiag [ku] * vj;
offdiag [ku] := w
end; {i}
end; {j}
end; {if n > 1 then)
{Пересчет оценок параметров]
for i := 1 to n do theta [i] := theta [i] + perr * k [i]/alphaj;
{Пересчет fi)
for i := 1 to n — 1 do fi [n + 1 — i] := fi [n — i];
fi [1] := - y;
fi [na + 1] := u
end {with eststate do)
end; {LS}
Идентификатор
U
У па
- п Л’ noff
theta
fi lambda
В программе приняты следующие обозначения переменных (идентификаторы):
Переменная и (k) и (k) па па + nb п(п- 1)/2 0(6) [ср. с (13.8)] <р (6) [ср. с (13.9)] Л
Пример 13.3
Пусть система описывается моделью
ц (6) - 1,5у (6-1)4- 0,7у (6 - 2) = и (6 - 1) + 0,5« (6 — 2) +
+ е (6) — е (6 — 1) + 0,2е (6 — 2), (13.20)
Рис. 13.1. Входной На вход подается
Время
и выходной сигналы при моделировании системы (13.20). последовательность
псевдослучайных двоичных сигналов.
Рис. 13.2. Реакция на ступеньку детерминированной части системы (13 20) и моделей, построенных по методу наименьших квадратов LSn (МНК) для п = 1, 2 и 4 и методу максимума правдоподобия MLn (МП) для п = 2.
где е имеет нулевое среднее и дисперсию 0,5. Это «стандартная» система, которую часто используют в литературе как тестовый пример для проверки
Таблица 13.1. Оценки параметров и стандартные отклонения моделей второго порядка для процесса (13.20) при использовании метода наименьших квадратов и метода максимума правдоподобия
Параметр Истинное значение LS п ~ 2 ML п = 2
Я1 — 1,5 — 1,285+0,027 — 1,497 +0,009
«2 0,7 0,540+0,021 0,699+0,006
Ь\ и 1 1,056+0,091 1,019+0,051
Ьг 0,5 0,913+0,121 0,497+0,075
С\ —1 — —0,964+0 045
сг 0.2 — 0,174+0,044
различных методов идентификации. В (13.20) C(q) qn, откуда следует, что метод наименьших квадратов дает смещенные оценки. Однако его можно применять для аппроксимации передаточной функции системы, если использовать модели более высокого порядка. На рис. 13.1 показаны результаты моделирования системы. Входом является последовательность псевдослучайных
О 100 200
Рис. 13.3. Входные и выходные сигналы для примера 13.4.
двоичных сигналов с амплитудой 1. Эта последовательность использовалась для идентификации параметров моделей различных порядков с помощью метода наименьших квадратов и метода максимума правдоподобия. На рис. 13.2 показаны реакция точной системы (13.20) и моделей, рассчитанных методом наименьших квадратов для порядков п — 1, 2 н 4 и методом максимума правдоподобия для п = 2. Метод наименьших квадратов дает неудовлетворительные результаты для п 2 и вполне хорошие — для п = 4; метод максимума правдоподобия дает очень хорошие оценки динамики и характеристик шума уже при п = 2. Оценки параметров моделей второго порядка по методам наименьших квадратов и максимума правдоподобия приведены в табл. 13.1.
Пример 13.4. Рекурсивное оценивание
Рассмотрим процесс y(k) ay(k— 1) — bu(k— 1) -f-e(ft) с а = —0,8 и ft = I. Пусть дисперсия шума равна единице, а входной сигнал — последовательность псевдослучайных двоичных импульсов с амплитудой 1. Входные и выходные данные показаны на рис. 13.3. Для оценки параметров а и ft использовались рекуррентные уравнения (13.13) — (13.15). Эти оценки показаны
Рис. 13.4. Рекурсивные оценки параметров при обработке сигналив показанных на рис. 13.3, по формулам (13.13)—(13.15).
на рис. 13.4 для случая, когда начальные значения параметров были приняты равными нулю, а Р(0) =10/, где I — единичная матрица. Видно, что после нескольких наблюдений эти оценки становятся достаточно близкими к истинным значениям параметров.
Выводы
В данной главе был дан краткий обзор методов идентификации параметров динамических систем. При этом основное внимание уделялось методу наименьших квадратов, являющемуся основой многих других методов. Довольно часто возникает необходимость оценивать параметры в реальном режиме времени, поэтому было показано, как можно вычислять эти оценки с помощью рекуррентных процедур.
ЗАДАЧИ
13.1. Для определения значения ускорения свободного падения был поставлен следующий эксперимент: стальной шарик сбрасывали с нулевой начальной скоростью с телевизионной башни и измеряли расстояние /, пройденное им за разные промежутки времени. Полученные данные были представлены в виде еле-
дующей таблицы:
Время, с Пройденное расстояние, м
1 8,49
2 « 20,05
3 50,65
4 72,19
5 129,85
6 171,56
Время каждый раз отсчитывалось точно, а расстояние — с некоторой ошибкой. Найдите величину ускорения свободного падения, применив метод наименьших квадратов к модели Z =-у- + е.
13.2. Выведите рекуррентные уравнения для оценки параметров по методу наименьших квадратов для случая увеличения числа параметров. (Ключ: воспользуйтесь той же идеей, что и в случае рекурсии по числу наблюдений.)
13.3. Имеется процесс
у (k) + ay (k — 1) = bu (k —- 1) -f- e (k) 4~ ce (k — 1), где и и e — независимые случайные процессы типа белого шума с нулевым средним и единичной дисперсией. Предположим, что для оценки а и b используется метод наименьших квадратов, как в примере 13.2. Найти ожидаемые значения а и 6 как функцию от а, b и с.
13.4. Параметры bi и Ь2 системы y(k) — bxu(k — 1) + b2u(k — 2)+ + е(&) определяются методом наименьших квадратов. Пусть входом является ступенька в момент времени k — 0. Можно ли сколь угодно точно вычислить параметры bi и Ь2 нри увеличении числа измерений? Изменится ли что-либо, если известно, что Ь2 = 0?
13.5. Английский математик Ричардсон предложил следующую простую модель для описания гонки вооружений для двух стран:
х (k + 1) = ах (k) + by (k) + f, у (k + 1) = ex (k) + dy (k) + g,
где x(k) и y(k) —расходы на вооружение в этих двух странах, a, b, с, d, [, g— постоянные.
Таблица (миллионы долларов США в ценах 1979 г.)
Год Иран Ирак Страны НАТО Страны Варшавского договора
' 1972 2 891 909 216 478 112 893
’ 1973 3 982 1 123 211 146 115 020
1974 8 801 2 210 212 267 117 169
1975 11 230 2 247 210 525 119612
1976 12 178 2 204 205 717 121 461
1977 9 867 2 303 212 009 123 561
1978 9 165 2 179 215 988 125 498
1979 5 080 2 675 218561 127 185
1980 4 040 225 411 129 000
1981 233 957 131 595
13.6. Найдите оценки параметров в модели Ричардсона (задача 13.5) по данным за три последовательных года. Исследуйте
обоснованность полученных оценок. Найдите рекурсивные оценки параметров. Начните с 197b г., используя данные за 1972— 1974 гг. в качестве начальных значений.
ЛИТЕРАТУРА
Проблема идентификации параметров
I. Jenkins G. М., Watts D. G. (1968): Spectral Analysis and Its Applications. San Francisco: Holden-Day.
2. Eykhoff P. (1974): System Identification: Parameter and State Estimation. London: John Wiley.
3. Box G. E. P., Jenkins G. M. (1976): Time Series Analysis and Control (rev. ed.). San Fransisco: Holden-Day.
4. Goodwin G. C., Payne R. L. (1977): Dynamic System Identification: Experiment Design and Data Analysis. New York: Academic Press.
5. Ljung L., Soderstrom T. (1 983): Theory and Practice of Recursive Identification. Cambridge, Mass.: MIT Press.
Обзор по идентификации систем
6. Astrom К. J., Eykhoff P. (1971): “System Identification: A Survey”. Automatica, 7, 123-62.
Дополнительные ссылки см. в книгах
7. Bierman G. J. (1977): Factorization Methods for Discrete Sequential Estimation. New York: Academic Press.
8. Eykhoff P., ed. (1981): Trends and Progress in System Identification. Oxford: Pergamon Press.
9. Isermann R., ed. (1981): “System Identification”, Tutorial presented at the 5th IFAC Symposium on Identification and System Parameter Estimation. Darmstadt, September 1979, Oxford: Pergamon Press.
10. Lawson C. L., Hanson R. J. (1974): Solving Least Sqwares Problems. Englewood Cliffs, N. J.: Prentice-Hall, Inc.
Специальный выпуск по идентификации и оценке параметров систем: Automatica, 17, No. 1 (January 1981).
История науки
11 Gauss К. F. (1909): Theoria Motus Corporum Coelestium (на латыни). [Английский перевод: Theory of Motion of the Heavenly Bodies. New York: Dover.]
12. Sorensen H. W. (1970): “Least-squares Estimation: From Gauss to Kalman”, IEEE Spectrum, 7, 63-68.
управление
Объединение методов аналитического конструирования систем управления и рекурсивного оценивания параметров для построения самонастраивающихся регуляторов. Общее описание принципов адаптивного управления
ВВЕДЕНИЕ
Для реализации методов, описанных в предыдущих главах, требуется последовательно пройти все этапы процесса: моделирование, идентификацию, проектирование системы управления и анализ чувствительности. Не исключено, что эти стадии, может быть, придется пройти не один раз, чтобы получить приемлемые результаты. Возникает вопрос: а нельзя ли упростить столь длительную итерационную процедуру путем введения более сложных регуляторов, автоматизации самой процедуры конструирования? Оказывается, можно, если включить в регулятор алгоритмы оценки параметров и конструирования управления. Такой подход приводит к понятию так называемых самонастраивающихся регуляторов (СНР). Хотя подобные регуляторы имеют существенно более сложную структуру, чем регуляторы с постоянным усилением, их довольно просто реализовать на практике с помощью программируемых микропроцессоров.
Замкнутые системы, включающие самонастраивающиеся регуляторы, почти всегда являются нелинейными и нестационарными, и для их анализа требуются иные подходы, принципиально отличающиеся от описанных в данной книге.
Небольшие модификации самонастраивающихся регуляторов позволяют получить адаптивные регуляторы, способные работать в системах с широким диапазоном изменения регулируемых параметров.
14.1. САМОНАСТРАИВАЮЩИЕСЯ РЕГУЛЯТОРЫ
Один из способов автоматизации моделирования и конструирования системы управления можно схематично представить в виде следующей последовательности операций: выбор подходящей структуры модели и оценка значения ее параметров с помощью рекурсивных методов, описанных в гл. 13; построение
закона управления по полученным оценкам каким-либо методом из описанных в гл. 9—12. Блок-схема такой системы показана на рис. 14.1. Построенный таким образом регулятор является самонастраивающимся, поскольку у него есть механизм настройки его собственных параметров и его можно рассматривать как двухконтурную систему. Внутренний контур включает сам процесс и обычный линейный рсгулйтор со звеном обратной связи; внешний контур включает блоки рекурсивной оценки параметров и расчета закона управления и предназначен как раз
Рис. 14.1. Блок-схема самонастраивающегося регулятора (СИР).
для настройки регулятора. Блок расчета управления (рис. 14.1) в реальном времени решает задачу аналитического конструирования регулятора для системы с известными параметрами.
Самонастраивающийся регулятор обладает большой гибкостью по отношению к выбору метода конструирования; здесь можно использовать практически любой из известных методов конструирования, а также различные схемы оценки параметров— стохастическую аппроксимацию, МНК, метод максимума правдоподобия, фильтр Калмана и др.
Самонастраивающиеся регуляторы делятся на два класса—• явные и неявные. В явных алгоритмах производится оценка параметров явной модели процесса. Вместе с тем иногда можно выразить модель процесса через параметры самого регулятора. В этом случае алгоритм существенно упрощается, поскольку отпадает необходимость расчета управлений. Такой регулятор называют неявным, так как он основан на оценке неявной модели процесса.
Задача управления
Рассмотрим задачу конструирования методом размещения полюсов типа обсуждавшейся в разд. 10.4. Пусть процесс описывается следующей моделью без учета возмущений:
A(q)y(k) = B(q)u(k), (14.1)
где и — управляющий сигнал, у—измеряемый сигнал и degA— — deg В = d. Предположим, что надо построить регулятор, такой что передаточная функция uc-^yi имеет вид
Нт + Вт/Ат. (14.2)
Пусть Ао— характеристический многочлен наблюдателя. Решение этой задачи приводится в разд. 10.4, а именно регулятор определяется уравнением
Ru — Tuc — Sy, (14.3}
где ис — командный сигнал. Многочлены R, S и Т определяются из решения диофантова уравнения
Л/?1 + е-5 = ЛтЛ0 (14.4>
относительно Ri и S. Оптимальное управление тогда определяется из (14.3) при
R = R,B+ и Т = Аов'т, (14.5)
где Вт = В~в'т и В = В~В+.
Для рекурсивной оценки параметров модели (14.1) можно использовать различные алгоритмы, например метод наименьших квадратов, описанный в разд. 13.3.
Явный самонастраивающийся алгоритм
Простой самонастраивающийся регулятор можно реализовать следующим алгоритмом.
Алгоритм 14.1
Шаг 1. Найти оценки коэффициентов многочленов А и В из (14.1) методом наименьших квадратов.
Шаг 2. Подставить полученные оценки вместо А и В в (14.4) и разрешить его относительно Ri и S. Найти R и Т из (14.5). '
Шаг 3. Вычислить управляющий сигнал из (14.3).
Шаги 1, 2 и 3 повторяются на каждом интервале квантования.
Данным алгоритмом следует пользоваться с определенной осторожность. Для получения хороших оценок необходимо, чтобы входной сигнал имел достаточно богатый частотный спектр, что не всегда бывает, поскольку этот сигнал генерируется звеном обратной связи.
Заметим, что для разрешимости уравнения (14.4) необходимо, чтобы многочлены А и В не имели общих делителей
*> Имеется в виду существование нетривиального решения. Это утверждение вытекает из теоремы 10.1. См. приложение D. — Прим. ред.
Неявный самонастраивающийся алгоритм
Введя иную параметризацию модели (14.1), можно исключить шаг 2 в алгоритме 14.1. Из (14.4) следует, что
А0Ату = ARxy + B~Sy = BRtu + B~Sy = B~ [Ru + St/], (14.6) где второе равенство вытекает из (14.4), а третье — из (14.5). Управление (14.6) можно интерпретировать как модель процесса, параметризованную через В~, R и S. Оценка параметров модели (14.6) дает явные значения параметров регулятора. Отметим, что модель (14.6) линейна по параметрам только при Д- = 1. Неявный алгоритм описывается следующим образом.
Алгоритм 14.2
Шаг 1. Найти оценки коэффициентов многочленов R, S и В~ из (14.6).
Шаг 2. Подставить полученные оценки в (14.4) и найти управляющий сигнал. Т определяется по формуле (14.3).
Шаги 1 и 2 повторяются на каждом интервале квантования.
В данном случае также следует проявлять некоторую осторожность. Дело в том, что управление (14.3) непричинно, если старший коэффициент оценки многочлена R обращается в нуль, поэтому в такой ситуации в алгоритм вводятся элементарные очевидные поправки.
Алгоритм 14.2 становится особенно простым, если В~—\, поскольку тогда задача оценивания решается рекуррентным способом методом наименьших квадратов. В связи с этим в большинстве самонастраивающихся регуляторов предполагается, что данное условие выполняется. При этом из (14.5) следует, что исключаются все нули процесса, и поэтому такие алгоритмы не работают для процессов с неустойчивыми обратными даже в идеальном случае, т. е. когда точно известны все параметры (разд. 10.4).
14.2. АНАЛИЗ
Замкнутые системы с самонастраивающимся регулятором нелинейны, что часто затрудняет понимание механизма их поведения. Достаточно детальное рассмотрение этого вопроса выходит далеко за рамки настоящей книги *>, однако на некоторых свойствах этого интересного и важного класса систем управления все-таки необходимо остановиться.
В качестве отправной точки необходима какая-либо модель процесса. Пусть это будет следующая модель:
Ау = Ви + Се, (14.7)
где е — белый шум.
п Для интересующегося читателя можно порекомендовать, например, 110].—Прим. ред.
Основные моменты
Ключевой проблемой является анализ поведения замкнутой системы при наличии самонастраивающегося регулятора. Такой анализ включает исследование устойчивости, сходимости и качества регулирования. Другой важный момент — это вопрос о том, настолько ли хороша саморегулирующаяся система управления и нет ли других, более рациональных решений?
Явные алгоритмы
Явные самонастраивающиеся алгоритмы, такие как алгоритм' 14.1, сходятся к решению, если оценки параметров сходятся к истинным значениям. Это так, если при оценке параметров используется корректная модель, а входной сигнал имеет достаточно богатый частотный спектр. Кроме того, поскольку при оценивании используется МНК, необходимо, чтобы возмущения были некоррелированы, т. е. чтобы С=1 в (14.7). Далее, поскольку управляющий сигнал генерируется звеном обратной связи, для «обогащения» его частотного спектра может потребоваться введение определенных возмущений.
Анализ системы первого порядка
Для иллюстрации принципиальной схемы анализа самонастраивающихся регуляторов начнем с систем первого порядка.
Предположим, что динамика процесса и внешние воздействия описываются простой моделью первого порядка:
у (k) + ay(k — i) = bu(k — 1) + e(k) + ce(k — 1), (14.8)
где и — управляющая переменная, у — выход, а {е(/г)} —после-•довательность независимых нормально распределенных случайных чисел. Предположим, кроме того, что целью управления является минимизация квадратичной функции потерь:
J= lim Е-^- 2 y2(k). (14.9)
М->ОО " k = i
Будем считать, что допустимые управления таковы, что u{k) зависит от всех «прошлых» выходов y(k), y(k— 1), .... Если параметры модели известны, то из теоремы 12.2 следует, что оптимальное управление реализуется пропорциональным регулятором
u(k) = -^-y(k). (14.10)
Рассмотрим самонастраивающийся регулятор с настройкой параметра 0 с помощью МНК по модели:
y(k) + ey(k-l) = u(k- V) + e(k). (14.11)
Среднеквадратическая оценка 0, полученная по данным, имеющимся для' моментов времени до k — i включительно, т. е. по у (k), y(k — 1), .... у (I), и (k — 1), u(k — 2), ..п(1), определяется выражением
6(А) =
fe-i
X 0 + D «S101 У (О 1=1
/г-1
1 = 1
(14.12)
Оптимальное управление для задачи (14.9) — (14.11) имеет вид и (k) = 0 (/г) у (k), если известно значение 0. Если же значение 0 неизвестно, то оно заменяется оценкой и управление принимает вид
и (/г) = 0 (/г) г/(/г)- (14.13)
Можно ожидать, что алгоритм управления (14.12) — (14.13) будет хорошо работать, если с = 0 и Ь = 1. В этом случае среднеквадратическая оценка 0; сходится к а при А->оо, а управ
fl 500
Время
Рис. 14.2. Оценка параметра 0, полученная при моделировании управления системой (14.8) регулятором (14.12)—(14.13) при « = —0,9. Ь = 3 и с = —0,3.
ление сходится к u(k) = ay(k), т. е. в силу (14.10)—к оптимальному управлению.
Замечательное свойство алгоритма (14.12) — (14.13) состоит в том, что он сходится к оптимальному управлению (14.10) даже тогда, когда с #= 0. Этот факт иллюстрируется на рис. 14.2, где показана оценка параметра 0 для а — —0,9, Ь — 3 и с = =—0,3. Отметим, что оценка 0 сходится к 0 = —0,2, а не к значению а, равному —0,9. Значение 0 = —0,2 соответствует управлению, минимизирующему дисперсию ошибки. Для сравнения самонастраивающегося регулятора с оптимальным регулятором, полученным при известных точных значениях пара
метров, вычислим значение функционала
k
J (*) = Е у2 (t) «=1
для самонастраивающегося регулятора и оптимального регулятора
п(/г) = —0,2г/ (А).
Результаты вычислений показаны на рис. 14.3, из которого следует, что результаты отличаются незначительно
Рассмотренный пример показывает, что простой самонастраивающийся регулятор (14.12) — (14.13) обладает очень хорошими характеристиками. После короткого переходного периода
Рис. 14.3. Полная функция потерь для самонастраивающего регулятора (14.12)—(14.13) и оптимального регулятора, построенного по известным значениям параметров.
он ведет себя практически так же, как и оптимальный регулятор с точными значениями параметров. При этом параметр 0, судя по всему, сходится к значению, соответствующему регулятору, минимизирующему дисперсию ошибки.
Проведем эти эмпирические рассуждения на более формальном уровне. Предположим, что система описывается уравнением
y(k+ l) + ay(k) = u(k) +n(k), (14.14)
где п — возмущение. Если возмущение ограничено в том смысле, что
1 k
lim -г- Е n2(i) < °°> (14.15)
fe->oo R i = l
то среднеквадратическое значение выхода замкнутой системы
-Г Е У2 (к) (14.16)
1 fe=i
также ограничено.
Это утверждение можно доказать рассуждением от противного. Если'у не ограничено, то влиянием п (k) в (14.14) можно пренебречь. Тогда 0(A) будет сходиться к а. Выбрав управление вида
и (k) = ay (k),
получим ограниченный выход, так как и ограничено, — противоречие.
Самонастраивающийся регулятор (14.12) — (14.13) всегда стабилизирует систему (14.14) в среднеквадратическом смысле. Можно показать, что оценка параметра 0(A) также сходится к точному значению. Если последовательность 0(A) сходится при оо, то легко найти ее предел. Нормальное уравнение можно записать в виде
it k k
Е У (» + О 0 (0 = ё (А + 1) Е У2 (I) + Е У (0 и (О-i=l r = l z=i
Тогда из (14.13) следует, что fe fe
~ Е У (i + 1) У (О = -г Е [ё (k + 1) - 0 (0] У2 (i).
Правая часть этого уравнения стремится к нулю при А—>оо, поскольку 0(A) сходится, a y(k) ограничено в смысле (14.16). Таким образом, если© (А) сходится, то
1 к
Ит 4 Е 5/G'+ 1)£/(0 = 0. (14.17)
fe->co i=l
Итак, самонастраивающийся регулятор стремится свести к нулю автокорреляцию в замкнутой системе, гу(х), для т=1. Предположив теперь, что регулируемый процесс описывается уравнением (14.8), получим, что (14.16) ограничено и (14.17) имеет место лишь при одном значении 0, а именно при 0 = — а — с.
Таким образом, регулятор (14.12) — (14.13) для системы (14.8) с функционалом (14.9) самонастраивается. Этот результат остается в силе и при Ъ =£= 1. Более того, его можно обобщить на случай процессов n-го порядка вида (14.7). Однако для получения устойчивости и сходимости по управлению необходимо ввести дополнительные ограничения. Более тог®, в многомерном случае последовательность оценок параметров может и не сходиться.
Общие результаты
Анализ этого простого примера можно обобщить. Некоторые асимптотические свойства самонастраивающихся регуляторов можно сформулировать в виде следующих теорем.
Теорема 14.1. Рассмотрим алгоритм 14.2, и пусть В~ — 1. Предположим, что оценки параметров s£, i = 0, ..., ns и г£, i=l......пг сходятся и что замкнутая система эргодическая
(по моментам второго порядка). Тогда замкнутая система обладает следующими свойствами:
Ey(k + т)у(Е) = гу (т) = 0, т = с?, ..., d + ns,
Еу (k + t)u(k) — гуи(т) = 0, i = d, ..., d + nr.
Теорема 14.2. Пусть управляемая система описывается уравнением (14.7)=, где rf = deg/ — deg В известно. Предположим, что используется алгоритм М2 с ns п — 1 и nr п d — 1. Если последовательность оценок параметров сходится, то регулятор (14.3) с Т = 0 сходится к регулятору, минимизирующему дисперсию ошибки для процесса (14.7).
Из теоремы 14.1 следует, что в стационарных точках алгоритма некоторые значения ^(т) и гуи(т) обращаются в нуль. При этом конкретный вид процесса не играет роли. Теорема 14.2 утверждает, что если процесс описывается уравнением (14.7) с известным значением d, то самонастраивающийся регулятор с достаточно большим числом параметров сходится к предельному регулятору^ минимизирующему дисперсию ошибки, если он сходится вообще.
Можно проанализировать устойчивость и свойства сходимости самонастраивающихся регуляторов. Можно также показать,, что если выражение [1/C(z)]— 1/2 действительно и строго положительно, то самонастраивающийся регулятор с оценкой параметров по методу наименьших квадратов и с функционалом (14.9) реализует оптимальное управление для процесса (14.7). Если C(z£)> 0 для Zi, таких что В(г£) = 0, то алгоритм локально устойчив.
14.3. ДРУГИЕ ПОДХОДЫ К АДАПТИВНОМУ УПРАВЛЕНИЮ
Построение самонастраивающегося регулятора, описанного в разд. 14.1, продиктовано желанием получить самонастраивающийся контур управления. Вместе с тем можно ожидать, что регулятор, показанный на рис. 14.1, может быть использован для управления процессом с переменными параметрами, т. е. для адаптивного управления. Для этого, однако, необходимо несколько изменить алгоритм так, чтобы блок оценки параметров мог отслеживать изменение параметров процесса. Один из способов решения этой задачи состоит в дисконтировании старых данных (разд. 13.4). Есть, однако, и другие схемы реали
зации адаптивного управления, более близкие к идее самонастраивающегося регулирования, в которых параметры регуляторов изменяются в зависимости от изменения состояния процесса и возмущений.
Программная регулировка усиления
В тех случаях, когда можно выявить вспомогательные переменные, тесно связанные с изменениями динамики процесса, возникает возможность исключения влияния изменений параметров процесса путем корректировки параметров регулятора как
Рис. 14.4. Блок-схема системы, в которой вариации параметров компенсируются программным усилением.
функции от этих вспомогательных переменных (рис. 14.4). Такой подход называют программной регулировкой усиления, поскольку изначально подобные схемы использовались для корректировки управления лишь при изменении усиления разомкнутой системы.
Одним из недостатков данного подхода является то, что он работает с разомкнутой системой и не имеет обратной связи, компенсирующей ошибки программного управления. Другой недостаток состоит в том, что для построения регулятора требуется слишком много времени, так как необходимо заранее рассчитать значения параметров регулятора для различных рабочих режимов. Кроме того, для оценки качества регулирования требуется большой объем вычислительных экспериментов с моделью процесса.
К преимуществам данного подхода относится высокая скорость перестройки параметров при изменении параметров процесса. Фактически лимитирующим фактором по быстродействию является лишь скорость реакции датчиков на изменение параметров процесса.
Заметим, что существуют некоторые сомнения терминологического характера относительно того, можно ли называть такой
дхадапти н и н т,о коль у и трр гул о а рассчитываются программно. Тем не менее независимо от терминологии этот прием является очень полезным методом сглаживания последствий изменения параметров регулируемого процесса.
Адаптивное регулирование по эталонной модели (АРЭМ)
На рис. 14.5 показана еще одна схема настройки параметров регулятора, поначалу предложенная для решения. задачи серворегулирования. Требования к регулятору определяются в терминах эталонной модели, показывающей, какова должна быть идеальная реакция системы на командный сигнал. Отметим, что сама эталонная модель является частью системы управления. При этом регулятор можно считать состоящим из двух контуров. Внутренний контур — это обычная конфигурация, включающая процесс и регулятор. Параметры регулятора настраиваются внешним контуром так, чтобы минимизировать рассогласование е между выходом модели ут и процесса у. Основная проблема здесь состоит в построении механизма самонастройки,
Рис. 14.5. Блок-схема адаптивной системы с эталонной моделью.
реализующего устойчивую систему управления и сводящую рассогласование к нулю. Эта проблема далеко не тривиальна: можно показать, что ее невозможно решить в рамках линейной обратной связи «ошибка — регулятор».
Авторами АРЭМ использовался следующий механизм настройки параметров, названный впоследствии правилом МТИ1’:
dtydt — —ае grade е, (14.18)
где е — ошибка модели, компоненты вектора 0 — настраиваемые параметры, а число а характеризует скорость адаптации. Уравнение (14.18) описывает механизм настройки, состоящей из трех частей: линейного фильтра для вычисления коэффициентов чувствительности (градиента), умножителя и интегратора. Такая конфигурация часто встречается во многих адаптивных системах.
Алгоритм (14.18) дает хорошие результаты, если а достаточно мало, при этом допустимая величина данного параметра зависит от величины эталонного сигнала. По этой причине невозможно заранее указать допустимые границы изменения а, при которых гарантируется устойчивость. Таким образом, этот алгоритм, вообще говоря, дает неустойчивую замкнутую систему. Пользуясь результатами теории устойчивости, можно построить аналогичные, но устойчивые алгоритмы настройки, в которых градиент ошибки заменяется другими функциями.
Связь между АРЭМ и самонастраивающимися регуляторами (СНР)
Из рисунков 14.1 и 14.4 следует, что между АРЭМ и СНР существует тесная связь. В обеих системах имеется два контура обратной связи. Внутренний контур включает обычную цепь обратной связи, процесс и регулятор, параметры которого настраиваются внешним контуром. При этом настройка регулируется обратной связью от входов и выходов процесса. Однако методы реализации внутреннего контура и способы настройки параметров во внешнем контуре могут отличаться. Когда эти методы идентичны, неявный СНР и АРЭМ совпадают.
Регулятор, показанный на рис. 14.1, можно получить, следуя идеям регулирования по эталонной модели, если для оценки параметров использовать коррекцию последней. Такую схему называют неявной схемой адаптивного регулирования по эталонной модели, поскольку здесь параметры регулятора корректируются не непосредственно, а через модель. Явная схема АРЭМ, где осуществляется непосредственная корректировка параметров регулятора, тесно связана с неявными СНР и наоборот.
о Массачусетский технологический институт, США. — Прим. ред.
Стохастическая теория управления
Регуляторы типа СНР и АРЭМ строятся на основе эвристических рассуждений, поэтому хотелось бы попытаться прийти к ним на основе некоторого единого теоретического подхода. Таким подходом является теория нелинейного стохастического управления, в которой сама система и внешние воздействия описываются некоторой стохастической моделью. При этом цель управления состоит в минимизации математического ожидания
Рис. 14.6. Блок-схема адаптивного регулятора, построенного на принципах стохастической теории оптимального управления.
функции потерь, являющейся скалярной функцией от переменных состояния и управлений.
Задача отыскания управления, минимизирующего математическое ожидание функции потерь, весьма сложна: на самом деле не известны даже условия существования решения этой задачи. Если, однако, предположить, что решение существует, то, воспользовавшись методом динамического программирования, можно вывести некоторое функциональное уравнение для оптимального значения функционала. Это уравнение, называемое уравнением Беллмана, можно решить численно только в самых простых случаях.
Структура полученного таким образом оптимального регулятора показана на рис. 14.6. Регулятор фактически состоит из блока оценки параметров и блока синтеза управления. По данным измерениям блок оценки генерирует функцию распределения условных вероятностей переменных состояния, называемую гиперсостоянием системы. Регулятор тогда представляет собой нелинейную функцию, отображающую гиперсостояние на пространство переменных управления.
Структурная простота решения получается ценой введения гиперсостояния, характеризующегося очень высокой размерностью. Заметим, что СНР (рис. 14.1) можно рассматривать как аппроксимацию регулятора, показанного на рис. 14.6, в которой гиперсостояние заменяется состоянием процесса и оценками параметров.
Оптимальное управление обладает следующим интересным свойством; Оно не только приводит выход к заданной величине, но и при наличии неопределенности в значениях параметров вводит некоторые возмущения, которые улучшают полученные оценки. Таким образом, оно одновременно минимизирует ошибки регулирования и величину необходимых управлений. Такое управление называют дуальным.
Пример 14.1
Рассмотрим систему, описываемую уравнением
у (k + 1) = у (k) + bu (k) + е (k), где и — управление, у — выход, е — белый шум, а Ь — постоянный параметр или марковский процесс. Предположим, что цель управления состоит в минимизации дисперсии выхода у.
Если b имеет априорное нормальное распределение, то можно показать, что при известных входах и выходах вплоть до момента k условные вероятности b также имеют нормальное распределение со средним 6(k) и стандартом g(fe). Уравнения для пересчета значений б и о имеют тот же вид, что и фильтр Калмана.
Оптимальное управление можно рассчитать методом динамического программирования. Аппроксимация дуального управления дается выражением
и (k) = —у (k)
_________g (fe) + 0,56g (fe)_______________1,9g3 (fe)
b' (fe) + 0,08g (fe) a (fe) + 2,2a2 (fe) g4 (fe) + l,7o4 (fe)
(14.19)
для f>0 и у 0. Отметим, что Ь и у входят в (14.9) несимметрично. Дуальность этого управления определяется наличием второго члена в (14.19).
Можно построить различные приближенные реализации оптимального управления (14.19). Решив задачу оптимального управления для заданных значений параметров и заменив эти значения их оценками, получим квазисто-хастический регулятор:
u(k) = -y(k)/t>(k). (14.20)
Кстати, СНР можно интерпретировать как квазистохастический регулятор. Управление вида
------------------------ym g (fe) g2 (fe.) + o2 (fe)
(14.21)
представляет собой другое приближение, называемое «осторожным» регулятором, поскольку при наличии неопределенностей в оценках он работает на нижней границе коэффициента усиления. Если b — детерминированная величина, то, очевидно, управления (14.19) и (14.21) сводятся к (14.20).
Заметим, что управления (14.20) и (14.21) не являются дуальными.
14.4. РЕАЛИЗАЦИЯ АДАПТИВНЫХ АЛГОРИТМОВ
Самонастраивающиеся и адаптивные методы еще не вышли из «периода младенчеству». До появления микропроцессоров практическая реализация этих алгоритмов стоила бы слишком дорого. Тем не менее, поскольку их применение сулит получение новых типов регуляторов и неординарные возможности систем управления, представляет определенный интерес попытка наметить возможную сферу их использования.
Автоподстройка
Вручную можно подобрать значения трех-четырех параметров регуляторов, если они не слишком сильно связаны между собой. Однако в более сложных случаях регулятор должен иметь специальный механизм настройки. Как правило, настройка параметров достаточно сложного регулятора включает этапы моделирования или идентификации и проектирования. Эта процедура часто весьма дорога и занимает много времени, поэтому к ней прибегают только в случае настройки особо важных элементов или массового производства.
Если параметры регулятора постоянны, то СНР и АРЭМ превращаются2в обычные регуляторы с постоянным усилением в контуре обратной связи и адаптивный контур можно использовать как элемент настройки контура управления. В таких случаях адаптивное звено подключается к регулятору и работает до тех пор, пока не будет достигнуто удовлетворительное качество управления. При этом коэффициент усиления адаптивного контура постепенно падает. В конце концов это звено отключается, и регулятор дальше работает с постоянным усилением. Автоподстройку можно рассматривать как удобный способ реализации в регуляторе механизма автоматического моделирования и проектирования. Таким образом, этот прием существенно расширяет область применимости формализованных методов конструирования регуляторов. Автоподстройка особенно полезна в таких схемах управления, как прямое регулирование, качество которого практически полностью определяется качеством модели. Этот метод можно с успехом применять как к простым ПИД-регуляторам, так и к более сложным системам.
Элементы автоподстройки очень удобны в многофункциональных системах цифрового регулирования, так как они могут использоваться для настройки параметров различных цепей. Поскольку для реализации хорошего алгоритма настройки достаточно лишь несколько килобайт памяти, можно сравнительно дешево получить значительный эффект.
Автоподстройку можно включать и в одноконтурные регуляторы. Так, например, можно сделать регулятор с тремя рабочими режимами: ручным, автоматическим и режимом настройки параметров. При этом, однако, алгоритм настройки будет занимать большую часть всего программного обеспечения одноконтурного регулятора — объем необходимой памяти, например, может возрасти более чем вдвое.
Автоподстройка позволяет обойти множество теоретических проблем, присущих адаптивным регуляторам. Единственная трудность, которая при этом остается, — это идентификация параметров в замкнутом режиме. Данный вопрос можно решить, введя при моделировании некоторые искусственные возмущения.
Поскольку настройку параметров можно производить под наблюдением 'оператора, эта процедура, как правило, не грозит какими-либо нежелательными последствиями.
Ручная регулировка параметров
Адаптивные регуляторы могут иметь ;наЁтраиваемые параметры, поэтому интерфейс с оператором играет здесь важную роль. При использовании адаптивных методов часто желательно иметь «абсолютно черный ящик» без необходимости какой бы то ни было настройки параметров. Это возможно в тех случаях, когда цель управления можно указать заранее. Тем не менее и в этих случаях регулятору по меньшей мере необходимо указать, что он должен делать. Для этого надо вывести
Рис. 14.7. Моделирование самонастраивающегося регулятора с ограниченной полосой пропускания.
Передаточная функция процесса есть 1/($4-1)2. Необходимая частота пропускания составляет: а —1,5 рад/с; б— 4,5 рад/с.
на переднюю панель ручки ручной регулировки параметров с соответствующими градуировочными шкалами, по которым можно выставить необходимые качественные свойства замкнутой системы. На этой основе можно создавать новые типы регуляторов. Можно, например, построить регулятор со шкалой, проградуированной по частотной полосе пропускания системы. Другой пример — это ЛКГ-регулятор с градуировочной шкалой по отношению отклонения фазовой переменной и амплитуды управления. Наконец, шкалу можно проградуировать через диапазон изменения фазы и амплитуды. Типичные характеристики подобного регулятора можно проиллюстрировать следующим примером;
Пример 14.2. Самонастраивающийся регулятор (СНР) с ручной регулировкой полосы пропускания
СНР с ручной регулировкой полосы пропускания — это адаптивный регулятор с одной ручкой настройки на передней панели, задающей полосу пропускания замкнутой системы. В данном примере регулятор построен методом размещения полюсов.
Реакция серворегулятора на прямоугольный командный сигнал показана на рис. 14.7. Вначале регулятор не имеет никакой информации об управляемой системе. Из рисунка следует, что уже после первого командного импульса серворегулятор ведет себя очень хорошо. При задании узкой полосы пропускания (1,5 рад/с) управляющий сигнал реагирует на командный импульс небольшим «всплеском» и затем постепенно приходит к некоторому установившемуся значению. При задании более широкой полосы (5,5 рад/с) (рис. 14.7, б) начальный всплеск более чем в 30 раз превосходит установившееся значение. Для узкой полосы пропускания характерна медленная реакция, небольшая амплитуда управляющих сигналов и низкая чувствительность к шумам измерений; для широкополосных систем картина прямо противоположная. Подобрать приемлемую в каждом конкретном случае ширину полосы пропускания нетрудно простым экспериментированием. Отметим, что, кроме ширины полосы, все остальные параметры (скажем, интервал квантования) определяются автоматически самим регулятором.
Целесообразность использования адаптивных регуляторов
Адаптивные регуляторы, будучи нелинейными системами по своей природе, являются гораздо более сложными объектами, чем регуляторы с постоянным усилением. Прежде чем пытаться применять адаптивные регуляторы, необходимо убедиться в том, что данную задачу управления нельзя решить, введя обычную обратную связь с постоянным усилением. В обширной литературе по адаптивному регулированию рассматривается множество случаев, когда адаптивные регуляторы можно было бы с успехом заменить регуляторами с постоянным усилением. Заметим, что, исследуя изменения динамики разомкнутой системы в заданной рабочей области, еще нельзя определить, действительно ли нельзя обойтись без адаптивного регулятора; известно много случаев, когда регуляторы с постоянным усилением дают очень хорошие результаты в широком диапазоне рабочих режимов.
Супервизорные цепи
Адаптивные' системы, показанные на рис. 14.1 и 14.5, можно рассматривать как двухуровневые иерархические системы. Нижний уровень представляет собой обычный контур обратной связи, включающий процесс и регулятор, а верхний — адаптивную цепь настройки параметров. Для реализации адаптивного механизма в типичных СНР или АРЭМ необходимо задание таких параметров, как порядок модели, коэффициенты забывания и интервал квантования. Для задания этих параметров можно-ввести еще один уровень. Так, подходящий коэффициент забывания можно подобрать, отслеживая режимы самовозбуждения процесса. Запоминая входы и выходы процесса, можно построить модели разных порядков с различными интервалами квантования и различной структурой.
ВЫВОДЫ
После многолетних теоретических исследований и многочисленных экспериментов адаптивные методы управления постепенно набирают силу. За прошедшие годы были получены важные теоретические результаты, касающиеся структуры адаптивных регуляторов и их устойчивости, однако многие вопросы еще остаются открытыми. Появление микропроцессоров дало мощный толчок развитию прикладных работ в этом направлении как в науке, так и в промышленности, что способствовало более глубокому пониманию принципов адаптивного управления. Некоторые из этих принципов уже реализованы в регуляторах, выпускающихся серийно.
ЗАДАЧИ
14.1. Рассмотрим процесс
у (k) + ay(k — 1) = bu(k — 1) + e(k) -f- ce(k — 1) и предположим, что для оценки параметра а в модели у (k + 1) + ay (k) = ро« (k) 4- е (k + 1)
(здесь Ро предполагается известным) используется метод наименьших квадратов. Пусть управление имеет вид
и (k) = а/^оу (k).
Покажите, что в предельной точке последовательности оценок выполняются равенства: rv(1) = 0, rj<„(l) = O. Покажите, что а — с -
регулятор с параметром а, равным а=——Ро, является возможным предельным регулятором.
14.2. Промоделируйте систему, описанную в задаче 14.1 с рекуррентной оценкой параметра р0. Исследуйте влияние р0 (на
пример, могут ли 6 и ₽о иметь противоположные знаки?). (Ключ-, попробуйте ввести ограничение на управляющий сигнал, потребовав, чтобы его амплитуда не превосходила дисперсию более чем в 3—5 раз.)
14.3. Получите условия, при которых процесс
У (k) 4- аху (k — 1) + ... 4- апу (k — п) = п (k) ограничен в среднеквадратическом смысле, если
1 *
lim ~г Е п (/)2 < оо.
fe->OO К /=1
14.4. Имеется''процесс
y(k 4- 1) — y(k) = u(k — 1) 4- e(k 4- 1) — 0,9e (k).
Найдите управление с минимальной дисперсией. Постройте самонастраивающийся регулятор для модели
y(k + 1) = 8^у(к) + 8ху(к — 1) 4- г0 [и (k) 4- г (k — 1)] 4- е(й), основанный на среднеквадратическом оценивании и минимизации дисперсии. Сравните этот регулятор с предыдущим случаем и с помощью теорем 14.1 и 14.2 найдите для него возможные равновесные точки.
14.5. Промоделируйте СНР, основанный на оценивании параметров модели
y(k) + axy(k— 1) 4- а2у (k — 2) = bxu(k — 1) 4- b2u (k — 2)
и размещении полюсов (см. гл. 10). Проверьте результаты, показанные на рис. 14.7.
14.6. Докажите, что (14.14) дает ограниченный выход при ограниченных возмущениях, если используется простой СНР, (14.12) и (14.13).
ЛИТЕРАТУРА
Обзоры по теории и приложениям самонастраивающихся регуляторов
1. Astrom К. J. (1980): “Self-tuning Regulators: Design Principles and Applications”, в книге Applications of Adaptive Control, eds. Narendra and Monopoli. New York: Academic Press.
2. Isermann R. (1982): “Parameter Adaptive Control Algorithms — A Tutorial”, Automatica, 18, 513-528.
3. Astrom K. J. (1983): “Theory and Applications of Adaptive Control”, Automatica, 19.
Впервые самонастраивающийся регулятор был описан в работе
4. Kalman R. Е. (1958): “Design of a Self-optimizing Control System”, Trans. ASME, 80, 468-78.
Некоторые основные работы в области самонастраивающихся регуляторов
5. Peterka V. (1970): Adaptive Digital Regulation of Noisy Systems. Preprint 2nd I FAC Symposium on Identification and Process Parameter Estimation. June 1970, Prague, Czechoslovakia.
6. Astrom К. J., Wittenmark В. (1973): “On Self-tuning Regulators”, Auio-matica, 9, 185-99.
7. Clarke D. W„ Gawthrop P. J. (1975): “A Self-t.uning Controller”, Proc. IEEE 122, 299-34.
8. Wellstead P. E., Edmunds J. M., Prager D., Zanker P. (1979): “Selftuning Pole/Zero Assignment Regulators”, Int. Journal Control, 30, 1-26.
9. Astrom K. J., Wittenmark B. (1980); “Self-tuning Controllers Based on Pole-Zero Placement”, Proc. IEEE, 127, 120-30.' -4
Общие вопросы адаптивного управления
10. Bellman R. (1961): Adaptive Control: A Guided Toor. Princeton N. J.: Princeton University Press.
11. Saridis G. N. (1977): Self-organizing Control of Stochastic Systems New York: Marcel Dekker.
12. Wittenmark B. (1975): “Stochastic Adaptive Control Methods: A Survey”, Int. Journal Control, 21, 705-30.
Адаптивное управление по эталонной модели
13. Whitaker Н. Р., Yamrom J., Kezer А. (1958): Design of Model-reference Adaptive Control Systems for Aircraft. Report R-164, Instrumentation. Laboratory, MIT, Cambridge, Mass.
14. Parks P. C. (1966): “Lyapunov Redesign of Model Reference Adaptive Control System”, IEEE Trans. Autom. Control, AC-19, 362-67.
15. Monopoli R. V. (1974): “Model Reference Adaptive Control with an Augmented Error Signal”, IEEE Trans. Autom. Control, AC-19, 474-84.
16. Landau Y. D. (1979): Adaptive Control: The Model Reference Approach.. New York: Marcel Dekker.
Анализ устойчивости и сходимости самонастраивающихся регуляторов
17. Liung L. (1977): “On Positive Real Transfer Functions and the Convergence of Some Recursive Schemes”, IEEE Trans. Autom. Control, AC-22, 539-51.
18. Egardt B. (1979): Stability of Adaptive Controllers. Berlin: Springer-Verlag.
19. Morse A. S. (1980): “Global Stability of Parameter Adaptive Systems”, IEEE Trans. Autom. Control, AC-25, 433-39.
20. Narendra K. S„ Lin Y. H., Valavani L. S. (1980): “Stable Adaptive Controller Design. Part II: Proof of Stability". IEEE Trans. Autom. Control AC-25, 440-48.
21. Goodwin G. P„ Rimadge P. J„ Caines P. E. (1980): “Discrete Time Multivariable Adaptive Control”, IEEE Trans. Autom. Control, AC-25, 449-56.
22. Goodwin G. P., Ramadge P. J., Caines P. E. (1981): “Discrete Time Stochastic Adaptive Control”, SIAM Journal on Control and Opitimization, 19, 829-53.
Дуальное управление
23. Фельдбаум A. A. (1960): «Дуальная теория оптимального управления 1-IV”, Автоматика и телемеханика, г. 21, стр. 874-80, 1033-39; т. 22, стр. 1-12, 109-21.
24. Astrom К. J., Wittenmark В. (1971): “Problems of Identification and Control”, J. Math. Analysis and Appl., 34, 90-113.
25. Bar-Shalom Y., Tse E. (1974): “Dual Effect, Certainty Equivalence and Separation in Stochastic Control”, IEEE Trans. Autom. Control, AC-19, 494-500.
26. Astrom K. J., Helmersson A. (1982): “Dual Control of a Low Order System”, Proc. CNRS Colloque National, Belle He, France, September.
Применения адаптивного управления
27. Narendra К. S., Monopoli R. V., eds. (1980): Applications of Adaptive Control. New York: Academic Press.
28. Unbehauen H., ed. (1980): Methods and Applications in Adaptive Control. Berlin: Springer-Verlag.
15
Реализация цифровых регуляторов
Методы реализации цифровых регуляторов на ЭВМ
ВВЕДЕНИЕ
В предыдущих главах обсуждались методы аналитического конструирования алгоритма управления, ориентированного на применение ЭЦВМ. В настоящей главе рассматриваются вопросы реализации таких алгоритмов на цифровых вычислительных машинах.
Алгоритмы управления, описанные в предыдущих главах, представляют собой некоторые дискретные «динамические» системы уравнений, поэтому основная проблема заключается в том, как реализовать эти системы на ЭЦВМ. Оказывается, что путь от дискретного алгоритма до его программной реализации довольно прост. Но есть некоторые моменты, на которых следует заострить внимание. Это касается интерфейса с датчиками, исполнительными механизмами и операторами. Столь же важен и вопрос о необходимой точности вычислений. Показано, что вычислительные задержки зависят от способа реализации алгоритма. При этом обсуждаются различные способы организации программ, направленные на сокращение вычислительных задержек. Приводятся эффективные методы фильтрации сигналов путем введения нелинейности, нивелирующие влияние ненадежных датчиков, — эти методы представляют собой одно из важных достижений автоматизированного управления.
Хотя книга в основном посвящена линейной теории оптимального управления, существуют некоторые нелинейности, которые необходимо учитывать явно. Примером нелинейности подобного рода является насыщение исполнительного механизма. В связи с этим обсуждаются возможные способы борьбы с этим явлением, являющиеся обобщением классических методов.
Интерфейс с оператором — это еще один важный фактор. Здесь рассматриваются различные способы реализации рабочих режимов и методы подавления переходных процессов, воз
никающих при переключении режимов. Кроме того, обсуждаются объем иг содержание выводимой информации, а также различные способы воздействия на контур управления. Цифровые вычислительные машины существенно расширяют возможности управления, однако до сих пор они для этих целей использовались не очень интенсивно, поэтому в этом направлении можно получить много новых полезных результатов.
Алгоритмы управления, естественно, должны основываться на надежных численных методах. Машинная реализация простых систем не вызывает затруднений, однако в тех случаях, когда параметры и сами алгоритмы управления изменяются в реальном масштабе времени, необходимо прибегать к таким инструментам, как параллельное программирование1).
15.1. ОБЩЕЕ ОПИСАНИЕ
В этом разделе дается общее описание схемы реализации цифровых алгоритмов управления. Вначале излагаются альтернативные представления регуляторов, полученных различными методами аналитического конструирования в гл. 8—14, и затем описывается схема их машинной реализации. Формулируются некоторые важные для приложений вопросы, которые подробнее рассматриваются в последующих разделах.
Различные представления регуляторов
С помощью методов конструирования, изложенных в предыдущих главах, можно получить алгоритмы управления в виде дискретных динамических систем управления. В зависимости от принятого подхода эти системы принимают разный вид.
Методы конструирования, основанные на размещении полюсов замкнутой системы с обратной связью по состоянию (гл. 9),. и ЛКГ-управление (гл. 11) приводят к регулятору вида
x(k \k) = x(k \k — 1) + K[y(k) — (j(k \k — 1)],
u(k) — L [xm(k) — x(k |fe)] -|- Dcuc(k), (15.1)
x (k -|- 1 | k) = Ax (k | k) + Bu (k), xm(k + l) = f [xin(k), uc(k)],
y(k+ 1 |fe) = Cx(fe + l|fe).
В таком представлении состояние регулятора описывается переменными х и хт, где х — оценка состояния процесса, а хт— состояние модели, генерирующей желаемую реакцию на командный сигнал ис. Запись (15.1) называют представлением в пространстве состояний с явным наблюдателем из-за физической
*> Имеется в виду многозадачный режим работы процессора. — Прим,, ред.
интерпретации состояния регулятора. В это представление при необходимости легко включить нелинейную модель некоторой переменной состояния.
Если функция f в (15.1) линейна, то регулятор (15.1) представляет собой линейную систему с входами у и ис и выходом и. Такой регулятор всегда можно представить в виде
и (k) = Сх (k) + Dy (k) + Dcuc (k),
x(k + i) = Fx(k) + Gy(k) + Gcuc(k) (15’2)
(см', задачу 9.7). Уравнения (15.2) являются представлением дискретной динамической системы в обобщенном пространстве состояний. Эта запись более компактна, чем (15.1), однако состояние может и не иметь явной физической интерпретации.
Методы конструирования систем с одним входом и одним выходом, описанные в гл. 10 и 12 и основанные на внешних моделях, приводят к регулятору, записанному в виде отношения «вход-выход»:.
R (<?) и (k) = Т (<?) ис (k) — S(q)y (k), (15.3)
где R(q), S(q) и T(q)—многочлены относительно оператора сдвига q. Эти различные представления связаны между собой простыми преобразованиями (см. гл. 3).
Машинная реализация дискретных систем
Реализация дискретных систем, описываемых уравнениями (15.1), (15.2) или (15.3), довольно проста. Конкретные детали
Тактовое прерывание
Программа:
АЦП
Вычисление управляющей переменной
ЦАП
Рис. 15.1. Структурная схема программы, реализующей дискретную систему управления.
реализации зависят от конфигурации ЭВМ и имеющегося программного обеспечения. Для иллюстрации самой идеи предположим, что речь идет о реализации системы (15.2) на цифровой машине с АЦ- и ЦА-преобразователями и таймером реального времени. Условная блок-схема программы показана на рис. 15.1. Исполнением программы управляет таймер — горизонтальная черточка на рисунке показывает, что программа находится в режиме ожидания до момента поступления прерывания от тай
мера. При этом таймер устанавливается таким образом, что прерывание ^поступает в каждый момент квантования, и в этот момент начинается исполнение программы. Текст программы, реализующей данный алгоритм, приведен в листинге 15.1.
Листинг 15.1. Структура программы, реализующей управление (15.2)
Процедура “Регулирование" begin
1 Adin у uc
2 u:=C* *x+D*y + Dc*uc
3 x:=F*x + G*y + Gc*uc
4 Daout u
end
Первая строка программы осуществляет преобразование «аналог-цифра», при этом полученные значения записываются в массивы у и ис. Во второй строке в результате линейных векторно-матричных операций вычисляется управляющий сигнал и. В третьей строке пересчитывается вектор переменных состояния х, а в четвертой выполняется преобразование «цифра-аналог». Для получения полного текста программы необходимо ввести декларации типов переменных для векторов и, ис, х и у и матриц F, G, Gc, С, D и De. Кроме того, необходимо определить значения элементов матриц и задать начальное значение вектора состояния х. Если язык программирования не содержит явных операций над векторами, то необходимо включить соответствующие процедуры реализации операций матричной алгебры.
♦ ♦♦ Заметим, что вторая и третья строки программы в
точности повторяют запись (15.2).
Для того чтобы получить хорошую систему управления, необходимо тщательно исследовать следующие важные вопросы:
• численные аспекты реализации;
• датчики;
• исполнительные механизмы;
• эксплуатационные вопросы;
• программирование.
Эти вопросы обсуждаются в следующих разделах,
15.2. ПРЕДВАРИТЕЛЬНАЯ ФИЛЬТРАЦИЯ И ВЫЧИСЛИТЕЛЬНЫЕ ЗАДЕРЖКИ
При реализации системы управления важно уделять серьезное внимание взаимодействию вычислительной машины с ее окружающей средой. В этом разделе обсуждается организация интерфейса ЭВМ с датчиками.
Предварительная фильтрация аналогового сигнала, используемая для борьбы с захватом частоты (см. разд. 2.1), и вычислительные задержки, которые, как следует из разд. 15.1, всегда имеют место, изменяют динамические характеристики объекта, что может оказаться весьма важным при реализации цифрового регулятора. Рассмотрим эти вопросы подробнее.
Предварительная фильтрация аналогового сигнала
Для того чтобы избежать захвата частоты, необходимо использовать предварительный аналоговый фильтр с тем, чтобы подавить возмущения с частотами выше частоты Найквиста, связанной с частотой квантования. Различные фильтры такого рода рассматривались в разд. 2.4, где расчет фильтра строился лишь на известном частотном спектре сигнала. В теории оптимального управления обычно о сигнале известно гораздо больше, поскольку имеются дифференциальные уравнения, описывающие процесс и, возможно, возмущения. В этой связи аналоговый фильтр Калмана был бы очень хорошим предварительным фильтром, поскольку он строится на основании подробного описания сигнала. Компьютерная реализация фильтра Калмана имеет ряд преимуществ перед аналоговой схемой. В этом случае аналоговый сигнал можно квантовать со сравнительно высокой частотой, а высокочастотные возмущения можно подавить с помощью обычного аналогового фильтра, рассчитанного по частотному спектру сигнала.
Частотная полоса фильтра ив обратно пропорциональна периоду квантования h. Грубо эта связь имеет вид:
aBh ~ 0,5 -т-1.
Точное значение ширины полосы определяется порядком фильтра и характером измеряемого сигнала. Отметим, что при расчете системы регулирования обязательно следует учитывать динамические свойства предварительного фильтра.
При изменении частоты квантования следует изменить и параметры фильтра. Из стандартных электронных компонентов можно построить аналоговый фильтр для периодов квантования в несколько секунд. При более редком квантовании часто оказывается проще проводить квантование раз в секунду или чаще с соответствующим предварительным аналоговым фильтром и использовать цифровой фильтр для фильтрации квантованного сигнала. При таком подходе можно, кроме того, изменять период квантования для вычисления управлений лишь программными средствами.
Поскольку аналоговый фильтр является динамической системой, его динамические характеристики необходимо включать в модель процесса. При этом при изменении параметров фильтра или частоты квантования необходимо пересчитать оптимальное
управление. Следующий пример иллюстрирует простой способ, позволяющей определить, необходимо ли включать динамику фильтра в модель регулируемого процесса.
Пример 15.1. Когда можно пренебречь динамикой фильтра
Рассмотрим серворегулятор с частотной полосой ыв рад/с, реализованный на ЭЦВМ с частотой квантования cos рад/с. Пусть в качестве предварительного фильтра используется фильтр Баттерворта-второго порядка. Тогда передаточная функция имеет вид (см. табл. 2.1)
( s2 + 2£<ofs + Of ’
где £=1/^/2. На частоте ов этот фильтр имеет задержку по фазе, равную
2£<of<oB 2£<о а = arctg —----j" « — при of <ofl.
oj — ов '
Ослабление па частоте Найквиста равно
= 1 ~ у_( у
I G (“°w) I ~ k “f ) 12fflf Л
Исключая Of из этих двух уравнений, получим:
При а=0,1 рад. (5,7°) и и=10 формула (15.4) дает частоту квантования со5, в 90 раз превышающую величину полосы частот.
Этот пример показывает, что при нормальной частоте квантования (то есть, 10—20 точек на период) необходимо учитывать динамику предварительного фильтра (ср. с разд. 9.1).
Вычислительная задержка
Поскольку для выполнения АЦ- и ЦА-преобразовадий и других вычислений требуется определенное время, при реализации управления на ЭЦВМ, всегда возникает временная задержка, величина которой зависит от способа реализации алгоритма управления. Способы реализации принципиально делятся на две группы (рис. 15.2). В случае А переменная, измеренная в момент tk, используется при вычислении управления для момента tk+\- В случае Б управление вырабатывается сразу после получения значения этой переменной.
Недостаток случая А состоит в наличии неоправданной задержки в управляющем сигнале; слабость подхода Б проявляется в том, что величина задержки является переменной и зависит от программной реализации. В обоих случаях, однако, величину вычислительной задержки необходимо учитывать при выработке управления. Это легко сделать, введя в модель процесса задержку h (случай А) или т (случай Б). При этом важно всегда приступать к вычислению управления только после завершения ввода входных сигналов, поскольку в противном случае возможны паразитные электрические связи.
Управляющая перемет Измеряемая переменная
Рис. 15.2. Два способа синхронизации входов и выходов.
Случай А—измеренные в момент сигналы используются для вычисления управляющего сигнала для момента времени Случай Б — управление начинает действовать
сразу же по завершении вычислений.
В случае Б желательно минимизировать вычислительную задержку. Единственная имеющаяся для этого возможность состоит в минимизации числа операций, выполняемых между АЦ-и ЦА-преобразованиями.
Рассмотрим программу, приведенную в листинге 15.1. Поскольку управляющий сигнал становится известным после выполнения второй строки программы, ЦА-преобразование можно выполнить до пересчета переменной состояния. Задержку можно еще более сократить, если вычислять произведение С*х после ЦА-преобразования. Модифицированная таким образом программа приведена в листинге 15.2.
Листинг 15.2. Структура программы, реализующей управление (15.2). (Эта программа имеет меньшую вычислительную задержку, чем приведенная в листинге 15.1.)
Процедура “Регулирование" begin
1 Adin у ис
2 u := ill-|-D * у + De * ис
3 Daout u
4 х := F * х + G * у + Gc * uc
5 ul := C * x
end
Полезно иметь надежные оценки быстродействия различных алгоритмов 'Управления, которые проще всего получить на прогонах тестовых программ. В случае линейных законов управления оценки быстродействия часто можно получить по времени вычисления скалярных произведений, поскольку в этом случае основной объем вычислений падает на векторно-матричные операции, например, следующего вида:
Rrocedure Scarpro; begin s := 0; for i := 1 to n s := s + a [i] * b [i]; end
В этой процедуре требуется вычисление адресов элементов массивов и выполнение операций сложения и умножения.
В простейших микро-ЭВМ, не имеющих аппаратной реализации арифметики с плавающей запятой, имеется большое различие во времени выполнения вычислений с плавающей и фиксированной запятой. Если же операции с плавающей запятой реализуются аппаратно, то это различие не так велико.
Для оценки последствий вычислительной задержки, кроме того, полезно знать чувствительность замкнутой системы к величине временного запаздывания. Ее можно оценить, построив корневой годограф по запаздыванию. Более грубый способ состоит в оценке изменения полюсов замкнутой системы при введении временной задержки величиной в один период квантования.
Определение выбросов и отказов датчиков
Помимо ошибок, обусловленных наличием шумов измерений, процедура вычисления управлений может содержать ошибки, источниками которых могут быть, например, датчики и преобразователи. Ошибки подобного рода обычно характеризуются большим разбросом и малой вероятностью. При компьютерной реализации систем управления для исключения таких ошибок существуют довольно эффективные приемы.
Ошибки можно обнаруживать в месте их возникновения. В системах, где требуется высокая надежность, это обычно достигается дублированием датчиков. При этом два датчика включаются в логическую схему, генерирующую аварийный сигнал, если разность сигналов этих датчиков превышает заданное пороговое значение. Таким образом, пару датчиков можно рассматривать как один датчик, выдающий или корректный сигнал, или сигнал, сообщающий о его отказе.
В особых случаях можно задействовать три датчика. Тогда измеряемое значение принимается, если показания не менее двух
датчиков из трех совпадают в заданных пределах (логика «два из трех»). Возможны и более сложные комбинации датчиков и фильтров.
Для обнаружения ошибок можно использовать фильтр Калмана. Рассмотрим, например, алгоритм (15.1) с явным наблюдателем. Отметим, что в алгоритм в явном виде входит ошибка одношагового предсказания:
е (fe) = у (k) + y(k\k - 1) = у (fe) - CH (fe'fe - 1). (15.5)
Если имеются оценки ковариационной матрицы ошибки предсказания, то легко проверить, лежит ли некоторое измерение в разумных пределах.
Один из способов получения ковариации ошибок состоит в преобразовании ковариационных уравнений фильтра Калмана в реальном масштабе времени. Для фильтра (15.1) эти уравнения имеют вид
(fe) = СР (fe | fe - 1) ст + r2,
K(fe) = P(fe|fe- l)CTR~' (k), (15.6)
P(fe|fe) = P(fe|fe- 1)-P(fe|fe- l)C7’/?~’ (fe)CP(fe|fe- I),
P(k + 1 \k) = ATP(k\k)A + Rl,
где R(k)— ковариация e(fe), P(fe|fe— 1)— ковариация x(fe|fe—1), a P(k\k)—ковариация x(fe|fe) (см. разд. 11.3). Если обнаружена ошибка измерений, то эти уравнения следует соответствующим образом скорректировать. Если отвергаются все измерения, то второй член в уравнении для P(fe|fe) следует опустить, поскольку он учитывает уменьшение дисперсии благодаря получению измеренных значений вектора y(k). Измерения y(k) можно отбрасывать и покоординатно. Совместное использование фильтров Калмана и дублированных датчиков позволяет построить очень гибкие системы управления. Если к тому же добавить возможность тестирования, то система сможет осуществлять различные виды диагностики.
При автоматизированном управлении имеется множество возможностей регистрации различных аппаратных и программных ошибок. Так, добавление к АЦ-преобразователю нескольких дополнительных каналов, присоединенных к источникам фиксированных напряжений, открывает возможности автотестирования и калибровки. Связав ЦА- и АЦ-преобразователи, можно автоматически тестировать и выставлять ЦА-преобразователь. Процессор можно проверять, выполняя операции с известным результатом и сравнивая известные и вычисленные результаты.
15.3. НЕЛИНЕЙНЫЕ ИСПОЛНИТЕЛЬНЫЕ МЕХАНИЗМЫ
Методы проектирования, рассмотренные в гл. 9—12, основаны на предположении о возможности описания процесса линейной моделью. Хотя область применимости линейной теории весьма широка, существуют некоторые нелинейности, которые все же следует учитывать явно. Так, часто случается, что исполнительные механизмы являются существенно нелинейными (рис. 15.3).
Процесс
Исполнительный Линейная
механизм динамика.
Рис. 15.3. Блок-схема процесса с нелинейным исполнительным механизмом с насыщением.
В системах управления производственными процессами часто используются вентили, представляющие собой нелинейности типа насыщения, когда нижняя и верхняя границы соответствуют полностью закрытому и полностью открытому положениям. Система, показанная на рис. 15.3, допускает линейное описание до тех пор, пока вентиль не насыщается. Таким образом, нелинейность играет особо важную роль, когда в системе происходят существенные изменения. Если нелинейности не принимать во внимание, то в этих случаях так же, как и при запуске и останове в системе управления, могут возникнуть осложнения. Типичным примером такого рода является насыщение интегратора, рассмотренного в примере 8.4.
Для учета насыщения было бы естественно на основе общей теории оптимального управления построить методы конструирования, явно учитывающие наличие нелинейностей. Однако такой подход довольно сложен, да и вид получаемого при этом оптимального управления довольно непрост. По этой причине более практично использовать простые эвристические методы.
Все сложности происходят от того, что регулятор является динамической системой. Поэтому необходимо следить за тем, чтобы регулятор должным образом реагировал на насыщение управляющей переменной. Ниже обсуждаются различные способы реализации этого условия.
Регуляторы с обратной связью по фазе и явным наблюдателем
Рассмотрим сначала случай, когда управление описывается как комбинация наблюдателя и обратной связи по фазовым переменным (15.1). Регулятор является динамической системой, со
стояние которой есть оценка X состояния процесса (1b. 1). t5 этом случае способ учета насыщения просматривается явно.
Модель (15.1) дает корректную оценку, если переменная и выбирается равной фактической переменной управления ир (рис 15.3). Таким образом, если ир измеряема, то оценка (15.1) и состояние регулятора являются корректными, даже если управляющая переменная насыщается. Если выход исполнительного механизма нельзя измерить, то его можно оценить при условии, что известна нелинейная характеристика механизма.
Рис. 15.4. Регулятор с компенсацией насыщения, включающий наблюдатель и контур обратной связи по состоянию.
В случае простого насыщения управление можно записать в виде
X(jfe|fe)=<e(fe|jfe- 1)ч- /<[£/(&) — Ct(k\k — 1)] = - [Л - КС] х (k - 11 k - 1) 4- Вйр (k - 1), йр (k) = sat {£ [xm (k) — x (k | £)] + um}, je(£+ 1 |£) = AX(k |k) + Вйр(/г),
где функция sat определяется как
sat u =
Wlow» «, ^hlgh»
W «low , «low U Uhlgh >
W «high
(15.8)
для скалярного аргумента и покоординатно
sat щ
sat «2
sat«==
(15.9)
sat «„_
для векторного. Значения «low и «high соответствуют нижней и Верхней границам насыщения. Блок-схема регулятора с такой моделью нелинейности исполнительного механизма показана на рис. 15.4. Отметим, что, даже если передаточная функция у-+ и
для (15.1) неустойчива, состояние системы (15.7) всегда будет ограничено? если матрица А — КС устойчива. Очевидно также, что х будет достаточно хорошей оценкой состояния процесса даже при насыщении, если, конечно, Uiow и Uhign выбраны соответствующим образом.
Модель общего вида
Регулятор можно описать в терминах пространства состояний моделью общего вида (15.2)
X(k+ l) = Fx(k) + Gy(k), (15.10)
и (fe) = Сх (fe) + Dy (fe), (15.11)
в которой нет явного наблюдателя. (Здесь для простоты опущены командные сигналы.) Если некоторые собственные значения матрицы F лежат вне единичного круга и управляющая
Рис. 15.5. Различные представления закона управления.
<7
переменная насыщается, то, очевидно, может произойти насыщение регулятора. Предположим, например, что выходная переменная достигла предельного значения и имеется ошибка управления у. В этом случае, несмотря на то что переменные состояния и управления будут продолжать расти, их влияние на процесс из-за насыщения будет ограниченным.
Чтобы исключить подобную ситуацию, желательно иметь гарантию того, что состояние (5.10) будет принимать нужные значения и при насыщении управления.
В обычных регуляторах для этой цели вводится специальный режим слежения, гарантирующий адекватность состояния системы последовательности входов и выходов {up(k), y(k)}. Расчет режима слежения можно интерпретировать как решение задачи построения наблюдателя. Когда в системе имеется обратная связь по состоянию с явным наблюдателем, слежение осуществляется автоматически, если наблюдателю доступен выход исполнительного механизма ир или его оценка йр. В системе (5.10) — (5.11) нет явного наблюдателя, поэтому для получения регулятора, свободного от нежелательных эффектов, связанных с насыщением, преобразуем эту систему так, чтобы она имитировала наличие явного наблюдателя (рис. 15.5). Системы (а) и (б) описываются одинаковыми передаточными функциями «вход-выход», система (б) устойчива, так как, введя насыще-
D
Рис. 15.6. Блок-схема регулятора (15.2) и модифицированного регулятора (15.12) с компенсацией насыщения.
ние в контур обратной связи, ее состояние всегда можно сделать ограниченным при ограниченных у и и. Формально эти рассуждения можно описать следующим образом. Умножив (15.11) на К и сложив с (15.10), получим
х (k + 1) = Fx (fe) + Gy (k) + К [и (fe) — Cx (fe) — Dy (fe)] =
= [F - tfC] x (fe) + [G - KD] у (fe) + tfu(fe) =
= Fox(fe) + Goy(fe) + /CU(fe).
Если система (15.10) — (15.11) наблюдаема, то матрицу К всегда можно выбрать так, чтобы матрица Fo — F — КС имела заданные собственные значения внутри единичного круга.
♦♦♦ Заметим, что эта система эквивалентна (15.7).
Повторяя те же рассуждения, что и в случае регулятора с явным наблюдателем, получаем
х (fe + 1) = Fox (fe) + Goy (fe) + Ku (fe),
и (fe) = sat (Cx (fe) + Dy (fe)]. (15.12)
Функция насыщения выбирается так, чтобы она соответствовала реальному насыщению в исполнительном механизме. Сравнение со случаем явного наблюдателя показывает, что (15.12) соответствует наблюдателю, динамика которого описывается матрицей Fo. При малых сигналах система (15.12) эквивалентна (15.2).
Блок-схема регулятора с компенсацией возмущения показана на рис. 15,6,
Модели типа «вход-выход»
Соответствующие построения можно провести и для регуляторов, которые описываются моделями типа «вход-выход». Рассмотрим регулятор типа
R (q) u(k) — T (q) ис (fe) -S(q)y (fe), (15.13)
где R, S и T — многочлены от оператора сдвига. Задача здесь состоит в том, чтобы переписать это уравнение в виде динамической системы, в которой динамика наблюдателя имеет три входа: командный сигнал ис, выход процесса у и управляющий сигнал и.
Пусть Ao(q) —желаемый характеристический многочлен наблюдателя. Добавив A0(q)u(k) к обеим частям (15.13), получим
Аои = Тис — Sy А- (А, — 7?) и.
Тогда регулятор с компенсацией насыщения имеет вид
| Aov = Tue — SyA-{AQ — R)u, (15 14)
1 и = satf. ' ' )
В отсутствие насыщения этот регулятор эквивалентен (15.13). Когда же управляющая переменная насыщается, его можно интерпретировать как наблюдатель с динамикой, описываемой многочленом Ло-
Блок-схемы линейного регулятора (15.13) и нелинейной модификации (15.14), свободной от насыщения, показаны на рис. 15.7. Регулятор особенно прост в случае апериодического
Рис. 15.7. Блок-схема регулятора (15.13) и модифицированного регулятора (15.14) с компенсацией насыщения.
наблюдателя (т. е. Л*= 1), и его можно записать в виде
и (k) = sat [Т* (<7~‘) ис (k) - S’ (q-')y(k) +
+ (!-/?’ (<’)) «(*)]• (15.15)
Пример 15.2. ПИ-регулятор с насыщением
Передаточная функция дискретного ПИ-регулятора имеет вид
И <z) = S°Z + S1 = s° 1) + S° + S| ' ' z — 1 z — 1 ’
(15.16)
в тер-иаблю-
(15.17)
Пусть и — управление, а е — ошибка управления. Перепишем (15.16) минах пространства состояний. Используя (15.12) с апериодическим дателем (т. е. прн К = 1), имеем
i (fi + 1) = s,e (fi) + и (fi), и (fi) — sat [soe (fi) + i (fe)].
Тот же результат можно получить, воспользовавшись моделью (15.15) вместо модели в терминах пространства состояний. Алгоритм (15.17) совпадает с алгоритмом из примера 8.4.
15.4. ИНТЕРФЕЙС С ОПЕРАТОРОМ
В данном разделе обсуждается оценка оператором предъявляемой ему информации и способы ручного изменения параметров регулятора. В случае обычных промышленных аналоговых регуляторов на панель управления, как правило, выводятся установочные значения (контрольные точки), измеряемый выход и управляющий сигнал. При этом регулятор можно переключать с ручного на автоматический режим и наоборот. Оператор может изменять коэффициент усиления, время интегрирования и время дифференцирования. Такая схема управления диктовалась свойствами ранних аналоговых устройств. Применение компьютеров открывает иные возможности реализации систем управления, тем не менее до сих пор возможности ЭВМ в этой области использовались более чем скромно.
Для анализа интерфейса оператора с системой управления необходимо исследовать «технологическую схему» использования системы управления (разд. 7.1). Ввиду разнообразия возможных применений систем управления невозможно дать их исчерпывающее описание, поэтому приведем лишь несколько примеров.
Пример 15.3. Автопилот
Рассмотрим автопилот современного самолета. В этом случае оператор взаимодействует с системой посредством педалей и штурвала. В ручном режиме автопилот может исполнять роль стабилизатора, увеличивая естественную инерционность самолета. Автопилот может работать в разных режимах, например с целью стабилизации курса или высоты полета. Заметим, что здесь пилота мало волнуют ошибки управления или параметры регулятора.
Пример 15.4. Управление производственным процессом
Рассмотрим систему управления производственным процессом, в которой имеется несколько контуров, поддерживающих некоторые переменные состояния процесса на заданном уровне. Обычно в таких системах регистрируется и запоминается ошибка регулирования. Кроме того, большие выбросы и изменения условий работы отрабатываются вручную. По этой причине в регуляторе есть переключатель, позволяющий выбрать ручной или автоматический режим работы.
В системе есть также контрольные приборы, показывающие установочные значения, величину выхода и управляющего воздействия. Обычно в управлении производственным процессом участвуют различные службы: эксплуатационники, управляющие процессом, инженеры по КИП, поддерживающие работоспособность системы управления, и технологи, занимающиеся совершенствованием технологического процесса.
Пример 15.5. Опытно-промышлеиное производство
В этом случае имеется необходимость частых изменений как самого технологического процесса, так и системы управления. Здесь очень важно иметь гибкую систему, позволяющую вести непрерывную запись информации и легко вносить изменения в систему управления.
Рабочие режимы
Часто желательно иметь возможность ручного управления объектом. Простая схема такой системы показана на рис. 15.8, где
Рис. 15.8. Система управления с автоматическим и ручным регулированием.
управление можно подбирать вручную. Ручное управление часто реализуется с помощью нажимных кнопок, регулирующих величину управляющего сигнала. На практике также бывает полезно иметь возможность изменять установочные значения.
Поскольку регулятор является динамической системой, его состояние должно иметь правильное значение при переключении с ручного на автоматический режим. Если это не так, то в системе происходят переходные процессы. Гладкий переходный процесс иногда называют плавным переходом, или плавным переклю чением.
В обычных аналоговых регуляторах плавный переход получают, вводя режим слежения, при котором состояние регулятора подстраивается таким образом, чтобы оно соответствовало
данным входам и выходам регулятора. Такой режим можно рассматривать как реализацию наблюдателя.
В регуляторах (15.7), (15.12) и (15.15) режим слежения реализуется автоматически, поскольку они имеют «встроенные» наблюдатели. Для запуска режима слежения достаточно положить
Wlow == ^high == ^manual*
Это означает, что управляющий сигнал всегда равен входному сигналу, задаваемому вручную. Состояние регулятора всегда будет устанавливаться автоматически благодаря наличию внутренней обратной связи. При этом введенное в регулятор насыщение автоматически приводит к плавному переключению. Можно ввести и полуавтоматические режимы, оставив в системе некоторые контуры обратной связи.
Применение компьютеров позволяет вводить и другие рабочие режимы» Так, например, в регулятор можно ввести алгоритмы оценивания параметров и корректировки закона управления. Тогда в режиме оценивания можно идентифицировать модель объекта и затем в режиме настройки подстроить параметры регулятора. Наконец, можно ввести режимы адаптивного управления, при которых параметры регулятора корректируются непрерывным образом (ср. с самонастраивающимся регулятором на рис. 14.1).
Инициализация
Поскольку регулятор является динамической системой, при его включении важно правильно установить его состояние. Если этого не сделать, то в системе могут возникнуть нежелательные переходные процессы. В обычных системах управления технологическими процессами с ПИ-регуляторами регулятор, как правило, инициализируют (т. е. устанавливают его начальное состояние), приводя вручную выход процесса к заданному значению.
В регуляторах с явным наблюдателем начальное состояние регулятора устанавливается фиксацией управляющего сигнала на время, необходимое для установки наблюдателя. Точно так же поступают и в случае регуляторов с антинасыщением.
Выводимая информация и контроль качества регулирования
Компьютеризованное управление открывает ряд интересных возможностей. Так, например, вместо установочных значений и рассогласования на панель оператора можно выводить показатель качества управления.
Из теоремы 12.2 следует, что выход системы управления с минимальной дисперсией является скользящим средним. Таким
образом, по ковариации рассогласования можно определить, минимизирует ли действующее управление дисперсию или нет. Поэтому в таких системах на консоль оператора стоит выводить текущее значение ковариации рассогласования.
Аналогично в разд. 12.4 показано, что выход ЛКГ-регулятора определяется управлением (12.55). Пусть у — выход процесса. Тогда величина '
должна быть белым шумом, если модель корректна и регулятор настроен правильно.
♦♦♦ Заметим, что многочлены P(q) и S(q) определены на стадии проектирования, поэтому и здесь имеет смысл выводить на консоль ковариацию сигнала в. Конечно, в этом случае неплохо добавить простые статистические оценки, такие, как среднее, дисперсия и минимальные и максимальные значения. Кроме того, желательно иметь возможность запоминать эту информацию, а также входы и выходы.
Параметризация и изменение параметров
В обычных регуляторах оператор может варьировать установочные значения и основные параметры регулятора. Компьютер в системе управления открывает ряд других интересных возможностей. Благодаря простоте проведения вычислений можно использовать один набор параметров в алгоритме управления и другой для организации интерфейса с оператором. При этом параметры, передаваемые оператору, могут характеризовать качество системы управления в целом, а не быть просто управляющими параметрами алгоритма регулирования. Преобразование одних параметров в другие, естественно, должно входить как элемент алгоритма регулирования.
Для иллюстрации идеи использования таких «качественных» параметров рассмотрим схему расчета серворегулятора методом размещения полюсов (гл. 10). Свойства замкнутой системы можно определить в терминах относительного демпфирования £ и полосы сов. Для расчета необходимо также иметь модель разомкнутой системы. Одним из возможных решений задачи был бы ввод оператором в компьютер желаемой полосы и коэффициента демпфирования вместе с непрерывной моделью системы. Тогда программа смогла бы получить нужное управление, выполнив соответствующие вычисления. Если, кроме того, программа реализует алгоритм рекурсивного оценивания, то вводить модель не обязательно. Очевидно, что наличие в регуляторе алгоритмов оценивания и настройки открывает множество интересных возможностей,
При изменении параметров в реальном масштабе времени Возникают две проблемы. Первая связана с программной реализацией режима разделения. Дело в том, что к данным, описывающим параметры, обращаются разные программы, поэтому необходимо исключить возможность обращения одной программы к данным, которые в настоящий момент обрабатываются другой программой (разд. 15.7).
Вторая проблема носит алгоритмический характер и связана с переходными процессами, которые могут возникать при изменении параметров алгоритма управления. Чтобы понять существо дела, рассмотрим простой ПИ-алгоритм:
е := ис — у u := к * (е + i * h/ti) i := i + e *h
Очевидно, что изменение времени интегрирования ti приведет к ступенчатому изменению управления, если интегральная часть i отлична от нуля. Эту проблему можно обойти, изменив состояние с i на i*ti/ti', где ti' — новое значение времени интегрирования. Другое простое решение состоит в модификации алгоритма следующим образом:
е := ис — у u := к * (е + i) i := i + е * h/ti Необходимость изменения состояния при изменении параметров диктуется тем, что состояние регулятора зависит от значений параметров. Плавного изменения параметров можно добиться, запоминая прошлые входы и выходы и подключая наблюдатель в момент изменения параметров регулятора. Часто, однако, можно решить эту задачу проще.
Рассмотрим, например, алгоритм (15.7) с явным наблюдателем и обратной связью по состоянию. Прежде всего нужно выбрать такую реализацию, чтобы матрицы С и D не зависели от настраиваемых параметров. Если состояние х представляет собой оценку физических переменных состояния, то проблем почти не возникает, поскольку оцениваемое состояние не будет резко изменяться при изменении параметров модели. Вместе с тем, если существует ненулевая ошибка е = х — х, невозможно избежать возникновения переходных процессов при изменении усиления в контуре обратной связи. Аналогично не будет никаких переходных процессов и алгоритмов (15.12), если матрицы С и D не зависят от изменяемых параметров.
Ситуация с алгоритмом (15.14) не столь проста. В данном случае состояние есть входы и выходы с запаздыванием, и оно неминимально. ' Хотя такое состояние не зависит от коэффициентов многочленов /?, S и Т, нет никакой гарантии, что имеющиеся R, S, Т, и и у совместны с уравнениями (15.14). Вообще
говоря, с алгоритмом (15.14) в системе всегда будут возникать переходные процессы при изменении параметров.
Надежность
Важной характеристикой автоматизированных систем управления является надежность. В идеале это означает, что система либо должна выдавать корректные-' сйгналы, либо сигнал отказа, если она работает не так, как должна. При очень высоких требованиях к надежности возможно трех- и даже четырехкратное дублирование, когда выходное значение принимается как правильное, если выходы двух подсистем совпадают. В более простых случаях можно ограничиться самоконтролем. В автоматизированных системах управления самоконтроль может быть организован самыми разными способами. Так, арифметические устройства можно тестировать, выполняя операции с известным результатом. Память и каналы передачи данных можно проверять по контрольным суммам. Для контроля ЦА- и АЦ-преобразователей можно ввести несколько дополнительных каналов. Тогда вначале можно выполнить ЦА-преобразование некоторого сигнала, а затем полученный результат подвергнуть АЦ-преобразованию и сравнить его с исходным сигналом. Аналогично можно контролировать временные характеристики, включив контур с известной постоянной времени между ЦА- и АЦ-преобразователями.
15.5. ЧИСЛЕННЫЕ АСПЕКТЫ
При реализации автоматизированных систем управления возникает ряд вопросов численного характера: Какова должна быть погрешность преобразователей? С какой точностью должны производиться вычисления? Должны ли операции проводиться с фиксированной запятой или с плавающей? Для ответа на эти вопросы необходимо понимать характер воздействия подобных ограничений на качество управления и уметь оценивать их влияние на поведение замкнутой системы. Эта задача далеко не проста, поскольку ответ является весьма сложной функцией от закона обратной связи, структуры и параметров управления и частоты квантования. К счастью, однако, для практических целей можно ограничиться грубыми оценками. Например, достаточно знать, должна быть точность преобразователя 10 или 12 знаков или длина слова 24 или 32 разряда и т. д.? Ответы на подобные вопросы можно получить довольно простыми способами.
Источники ошибок
Основными источниками ошибок являются:
• дискретизация в АЦ-преобразователях;
• дискретизация параметров;
• окружение и переполнение при выполнении сложении, вычитаний, умножений, делений, вычисления функций и других операций;
• дискретизация в ЦА-преобразователях.
АЦ-преобразователи обычных типов имеют точность 8, 10, 12 и 14 знаков, что соответствует разрешению 0,4, 0,1, 0,025 и 0,006 (процент берется от полной шкалы). Точность ЦА-преобразова-телей также ограничена; типичным значением является 10 разрядов. Ошибка, порождаемая дискретизацией параметров, в основном определяется периодом квантования и выбранной реализацией закона управления.
Длина слова
Цифровые алгоритмы управления обычно реализуются на микро- и мини-компьютерах с длиной слова 8, 16 или 32 разрядов. Специализированные ЭВМ с произвольной длиной слова используются для управления такими объектами, как, например, космические корабли, или в технологических системах массового производства.
Числа могут представляться в ЭВМ различными способами, из которых чаще всего используются следующие:
• с фиксированной занятой, с одинарной точностью. 16 разрядов;
* с фиксированной запятой, с двойной точностью, 32 разряда;
• с плавающей запятой, с одинарной точностью, 8 разрядов— порядок, 24 разряда — мантисса;
* с плавающей запятой, с двойной точностью, 8 разрядов— порядок, 56 разрядов — мантисса.
Пример 15.6. Вычисление скалярного произведения
Пусть даны два вектора:
а = [100 1 100], b = [100 1 —100].
Скалярное произведение <а, by этих векторов равно единице. Если скалярное произведение вычисляется с плавающей запятой и точностью до трех десятичных знаков, то результат будет равен нулю, поскольку 100-100 4- 1-1 округляется до 10 000.
♦♦♦ Заметим, что результат зависит от порядка выполнения операций1), т. е. операции над словами конечной длины не являются ни ассоциативными, ни дистрибутивными.
Решить эту проблему с минимальным использованием памяти можно, если сложение выполнять с двойной точностью, а результат представлять с одинарной. Такой прием применим
*> Если вначале перемножить и сложить первую и третью компоненты векторов, а затем добавить произведение вторых компонент, то получим правильный результат. — Прим. ред.
как с фиксированной, так и с плавающей запятой. Заметим, что на многих' ЭВМ операция умножения выполняется таким образом, что результат представляется с двойной точностью. Такого рода конструкции поддерживаются во многих языках программирования высокого уровня. Вообще говоря, округление и дискретизацияп порождают сравнительно небольшие ошибки, в то время как переполнение может привести к катастрофическим последствиям.
Влияние округления и дискретизации
Степень влияния округления и дискретизации зависит от свойств замкнутой системы и самого алгоритма управления, и эту зависимость необходимо достаточно хорошо знать.
Подробное описание процессов округления и дискретизации приводит к сложной нелинейной модели, трудно поддающейся анализу. Однако исследование простых случаев показывает, что эти процессы могут приводить к появлению предельных циклов.
Некоторые особенности округления и дискретизации в замкнутых системах можно выявить, оставаясь в рамках линейных моделей. При таком подходе округление и дискретизацию можно описать как аддитивные и мультипликативные шумы, воздействующие на идеальные операции, выполняемые точно. Эти шумы могут быть как детерминированными, так и стохастическими. Такой тип анализа особенно удобен, когда требуется Оценить лишь порядок величины какой-либо переменной. Он позволяет исследовать довольно сложные системы и сравнивать между собой различные алгоритмы.
Для исследования чувствительности алгоритмов управления к изменению параметров полезны методы, используемые при анализе чувствительности в численном анализе. Однако эти методы годятся только для сравнения качества алгоритмов по анализу разомкнутых систем. Помимо сказанного необходимо сравнить степень влияния округления и дискретизации с воздействием других возмущений.
Нелинейный анализ
Проиллюстрируем на простом примере нелинейные эффекты от ошибок округления и дискретизации.
Пример 15.7. Предельные циклы, возникающие из-за округления
Рассмотрим следующую модель простой системы с округлением:
y(k+l) = u(k) + Q[ay (fe)I,
где оператор Q обозначает взятие целой части числа по обычным правилам. Положив вход и равным нулю, получим
»(fe + l) = Q[aj/(fe+l)]. (15.18)
° Имеется в виду представление действительных чисел с конечным числом разрядов. — Прим. ред.
Если округления нет, т. е. Q(y) = у, то это уравнение имеет одно равновесное решение у—0, которое устойчиво при |а[<1. Равновесия, возникающие из-за округления, легко обнаружить графически. На рис. 15.9, а показаны график ау при а > 0 и прообраз Qfj/]. При этом равновесия соответствуют
Рис 15.9. Графический метод нахождения равновесного состояния системы с управлением (15.18).
Параметр а равен 0.8 в случае (а) н —0,8 в случае (б).
точкам пересечения графиков, откуда следует, что у = 0 есть равновесное состояние. Если существуют целые числа k > 0, такие что
{ak > k — 0,5, ak k — 0,5,
k — нечетно, k — четно,
то существуют и другие равновесия.
Ситуация для случая —1 < а 0, показана на рис. 15.9,6. Из рисунка следует, что если существуют такие целые k, что
ak > —k + 0,5, ak —k + 0,5,
k — нечетно,
k — четно,
то возможны предельные циклы с периодом, равным двум периодам квантования.
Этот пример иллюстрирует некоторые возможные последствия округления. Вообще говоря, могут возникать различные равновесные решения и периодические решения с разными амплитудами и периодами. Хотя анализ более сложных систем весьма сложен, практические результаты можно получить приближенными методами.
Метод описывающих функций
Если в контуре имеется только одна нелинейность, то для приближенного отыскания предельных циклов можно воспользоваться методом описывающих функций.
Рассмотрим систему, показанную на рис. 15.10, а. Метод описывающих функций можно рассматривать как обобщение критерия Найквиста, в котором критическая точка —1 заменяется на —1/¥с(А), где УСИ) —описывающая функция данной нелинейности. Эта функция описывает прохождение синусоидаль-
Рис. 15.10.
а—дискретная система с одной нелинейностью NL‘t б —иллюстрация метода описывающих функций.
ного сигнала с амплитудой А через эту нелинейность. Метод предсказывает наличие предельного цикла, если
//(ег'в,1) = -1/Ус(Л).
(ср. с рис. 15.10,6). При этом частота цц и амплитуда Д1 в точке пересечения дают оценку частоты и амплитуды предельного цикла.
Рис; 15.11. Описывающая функция для ошибок округления.
Описывающая функция
0,
УсИ) = <
46 А
2i — 1
2Д
о<л<4-,
2п — 1 ~ . 2п + 1 .
—— 6<Л<—— 6
и графически изображена на рис. 15.11.
Пример 15.8
Рассмотрим систему, описанную в примере 5.3, с импульсной передаточной функцией
... . 0,25 К
(2) (z - 1) (z - 0,5) ’
1) Здесь 6 — шаг дискретизации — Прим, ред.
к=!,г
Рис. 15.12. Выход системы, рассмотренной в примере 15.8 (6 = 0,2).
Как было показано, такая система без округления асимптотически устойчива, если К < 2. Округление ошибки рассогласования методом описывающих функций позволяет установить возможность возникновения предельного цикла, если К будет больше 1,3. На рис. 15.12 показано поведение системы с шагом дискретизации 6 = 0,2. Предельный цикл явно виден уже при К = 1,6.
Линейный анализ
Влияние округления и дискретизации можно оценить и с помощью линейного анализа, идея которого состоит в замене реальных операций их идеальными моделями и добавлении аддитивного возмущения еа. Тогда ЦА- и АЦ-преобразователи представляются как линейные элементы, при этом дискретизация моделируется возмущением. В арифметике с фиксированной запятой сложение выполняется точно, однако при умножении возникают ошибки. Операции умножения представляются как идеальные (точные) операции с аддитивной ошибкой, описывающей округление (рис. 15.13),
Ошибки можно описывать как детерминированными, так и стохастическими моделями. В детерминированной модели ошибки моделируются как константы, имеющие величину ошибок дискретизации с точной арифметикой. В стохастической модели ошибка, порожденная округлением или дискретизацией, описывается как аддитивный белый шум с прямоугольным распределением. Таким образом, ошибки в рйзные моменты квантования предполагаются некоррелированными. Если дискретизация
Операция
Символ
АЦП-преобразование
ЦАП- преобразование
Умножение
С округлением
Рис. 15.13. Линейные модели квантования и округления.
осуществляется округлением, то ошибка будет равномерно распределенной на интервале (—6/2, 6/2), где 6 — шаг дискретизации. Если дискретизация проводится путем отбрасывания младших разрядов, то ошибка будет равномерно распределенной по интервалу. Дисперсия сигнала, равномерно распределенного на интервале длиной 6, равна 62/12.
С помощью линейных моделей округления и дискретизации задачу оценки их влияния можно свести к вычислению реакции некоторой линейной системы на детерминированный или стохастический входной сигнал (разд. 6.5). Линейные модели позволяют получить качественные оценки без подробных вычислений. Кроме того, они дают возможность сравнить округление с другими возмущениями, действующими на систему. В линейной модели влияние округления в АЕ(-преобразователе такое же, как и влияние шумов измерений. Это влияние на управляющий сигнал может оказаться весьма существенным на частотах, где усиление регулятора велико. Округление в Е(А-преобразователе оказывает такое же влияние, что и возмущения на входе объекта. Так как обычно высокие частоты подавляются, влияние этих ошибок на выход обычно мало. Следует, однако, помнить, что линейная модель не учитывает всех эффектов, вызываемых ркруглением.
Анализ чувствительности
Как в линейном, так и в нелинейном анализе влияние ошибок округления и дискретизации изучается в замкнутой системе. Существуют, однако, более простые методы оценки ошибок по разомкнутой системе. Хотя в них игнорируется контур обратной связи, они тем не менее все же позволяют сравнивать между собой различные алгоритмы управления.
Грубые оценки ошибок вычислений можно получить, если воспользоваться понятием числа обусловленности, используемого в численном анализе и имеющего следующий смысл. Рассмотрим задачу вычисления функции f. Число обусловленности, или чувствительность задачи, определяется как минимальное из чисел Ср, при котором имеет место неравенство
||Цх + 6х)-Цх)|| r JIM Ilf«II UM'
Число обусловленности позволяет оценить относительную ошибку результата через относительную ошибку в данных.
Вообще говоря, численный алгоритм решения некоторой задачи представляет собой конечную последовательность определенных элементарных операций (сложений, умножений и т. д.), порождающую решение данной задачи. Алгоритм а вычисления функции f можно рассматривать как конечную последовательность отображений
а — Чв • Я(г-1) • . Яц) • CLq,
где каждое представляет собой некоторую элементарную операцию. Число обусловленности алгоритма а можно определить следующим образом:
С -sunW ----sup ,
где а (х) = f (х + б£).
Таким образом, число обусловленности алгоритма показывает, во сколько раз ошибка алгоритма больше относительной ошибки во входных данных. Числа обусловленности Ср и Са позволяют оценить относительную ошибку вычисления функции f с помощью алгоритма а по формуле
II а (х + 6х) — f (х) || _ (|| 6х [| . р >
Ilf (411 ^ р I 1И| + <
Числа обусловленности полезны при оценке чувствительности задачи и алгоритма к малым изменениям входных данных. Таким образом, ошибка вычислений зависит как от характера самой задачи, так и от алгоритма ее решения.
При реализации управления на ЭЦВМ проблема состоит в оценке выхода динамической системы по ее входу. При этом данные соответствуют входному сигналу и параметрам. Вьц
бранное представление задачи и параметризация могут существенно повлиять на обусловленность решаемой задачи, поэтому необходимо рассмотреть характер этого влияния.
Различные реализации
Различные реализации закона управления можно получить простым преобразованием фазовых координат. От выбора системы координат сильно зависит обусловленность задачи. В частности, представление с сопровождающей матрицей весьма неустойчиво с вычислительной точки зрения.
Рассмотрим линейный фильтр с различными полюсами pi и характеристическим многочленом вида
А(г) = (г~ р^ ... (г —pR) = z" + aIzn-1+... 4-а„.
Многочлен А можно рассматривать как функцию z и ai. При изменении параметра at до а, + ба, корни изменяются с рк до pk + 6pfe, и, следовательно,
О = A (pk + 6pfe, at + 6az) A (pk, a£) +
|p& Ou/ \p&
Первый многочлен в правой части равен нулю, поэтому, пренебрегая членами второго порядка и выше, получаем
. ISA/iSat I .
Поскольку 6Д | __ п—1
^>at |z=pft Pk
И
= П (Рк - Pj) Jz=pt j*k
имеем следующую оценку:
115191
Л‘к
Если многочлен имеет корень pk кратности т, то уравнение (15.19) принимает вид
(15-20)
J^k
Если фильтр устойчив, то |pfc|< 1, поэтому числитель (15.19) достигает максимума при i — п, т. е. коэффициент ап является наиболее чувствительным параметром. Далее, знаменатель бу
дет мал, если корни pt близки, и в этом случае чувствительность к изменению коэффициентов еще более повышается. Уравнение (15.20) показывает, что при наличии кратных корней чувствительность возрастает. Уравнения (15.19) и (15.20) можно использовать для оценки чисел обусловленности при переходе от диагональной матрицы к сопровождающей, вычисление которой, как видно из этих уравнений, может быть плохо обусловленной задачей.
Пример 15.9
Пусть требуется реализовать систему со следующей импульсной передаточной функцией:
’ 10~8
^(7=W (15'21)
Прежде чем писать программу, необходимо найти представление данной передаточной функции в терминах пространства состояний. Тогда программирование сведется к записи полученных разностных уравнений на каком-либо алгоритмическом языке. Из множесгва возможных систем координат выберем представления,.соответствующие управляемой канонической форме и жорда-новой канонической форме, с тем чтобы продемонстрировать различие численных свойств разных схем. Программы, реализующие эти две схемы, даны в листингах 15.3 и 15.4. Реализация дискретной системы включает и мониторинговую подсистему, запускающую управляющую программу в каждый момент квантования. Отметим, что 'программы содержат лишь операции сложения, умножения и оператор присваивания, поэтому их легко записать на любом языке программирования. Поскольку оператор присваивания лишь пересылает данные, он не вносит вычислительных ошибок. Это означает, что 0 и 1 в стандартном матричном представлении представляются точно.
Листинг 15.3. Программа, реализующая функцию (15.21), основанная на управляемой канонической форме
begin
у := х4
s := — al * xl — а2 * х2 — аЗ * хЗ — а4 * х4 + Ь4 * и х4 := хЗ
хЗ : = х2
х2 := xl х! := з end
Листинг 15.4 Программа, реализующая функцию (15.21), основанная на жордановой канонической форме
begin
у := х4
х4 : = — а * х4 + хЗ
хЗ : — — а * хЗ + х2
х2 : = — ах * 2 + xl xl := — а * xl + b * и
end
Численные значения параметров управляемой канонической формы
a-i = —3,96, а3 =—3,881196,
а2 = 5,8806,
а4 = 0,96059601,
bi — b2 = Ь% — о, Ь4 = 10-8.
На рис. 15.14 показаны точное решение и решения, полученные на ЭВМ VAX 11/780 для представления вида (3.30). 'Отметим исключительную чувствительность результата к точности вычислений. Вычисления с одинарной
Рис. 15.14.
1—точная реакция системы на ступеньку*. 2—моделирование системы (15.21) с управляемой реализацией на ЭВМ VAX 11/780 с одинарной точностью вычислений; 3—то же, что и (2), ио с двойной точностью н «4=0,96059602; 4—то же, что и (2)._ но с двойной точностью и ai=—3.8811959.
точностью дают неустойчивое решение (кривая 2) в то время, как с двойной точностью получается кривая того же характера, что и аналитическое решение. Система оказывается весьма чувствительной к точности задания коэффициентов, что проявляется даже при вычислениях с двойной точностью (кривые 3 и 4). В то же время при использовании канонической жордановой формы никаких проблем с чувствительностью не возникает.
Чувствительность характеристического уравнения к изменению параметров определяется уравнением (15.20). Если характеристическое уравнение включает постоянное возмущение е
то его корни
(г — 0,99)4 + е = 0, г = 0,99 + (— е)1/4
смещаются из точки 0,99 на границу окружности с центром в точке 0,99 и радиусом, равным /’ = [в|,/4. При е — 10~s радиус г равен 10~2, т. е. система может оказаться неустойчивой даже при весьма малых возмущениях. В этом случае возникает серьезная проблема потери устойчивости, поскольку появляются собственные значения, близкие к единичной окружности. Такая ситуация возникает, например, при большой частоте квантования.
Хорошо обусловленные реализации
Проблему, связанную с численной неустойчивостью присоединенной формы, можно обойти, представив систему в виде комби-нации систем первого и второго порядка (рис. 15.15).
Если динамическая система, описывающая регулятор, имеет пг различных действительных полюсов и пс комплексно-сопряженных пар полюсов, то алгоритм управления можно преобра
зовать к следующей модельной форме:
zt(k+ 1) = 4- i=l, ...,nr
0(fc+l) = r а' ЮЧМ&)+Г¥'1Ъ(6)> i=l, .... пс (15.22) L—co£ и, J LYhJ
и (k) = Dy (k) + Sy.Z/ (k) +X^vi (k),
4 = 1 4 = 1
где комплексные полюса представлены через действительные переменные. Здесь zt — скаляры, а щ —векторы с двумя элементами. Во избежание численных осложнений закон следует при
Рис. 15.15. Реализация регулятора в виде последовательно-параллельного соединения блоков первого и второго порядка.
Каждый блок на рисунке представляет собой систему первого и второго порядка.
вести к виду (15.22) и только затем программировать. Это преобразование легко осуществить стандартными средствами, входящими в пакеты автоматизированного проектирования. Отметим, что уравнения вида (15.22) допускают простую реализацию вычислений и масштабирования с фиксированной запятой.
В случае кратных собственных значений представление (15.22) можно заменить жордановой формой. Так, собственно-
Влияние периода квантования
Как видно из следующих примеров, величина периода квантования также оказывает влияние на обусловленность.
Пример 15.10. Влияние периода квантования на точность вычисления коэффициента
Рассмотрим систему первого порядка с постоянной времени Т. Дискретный аналог такой системы имеет вид
х (kh + h) = ax (kh) + bu (kh), где a = e~h,T.
„ dT T da
Простые вычисления дают -=—=----------.
T h а
Таким образом, при заданной относительной точности представления коэффициента а относительная точность вычисления постоянной времени оказывается обратно пропорциональной величине периода квантования.
Пример 15.11. Точность вычислений, необходимая для ПИ-регулирования
Рассмотрим формулу для пересчета интеграла в ПИ-регуляторе:
i (kh + h)=i (kh) + e (kh) * h/tl.
Если период квантования равен 0,03 с и время интегрирования составляет 15 мин — 900 с, то отношение hjti становится равным 3-10-5, что соответствует приблизительно 15 двоичным разрядам. Чтобы обойти эту проблему, величину eh/ti округляют. В связи с этим приходится производить вычисления с большей длиной слова. В результате в специальных ПИ-регулягорах интегрирование производят с длиной слова 24 разряда.
Рассмотренные примеры показывают, что при частом квантовании необходима высокая точность задания коэффициентов.
15.6. ПРОГРАММИРОВАНИЕ
Программирование — весьма важный элемент реализации системы управления как в смысле эффективности системы, так и в отношении времени, затрачиваемого на реализацию.
Трудоемкость и методика программной реализации определяются существом задачи управления и имеющимся программным обеспечением. Когда автоматизированные системы управления только появились, еще не было языков прграммирования высокого уровня, подходящих для управляющих ЭВМ. Системное программное обеспечение было настолько бедно, что единственным выходом было программирование на языках ассемблера. Сейчас ситуация в корне изменилась: появилось множество языков, таких, как Forth, BASIC, FORTRAN, С, Jovial, Pascal, Concurrent Pascal и Ada. Язык Ada, разработанный no заказу министерства обороны США специально для автоматизированного управления, был первым языком, задуманным и созданным для использования в реальном масштабе времени.
Использование языков высокого уровня позволило резко сократить время, необходимое для программной реализации системы управления. Кроме того, программа становится более читаемой и, как следствие, ее проще отлаживать и модифицировать. Характер программирования и возникающие при этом трудности существенно зависят от характера задачи. При этом особо важным является организация интерфейса с оператором. Так, программы, реализующие этот интерфейс, часто во много раз превосходят по объему процедуры, реализующие собственно алгоритм управления.
Простая специализированная система управления Рассмотрим простой контур управления, имеющий несколько измеряемых сигналов, несколько выходных сигналов и довольно ограниченный интерфейс с оператором. Последний может иметь несколько контрольных приборов и кнопок для ручного упрац* Ленин,
Программирование такой системы весьма просто. Если в системе имеется таймер реального времени, то структура программы имеет вид, показанный в листинге 15.5.
Листинг 15.5. Структура программы, реализующей простой контур управ тения
Начало
Ожидание прерывания от таймера
Регулирование
Отображение результатов
Возврат к началу
Первая строка —это просто некоторая процедура, приостанавливающая исполнение программы до поступления прерывания от таймера. Процедура «Регулирование» — это подпрограмма, реализующая выбранный алгоритм управления. Типичный пример такого алгоритма приведен в листинге 15.6.
Листинг 15.6. . Структура программы, реализующей алгоритм управления с командными сигналами
Процедура „Регулирование" begin
1 Adin у uc umanual
2 Din manual
3 If manual then
4 u := ulow := uhigh := umanual
5 else
6 u := ul + D * у + De * uc
7 u := sat(u, ulow, uhigh)
8 Daout u
9 x := Fo*x + Go*y + Gc*uc + K*u
10 ul := C * x
end
Оператор Din в строке 2 считывает дискретный сигнал и присваивает его булевой переменной manual. Если значение этой переменной «истинно», то регулятор работает в ручном режиме, а переменная управления полагается равной переменной umanual, которая является аналоговым входом. Заметим, что эта программа аналогична приведенной в листинге 15.2, за исключением входов от оператора и функции насыщения.
Процедура «Отображение» в листинге 15.5 вычисляет значения некоторых переменных и выводит их в аналоговом или цифровом виде. Заметим, что довольно легко ввести возможности для оператора изменять значения параметров, просто вводя Их как аналоговые входы,
Отладка программы из листинга 15.5 довольно проста. Процедуры «Регулирование» и «Отображение» — это простые последовательные процедуры, которые можно отладить автономно. Довольно легко проверить, что процедура ожидания выдает прерывание в каждый момент квантования. Эта процедура будет «сбоить», только если время, необходимое для вычислений, превосходит Величину периода квантования.
Более сложные контуры управления
Принципы программирования, использованные при построении программы из листинга 15.5, можно распространить и на более сложные многоконтурные системы управления с различными
Таймер
Рис. 15.16. Блок-схема многоконтурной системы управления с двумя частотами квантования
периодами квантования. Для таких систем получается программа, блок-схема которой показана на рис. 15.16. Программа РО на рис. 15.16 запускается таймером в каждый момент квантования. Каждая из программ Pl, Р2 и РЗ запускается каждым третьим импульсом от таймера. Для реализации схемы, изображенной на рис. 15.16, необходимо, чтобы время выполнения операции на каждом контуре было меньше минимального периода квантования. Этого легко добиться при больших периодах квантования, но при час/ом квантовании может потребоваться специальная изощренная организация вычислений.
Отладка системы программ типа изображенной на рис. 15.16 будет несложной, если контуров немного, а процедуры просты. Однако с ростом сложности схемы трудность отладки программ резко возрастает, поэтому для надежной реализации такого подхода требуются новые идеи и методы.
Программирование в реальном масштабе времени
Различные контуры управления естественно представлять как параллельно протекающие процессы. Обычные языки программирования удобны для описания последовательных действий,
поэтому ключевой проблемой является отображение одновременных, параллельных действий последовательной программой. С одной стороны, эту процедуру можно решать вручную, как показано на рис. 15.16. С другой стороны, существует специальное программное обеспечение-—операционные системы реального времени, — позволяющее в какой-то мере решить эту задачу. Рассмотрение этих вопросов выходит далеко за рамки данной книги, поэтому ограничимся лишь изложением основных идей и приведем несколько примеров *>.
При программировании в реальном масштабе времени используются два фундаментальных понятия — процесс и задание, — описывающих действия, которые можно рассматривать как параллельные. Это в свою очередь позволяет считать, что ЭВМ параллельно выполняет несколько процедур. Поэтому некоторые действия в реальном масштабе времени можно структурировать точно так же, как структурируют последовательные операции, вводя процедуры или подпрограммы. Операционная система реального времени организует выполнение процессов для достижения желаемого результата, используя присваиваемые каждому процессу приоритеты. Кроме того, процессы могут запускаться периодически либо по наступлении таких событий, как прерывание, или выполнение других заданий.
В параллельном программировании одной из ключевых проблем является проблема разделяемых (общих) переменных и ресурсов. Если разные процессы используют одни и те же данные, то необходимо гарантировать, что один процесс не обращается к данным, которые в настоящий момент пересчитываются другим процессом. Если два процесса используют один и тот же ресурс2), то их работа должна быть организована так, чтобы не было тупиков, когда процессы будут бесконечно уступать друг другу очередь.
Не менее важной является проблема быстродействия: машина должна быть достаточно мощной, чтобы обработать все задания за требуемое время.
Регулятор с ручным управлением
Одним из простейших примеров программирования в реальном масштабе времени является контур управления с возможностью вмешательства оператора. Типичной задачей здесь может быть выполнение процедуры, аналогичной той, что представлена в листинге 15.4, с периодом квантования 20 мс и с возможностью ручной перестройки параметров с консоли или терминала. По-
*>) Об организации параллельных вычислений на машинах с различной архитектурой см. книгу: Воеводин В. В. Математические модели и методы в параллельных процессах. — М.: Наука, 1986, 296 с. — Прим. ред.
То есть Какое-либо устройство машины. — Прим. ред.
скольку время, требуемое для вмешательства человека, многократно превосходит величину периода квантования, весь процесс необходимо разбить на множество мелких сегментов, чтобы можно было воспользоваться схемой, изображенной на рис. 15.16. Это, однако, очень сложный и довольно замысловатый путь. Более естественно рассматривать задачу как совокупность двух одновременных процессов: один процесс, регулирование, запускается в каждый момент квантования, другой процесс, диалог с оператором, идет в то время, когда регулирование находится в режиме ожидания. Для включения управления в нужные моменты времени необходимо, чтобы процесс регулирования обладал более высоким приоритетом и мог бы прерывать диалог с оператором в любой момент. Кроме того, для удобства принимается соглашение о том, что процесс регулирования после запуска идет до конца. В этом случае регулирование называют приоритетным заданием (или процессом), а диалог с оператором — фоновым!).
В листинге 15.7 приведена программа на языке Process Basic, выполняющая описанную задачу.
Язык Process Basic имеет возможности аналогового ввода и вывода, а также позволяет определять задания или процессы, способы их запуска и присваивать приоритеты. Так, строка 140 определяет, что процесс 1 начинается со строки 200; в строке 170 процесс запускается с периодом Н и приоритетом 2; строка 180 устанавливает, что процесс 2 запускается нажатием любой клавиши на клавиатуре дисплея с приоритетом 5.
В случае языка Process Basic имеется монитор, управляющий выполнением программы. Управление передается монитору после выполнения каждой из строк программы: монитор определяет, должна ли программа выполняться дальше в естественном порядке в соответствии с номерами строк или же должен быть запущен процесс с более высоким приоритетом. Поскольку процесс 1 имеет более высокий приоритет, чем процесс 2, он всегда после запуска будет выполняться до конца. Процесс 1 будет запускаться каждый раз по прошествии И с после предыдущего запуска. Предположим, например, что после завершения процесса 1 происходит выполнение строки 320. После ее выполнения монитор передает управление строке 200 и далее до передачи управления строке 330 выполняются строки 200— 280. Таким образом, имеется возможность задержки выполнения программы на время, необходимое для выполнения одной строки. «
Отметим, что переменные Н, S0 и S1 являются общими для обоих процессов. Значения этих переменных задаются в процессе диалога с оператором (процесс 1) и используются в про-
*> В оригинале foreground и background соответственно, — Прим, ред,
Листинг 15.7. Программа на языке Process Basic, реализующая ПИ-регуля-тор, работающий в режиме диалога с оператором
100 REM **********************
ПО REM ** ПИ-РЕГУЛИРОВАНИЕ **
120 REM **********************
140 TASK 1, 200: REM РЕГУЛИРОВАНИЕ
150 TASK 2, 300: REM СВЯЗЬ С ОПЕРАТОРОМ
160 GOSUB 400: REM ИНИЦИАЛИЗАЦИЯ
170 ACTIVATE TASK 1 WITH PERIOD H AND PRIORITY 2
180 ACTIVATE TASK 2 ON KEYPRESS WITH PRIORITY 5
200 REM ** РЕГУЛИРОВАНИЕ **
210 ADIN Y UC
220 E = UC — Y
230 U = SO * E + 1
240 IF (J < ULOW THEN U = ULOW
250 IF U > UHIGH THEN U = UHIGH
260 DAOUT U .
270 I = U + SI * E
280 DISMISS
290 REM ** СВЯЗЬ С ОПЕРАТОРОМ **
300 PRINT “УСИЛЕНИЕ =’ ;Kt „НОВОЕ ЗНАЧЕНИЕ =„
310 INPUT К
320 PRINT „ВРЕМЯ ИНТЕГРИРОВАНИЯ =“ ;TI; “НОВОЕ ЗНАЧЕНИЕ =“
330 INPUT TI
340 PRINT „ПЕРИОД КВАНТОВАНИЯ =“ ;Н; “НОВОЕ ЗНАЧЕНИЕ =“
350 INPUT HI
360 H = Hl:S0 = K:Sl = -K*(TI-H)/TI
370 DISMISS
380 REM ** ИНИЦИАЛИЗАЦИЯ **
390 H= 1
400 SO =10
410 SI = — 10
420 RETURN
цессе регулирования (процесс 2), При этом важно, чтобы при изменении переменных их значения пересчитывались до того, как они будут использованы в процессе регулирования. Поскольку пересчет всех переменных происходит в строке 360, а управление передается монитору только по исполнении строки до конца, то это условие автоматически выполняется. Отметим, что это было бы не так, если бы разные переменные пересчитывались в разных строках.
Соглашение о передаче управления монитору только в конце строки упрощает организацию обращений к общим перемен
ным, однако приводит к вариациям периода квантования, так как время выполнения различных строк программы неоди-ково.
Операционные системы реального масштаба времени
Для задач с двумя процессами нетрудно,, написать программу, управляющую выполнением этих процессов. Такой монитор в этом случае займет не более 100 строк на ассемблере.
Эту программу можно обобщить и на более сложный случай, включающий большее число независимых процессов, однако написание такой программы будет далеко не тривиальной задачей. Такая управляющая программа, называемая также операционной системой реального времени, может занимать до 20 К байт памяти.
Операционные системы реального времени дают возможность определять процессы или задания на языках высокого уровня типа Фортран или Паскаль. Кроме того, они позволяют инициировать процессы через регулярные промежутки времени или в зависимости от текущего состояния других процессов. Процессы могут также вводиться, запускаться и сниматься в он-лайновом режиме, т. е. по ходу вычислений. Точно так же можно изменять приоритеты процессов.
Появление операционных систем реального времени явилось одним из важных событий в истории развития управляющих ЭВМ, появившихся в середине 60-х годов. Примерами таких операционных систем являются TSX для машин IBM и RSX для машин фирмы Digital Equipment Corporation. Конструкции, позволяющие явно работать с процессами, были включены и в простые языки программирования, например в Бэйсик (см. листинг 15.7).
Операционные системы реального времени представляют собой большие универсальные программы, которые, как правило, пишут на языках ассемблера; поэтому их часто трудно поддерживать и модифицировать. Кроме того, нередко возникает необходимость иметь операционные системы, которые можно было бы легко подстроить под конкретные приложения. Эти причины стимулировали появление языков программирования для работы в реальном режиме времени, таких, например, как Concurrent Pascal и Modula. Язык Ada, по-видимому, тоже может стать стандартным средством программной реализации систем компьютеризованного управления.
Пакеты программно-числового управления
Существуют специальные методы программирования для систем управления, состоящих из множества идентичных контуров управления. Структура программ часто имеет следующий вид;
• чтение всех аналоговых входов и запись в таблицу;
• приведение всех сигналов к соответствующим единицам измерений и запись результатов в таблицу;
• последовательное применение алгоритма управления ко всем значениям из таблицы при значениях параметров регулятора, взятых из таблицы параметров;
• ЦА-преобразование всех переменных, имеющихся в выходной таблице.
Программы такого типа называют пакетами прямого числового управления (ПЧУ). Выбор алгоритма управления обычно ограничивается ПИД-регуляторами. Такие пакеты просты в реализации, ’’поскольку все программирование сводится к вводу соответствующих данных в таблицы. По этой причине подобные программы иногда называют таблично управляемыми.
ЗАДАЧИ
15.1. Имеетсй интегратор второго порядка с периодом квантования 1 с. Найдите апериодическое управление для данной системы с предварительным фильтром с передаточной функцией:
G ($) = —, , , \-г—Г-.
' s2 + 1,4s + 1
Сравните полученное управление с апериодическим управлением для системы без фильтра.
15.2. Напишите программу вычисления скалярного произведения двух векторов
begin
s := О
for i:=l то n do s := s + a [i] * b [i] end
для каждого из следующих случаев: a) s — целое; а, Ъ — целочисленные массивы; б) $ —- целое с двойной точностью; а, b — целочисленные массивы; в) s—действительное; а, b — действительные массивы; г) s — действительное с двойной точностью; а, b — действительные массивы.
Сравните время и точность вычислений. Попробуйте эти программы на ЭВМ с программной и аппаратной реализацией вычислений с плавающей запятой.
15.3. Рассмотрите возможность использования двух контуров с различными периодами квантования для повышения точности вычислений в случае примера 15.11.
15.4- Напишите программу для цифрового ПИ-регулятора, в котором антинасыщение реализовано с помощью наблюдателя с постоянной времени То.
15.5. Напишите программу для цифрового ПИД-регулятора, где антинасыщенуе реализовано с помощью апериодического наблюдателя.
15.6. Напишите на каком-либо языке высокого уровня программу для цифрового ПИД-регулятора, в котором антинасыщение реализовано в виде наблюдателя с постоянной времени То. Подсчитайте число операций на одной итерации. Оттранслируйте программу и посмотрите, сколько памяти она требует. Отметьте время выполнения программы и сравните это время с оценкой по числу операций и времени вычисления элементарных операций на вашей ЭВМ.
15.7. Имеется алгоритм управления (15.1), где хт рассматривается как вход. Предположим, что состояние, управление и выход имеют размерности пх, пи и пу и что матрицы полностью заполнены. Подсчитайте число сложений, умножений и делений на каждой итерации
15.8. Имеется алгоритм управления (15.2). Напишите программу, реализующую этот алгоритм на каком-либо языке высокого уровня. Оттранслируйте программу, посмотрите, сколько памяти она занимает, и заметьте время выполнения. Постарайтесь найти простую и надежную формулу для оценки времени выполнения программы.
15.9. Повторите задачу 15.8, однако вычисление скалярного произведения оформите в виде подпрограммы. Проанализируйте, как такое структурирование программы влияет на необходимую память и время выполнения.
15.10. Имеется алгоритм управления (15.1) с отбрасыванием выбросов (15.5). Оцените число операций на одной итерации. {Ключ-, перемножение п\р и р X г матриц требует N — прг операций, где под операцией понимается пара умножение -f- сложение. Решение матричного уравнения Ах — В, где А — п X ft-матрица, а В — «Хр-матрица, требует приблизительно
ДГ = 1«3 +v2ftzP О 4
операций, причем основной объем вычислений приходится на приведение А к треугольному виду.)
15.11. Ниже приводится программа, реализующая фильтр Калмана с селективным отбрасыванием больших ошибок измерения. Посмотрите, как перестраивается фильтр после получения ошибочного измерения. Программа написана для случая, когда вычисления занимают приблизительно один период квантования, begin
е = у — С * х
R = R2 + С * Р * СТ
{Формирование массива приемлемых измерений}
па := 0
for i;=I to пу do
begin
t == e[i] »e [i]/R [i, i] if t < test then begin
na := na + 1
ya [na] :=y[i] ia [na] := i end end
{Число приемлемых измерений есть па. Массив ia [1...па] содержит индексы принятых из-
^мерений. Массив ya [1,_, па] содержит при-
емлемые измерения.} for i := 1 to na do begin
for j := 1 to na do
Ra [i, j] := R [ia [i], ia [j] ]
• for j := 1 to nx do
Ca[i, j] := C [ia [i], j]
ea [i]:=e[ia[i]J
end
K:= A* P* CaT * Inv (Ra) x := A * x + B *u-}K*ea P ;= A * P * AT + R1 — К * Ca * P * AT end
15.12. Имеется дискретная система с импульсной передаточной функцией
H(z) = , -Т7Г-
' ’ (г — а)п
Определите чувствительность полюсов к изменениям параметров, воспользовавшись уравнением (15.2) для каждого из следующих случаев: а) фильтр, записанный в виде формы с сопровождающей матрицей; б) фильтр с матрицей, представленной в канонической жордановой форме.
15.13. Нарисуйте блок-схему, аналогичную приведенной на рис. 15.16, для системы с контурами с периодами квантования 1, 2, 5 и 60 с.
15.14. Имеется система с передаточной функцией
~ zn +а гп~х 4- 4- а ’
< 1 Ul< "Г • • • “rt
Предположим, что система реализуется в арифметике с фиксированной запятой. Пусть ошибки округления описываются как обычное округление до целого. Покажите, что ошибка k в уста-
новившемся состоянии без входов удовлетворяет уравнению
& ~Ь SQ = 0.
Покажите, что условие возникновения предельного цикла с периодом колебаний, равным удвоенному ^периоду квантования, имеет вид
k+ Ё(-1ГШб] = о.
15.15. На рисунке изображен ПИ-регулятор с АЦ- и ЦА-преоб-разователями, а на рис. 15.17,6 — линейная модель с ПИ-ре-
АЦП
ЦАП
а
в гулятором. Покажите, что эквивалентную ошибку, приведенную ко входу ЦА-преобразователя, можно записать как
6 = ead + д _]_ (еа + eb)-
На рис. 15.17,в приведена линейная модель с другой реализацией ПИ-регулятора. Найдите соответствующее выражение для ошибки в этом случае и сравните его с предыдущим.
15.16. Имеется следующий алгоритм для ПИ-регулятора:
Adin ис у е:= ис — у v := k * е -f- i u := max (min (512, v), 0) Daout u i : = u + к * h * e/ti
Предположим, что АЦ- и ЦА-преобразователи имеют разрешение 8 разрядов, и все вычисления производятся в целых числах. Какова должна быть длина слова, необходимая для представления переменной I, если необходимо избежать переполнения. Возьмите следующие численные значения: & = 50 и (a) h — 1, ti = 300, или (б) h =0,01; = 1500. Исследуйте влияние на
результат длины периода квантования.
15.17. Ниже приведены три различных алгоритма для ПИ-регулятора. Используйте линейную модель округления для анализа чувствительности алгоритмов к дискретизации в АЦ и ЦА-преобразователях и округлению при умножениях. Предполагается, что вычисления производятся с фиксированной запятой. Определите/ кроме того, необходимую длину слова в каждом случае.
Алгоритм 1 е := ис — у u := к * (е + h * i/ti) i := i -J- e *h
Алгоритм 2 e := uc — у u := к * (e + i) i := i + e * h/ti
Алгоритм 3 e := uc — у u := i + к * e i := i + к * h * e/ti
ЛИТЕРАТУРА
Проектирование фильтров
1. Kuo F. F. (1962): Network Analysis and Synthesis. New York: John Wiley.
2. Williams A. B. (1981): Electronic Filter Design Handbook. New York: McGraw-Hill.
Полезные практические советы можно найти в фирменных руководствах по операционным усилителям. Эти руководства полезны, кроме того, как источ
ник информации по АЦ- и ЦА-преобразователям. Проблемы, связанные с насыщением регуляторов, часто обсуждаются в отраслевых технических журналах. Подход к решению этой проблемы, изложенный в разд. 15.3, по-видимому, является новым.
Обнаружение ошибок и отбрасывание выбросов
3. Willsky А. (1976): “A Survey of Design Methods for Falure Detection in Dynamic Systems”, Automatica, 12, 601-11. -•
Квантование и ошибки округления в дискретных системах управления
4. Moroney Р. (1983): “Issues in the Implementation of Digital Feedback Compensators”, Cambridge, Mass.: MIT Press.
5. Knowles J. B., Edwards R. (1965): “Effects of a Finite-Word-Length Computer in a Sampled-Data Feedback System”, Proc. IEE, 112, 1197-1207.
6. Curry E. E. (1967): “The Analysis of Round-Off and Trancation Errors in a Hybrid Control System”, IEEE Trans. Autom. Control, AC-13, 601-4.
7. Bertram J. E. (1958): “The Effects of Quantization in Sampled-Feed-back Systems”, Trans. Amer. Inst. Elec. Engrs., 77, 177-82.
8. Slaughter J. V. (1964): “Quantization Errors in Digital Control Systems”, IEEE Trans. Autom. Control, AC-9, 70-74.
9. Rink R. E., Chong H. Y. (1979): “Performance of State Regulator Systems with Floating-Point Computation”, IEEE Trans. Autom. Control, AC-24, 411-21.
Общие проблемы, связанные с квантованием, округлением и переполнением
10. Oppenheim А. V., Schafer R. W. (1975): Digital Signal Processing. Englewood Cliffs, N. J.: Prentice-Hall, Inc.
11. Rabiner L. R., Gold B. (1975): Theory and Application of Digital Signal Processing. Englewood Cliffs, N. J.: Prentice-Hall, Inc.
Специальные вопросы
12. Jackson L. B. (1970): “Roundoff Noise Analysis for Fixed-Point Digital Filters Realized in Cascade or Parallel Form”, IEEE Trans & Audio & Electroacoustics, AU-18, 107-22.
13. Jackson L. B. (1970): “On the Interaction of Roundoff Noise and Dynamic Range in Digital Filters”, Bell Syst. Tech. Journal, 49, 159-84.
14. Jackson L. B. (1979): “Limit Cycles in State-Space Structures for Digital Filters”, IEEE Trans. Circuits & Systems, CAS-26, 67-68.
15. Parker S. R., Hess S. F. (1971): “Limit Cycles Oscillations in Digital Filters”, IEEE Trans. Circuit Theory, CT-18, 687-97.
16. Willson Jr. A. N. (1972): “Some Effects of Quantization and Adder Overflow on the Forced Response of Digital Filters”, Bell Syst. Tech. Journal, 51, 863-87.
17. Buttner M. (1977): “Elimination of Limit Cycles in Digital Filters with Very Low Increase in Quantizaiton Noise”, IEEE Trans. Circuits & Systems, CAS-24, 300-304.
18. Willson Jr. A. N. (1972): “Limit Cycles D,ue to Adder Overflow in Digital Filters”, IEEE Trans. Circuit Theory, CT-19, 342-46.
Численный анализ
19. Bjork G., Dahlqvist A., Andersson N. (1974): Numerical Methods. Englewood Cliffs, N. J.: Prentice-Hall, Inc.
Мультипрограммирование -
20. Brinch-Hansen P. (1973): Operating System Principles. Englewood Cliffs. N. J.: Prentice-Hall, Inc.
21. Barnes J. G. P. (1982): Programming in ADA. New York: Addison-Vesley.
Приложение А
В данном приложении описаны примеры, использованные в книге в качестве стандартных.
а
Пример А. 1. Интегратор второго порядка
На протяжении всей книги для иллюстрации теоретических положений чаще всего использовался интегратор второго порядка. Процесс описывается
Вращающий.
момент
Рис. Л.1. Схематическое изображение шарика на желобе.
дифференциальным уравнением второго порядка:
Передаточная функция имеет вид G(s) = 1/s2 Введем у и у как состояния системы. Тогда (А. 1) можно записать в виде
У = [1 0] х. (А.2)
Квантование этой системы с фиксатором нулевого порядка и периодом квантования h дает (см. пример 3.1)
х {kh + h) = Г 1 Ч х {kh) + Г Л72 1 и (kh),
L ° 1J L h J (A3) y(kh) = [l 0] x (kh). v ’
Импульсный передаточный оператор для (А. 3) имеет вид
В рамках этой модели можно описать множество физических процессов. Одним из таких процессов является движение шарика по качающемуся желобу (рис. А. 1). Уравнения движения шарика и желоба имеют вид °
, (Ж
J = m£r sin ф as mgr ф,
х = гб
« При малых колебаниях желоба, конечно. — Прим. ред.
или
= mgr2(flJ,
где 0 — уГОл поворота шарика, g — ускорение свободного падения, х — положение шарика, а <р = угол поворота желоба.
Пример А. 2. Электродвигатель
Электродвигатель постоянного тока можно описать моделью второго порядка с одним интегратором и одной постоянной времени (рис. А. 2). Входом здесь является напряжение на обмотке возбуждения двигателя, а выходом — угол поворота ротора. Постоянная времени определяется механическими характеристиками системы. Если пренебречь динамическими характеристиками
Напряжение. Спорость Положение
Рис. Л.2. Нормализованная модель электромотора постоянного тока.
электрической части системы, то нормализованную модель процесса описать уравнением вида
МОЖНО
1'М“7(ЙПГ1'И-
Выберем в качестве состояния угловую скорость и угол поворота вала двигателя (рис. А. 2). Тогда модель можно представить в виде
г/ = [0 1]х(0-
(А.5)
Квантование системы (А. 5) с фиксатором нулевого порядка дает следующую дискретную модель (см. пример 3.2):
Г е-Л О'] Г 1—e~h 1
х (kh + h) = h x (kh) + _h « (kh),
1J Lft-1+еЧ
y(kh) = \G l]x(fe/z). ’
Электродвигатель постоянного тока с регулированием скорости вращения по току возбуждения также можно описать моделью (А.5).
Другим примером процесса, описываемого интегратором с одним полюсом, является управление движением судна. Пусть входом будет угол поворота руля, а выходом — курс. Тогда динамика судна описывается передаточной функцией
G(S)== s(I + Ts) ’
где постоянная времени может быть как положительной, так и отрицательной в зависимости от типа судна. Так, например, супертанкеры являются неустойчивыми объектами.
Пример А. 3. Гармонический осциллятор
Рассмотрим математический маятник, показанный на рис. А. 3. Ускорение точки подвеса является входом, а угол отклонения нити у — выходом. Такая
Рис. А.З. Маятник.
система описывается следующими нормализованными нелинейными уравнениями:
Xl = х2,
хг = — sin X, + и cos Xi, y = Xi,
где xt — угол отклонения, a х.г — угловая скорость. Линеаризация уравнений в окрестности точки и = Xi — 0 дает
. = [ ° 1 L-1 о
г/ = [1 0]х.
(А.7)
Передаточная функция для (Л. 7) имеет вид
G (S) = s2+ 1
и в более общем виде
G(s) = 2.
S2 + со
В терминах пространства состояний эта функция может быть представлена как
г/ = [1 о]х.
(А.8)
Квантование (A.8) с фиксатором нулевого порядка приводит к системе
1
— cos сой sin сой
cos сой sin (oh .
• к и х(А/г) + — sin сой cos con J
г/(йй) = [1 0] x (kh).
Система (A. 8) может быть использована также приближении динамики подъемного крана.
Пример А. 4. Процесс с временной задержкой
Многие производственные процессы можно аппроксимировать динамическими системами первого порядка с временным запаздыванием. Одним из таких процессов является производство бумаги (рис. А. 4). В этом случае входом является сплошной поток пульпы, а выходом — давление выходной ленты бумаги, пропорциональное ее толщине. В иормализованиом виде этот процесс можно описать следующей передаточной функцией:
х
для описания в первом
G(s) =
e~sx
(А.9)
Другим процессом, который можно описать моделью вида (А. 9), является, например, смесительная система с трубопроводами большой длины. Квантование (А. 9) с фиксатором нулевого порядка дано в примере 3.6.
Пример А. 5. Модель склада
Функционирование склада продукции является типичным примеоом, который допускает естественное описание дискретной системой уравнений. Поступление продукта на склад и его отправка потребителям происходят в регуляр-
Входной. поток пульпы
Вес
Сушильня листа
Рис А.4. Схематическое изображение бумагоделательной машины.
ные моменты времени, привязанные к календарю, скажем ежедневно или еженедельно.
Пусть y(k)—объем продукта на складе в момент k. Обозначим через u(fe) объем продукта, заказанного складом в момент k. Предполагается, что заказанный продукт поступает на склад с запаздыванием в один период. Пусть, наконец, v(k)—объем поставки со склада в момент k. Введем переменные состояния xi(fc) = y(k) и х2(А) = u(k— 1). Тогда функционирование склада можно описать следующей системой дискретных уравнений:
х, (k 4- 1) = х, (k) + х2 (k) — v (k),
(k + 1) = и (k) или
х(* + 1) = [о о]хw + [ 1 ]“{k} + [~о]°
г/(^)==[1 0]х(*). (АЛ0)
В этом случае связь вход-выход имеет вид
У (k) — у (k — l) = u(k — 2) — v (k). (A.ll)
Приложение В
В теории дискретных систем управления широко используются функции типа ехр А и 1пД, где А — некоторая матрица, т. е. функции от матриц. Примерами функций от матриц являются матричная экспонента и матричный логарифм. В данном приложении приводится ряд свойств функций от матриц и обсуждаются некоторые способы их вычисления.
Одно полезное свойство квадратных матриц дается теоремой Гамильтона — Кэли.
Теорема Гамильтона — Кэли (приводится без доказательства). Пусть а (Х) = X" + ai?.""1 4- ... 4- ап — 0 есть характеристический многочлен квадратной матрицы А. Тогда А удовлетворяет следующему уравнению:
а (Л) = Ап 4- аИ”-' + ... 4- ап1 = 0.
Иными словами, матрица А удовлетворяет собственному характеристическому уравнению.
Пусть А—п X n-матрица, a f(X)—скалярная функция скалярного аргумента X. Скалярную функцию [(х) можно распространить на случай функций от матричных аргументов, т. е. функций вида f(A). Если f(X) —многочлен
f (-М = «(Л™ + a\^n * + • • • 4~ ат>
то матричная функция f(A) определяется как
f (Л) = апЛ 4- ai Л * 4~ • • • 4"
Собственные значения f(A) можно найти, воспользовавшись следующей теоремой.
Теорема В.1. Если [(А)—многочлен от А, а е, — собственный вектор А, соответствующий собственному значению X/, то
f (A)et —f
т. е. f(ki) является собственным значением f(A), а е,— соответствующим собственным вектором.
Далее, если f(X) можно определить через степенной ряд
t со
i=U
сходящийся при |Х| < R, то матричный ряд
оо
ги)=2>иг
i=0
сходится, если все собственные значения X, матрицы Л удов* летворяют неравенству |Х, | < R.
С помощью теоремы Гамильтона — Кэли можно показать, что для любой функции f существует многочлен р степени, меньшей п, и такой, что
КЛ) = /2(Л) = а0Л'1-, + аИ',-2+ (В.1)
Из теоремы В.1 получаем = z=l........п. (В.2а)
Если все собственные значения различны, то этих условий достаточно для определения всех at, i = 0, ..., п— 1. Если же имеется собственное значение кратности т, то выполняются условия:
f(1) (М = р(1)(М,
(В.26)
где f(0 — i-я производная по X.
С помощью (В.1) и (В.2) можно вычислять функции от матриц, и это очень удобный метод для ручных вычислений.
Пример В. 1
Пусть
Вычислим exp Ah = а0Л -f- aj.
Собственные значения Ah равны ±—ih. Имеет место система уравнений
el,l = aoih + аь e~ift = — а0г7г + а,, откуда
а0 = l/2t (elh — е“гл) = sin h,
а, = 1/2 (е/й + е~,л).
Наконец,
. Г 0 1 1 Г 1 01 Г cos h exp Ah = sin hl I + cos hl I =
L-10j L01J L - sin h
sin h cos h
Пример В. 2
Вычислим 1л ф, где
Ф =
Характеристическое уравнение (>.—1)г = 0 имеет кратные корни, поэтому матричный логарифм можно записать в виде
in Ф = а0Ф + «1/,
где числа ао и он определяются из системы уравнений
Поэтому
In 1 = а0 +
4- (In X) I = а0
ОЛ |Л=1
или
О = а0 +
1 = а0.
Г 1 h1 Г 1 01 ГОЛ 1о 1J L0 1 ] = |_о о
Заметим, что вместо характеристического многочлена можно использовать минимальный многочлен матрицы. Степень многочлена в»(В.1) будет тогда на единицу меньше степени минимального многочлена. Однако это не дает какого-либо сокращения времени счета, поскольку для вычисления минимального многочлена (или, что то же самое, для приведения к жор-дановой форме) также требуется время.
Другие свойства функций от матриц можно найти в книгах Гантмахер Ф. Р. Теория матриц. — М.: Наука, 1967.
Веллман Р. Введение в теорию матриц.— М.: Наука, 1969.
Приложение С
Хороший пакет моделирования — незаменимый инструмент анализа автоматизированных систем управления. В данном приложении дается описание пакета Simnon—одного из многих, имеющихся в этой области.
Введение
Simnon — это командно-управляемая система программ для моделирования систем, описывающихся нелинейными обыкновенными дифференциальными или разностными уравнениями. Она была разработана на факультете автоматического управления Лундского технологического института в Швеции *> при финансовой поддержке Шведского института прикладной математики и Шведского совета по техническому развитию.
Simnon — это интерактивная система моделирования, которая широко используется с 1974 г. для научно-исследовательских и учебных целей, а также для решения прикладных задач управления и моделирования в разных отраслях промышленности. Интерактивный (диалоговый) характер системы позволяет быстро строить имитационные модели объектов и исследовать их поведение. Кроме того, простота языка моделирования и хорошая диагностика ошибок делают его весьма эффективным средством обучения.
Пользователь общается с системой с помощью специального командного языка, в который, например, входят команды изменения параметров модели, выполнения моделирования, графического отображения результатов моделирования и модификации модели. Пользователь может строить и собственные модели с помощью макросов.
Модель можно описать либо на специальном языке моделирования, либо на Фортране. Язык моделирования достаточно прост и имеет хорошую систему диагностики ошибок. Система включает компилятор и текстовый редактор, позволяющий сразу исправлять ошибки.
” Department of Automatic Control, Lund Institute of Technology, Lund, Sweden. — Прим, перев.
Simnon допускает декомпозицию системы на подсистемы, которые можно описывать независимо друг от друга и затем состыковывать друг с другом по входам и выходам. Это позволяет создавать библиотеку моделей процессов. Кроме того, легко можно изменять структуру процесса или регулятора. При моделировании управляемых процессов естественно описывать сами процессы обыкновенными дифференциальными уравнениями, а компьютер вместе с алгоритмами управления — разностными уравнениями. По этой причине Simnon позволяет описывать как непрерывные, так и дискретные подсистемы.
Структура моделей
В Simnon есть три типа систем: непрерывные, дискретные и связующие.
Непрерывная подсистема математически определяется как х (/) = /[*(/), Л «(О, Р]> y(t) = g[x(t), t, u(t), р], х (t0) = х0.
Здесь использованы следующие обозначения: t: время (независимая переменная), х: вектор переменных состояния (зависимых), у: вектор выходных переменных, р: вектор параметров, to: начальное время моделирования, х0: начальное значение переменных состояния.
Дискретная система математически определяется следующим образом:
x(tk+i) = f [х (tk), tk, u(tk), p], y(tk) = g[x(tk), tk, u(tk), p], x (t0) = x0.
Здесь через th обозначен k-й момент квантования. Моменты квантования вовсе не обязательно должны быть эквивалентными и совпадать для всех дискретных подсистем.
Уравнения для дискретных подсистем не определяют выходов между моментами квантования и на участке до первого такого момента. Для стыковки непрерывных и дискретных систем с различными моментами квантования следует расширить понятие выходов. Это делается введением фиксаторов (цепей восстановления) нулевого порядка на выходах и фазовых переменных, поскольку последние также могут использоваться как выходы.
Связь подсистем между собой осуществляется связующей системой, которая определяет структуру связей различных подсистем. Эта система представляет собой статическую систему, которая может быть и нестационарной, но не Динамической.
Если в системе нет замкнутых контуров, то уравнения, описывающие ее, при надлежащей нумерации могут решаться по-следовательйо. Эти операции выполняются автоматически.
Моменты квантования для каждой дискретной подсистемы задаются специальной переменной, входящей в описание системы. Эта переменная преобразуется в каждый момент квантования и принимает значение, равное; следующему моменту квантования. Таким образом, после запуска некоторой дискретной подсистемы будет известно, когда должно производиться следующее квантование. Дифференциальные уравнения, параметризованные дискретными состояниями и выходами, на периоде квантования могут решаться обычными процедурами интегрирования. В настоящее время в систему включены предиктор-корректор Хэмминга, метод Рунге—Кутта и процедура решения жестких дифференциальных уравнений.
Язык моделирования
Simnon включает специальный язык описания подсистем и связи между ними. Уравнения вводятся в программу с помощью оператора присваивания, аналогичного имеющемуся в Алголе-60. Конструкция IF-THEN-ELSE оказалась весьма полезной. Язык моделирования очень прост, что позволяет включить в него мощные средства диагностики ошибок. Если требуются очень сложные модели, то для их описания можно использовать модули, написанные на Фортране или Паскале.
Ниже служебные слова системы Simnon выделены прописными буквами, а для описания модели используются как прописные, так и строчные буквы латинского алфавита.
Описание конструкций языка можно получить, вызвав крманду HELP SIMNON.
Непрерывные и дискретные системы имеют следующую структуру:
CONTINUOUS SYSTEM <имя> DISCRETE SYSTEM (имя)
описание переменных описание переменных
присваивание присваивание
END END
В заголовке системы определяется ее тип и ее имя. Далее следуют описания типов переменных. Этими типами являются INPUT (вход), OUTPUT (выход), TIME (время), STATE (состояние), DER (производная), NEW (новая) и TSAMP (момент квантования). Тип DER используется в непрерывных системах для указания того, что некоторая переменная является производной некоторой переменной состояния. Тип NEW используется аналогичным образом в дискретных системах для пересчета переменной состояния. Одна переменная TSAMP используется в каждой дискретной системе для задания следующего момента
квантования. Описание системы может также содержать параметры и вспомогательные переменные, тип которых не определяется.
Значения параметров задаются предложением вида
(параметр):(число).
Начальные значения переменных состояния задаются аналогичным образом, а именно:
(переменная) = (выражение).
В разделе присваивания переменным присваиваются численные значения.^Так, значения присваиваются таким переменным, как производные, пересчитанные переменные состояния и выходные переменные. Эти предложения автоматически сортируются компилятором в заданный порядок вычислений.
Связующая система имеет следующую структуру:
CONNECTING SYSTEM <имя> описание переменных раздел связей END
Раздел связей содержит операторы присваивания для переменных типа INPUT (вход) различных подсистем. Для переменных, определенных в различных подсистемах, могут использоваться одинаковые идентификаторы. Поэтому в связующей системе для обозначения переменных используется их полное имя:
(переменная) [(подсистема)].
Правая часть оператора присваивания может включать переменные типов STATE и OUTPUT, имена которых также задаются полностью (т. е. включают имя подсистемы).
Стандартные функции и системы
В системе SIMNON имеется несколько стандартных функций, которые могут использоваться в операторах присваивания в подсистемах или в связующей системе. Имеются следующие стандартные функции:
ABS(x): Абсолютное значение х.
ATAN(x): Арктангенс х в радианах в интервале (—л/2, л/2).
ATAN2(x, у): Арктангенс х/у в радианах в интервале (—л, л).
COS(x): Косинус х; х в радианах.
ЕХР(х): Экспонента от х.
INT(x): Целая часть х.
LN(x): Натуральный логарифм х, х > 0.
LOG(x): Десятичный логарифм х, х > 0.
МАХ(ху у): Максимум из х и у.
MIN(x, у): Минимум из х и у.
MOD(x, у): Остаток от деления х на у. Отметим, однако, что здесь MOD (х, х) = х.
SIGN(x): Знак х; 1 при х > 0, 0 при х = 0 и —1 при х < 0. -•
SIN(x): Синус х; х в радианах.
SQRT(x): Квадратный корень из х, х 0.
TAN(x): Тангенс х, х в радианах.
В систему включены также некоторые специальные процедуры:
DELAY (непрерывная): Временное запаздывание.
FUNC (непрерывная): Табличная функция.
IFILE (дискретная): Чтение входных переменных из файла. LOGGER (дискретная): Выборка и запись переменных в файл.
NOISE 1 (дискретная): Генератор случайного шума с гауссовским или прямоугольным распределением.
ОРТА (дискретная): Процедура оптимизации.
Работа с моделью
Описание модели содержится в файлах, хранящихся в массовой памяти. Обращение к моделям и работа с ними производятся с помощью специальных команд с параметрами. Обычно команды вводятся с терминала, однако они могут также считываться из командного файла. Результаты расчетов выводятся на графический дисплей.
Ниже приводится краткое описание команд, а подробно ознакомиться с ними можно в работе [1].
Компилятор работает параллельно с текстовым редактором. При обнаружении ошибки компилятор выдает сообщение об ошибке, и пользователь может сразу исправить найденные ошибки с помощью редактора, команды которого приведены ниже.
Возможности диалога
Ядром интерактивной системы является набор подпрограмм. Intrac. Эти подпрограммы реализуют интерфейс пользователя с прикладными программами. Intrac в числе прочих функций осуществляет декодирование команд, структура которых может быть довольно гибкой. Так, в некоторых случаях аргументы (параметры) у команд могут быть опущены. В подобных ситуациях используются значения параметров «по умолчанию».
При работе с системой довольно часто одна и та же последовательность команд используется многократно. В таком слу
чае пользователь может построить макрос, включающий эту последовательность команд, и использовать его далее как новую команду, может быть, с различными значениями аргументов. Макросы определяются специальными командами Intrac. В макросы могут включаться также циклы и команды управления.
Помощь
Интерактивный пакет включает систему помощи пользователю, которой можно пользоваться во время сеанса моделирования. Команда HELP вызывает меню команд, имеющихся в системе SIMNON. Дополнительную информацию о каждой команде можно получитр, набрав на консоли (терминале)
HELP <имя команды).
Кроме того, напечатав HELP и имена EDIT, INTRAC или SYSTEMS, можно получить информацию о редакторе, системе Intrac и имеющихся подсистемах соответственно.
Пример
Проиллюстрируем некоторые возможности Simnon на примере системы, показанной на рис. С.1.
Рис. С.1. Система резервуаров с
вентилями и регулятором.
Вентиль на входе управляется регулятором, цель которого поддерживать постоянный уровень в резервуаре. Вентиль на выходе управляется извне, и при моделировании это управление рассматривается как возмущение. Целью моделирования является поиск подходящей схемы регулирования и выбор значений ее параметров.
Описание модели приведено в листинге С.1. Резервуар и вентили описываются в системе, названной tank (резервуар). Система имеет два входа: сигнал п, подающийся на входной вентиль, и сечение выходного вентиля aout. Уровень в резер
вуаре является фазовой переменной и также рассматривается как выходная переменная. Уровень регулируется управляющим компьютером, реализующим ПИ-регулятор, описанный в подсистеме dpi.
Связь подсистем tank и dpi осуществляется подсистемой regtank, где также описывается возмущение на выходе. В момент / = 100 сечение выходного вентиля увеличивается с 0,01 до 0,05. В начальный момент резервуар пуст.
Рис. С.2. Моделирование с пропорциональным регулятором, k = 1.
Ниже приводится запись сеанса диалога оператора с системой Simnon, где двойными кавычками отделены комментарии.
> SYST tank dpi regtank “Компиляция модели.
> TURN S125 ON “Выбор масштаба для графиков.
> STORE h [tank] href qin “Подготовка к записи результатов.
>“
> “Пропорциональный регулятор с k = 1.
> PAR h: 5 “Установка интервала квантования.
> SIMU 0 200 “Моделирование на интервале 200 с.
> ASHOW h href qin-MARK “Вывод результатов на график,
> HCOPY “Выдача твердой копии (см. рис. С.2).
> “Отработка статической ошибки ПИ-регулятора.
> PAR ti: 25 “Изменение времени интегрирования.
> SIMU “Моделирование.
> ASHOW h href qin-MARK >HCOPY “(см рис. C.3).
Рис. С.З. Моделирование с ПИ-регулятором. k= 1, /г = 25.
Рис. С.4. Моделирование с ПИ-регулятором и антинасыщением, k = 1 ti = 25.
“Слишком большое перерегулирование. Ввод антинасыщения.
> SAVE pipar “Запись параметров в файл pipar.
> EDIT dpi “Редактирование файла dpi.
EDIT
> L u = “Поиск выражения.
и = k * e + il
> С/u/v/ “Замена в найденном выражении.
v = k * е + il
>1 u = IF v <0 THEN 0 ELSE IF v< I THEN v ELSE 1 “Вставка строки.
> N “Переход к следующей строке.
> C/il/il + и — v/
ninte = il + и — v
> Е “Выход из редактора.
> SYST tank dpi regtank
> GET pipar “Чтение параметров из файла pipar.
> STORE h [tank] href qin
> SIMU
> ASHOW h href qin-MARK
> HCOPY “(см. рис. C.4).
Листинг C.l Подсистемы tank, dpi и regtank CONTINUOS SYSTEM tank ————-
INPUT v aout STATE h DER dh valve = IF v <0 THEN 0 ELSE IF v > 1 THEN 1 ELSE v qin = qmax * valve qout = aout * SQRT (2* g * MAX (h, 0)1 dh = (qin — qout)/area qmax: 1 g:9,81 area: 10 END
DISCRETE SYSTEM dpi INPUT у yref OUTPUT u STATE inte NEW ninte TIME t TSAMP ts e = yref — у il = inte + k * e * h/ti u = k * e + il ninte = il ts = t + h k: 1
ti: 1Е10 h: 1 END
CONNECTING SYSTEM regtank
TIME t
aout [tank] = IF t < 100 THEN al ELSE a2 al : 0.01
a2:0.05
yref [dpi] = href
href: 2
У [dp'] = h [tank] v [tank] =’u [dpi]
END
Команды системы Simnon
Ниже дается перечень команд системы Simnon, их краткое описание и синтаксис языка, а также некоторые команды Intrac. Команда HELP (помощь) позволяет получить более подробную информацию. Приведенные команды относятся к реализации системы на ЭВМ VAX 11/780, при этом используются следующие обозначения:
{op 11 ... I орп)
[..••Г
[....]
(....)
Перечень возможных вариантов, из которых следует выбрать один.
Выражения, заключенные в квадратные скобки, не обязательны и могут быть опущены.
Звездочка означает, что предыдущее выражение можно повторить.
Аргументы (параметры) команд.
ALGOR{HAMPC|RK|RKFIX|DAS}. Выбор процедуры интегрирования
НАМРС Предиктор-корректор Хэмминга (по умолчанию).
RK Процедура Рунге — Кутта с переменным шагом.
RKFIX Процедура Рунге — Кутта с фиксированным шагом.
DAS Процедура интегрирования жестких систем.
AREA (строки)(столбцы>. Определение площади рисунка (см. SPLIT).
ASHOW Построение графиков переменных с автоматическим масштабированием по осям.
AXES [(парам. оси> [(парам. оси)]]. Отрисовка осей.
(парам. оси> : = {Н | V} (мин. значение) (макс, значение)
Н — ось абсцисс, V — ось ординат.
DISP [({DIS|TP|LP}{FF|LF})] [(переменная)]*. Вывод переменных на следующие устройства:
DIS Дисплей (по умолчанию).
ТР Терминал.
LP АЦПУ.
FF Прогон страницы (по умолчанию, если,переменные не указаны).
LF Перевод строки (по умолчанию, если указаны некоторые переменные).
Если конкретные переменные не указаны, то выводятся все переменные.
EDIT (имя файла). Редактирование файла. Редактор работает в двух режимах: INPUT (ввод) и EDIT (редактирование). Переключение режима производится вводом пустой строки. В режиме редактирования можно вносить изменения в существующий файл. При этом имеются следующие
команды.
A[PPEND](cTpoKa)
В[ОТТ] C[HANG]/x/«// П[ЕЕ](целое) DIS[ON | OFF]
E[XIT]
р[1НП](выражение) I[NS](cTpoKa) ЦОС](выражение) LEAVE
N[EXT](uejioe) OfVERL ]<целое) Р[Р1ПТ](целое) R[ETYP](cTpoKa)
Т[ОР]
Добавление строки.
Перевод указателя в конец файла.
Замена выражения х на выражение у.
Удалить (целое) число строк и.
„Эхо" вкл/выкл.
Выход из редактора с сохранением сделанных изменений.
Поиск строки, начинающейся данным выражением.
Вставка данной строки после текущей.
Поиск данного выражения.
Выход из редактора с игнорированием сделанных изменений.
Перевод указателя на (целое) число строк вниз.
Запечатывание заданного числа строк новым текстом.
Печать заданного числа строк.
Повтор данной строки.
Перевод указателя в начало файла.
ERROR (число). Задание границы погрешности для процедуры интегрирования (по умолчанию 0,001).
GET (имя файла). Ввод параметров и начальных значений из файла, записанных ранее командой SAVE.
HCOPY [(масштаб)] (комментарий). Вывод графиков на «твердую копию» в заданном масштабе (от 0,5 до 1.6). Комментарий также Выводится на твердую копию.
HELP [((команда)| EDIT| INTRAC]SIMNON|SYSTEMS}]. Получение более подробной информации о командах, редакторе Intrac, Simnion и имеющихся подсистемах. HELP без параметров выдает меню команд.
HELPDEV ={LP|TP|DIS}. Задание устройства вывода для команды HELP (см. DISP). Информация, выводимая на АЦПУ, сначала записывается в буферный файл, который затем распечатывается командой LP.
INIT (переменная состояния) : {(число) | (переменная)}. Изменение начального значения переменной состояния.
LET (переменная) = (число). Команда системы Intrac, использующаяся для задания параметров подсистем.
LIST [({DIS |ТР|LP} [FF| LF]) ] {(имя файла)}*. Печать файлов. Аналогична команде DISP, но работает с файлами, например с подсистемами.
LP Печать на АЦПУ переменных и файлов, указанных ранее командами DISP, LIST или PRINT.
MARK Вставка текста в график. Информация о ее синтаксисе дается командой HELP INTRAC MARK.
NEWS Вывод информации о новых изменениях в системе.
PAR (параметр) : {(число) | (переменная)}. Изменение значения данного параметра.
PLOT [{(переменная)}*[((переменная))]]. Выбор переменных для отрисовки графиков при исполнении команды SIMU. Примеры: PLOT XI Х2 выводит графики зависимостей XI и Х2 от времени. PLOTX1(X2) изображает XI как функцию от Х2.
PRINT [({DIS|ТР|LP} [FF|LF])] (имя файла) [(строки)] [/(начало)]. Печать файла, указанного командами STORE + SIMU. Печатается (строки) строк, начиная со строки (начало). Остальные параметры имеют тот же смысл, что и в DISP.
SAVE(hmh файла)[(имя системы)] [—{PAR | INIT}]. Запись значений параметров и начальных значений в файл. Если записываются только параметры, или только переменные, то должна быть явно указана опция PAR или INIT соответственно.
SHOW {[(начало)(конец)] {(переменная)}«-[((переменная))]
[—MARK] |—LIST} [/(имя файла)]. Отрисовка переменных, хранящихся в файле (имя файла). Используется с командой STORE. Графики указанных переменных строятся на интервале времени от (начало) до (конец). Если указана опция MARK, то графики разных переменных помечаются номерами. Опция LIST печатает имена всех переменных.
SIMU [(начало)(конец>] [(шаг)] [—(опция)].
[/<имя файла) [(шаг)] ]
(опция) :={MARK| CONT}
Моделирование системы на интервале времени от (начало) до (конец) с максимальным шагом (шаг) [по умолчанию: ((конец) — (начало))/100]. С опцией MARK переменные, заданные в команде PLOT, нумеруются, а с CONT моделирование продолжается с полученными значениями переменных состояния, взятыми в качестве начальных значений, При указании имени файла отрисованные переменные записываются в этот файл с периодом квантования (шаг).
SPLIT (число строк)(число столбцов). Разбиение экрана на несколько областей для отрисовки графиков (максимум 6). (число строк) :={11213} по умолчанию 1 (число столбцов) :={112} по умолчанию 1
STATE Используется с процедурой интегрирования DAS.
STOP Выход из системы Simnon.
STORE [(переменная)] *[—ADD], Выбор переменных, которые должны быть запомнены при моделировании. С опцией ADD к имеющемуся списку можно добавить новые переменные. Переменные можно вывести командами ASHOW или SHOW и распечатать командой PRINT.
SWITCH (опция) {ON | OFF}
(опция) :={CLOCK| DATE | ECHO ] EXEC | LOG |TRACE} Управление системой Intrac.
CLOCK Печать текущего времени на твердой копии; по умолчанию OFF (откл).
DATE Печать текущей даты на твердой копии: по умолчанию OFF (откл).
ECHO Эхо макрокоманд; по умолчанию OFF (откл).
ЕХЕС Во время определения макрокоманд макрокоманды, включаемые в макрос, автоматически выполняются; по умолчанию OFF (откл), LOG Выполненные команды из макроса печатаются на АЦПУ; по умолчанию OFF (откл).
TRACE Действует на ECHO и LOG.
SYST {(подсистема)}* [—(опция)] [/(имя файла)] (опция) :={EDIT | EXIT}
Определение системы. Компиляция подсистемы. Если имеется несколько подсистем, то последняя из них должна быть связующей. EDIT означает, что компилятор для каждого файла передает управление редактору. Если ука
зано (имя файла), то отсортированные уравнения записываются в текстовый файл.
TEXT (любая строка, не содержащая одинарных кавычек). Включение текста в график, выводимый на твердую копию,
TURN (опция) {ON | OFF}
(опция) :={S1251 DARK| DIS |OVFLO}
Установка переключателей.
S125 Выбор одного из масштабов (1, 2 или 5) для осей; по умолчанию. OFF (откл).
DARK Если ON (вкл), то между точками квантования на графике зависимости не проводятся; по умолчанию OFF (откл).
DIS Признак наличия графического дисплея; по умолчанию ON (да).
OVFLO Если ON (вкл), то при переполнении процедура моделирования прекращается; по умолчанию OFF (откл).
Приложение D
Теорема 10.1.
Пусть А, В 'л С — многочлены с действительными коэффициентами. Тогда уравнение
AX + BY = C (D.1)
имеет решение тогда и только тогда, когда наибольший общий делитель А и В является делителем С.
Доказательство. Не теряя общности, можно считать, что deg А deg В. Пусть А0 = А и Ai — B. Пусть, кроме того, Qi будет частным, а Л2 остатком от деления Ло на Ль т. е.
Ло = Л^ + А2,
где deg/42 < deg Ль Разделим At на Л2:
Л1 = A.,Q2 + А3.
Продолжая этот процесс, получаем
Ло = j4|Q] + А2
Л] — A2Q2 + Л3
(D.2)
Л«-2 = ^n-tQn-l +
Лг-1 = ^nQn + Лге+1
Лге+1 = о,
где An+t — первый многочлен, тождественно равный нулю. Поскольку degX0 > degA > degX2 > ... > deg/L+i, этот процесс завершится за конечное число шагов. Он называется алгоритмом Эвклида.
Многочлен Лп-1 делится на Ап, поскольку Л„+] =0. Поэтому Ап является наибольшим общим делителем Ап и An-i- Из (D.2) вытекает, что
^п-2 = + Ап = AnQnQn_t + Ап,
поэтому Ап-1 и Лп-2 делятся на Ап, который к тому же является их наибольшим делителем. Если это не так, т. е. существует наибольший общий делитель Q =# Ап, то
Лп_2 = Лп_1<2,
откуда следует, что Ап = 0, а это противоречит предположению о том, что алгоритм заканчивается при An+i — 0. Повторяя эти рассуждения, получаем, что Ап является наибольшим общим делителем многочленов А0 = А и Во — В. Тогда (D.1) можно переписать в виде
АХ+ BY = (A'X + B'Y)An = C, (D.3)
откуда следует, что это уравнение не имеет решения, если Ап не является делителем С.
Если Ап является делителем С, то обе части (D.3) можно разделить на Ап и получить уравнение (D.3), в котором, однако, Л и В Не будут иметь общих делителей. В этом случае алгоритм Эвклида дает для многочленов А и В наибольший общий делитель Ап = 1. Алгоритм D.2 дает
I ~ ~ ^п-2 — Qn-lAn_i.
Из (D.2) вытекает, что
1 ^п-3 ^п—sQre—2>
поэтому
== Лп_2 Qn— 1 С^п-З Qn-2^п—й) ==
= — Qn-Ип-З + (I + Qn-lQn-2) ^п-2 = ^п-З^п-З + Уп-2^п-2-Продолжая этот процесс, получим
1={/оА>+У,Л==£/0Л +
Тогда решение уравнения (D.1) имеет вид
X = иос,
Y^Vfi.
11редметный указатель
Автоковариация 153
Автопилот 422
Автоподстройка 402
Авторегрессия 154
Автоспектральная плотность 153
Адаптивное регулирование по эталонной
модели АРЭМ 398
— управление 28. 388
Адаптивные алгоритмы 401
Активное управление 16
Алгоритм аналитического конструирования 261
— Далина — Хигема 271
— неявный самонастраивающийся см. Неявный самонастраивающийся алгоритм
— Пикаро 23
— управления 23
— явный самонастраивающийся см. Явный самонастраивающийся алгоритм
Анализ дискретных систем ПО
— замкнутой системы 241
Аналитические приборы 24
Аналитическое конструирование 279
Аналого-цифровой преобразователь АЦП 11
Апериодический наблюдатель 236
Апериодическое управление 133, 231
Аппроксимация Тустена 200
— дискретная См. Дискретная аппроксимация
Асимметричное устройство 112
Белый шум 169
— — дискретный см. Дискретный белый шум
Билинейное приближение 201
Боковые полюса 90
Биологические системы 24
Большое временное запаздывание 54
Вариации функции потерь между моментами квантования 256
Верификация модели 372
Весовая функция 59
Весовые матрицы 302
Взаимная ковариация 152
— спектральная плотность 153
Вибрация между моментами квантования 135
Возмущения 144, 225, 252, 321
— импульсы 141
— кусочно-детерминированные см. Кусочно-детерминированные возмущения
— люфт 144
— скачок 141
Восстанавливающая цепь 87
Восстановление 34
— сигнала 31
— Шеннона 35
Временная зависимость 19
Время квантования 32
Второй метод Ляпунова 120
Выбор периода квантования 41
Выборка 31
Высшие гармоники 19
Вычисление дисперсий 167
— скалярного произведения 426
Вычислительная задача 413
— задержка 413
Гармонический осциллятор 52, 452
Гауссовское линейное квадратичное управление ЗЮ
Генератор возмущений 175
Двигатель внутреннего сгорания 24
Двойной интегратор 50
---с запаздыванием 54
Двойственность 312
Декомпозиция Калмана 128
Демпфирование 231
ДиагонаЛнная форма 56
Диаграмма Найквиста 117
Диафонтовы уравнения 258, 340
Дипольная компенсация 269
Дискретная аппроксимация 20
Дискретное представление 87
Дискретные системы 12, 110
Дискретный компенсатор с опережением
203
— процесс 155
Дисперсия 167
Допустимые управления 225, 252, 290, 323
Достижимость 26, 27, ПО, 122
Жорд ано в а форма 49, 57
Зависимость линейной дисперсии от периода квантования 356
Задача оптимального управления 288
— серворегулироваиня 195, 312
— слежения 124
Замкнутое управление 42
Идентификация систем 27, 367
--- рекурсивная см. Рекурсивная идентификация систем
Иерархия систем 367, 369, 374
Импульс 146
Импульсная передаточная функция 68, 99
— характеристика 59
Импульсный передаточный оператор 63
Инверсия 83
— квантования 51, 83
Инициализация 424
Интегральный регулятор 351
Интегратор второго порядка 132, 236, 452
Интеративиое решение 22
Интерактивные моделирующие программы
Интерактивное моделирующее программирование 422
Квазистохастический регулятор 401
Квантованная цепь с кусочно-постоянным восстановлением 83
Квантование 18, 24, 32
— механизм см. Механизм квантования
— миогочастотное см. Миогочастотное квантование
— момент см. Момент квантования
— непрерывной системы 46
— непрерывных сигналов 31
— период см. Период квантования
— периодическое см Периодическое квантование
— функции потерь 290
Ковариация процесса 152
Колебания параметров системы 350, 356
Командный режим 131
Компенсация синусоидального возмущения
— полюсов и нулей 256, 352
Конечномерность 152
Корневой годограф 113. 268
Корреляционная функция 153
Косвенное управление 15
Критерий Джури 114
— качества 62, 225. 252, 290. 322. 370
— Найквиста 114, 116
—> Рауса — Гурвица 113
— усталости 112
— устойчивости 112
Кусочно-детерминированные возмущения
147
Линейное квадратичное управление 293, 323
------гауссовское см. Гауссовское линейное квадратичное управление
Люфт 147 з
Марковский процесс 154
Математическая идеализация 86
Математическое ожидание 152
Метод наименьших квадратов 372
— описывающих функций 430
— переходного режима 212
— предельной чувствительности 213
— z-преобразования 25
— проектирования регуляторов 195
Механизм квантования 31
Микро-ЭВМ 17
Мини-компьютер 16
Многочастотное квантование 19, 32, 104
Многочастотный квантователь 104
Множество индексов 151, 181
Моделирование 131
— - сигнала со смещением 336
Модели возмущений 140, 144, 145
----детерминированные 140
— — стохастические 140, 150
Модель амплитудно-импульсная 330
— КВЦ 83
— модуля 87
— стробоскопическая см. Стробоскопическая модель
Модифицированное z-преобразование 26, 104
Модуляционная модель 82
Момент квантования 18, 32, 82, 355
Наблюдаемая форма 57
--- каноническая 58
Наблюдаемость 26, 27, 110, 122, 125, 189
Наблюдатель 234
— апериодический 230
— Люенбергера 238
— системы 234, 238
Надежность 427
Наложение частот 39
Насыщение интегратора 210
Неопределенность в объекте 253
Неполная информация о системе 290
Непрерывный стохастический ироцесс 163
Нестационарная система 84, 390
Неуправляемость 346
Неуправляемые режимы 346
Неустойчивая обратная система 74
Неустойчивые режимы 346
Неявный самонастраивающийся алгоритм
391
Новационное Представление 166
Новация процесса 166
Нули системы 60, 69, 72
Обратная связь 190
---по выходу 240
---— ошибке 253
------состоянию 216, 224
Обратный многочлен 61
Ограничения 62
Оператор сдвига 60
— обратного сдвига 60
— прямого сдвига 60
Операционные системы реального времени 442
Оптимальный предиктор 328
— регулятор 351
— режим 206
Оптимальное прогнозирование 325
— управление 27, 194
Отклонения нагрузки 145'
Отслеживание модели 195, 270
Ошибки намерения 145
Пакет ПЦУ 18
Пакеты программно-числового управления
445
Параметры 225
Пассивное управление 16
Период квантования 18, 32„ 41, 203, 213,
310, 355
Периодическая система 19
Периодическое квантование 18, 32
Плавный переходной режим 209, 429
Поглощение частоты 37, 38
Подход «сверх,у-вниз» 186
— «снизу-вверх» 186
Полная информация о состоянии 291, 296
Полюса системы 66, 69, 70, 293
---боковые см. Боковые полюса системы
Порядок системы 66
Правила настройки 212
Предварительная фильтрация 33, 40
— частотная коррекция 201, 203
Предельное усиление ЛК-регулятора 301
Предельные циклы 427
---сигнала типа «люфт» 148
Предиктор Смита 214, 269
— ступенчатого сигнала 148
Z-преобразование 36, 66, 97, 200
— модифицированное см. Модифицирован ное Z-преобразованне
Приближение нулевого порядка 35
Приближения старших порядков 36
Принцип вариации аргумента 116
Принципы структуризации 185
— управления 186
Приращение ковариации 170
Присоединенные формы 58
Причинность 260
Прогнозирование 304
— оптимальное см. Оптимальное прогнозирование
Проектирование простейшего контура усиления 199
Простая машина для производства бумаги 54
Простейшие модели возмущений 146
Процесс 182
— Винера 170
Прямая связь 180, 190
Прямое цифровое управление ПЦУ 15
Пульсация 146
Рабочие режимы 49
Радар 24, 25
Разделяемые переменные 442
Разностные уравнения 25
Реальные квантователи 86
Регулятор 182
ЛК-регулятор 290
— свойства 290 г
ПИ-регулятор с антинасыщеиием 211
___ — насыщением 422
---плавным переходным режимом 209
ПИД-регулятор 205, 207
Режим 131
— командный см. Командный режим
— меню 131
— настройки 424
— слежения 419
Рекурсивная идентификация 376
Рекурсивное оценивание 385
Релейно-фазовая декомпозиция 106, 107
Робастность 118, 352
Самонастраивающийся регулятор 388 ---с ручной регулировкой полосы пропускания 404
Сглаживание 304
Связь вход-выход 88
Серворегулирование 243, 272
— качество 272
Сигнал кусочно-детерминированный 149
Система нестационарная 86
— периодическая 19, 86, 89
— прерываний 15
с квантованием 22
Системы 11
— автоматического управления 12
— биологические см. Биологические системы
«— дискретные 12, 22, 46
с неустойчивой обратной 333
— с устойчивой обратной 330
— экономические см. Экономические системы
Скачок 146
Скользящее среднее 154
Скрытые колебания 129, 135
Слабо стационарный процесс 153
Состояние 154
Спектральная плотность 153
— факторизапия 163, 172
Спектральное разложение 339 .
Способы аппроксимации 199
Стандартная конфигурация цифровой системы управления 101
Стационарная система 81
Стационарный процесс 153
Стохастические модели возмущений 150
Стохастическое управление 27, 170
Стробоскопическая модель 46, 47, 81
Структура регулятора 244
Структуризация 185, 217
Супервизорные цепи 405
Теорема Гамильтона— Кэлли 49
— Ляпунова 121
— об асимптотической устойчивости линейных систем 111
--- устойчивости регулятора 299
— о квантовании 25, 32
------ критерии устойчивости Джури 114
---разделении 310, 332
---спектральной факторизации 164, 174
Тиристорное управление 24
Типичный порядок ошибок 42
Типы возмущений 145
Точность вычислений, необходимая для
ПИ регулятора 439
Трансформация многочлена С 322
Управление 28
— адаптивное см. Адаптивное управление активное см. Активное управление
— апериодическое см. Апериодическое управление
— в условиях ограничений 187, 189
— замкнутое см. Замкнутое управление
— кораблем 187, 194
— косвенное см. Косвенное управление
— линейно-квадратичное 323
— материальным балансом 187, 189
— оптимальное см. Оптимальное управление ' *
— пассивное см. Пассивное управление
— по контрольным точкам 14
— поршневым паровым котлом 187
— потоком жидкости 187
— производственным процессом 423
— с минимальной дисперсией 322, 323
— стохастическое см. Стохастическое управление
— тиристорное см. Тиристорное управление
— цифровое см. Цифровое управление Управляемая кононическая форма 58 Управляемость. 122, 182, 183, 266
Управляющая цепь 86
---с емкостной связью 86
Управляющие сигналы 273
Уравнение Белмана 400
Ляпунова 121
— Риккати 295, 313
— состояния 50
— Эйлера 299
Условное интегрирование 211
Установившиеся отклонения 322
— состояния 129
Устойчивость ПО, 266
Фазоопережающее звено 79
Фильтр аналоговый второго порядка см. Аналоговый фильтр второго порядка
— Калмана 305
— ограниченной импульсной реакции 78
— частотные свойства 308
Фильтры Бесселя 40
— высших порядков 40
Фильтрация 304
— непрерывных процессов 172
Функция Ляпунова 120
— модулирования 84
«Холостой» ход интегратора 211
Цифровая система управления 11, 81
— вычислительная машина ЦВМ 11
Цифровое управление 15
— — прямое см. Прямое цифровое управление
Частота квантования 32
— Найквиста 34
Частотная коррекция 203
— характеристика 89
Частотное искажение 201
Чувствительность 352
— к возмущениям 274
•--ошибкам модулирования 265
Экзотермический химический реактор 183
Экономические системы 24
Эксцесс полюсов 61
Электродвигатель 453
— без компенсации нулей 264
— с компенсацией нулей 262
Электромотор 50
Элемент настройки 402
Явные алгоритмы 392
Явный самонастраивающийся алгоритм 390