Текст
                    ББК 32.81
П26
УДК 62-50
Первозванский А. А. Курс теории автоматического управления:
Учеб, пособ.— М.: Наука. Гл. ред. физ.-мат. лит., 1986,— 616 с.
Рассматриваются основные разделы классической и современной теории
автоматического управления: операторно-частотный подход, метод пространства
состояний, оптимизация программ и законов управления с обратной связью,
идентификация и адаптация. Теоретические постановки представлены в тесной
связи с практичёскими проблемами. Изложение ведется концентрически, с по-
стоянным возрастанием уровня сложности, что обеспечивает его доступность
для читателей с различным уровнем подготовки. Включение ряда оригиналь-
ных результатов делает книгу интересной и для специалистов.
Для студентов втузов и специалистов в области теории автоматического
управления.
Табл. 12. Ил. 150. Библиогр. 121 наэв,
Рецензенты:
академик А. А. Воронову
кафедра автоматики и процессов управления Ленинградского электротех-
нического института
1502000000—178
053(02)-86	154-86
© Издательство «Паука».
Главная редакция
физико-математической
литературы, 1986

ОГЛАВЛЕНИЕ Предисловие....................................................... 5 . Список обозначений................................................. 8 Глава 1. Основные понятия...................................... . 9 § 1. Цели и принципы управления ................................. 9 § 2. Сведения о технических средствах . ...................... 11 § 3. Примеры систем автоматического управления..................15 § 4. Проектирование и теория .................................. 17 Глава 2. Операторный метод анализа линейных систем..................19 § 1. Описание элементов ...................................... 19 § 2. Описание систем . . . . . . . . . . . . . . 27 § 3. Устойчивость.............................................40 § 4. Установившаяся реакция и частотная характеристика . . . 47 § 5. Анализ типовых структур.................................52 Глава 3. Построение законов управления............................ 70 § 1. Программа, обратная связь, стабилизация ....... 70 § 2. Основные законы управления. Инвариантность ..... 82 § 3. Метод динамической компенсации .......................... 90 § 4. Выбор желаемой передаточной функции по типовым воздейст- виям ......................................................... 90 § 5. Логарифмические частотные характеристики . . . . . . 108 § 6. Реализация закона управления ..............................121 § 7. Синтез обратных связей в электромеханической следящей систе- ме . . , . . ............................................. . 126 Глава 4. Управление при случайных воздействиях ....................140 § 1. Случайные воздействия и реакция па них . . . / . . 140 § 2. Оптимальный выбор передаточных функций.....................152 § 3. Грубость и коэффициенты чувствительности показателей каче- • ства ..................................................... 160 § 4. Управление неустойчивыми и неминимально-фазовыми объекта- ми .............................................................176 § 5. Регулирование угловой скорости вала гидравлической турбины 181 Глава 5. Введение в нелинейную теорию . , ...............196 § 1. Необходимость нелинейной теории и ее возможности . . . 196 § 2. Равновесные состояния и устойчивость . . . . . . . 205 § 3. Автоколебания. Гармонический баланс и гармоническая линеа- ризация .................................................... 217 § 4. Реакция нелинейной системы на внешние воздействия . . . 230 § 5. О выборе законов управления с учетом нелинейных факторов 244 Глава 6. Метод пространства состояний в линейной теории ; . , , 250 § 1. Описание в нормальной форме................................250 § 2. Анализ системы........................................... 256 1*
4 ОГЛАВЛЕНИЕ § 3. Управляемость и наблюдаемость . . . . . . . . . 268 § 4. Размещение собственных чисел и стабилизация...................274 § 5. Оптимизация стабилизирующей обратной связи ’ л . 284 § 6. Управление при наличии случайных возмущений^ .... 293 § 7. Управление при неполных и неточных измерениях .... 299 § 8. Системы с переменными параметрами........................... 304 Глава 7. Линейные дискретные системы и импульсное управление 316 § 1. Свойства дискретных систем ................... . . . 316 § 2. Управление с обратной связью .................................320 § 3. Импульсное управление непрерывными объектами .... 328 § 4. Операторный метод . . . ............................... . 342 Глава 8. Анализ нелинейных систем................................. . 359 § 1. Описание системы. Равновесные состояния . . . . . . 359 § 2. Построение функций Ляпунова и критерии устойчивости . . 366 § 3. Элементы теории возмущений и зависимость от малого парамет- ра ........................... ' . . . . ... . . 376 § 4. Периодические решения. Автоколебания и вынужденные коле- бания ............................................................. . 386 Глава 9. Оптимизация программ управления . . . . . . . . 407 . § 1. Формулировка задачи.......................................... 407 § 2. Условия оптимальности. Принцип максимума......................411 § 3. Задачи оптимизации со свободным правым концом траектории 424 § 4. Линейно-квадратичные задачи . V . . . . . . . . 435 § 5. Оптимизация по быстродействию ................................445 § 6. Дискретные системы . . ........... 457 § 7. Понятие о численных методах оптимизации.......................401 § 8. Численная оптимизация непрерывных систем......................471 Глав а 10. Синтез оптимальных обратных связей . ....................481 , § 1. Динамическое программирование................................ 481 § 2. Субоптимальные обратные связи.......................... . . 490 § 3. Управление при недетерминированных внешних возмущениях 509 § 4. Управление с обратной связью по неточным измерениям . . 517 Глава И. Методы идентификации и адаптивное управление . . . 532 § 1. Идентификация объектов управления........................... 532 § 2. Адаптивное управление статическим' объектом . . . . . 549 § 3. Адаптивное управление динамическими объектами. Самона- стройка . . ... .. . . . w . . 569 § 4. Заключение............................................... . . Приложение 1. Сведения о преобразованиях Лапласа . . . . 583 Приложение 2. Сведения из теории матриц ..............................587 Список литературы . . . . . .....................................С04 Предметный указатель..................................................610
ПРЕДИСЛОВИЕ Книга является учебным пособием по курсу теории автоматиче- ского управления. Этот курс включен в учебные планы различных инженерных специальностей и в настоящее время является одним из важнейших элементов общетехнического образования. С другой стороны, для некоторых специальностей он является профилирую- щим, определяющим квалификацию инженера. Курс входит и в си- стему университетского образования на механико-математических и иногда —- на экономических факультетах. Разнообразие интересов слушателей и их подготовки делает особо сложной проблему создания приемлемого учебного пособия. Поэтому в книге принята концентрическая система изложения. Первый концентр (главы 1—5) посвящен описанию основных задач автоматического 'управления и использованию для их реше- ния классических операторно-частотных методов. Изложение ве- дется детально и сопровождается большим количеством примеров. Особое внимание уделяется постановке технических задач и про- блеме реализации законов управления. Математической базой глав 2 и 3 является алгебра многочленов и теория линейных дифферен- циальных уравнений с постоянными коэффициентами, но все необ- ходимые сведения приводятся, по ходу изложения, а кроме того, в Приложении 1 дана краткая сводка формул операционного ис- числения. Для понимания главы 4 дополнительно требуется нали- чие минимальных сведений из теории вероятностей. Глава 5 по- священа анализу основных явлений, связанных с наличием нели- нейных элементов. „ В целом первый концентр ориентирован на программы курсов общетехнического назначения, хотя порядок представления мате- риала несколько отличается от традиционного. При необходимости он может быть сокращен за счет изъятия гл. 4 (и частично гл. 5), где используются вероятностные представления. Однако включе- ние в любой курс начальной части гл. 5 представляется обязатель- ным. Текст, данный петитом, приведен лишь в качестве справоч- ной информации. Второй концентр (главы 6 и 7) содержит методику анализа и синтеза линейных систем, основанную на первичном описании в пространстве состояний. Стиль изложения становится более сжа- тым. Предполагается умение пользоваться аппаратом теории мат- риц. Хотя сводка всех используемых результатов этой теории дана
6 ПРЕДИСЛОВИЕ в Приложении 2, опыт преподавания показывает, что активное вла- дение матричным аппаратом требует получения предварительных навыков. В настоящее время принято, что материал первого и второго концентров должен включаться в общие курсы, читаемые студен- там технических вузов, для которых теория автоматического управ- ления является профилирующим предметом. Наконец, третий концентр (главы 8—11) включает ряд спе- циальных курсов (анализ нелинейных систем в пространстве со- стояний, оптимизация программы управления на основе принципа максимума и вычислительных методов, синтез оптимальных и при- ближенно оптимальных законов управления (обратной связи), вве- дение в методы идентификации и адаптивного управления). В рам- ках третьего концентра предполагается наличие более высокой об- щей математической культуры, хотя прикладные аспекты остаются в центре внимания. В основном третий концентр ориентирован на подготовку инженеров-математиков и инженеров-физиков, но мо- жет быть в сокращенном виде использован и для чисто техниче- ских специальностей. Материал спецкурсов может быть также по- лезен для подготовки к экзаменам кандидатского минимума по специальностям «теория автоматического управления» и «техниче- ские системы управления». В нем, в частности, содержатся доказа- тельства ряда математических утверждений, приведенных в общем курсе. Однако взаимосвязь между всеми частями курса проявляется не только и не столько в этом. Без освоения технического аспекта изучение теории автомати- ческого управления недопустимо и может привести лишь к полной беспомощности в постановке и решении практических проблем да- же при хороших формально-математических знаниях. Поэтому со- держательная постановочная сторона дела подчеркивается в тече- ние всего курса. Хотя изложение ведется по возможности строго в математическом смысле этого слова, акцент делается на соот- ветствии формальных моделей практической реальности. Формули- ровки и доказательства необходимых математических фактов дают- ся экономно, без претензий на наибольшую общность. Предлагаемый курс, конечно, не является курсом лекций. Ис- пользуя его для формирования лекционного материала, каждый преподаватель должен сделать выборку, соответствующую конкрет- ной задаче и возможностям общего плана обучения. Цель автора состояла лишь в том, чтобы предоставить достаточный материал для такой выборки. При этом учитывалось, что значительная часть преподавателей (а они также рассматриваются в качестве предпо- лагаемых читателей!) получила подготовку в тот период, когда современная теория управления еще не сформировалась. Поэтому в книге осуществляется «плавный переход» от классического ча- стотного подхода к более новым подходам. .
ПРЕДИСЛОВИЕ 7' Определенная часть содержания книги оригинальна не только в методическом‘отношении. Поэтому можно надеяться, что знаком- ство с ней представит интерес и для специалистов. Вместе с тем книга отнюдь не претендует на всесторонний охват проблематики теории автоматического управления, да это и невозможно при сов- ременном масштабе исследований. Книга базируется на собственном педагогическом и исследова- тельском опыте автора, но прежде всего отражает традиции, сло- жившиеся на физико-механическом факультете Ленинградского по- литехнического института. Они были заложены такими замечатель- ными учеными, как А. И. Лурье и А. М. Кац, светлой памяти ко- торых автор посвящает эту книгу. Традиции А. И. Лурье и А. М. Каца продолжались в лекциях Ю. В. Долголенко, Р. А. По- луэктова, И. Б. Челпанова, В. Я. Катковника. Содержание лекций менялось вместе с развитием теории, однако’ неизменной остава- лась общая тенденция — сочетание инженерной направленности с обновляющимся математическим аппаратом. Написание этой книги было выполнением долга автора перед учителями и перед ныне работающими товарищами и учениками, которым автор неизменно признателен за поддержку и советы. Особо следует упомянуть А. А. Воронова, который многие годы оказывал влияние на автора и как руководитель первых научных исследований, и как создатель прекрасных книг по теории управ- ления, и, наконец, как благожелательный и требовательный рецен- зент этого курса. Замечания А. А. Воронова вместе с замечаниями коллектива кафедры «Автоматика и процессы управления» Ленин- градского электротехнического института, возглавляемой В. Б. Яков- левым, были исключительно полезными и способствовали суще- ственному улучшению окончательного варианта рукописи. Автор глубоко благодарен всем непосредственно помогавшим в работе над рукописью: Т. В. Варядченко, Е. Ю. Коломиец, Н. В. Солониной, И. Л. Дороту, М. Г. Захарову, О. Ю. Кульчицко- му, В. К. Подгайскому, Б. Л. Розету и, прежде всего, Т. Н. Пер- возванской и Ал. А. Первозванскому. Весьма полезным было и вни- мательное прочтение рукописи А. С. Позняком. Следует все же заранее признаться, что несмотря на длитель- ную и напряженную работу данный курс отнюдь не совершенен. В тексте наверняка имеются незамеченные неточности и даже ошибки. Автор заранее признателен всем читателям, которые не сочтут за труд прислать свои поправки в издательство или непо- средственно в Ленинградский политехнический институт..
СПИСОК ОБОЗНАЧЕНИЙ Обозначения величин и функций сохраняются только в преде- лах каждой главы. При ссылках приняты сокращенные обозначе- ния: П.— пример, Т.— теорема. Нумерация формул, теорем и при- меров двойная (сначала номер параграфа в данной главе, затем номер внутри параграфа), самостоятел'ьная в каждой главе. При ссылках на другую главу указывается ее номер. В —- конец доказательства теоремы или ее формулировки (если доказательство не приводится) О —конец примера А => В — из А следует В А В — А эквивалентно В (тогда и только тогда, когда) А /В — А при условии, что верно В А— равно по определению D —оператор дифференцирования ^D^(Z) A-^-^(Z) j t — оператор сдвига на ^кт (£ж [ к] А х \к + 1 ]) 3?{}— оператор преобразования Лапласа (см. приложение I)’ <2Л)— оператор ^-преобразования (см. приложение I) h(t) —весовая функция Я(1>)—передаточная функция l(t)—функция Хевисайда б (t) — б-функция Дирака р — индекс разомкнутого контура . з — индекс замкнутого контура / — индекс обратной связи Р{А) — вероятность события А М{х)— символ математического ожидания случайной ве- личины х ' DLrl— символ дисперсии случайной величины х о(ц) — величина меньшего порядка, чем ц ( Нт == (А \в-»о Р } О(ц)—величина порядка ц(0< lim|O(р)/р|^ Ит|О(p)/p|<oo\ \ |1-*0 в-»о / V — градиент • deg а (р)—степень полинома а (р) Обозначения, относящиеся к матрицам, описаны в Приложе- нии II.
ГЛАВА 1 ОСНОВНЫЕ ПОНЯТИЯ § 1. Цели и принципы управления Управление состоит в том, чтобы, оказывая на какой-либо объект воздействие, изменять протекающие в нем процессы для достиже- ния определенной цели. Управление является автоматическим, если оно осуществляется без вмешательства человека с помощью спе- циальных технических устройств. Разработка общих принципов создания этих устройств и является основной задачей теории авто- матического управления. Теория должна давать единую базу для решения задач управления объектами различной физической, хими- ческой или биологической природы. Перечислим некоторые типич- ные классы технических задач. а. Управление движением механических объектов. Управляемы- ми являются процессы изменения некоторых координат и скоростей, а управляющими воздействиями являются- внешние силы*). Цель управления обычно формулируется через задание желаемых значе- ний координат и скоростей в определенные моменты времени или на определенных участках траектории. б. Управление электротехническими (или электронными} объек- тами^ где управляемыми являются процессы изменения напряже- ний, токов, мощностей, а управляющими воздействиями являются внешние электродвижущие силы (ЭДС) или токи от внешних ис- точников, или сопротивления, емкости, индуктивности элементов с варьируемыми характеристиками. Целью управления может быть, например, обеспечение постоянства напряжения между различными узлами системы или достижение максимальной мощности, выделяе- мой на определенном элементе. в. У правление теплотехническими объектами. Управляемыми яв- ляются процессы изменения температур в различных точках объек- та, а воздействие осуществляется путем подвода тепловой энергии. Цель управления может состоять в желании поддерживать некото- рое распределение, температур или не допускать превышения тем- пературой некоторого предельного уровня. *) Координаты, скорости и силы могут пониматься в обобщенном смысла теоретической механики. .
10 ГЛ. 1. ОСНОВНЫЕ ПОНЯТИЯ г. Управление химической или биологической технологией. Здесь управляемым является как изменение температур, так и из- менение концентраций различных веществ. Управляющими воздей- ствиями являются изменения подхода энергии (топлива, освещения) или вещества, а целью — обеспечение желаемого количества выход- ного .продукта (желаемой продуктивности) или (и) постоянства его качественных физико-химических характеристик. Эти проблемы зачастую переплетаются, поскольку объекты сов- ременной техники, как, например, системы энергообеспечения, явля- ются сложными системами, в которых взаимодействуют и механи- Рис. 1.1 ческие, и электромагнитные, и термодинамические, и химические процессы. Однако, несмотря на разнообразие технических проблем, существуют общие подходы, общие принципы создания систем управ- ления. В соответствии с ними любая си- стема управления строится на осно- ве трех функциональных блоков (рис. 1.1). Первый блок состоит из устройств, позволяющих получать информацию о текущих значениях других процессов в объекте, связан- Этот блок называют измерительным В ходе функцио- управляемых процессов (или пых с управляемыми), или блоком датчиков информации (ДИ)*), пирования этого блока выдаются информационные сигналы. Эти сигналы поступают во 2-й блок, блок преобразования и хранения информации (ПИ), где на их основе, а также на основе заранее заложенных сведений (априорной информации) вырабатываются сигналы управления. Правило (алгоритм) преобразования ипфор- мационных сигналов в сигналы управления называется законом управления. Сигнал управления показывает, каким должно быть управляющее воздействие в текущий момент времени. Чтобы вы- работать это воздействие, превратить сигнал в механическое уси- лие или поток тепла, Или поток вещества, требуется еще один блок — исполнительное устройство (ИУ). Как видно из рис. 1.1, совокупность перечисленных блоков об- разует замкнутый контур, охватывающий объект управления. По- этому систему, где присутствуют все эти блоки, часто называют замкнутой системой, или системой управления с обратной связью от управляемых процессов к управляющим воздействиям. Иногда, однако, используются и более простые разомкнутые системы, где отсутствуют датчики информации, а функции преобразователя ин- формации сводятся лишь к хранению и выдаче выработанной про- *) Иногда употребляются и другие термины; блок чувствительных элемен- тов, блок сенсоров.
§ 2. СВЕДЕНИЯ О ТЕХНИЧЕСКИХ СРЕДСТВАХ Ц граммы управления с требуемыми в каждый момент времени зна- чениями сигнала управления., Таким образом, в системе управления можно выделить инфор- мационную часть, осуществляющую получение, хранение, обработку и выдачу информации, и энергетическую (силовую) часть, служа- щую для преобразования информации (сигнала управления) в уп- равляющее воздействие на объект. § 2. Сведения о технических средствах Описанные функциональные блоки реализуются с помощью раз- личных технических средств автоматики. Детальное изучение их конструкций служит предметом специального курса. Однако пони- мание задач общей теории автоматического управления невозможно без четкого представления об основных особенностях этих средств, тем более что в настоящее время намечается тенденция к их уни- фикации. В них в качестве информации выступают электрические сигналы, причем информация содержится либо в текущих значе- ниях напряжения (сигналы аналогового типа), либо в виде коди- рованных последовательностей импульсов (сигналы цифрового или кодированного типа). В соответствии с этим датчики информации являются преобра- зователями значений различных физических процессов в электри- ческие сигналы, преобразование и хранение информации осуществ- ляется с помощью электронных вычислительных устройств анало- гового или цифрового типа, исполнительные устройства управляют- ся опять-таки с помощью электрических сигналов, поступающих из блока ПИ. Приведем некоторые примеры датчиков [1.1]. а. Датчик относительного перемещения (измерительный потен- циометр) (рис. 1.2, а). Напряжение и, снимаемое движком потен- циометра, пропорционально перемещению движка относительно средней точки. Если связать движок с одним из тел, а корпус с другим, то получим датчик их относительного поступательного перемещения. С помощью кругового потенциометра аналогичным образом можно получить электрический сигнал, пропорциональный относительному углу поворота.
12 ГЙ. 1. ОСНОВНЫЕ понятия б. Датчик угловой скорости (тахогенератор) (рис. 1.2, б). Э. д.с., вырабатываемая генератором постоянного тока с независимым воз- буждением или постоянными магнитами, пропорциональна угловой скорости вращения ротора. Если ротор генератора связан с враща- ющимся телом, то генератор является датчиком угловой скоро- сти тела. в. Датчик давления (измерительная мембрана). Прогиб мембра- ны (рис. 1.2, в) пропорционален давлению газа, действующему на ее поверхность. Таким образом, мембрана является преобразовате- лем «давление-перемещение». Однако перемещение, как уже ука- зывалось, можно преобразовать в напряжение электрического сигнала. г. Датчик температуры (термопара). Действие этого датчика основано на свойстве разнородных проводников или полупроводни- ков образовывать в паре (спае) электродвижущую силу, зависящую от температуры спая. Перечень датчиков можно было бы продолжать практически не- ограниченно, поскольку разработаны и непрерывно разрабатывают- ся устройства для измерения .различного рода процессов, основан- ные в свою очередь на различных физических принципах и имею- щие разную сложность, стоимость, габариты. При этом в зависи- мости от диапазона возможного изменения одной и той же физической величины могут применяться совершенно несходные устройства, например, для измерения перемещений порядка 10~2 м — уже упомянутые потенциометры, а при порядке более 102 м —ра- диолокационные дальномеры, используемые, в- частности, в систе- мах управления полетом. В дальнейшем будем называть датчик идеальным, если выраба- тываемый им сигнал пропорционален измеряемой величине. Суще- ственно, что все реальные датчики являются в, той или. иной степе- ни неидеалъными. В частности, всегда возможны малые ошибки, проявляющиеся в виде добавочных, «паразитных», сигналов. Более того, пропорциональность заведомо сохраняется только в опреде- ленном диапазоне изменения, зависящием от конструкции датчика (это очевидно даже из представленной выше схемы измерительного потенциометра). Наконец пропорциональность может нарушаться при быстрых изменениях измеряемого процесса — в силу инерцион- ности датчика. Например, спай термопары обычно защищается по- крытием (чехлом). Это покрытие не может прогреться (или ох- ладиться) мгновенно при резком изменении измеряемой температу- ры газовой среды, так что тепловая инерция покрытия искажает показания датчика’ В дальнейшем будет продемонстрировано, на- сколько неизбежная неидеальность датчиков информации влияет на эффективность систем управления. . Кратко остановимся на средствах преобразования и хранения информации, т, е. технической реализации блока ПИ. Наиболее мощным средством являются управляющие цифровые электронные
§ 2. СВЕДЕНИЯ О ТЕХНИЧЕСКИХ СРЕДСТВАХ . 13 вычислительные машины (ЭВМ). Общие принципы действия ЭВМ Хорошо известны (см., например, [1.7]). Подчеркнем лишь, что ис- пользование ЭВМ в качестве блока системы автоматического управ- ления влечет за собой определенные особенности ввода и вывода информации. В отличие от неавтоматических (человеко-машинных) систем информация не. должна представляться в визуальной фор- ме*), например, в виде распечатки на бумажной ленте или гра- фика на графопостроителе.. Как правило, -ввод текущей информа- ции, поступающей от ДИ, осуществляется следующим образом: аналоговые электрические сигналы масштабируются с помощью усилителей к требуемому диапазону, далее преобразуются с по- мощью устройств «аналог — цифра» (АЦП) в кодированную после- довательность импульсов, вводимую в память ЭВМ. Результат пе- реработки информации по заложенным в ЭВМ программам в виде цифрового кода поступает на преобразователь «цифра — аналог» (ЦАП), на выходе которого возникает аналоговый сигнал соответ- ствующего напряжения. Для дальнейшего существенно, что цифровая ЭВМ фактически оперирует не с непрерывно поступающей информацией, а с перио- дической выборкой, иначе говоря, с последовательностями измеряе- мых величин. Отметим также, что при преобразованиях в АЦП возможны дополнительные ошибки, связанные с округлением, хотя они, как правило, малы по сравнению с ошибками датчиков. В настоящее время использование цифровых ЭВМ ограничено достаточно сложными и дорогостоящими системами управления, в частности, системами управления крупными судами и летатель- ными аппаратами, хотя общая тенденция технического развития свидетельствует о возможности их все большего распространения. Широко применяются аналоговые вычислительные устройства, представляющие собой схемы, включающие электронные усилители и ЛС-цепи. Основная идея построения таких схем проста. С по- мощью делителей или усилителей возможно осуществить операцию умножения входного напряжения на постоянный коэффициент, с помощью емкостных элементов возможно осуществлять операцию интегрирования данных, поскольку напряжение на емкости пропор- ционально интегралу от протекающего тока. Сочетание таких эле- ментов позволяет создавать устройства, практически мгновенно производящие алгебраические и интегральные преобразования по- ступающих сигналов. Эти устройства иногда по'лностью разрабаты- ваются специально для реализации требуемого закона управления, а иногда строятся на базе стандартных так называемых операцион- ных усилителей, входящих в состав аналоговых вычислительных машин (АВМ)**). Аналоговые вычислители проще и пока дешевле *) Это, конечно, не исключено и, более того, даже необходимо в ходе на- ладки системы. - **) Принципы функционирования АВМ тесно связаны с теорией управле- ния и кратко излагаются ниже (гл. 2),
14 ГЛ. 1. ОСНОВНЫЕ понятия цифровых. Хотя возможности преобразования и в особенности хра- нения информации в них ограничены, их, как правило, достаточно для реализации наиболее часто используемых законов управления. Кратко остановимся на средствах реализации блока исполни- тельных устройств. Из ПИ в него поступает сигнал управления. Это электрический сигнал с низким уровнем мощности. Поэтому ИУ должно реализовать две фунйции: во-первых, повысить уровень мощности, быть усилителем мощности, а во-вторых, преобразовать электрический ток в управляющее воздействие требуемого типа, например, механическое усилие или расход вещества. Наиболее распространенным ИУ являются электрические дви- гатели (см., например, [1.4]), на которые управляющий сигнал по- дается через усилители мощности (УМ) (электронные, магнитные, электромашинные). Простейший электродвигатель — электромаг- нит, якорь которого перемещается в поле, создаваемом током в об- мотке (рис. 1.3). Во вращающихся электродвигателях момент, дей- ствующий на ротор двигателя, создается за счет взаимодействия токов в обмотках, уложенных на роторе и статоре. В частности, в двигателе постоянного тока с независимым возбуждением, ис- пользуемом во многих системах управления, ток в роторную (якор- ную) обмотку подается от усилителя мощности, а ток в обмотку статора подается от внешнего источника постоянного напряжения (рис. 1.4). Всякий электродвигатель является, по существу, преоб- разователем «электрический ток — механическое усилие» и поэтому может быть непосредственно использован в качестве ИУ в систе- мах управления движением механических объектов. Вместе с тем он может быть применен и в других системах. Если, например, кинематически связать двигатель с заслонкой (вентилем), измене- ние положения которого меняет расход вещества, поступающего к объекту (рис. 1.3), то создается ИУ для управления расходом с помощью электрического сигнала. Таким же способом может уп- равляться подача тепловой энергии, если вентиль дозирует подачу топлива. Наряду с электродвигателями в системах управления использу- ются и иные, в особенности гидравлические и пневматические. Для
§ 3. ПРИМЕРЫ СИСТЕМ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 15 них входным управляющим сигналом является перемещение за- слонки, открывающей или закрывающей доступ рабочего тела (сжа- той жидкости или газа) к движущемуся поршню*). Управляющий сигнал такого рода может поступать либо непосредственно от дат- чика (см. выше, пример измерительной мембраны), либо быть ре- зультатом преобразования электрического сигнала с помощью дви- гателя, перемещающего заслонку. Для дальнейшего теоретического изложения важно понимать, что несмотря на разнообразие возмож- ных технических реализаций любые ИУ обладают следующими принципиальными особенностями: 1) они используют энергию от внешних источников (блоки пи- тания электрических усилителей, напорные установки гидравличе- ских двигателей и т. д.); 2) возможный уровень управляющего воздействия ограничен конструкцией ИУ. Таким образом, мы кратко обрисовали типовую техническую базу реализации основных функциональных блоков систем автома- тического управления (САУ). ' § 3. Примеры систем автоматического управления Дадим схематическое описание двух типичных САУ. Пример 1. Электромеханическая следящая система (ЭСС} [1.3, 1.6]. Объектом управления является вращающийся вал (рис. 1.5), нагруженный внешним моментом. Целью управления является обес- печение поворота вала на угол, близкий к углу поворота задающей оси, который может меняться за- ранее непредвиденным образом. При этом не допускается, чтобы на возможность поворота задаю- щей оси существенно влияло на- личие момента, противодействую- щего повороту вала (в противном случае можно было бы просто связать задающую ось с валом ки- нематической связью). Для решения задачи управле- ния строится автоматическая си- стема с обратной связью. Элект- Рис. 1.5 родвигатель передает на вал через редуктор управляющее воздействие — вращающий момент. Угол поворота вала изме- ряется с помощью датчика, вырабатывающего пропорциональное ему напряжение. Другой датчик**) вырабатывает напряжение, *) Несколько более подробное описание гидравлического двигателя (сер- вомотора) дано в гл. 4 § 5. **) Зачастую используется только один датчик, непосредственно выраба- тывающий напряжение, пропорциональное разности углов поворота вала и задающей оси (относительному углу поворота)»
16 ГЛ. 1. ОСНОВНЫЕ ПОНЯТИЯ пропорциональное углу поворота задающей оси. Разность между этими напряжениями характеризует ошибку управления, т. е. несоответствие между углами поворота вала и задающей оси. Она усиливается по уровню и подается через усилитель мощности на исполнительный двигатель. Функционирование систе- мы построено на простом принципе управления с обратной связью по ошибке: если ошибка положительна (угол поворота оси больше угла поворота вала), то к валу прикладывается момент, ускоряю- щий его вращение в необходимую" сторону, и вал начинает «дого- нять» задающую ось; если ошибка отрицательна, то к валу при- кладывается момент противоположного знака, и вал тормозится. В описанной простейшей схеме функции вычислительного уст- ройства сводятся к вычитанию сигналов двух датчиков и умноже- нию разности на постоянный коэффициент—коэффициент усиле- ния усилителя напряжения. Как мы убедимся в дальнейшем (гл. 3, § 7), для обеспечения высокого качества управления (малости ошибки) приходится усложнять эти функции, однако, как правило, закон управления остается таким, что он легко реализуется с помощью простых аналоговых ВУ. □ Пример 2. Управление движени- ем промышленного робота [1.2, 1.5]. Промышленный робот можно рас- сматривать как Систему, состоящую из манипуляционного механизма и блоков управления. Манипуляцион- ный механизм представляет собой конструкцию, предназначенную для Рис. 1.6 рабочей зоны. На рис. возможных компоновок внутри цилиндрической перемещения и ориентации схвата или инструмента в любую точку 1.6 схематически представлена одна из механизма, обеспечивающая перемещение рабочей зоны. С помощью двигателей можно поворачивать вертикальную колонну, поднимать или опускать каретку с балкой— «рукой робота», выдвигать или вдвигать «руку», осуществлять поворот схвата. В отличие от предшествующего примера здесь мы сталкиваемся с задачей управления сложным пространственным движением, при- чем это движение должно определиться перемещением (поступатель- ным или вращательным) звеньев механизма относительно друг друга и неподвижного основания. Отсюда вытекает необходимость и целесообразность более сложной (и в принципиальном, и в тех- ническом отношении) системы управления, использующей в каче- стве блока ПИ управляющую цифровую ЭВМ. Общую схему функ- ционирования системы можно описать следующим образом. От оп- тических датчиков (системы «технического зрения робота») посту- пает информация о координатах и ориентации детали, которая
§ 4. ПРОЕКТИРОВАНИЕ И ТЕОРИЯ 17 должна быть взята охватом робота. В памяти ЭВМ хранится ин- формация об исходной пространственной ориентации звеньев мани- пуляционного механизма, а также его динамических свойствах и расположении возможных препятствий внутри рабочей зоны. С уче- том этой информации по специальной программе в ЭВМ вычисля- ются требуемые перемещения и углы поворота по различным сте- пеням подвижности механизма. Результаты вычислений с помощью ЦАП преобразуются в аналоговые электрические сигналы, переда- ваемые в блоки управления звеньями. Каждый из этих блоков мо- жет работать по той же схеме, что и описанная выше электромеха- ническая следящая система. Различие заключается лишь в том, что сигнал на требуемое изменение положения поступает не от датчика положения задающей оси, а от управляющей ЭВМ*). Описанная общая схема разнообразным образом варьируется при создании реальных промышленных роботов и может служить прототипом любых достаточно сложных САУ, где центральное вы- числительное устройство осуществляет «командные» функции по отношению к более простым, локальным системам. □ § 4. Проектирование и теория Наметим основные задачи, возникающие при проектировании систем автоматического управления. а. Формулировка технического задания, в котором должно быть указано, какими процессами требуется управлять, каковы цели уп- равления и в каких условиях должно осуществляться управление. б. Выяснение возможностей воздействия на управляемые про- цессы и прогноз внешних возмущений. в. Оценка требуемой мощности исполнительных устройств, вы- бор типа ИУ и источников питания. г. Оценка возможностей получения текущей информации и вы- бор датчиков. д. Построение законов управления (правил преобразования ин- формации). е. Выбор типа преобразователя информации. ж. Программирование или схемная реализация блока ПИ, реа- лизующего законы управления. з. Компоновка системы в целом. Подчеркнем, что в настоящее время проектирование самих, тех- нических средств все реже входит в непосредственный круг обя- занностей инженера-проектировщика САУ. Обычно он ориентиру- ется на серийно выпускаемые промышленностью блоки. Главная же его работа состоит в обеспечении взаимосвязи технических средств и в подчинении системы общим целям. *) ЭСС, осуществляющие управление поступательно движущимися звень- ями, отличается лишь кинематическими связями. А, А. Первозвааский
18 ГЛ. 1. ОСНОВНЫЕ ПОНЯТИЯ При этом совершенно особую роль играет задача построения законов управления, которая и является основной проблемой общей теории автоматического управления, изучаемой в данном курсе. Причина такого особого внимания заключается не только в важ- ности задачи, но и в существовании общего пути ее решения. Этот путь заключается в использовании математического описания, мате- матической модели как самого объекта, так и функциональных бло- ков системы управления, позволяющих прогнозировать поведение объекта, возможность достижения поставленных целей при различ- ных внешних условиях. Более того, поскольку самые разнообразные реальные процессы могут быть описаны в рамках одних и тех же математических структур (алгебраических, дифференциальных, ин- тегральных уравнений), общая теория может оперировать не с конк- ретными техническими описаниями, а с классами математических моделей. Это обстоятельство придает теории внешний облик мате- матической дисциплины. Однако по своему содержанию и направ- ленности теория автоматического управления — техническая наука. Техническое содержание проявляется при выборе типа изучае- мых общих математических моделей, но главным образом —при приложении и трактовке математических результатов. Во-первых, при построении системы управления конкретным объектом необходимо исходить именно из его модели, которая хотя и выбирается как частный вариант общей модели, но, как правило, обладает специфическими особенностями. Во-вторых, любая модель лишь приближенно отражает свойства реального объекта, позволяет лишь приближенно прогнозировать его реакцию на воздействия. Следовательно, важно проверять лю- бые законы управления, формально получаемые с помощью модели, на то, не приведут ли такие даже малые неточности к существен- ному изменению управляемых процессов. В-третьих, чисто математическое исследование может привести к результату, что не существует никакого закона управления, при котором удовлетворяются заданные технические условия. Инженер должен, однако, помнить, что этот вывод относителен: ведь расчет проводился при уже выбранном комплексе датчиков и исполнитель- ных устройств. Изменение этого комплекса (использование новых датчиков и ИУ) может привести и к изменению полученных выводов. Короче говоря, при технических приложениях исходными явля- ются не уравнения, а реальный объект и реально используемые тех- нические средства. Это обстоятельство неоднократно будет подчер- киваться в предстоящем курсе. Изучающий его должен обращать внимание не только на математические утверждения, но и на осо- бенности их конкретного приложения. Примеры таких приложений не менее важны, чем теоремы!
ГЛАВА 2 ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ § 1. Описание элементов 1.1. Уравнения 'Элементов. Объекты и системы управления со- стоят из элементов, имеющих различную природу. Описание каж- дого элемента обычно дается на языке соответствующей научной дисциплины (механики, электротехники, химической кинетики и т. д.). Для анализа их взаимодействия удобно перейти к единооб- разному, стандартному описанию. В инженерной практике наиболь- шее распространение получил следующий способ: а) каждый реальный элемент рассматривается как устройство, звено системы, в котором осуществляется преобразование одного процесса, называемого входным воздействием, в другой, называемый выходной реакцией, или просто преобразование «.вход-выход»: б) взаимодействие между звеньями задается путем описания связей между их входами и выходами, определяющих структуру системы. Приступим к изучению свойств отдельных звеньев. Универсальным языком теоретического естествознания, служа- щим для математического моделирования взаимосвязей процессов в природе и технике, является язык уравнений — алгебраических и, в особенности, дифференциальных. Введем основное предположе- ние: для описания преобразования «вход-выход», осуществляемого любым звеном, может быть использовано линейное дифференцйаль- ное уравнение с постоянными коэффициентами: а” + • • • + аоУ = Pm —m + Pm-l ——- + ... ..+ Рор, al al .at al (1.1) где ac, ..., oc„; p0, ..., — постоянные величины, параметры звена, п и тп — целые числа, п > 0, тп>0, а для обозначения входа и вы- хода (независимо от их природы) применены символы v = v(t) и y==y(t). Число п называется порядком уравнения (1.1) (порядком эвена) *). *) Запись (1.1) предполагает существование соответствующих производ- ных функций v(t), y(t) в обычном или обобщенном (см. ниже) смысле,- 2*
20 ГЛ. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ Уравнение (1.1) удобно записывать в сокращенной, оператор- ной форме [2.5]. Введем оператор дифференцирования D, обладающий тем свой- ством, что умножение на D эквивалентно дифференцированию по времени, т. е. для любой функции /(4): D/Д ' — di Повторное умножение эквивалентно повторному дифференци- рованию D(D/) Д D2/А-^-4» \ i Г CSSS . * SSS3 и вообще для любого целого к > 0 d'va^I. ‘ = dtk С использованием операторных обозначений уравнение (1.1) запи- сывается в виде anD”y+an_1Dn-1y + ... + aoy^fimbmv+$m-lDm~lv+ ... +роу (1.2) или, еще короче, a(D)p==P(D)p, (1.3) где введены многочлены от оператора дифференцирования а (®) <xnDn + an_.]Dn + ... 4- a0, • (1-4) ₽ (D) A ₽mDm + + ... + ptt. Рассмотрим ряд простых примеров приведения описания раз- личных физических элементов к стандартному. Пример 1.1. Напряжение на входе усилителя (рис. 2.1) обыч- но обозначают мВ1С(4), напряжение на выходе — пвык( 4), а связь между ними задают в виде П'вы1-(4) ~ kum(t). (1.5) В стандартных обозначениях полагаем у(4)Дм. вх (0t У (4) А ^ВЫХ (0> так что р(4) = Ь(4). (1.6) Это частный случай уравнения (1.1) при m — n = 0, a0 = l, р0 =* к. О
§ 1. ОПИСАНИЕ ЭЛЕМЕНТОВ 21 Пример 1.2. Уравнение вращающегося вала обычно записывают в виде /^ = от(0, • (1-7) тде w(Z) — угловая скорость, m(t) — момент действующих сил, ] — момент инерции. Это уравнение определяет связь входного воздей- ствия m(t) с выходом Полагая га(0Дот(0, у(£)Д<о(£),; J = а4, можем переписать (1.7) в виде a1Dy(t) = ra(0, (1.8) что соответствует (1.1) при п = 1, т = 0, а0 = 0, = 1. Если считать входным воздействием движущий момент отд(0, а момент сопротивления считать пропорциональным со(0, то уравнение- +Ь«>(0 = тд(г) (1.9) опишет связь «вход-выход» в форме (1.1) при = га=1, т = 0, «1 = J, а0 = Ь, = 1. О Пример 1.3. Рассмотрим традиционную модель теории колеба- ний: груз массы т связан с основанием с помощью пружины жест- кости с и демпфера, создающего вязкое трение и характеризуемого коэффициентом b (рис. 2.2). Пусть, входным воздействием является сила F(t), приложенная к грузу, а выходом будем считать его перемещение y(t) относительно положения, в котором пружина не деформирована. Тогда уравнение движения традиционной форме, имеет вид m^+b± + cy(t)^F{t)t а стандартная запись вида (1.2) (a2D2 + a,D + «„) у (0 = га(0 получится, если положить v(t) = F(t), сс0 = с, а, = 6, а2 = от, причем га = 2, от = 0, Ро = 1. В рамках той же модели можно описать и пусть сила отсутствует, а входным воздействием является кинема- тическое перемещение основания, которое сразу обозначим v(t). Тогда уравнение движения, от^ + 6^-(у —га) + с(у —га) = 0 (1.12) записываемое в (10,1) т ь (1.11) с 77777777777777) Рис. 2.2
22 ГЛ. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ переписывается в операторном виде (1.1) (a2D2 + aiD + ao)z/(f) = (^D + Wy(f), (1.13) где кроме ранее введенных обозначений параметров введены также Ро = с, => Ъ. О 1.2. Передаточные функции. Наряду с операторной записью диф- ференциального уравнения (1.1) в виде (1.3) будем широко ис- пользовать еще более компактную: y(t)^^V(t)^H{D)v(t)t (1.14) где Н(D) называется операторной передаточной функцией (п. ф.) или оператором звена. Формально Я(Ь) можно рассматривать как дробно-рациональную функцию от оператора D, отношение двух многочленов от D: я<п>-гда- которые условимся выписывать, не производя возможных сокраще- ний. Запись (1.14) является лишь символической и не дает реше- ния дифференциального уравнения (1.3) относительно выходной переменной y(t), поскольку не определено, какой смысл имеет де- ление на операторный многочлен a(D). Выяснить этот смысл помогают правила операционного исчис- ления, основанного на использовании преобразования Лапласа*). Напомним, что преобразованием по Лапласу функции f(t) (ее .S’-образом) называется функция F(р) комплексной переменной р, вычисляемая как интеграл F(p}~ J f(t)e~ptdt AS? {f(t)}. (1.16) о По заданной F(p) может быть однозначно восстановлена функция /(1), называемая в этом случае оригиналом F{p) (прообразом), если f(t) && 0 при t < 0. Использование преобразования Лапласа для изучения диффе- ренциальных уравнений основывается на простом утверждении: 2'{Df(t))—p2,{f(t)} — pF(p), (1.17) если /(0) = 0. Из него сразу следует, что ^’{D7(0) = pkS’{/(Z)) = p',F(p), *>0, (1.18) ^{A\D)f(t)}TA(p)^{Ht)} = A(p)F(p) (1.19) для любого операторного многочлена степени к, если равны нулю значения /(1) и ее производных вплоть до (к - 1)-й* **). ♦) Далее предполагается, что читатель знаком с операционным исчисле- нием. В противном случае можно получить необходимый минимум сведений из Приложения 1. **) Соответствующие формулы для ненулевых значений более громоздки и даны в Приложении 1.
§ 1. ОПИСАНИЕ ЭЛЕМЕНТОВ Применяя правило (1.19) к уравнению (1.3), получим где а(р)У(р)=»Р(рП(р), У(р)=<?{р(1)}, V(p)=<£Mi)}; (1.20) при этом предполагается, что равны нулю у(0), v(0) в начальные значения производных y(t), v(t) вплоть до (п — 1)-й и (пг — 1)-й -соответственно. Подчеркнем, что а(р), (5 (р) — обычные, а не опе- раторные многочлены, функции комплексной переменной р. Поэто- му операция деления на а(р) имеет обычный смысл, так что У(р) =£14 V(p). а (р) (1.21) Учитывая определение (1.15), приходим к основной формуле У(р) = Я(р)У(р). (1.22) Вывод: S-образы входа и выхода при нулевых начальных условиях связаны между собой коэффициентом, зависящим от пе- ременной р. Этот коэффициент называется комплексной переда- i точной функцией (п. ф.) преобразования «вход-выход» и нахо-, дится заменой оператора дифференцирования D в операторной п.ф. //(D) на комплексную переменную р. 1.3. Весовые функции. Вторым замечательным свойством преоб- разования Лапласа является следующее утверждение (теорема -о -свертке): - Я (р) V (р) = S J h (т) v (t —- т) dx L (1.23) где функция h(t), t>0, является оригиналом п.ф. Н(р). Если h(t) вычислена, то из (1.22), (1.23) и однозначности восстановления оригинала y(t) по ее S’-образу У(р) следует у (t) = j h (т) v (t — т) dx. (1.24) Функция /г (О называется весовой функцией преобразования «вход- выход», поскольку с ее помощью взвешиваются значения входной переменной в «прошлом», в моменты t — х, для того чтобы, сумми- руясь, сформировать значение выхода в текущий момент t. Фор- мула (1.24) дает явное выражение связи входного воздействия с выходной реакцией, которая формально записывалась в виде y(i) = //(D)n(i). Иначе говоря, (1.24) расшифровывает смысл умножения функции v(t) на дробно-рациональную функцию //(D) от оператора диф- ференцирования D (при принятом выше соглашении о нулевых начальных значениях!). С помощью (1.24) несложно рассчитать реакцию на любое заданное входное воздействие,
24 ГЛ. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ Особо выделим случай, когда вход изменяется от нулевого на- чального значения скачком на 1: (О, f<0, ^> = {1, i>0, (1.25) Такую разрывную функцию принято называть функцией единич- ного скачка (функцией Хевисайда) и обозначать 1(f). Тайл иц в 1.1 • № Наименование Уравнение Передаточрая функция 1 2 Идеальный усилитель Интегратор y(t) — kv(t) Dy(l) = v(t) k 1 P 3 Апериодическое звено (TD-y = T>0 1 rp H-1 4 Колебательное звено (Г№ + 2£ГО + 1) y(t) = == "W T > 0, 0 < g < 1 i'2p2 -Ь2'7’р+'1 Явная связь «вход-выход» № Весовая функция Л((), О Переходная функция я(1), t>0 1 2 3 4 1 *6 (t) 1(0 1е~7 Т е И («) -2 i-e * у (z) = ku (О ') === j v (T) й’т о i т I f T - te v (t — т)Л Г е t У о X sin Vl-?t Vi-? cos--у---i-f- I . Vi-V ’ ---S—...sin-I------2- f /1-Ч2 T J Т Vi — s2 . v~ X |<? SiD—-_- 1 — е т 1 Т о X v (t — т) dr Реакция звена на воздействие (1.25) называется его переходной функцией n(f), В силу (1.24) она является интегралом от весовой функции > Л (t) == J h (?) d^ Q (1,26)
§ 1. ОПИСАНИЕ ЭЛЕМЕНТОВ 25 лак что Dn(i) = fc(«). (1.27) п П(р)А^{л(0}= ~Н{р). (1.28) Подведем итоги-, звено, описываемое дифференциальным урав- нением a(D)y(f) = ?(D)p(f), может быть также описано путем задания одной из четырех ха- рактеристик: Я (D) = — операторная передаточная функция (п. ф.)’, II (р) = —— комплексная п. ф. * *), <х(р) ” ' h(t)—весовая функция, n(t)—переходная функция, любая из которых полностью характеризует функционирование звена как преобразования «вход-выход» при нулевых начальных условиях. > . ' , .1.4. Типовые звенья. В табл. 1.1 приведены характеристики для ряда звеньев, которые принято считать типовыми и для которых имеются специальные традиционные . наименования. Происхождение найме- j1' новаций ясно из вида весовой функции и явного выражения связи «вход-вы- ход», записанного согласно (1.24) (сло- во «апериодическое» эквивалентно сло- ву «неколебательное»). Нуждается в комментарии лишь описание простей- шего звена —- идеального усилителя. Во-первых, этот термин используется о д при Любых к, а не обязательно при рис. 2.3 Л>1, как следовало бы по прямому смыслу слова «усилитель». Во-вторых, соответствующая весовая функция не является обычной, она именуется делъта-функцией Ди- рака, или короче, 6-функцией и относится к классу так называемых обобщенных функций. Строгая теория таких функций сложна, но упрощенно можно представлять 6-функцию как предел при Д О прямоугольного импульса (рис. 2.3) шириной Д и высотой 1/Д. По- этому ее часто называют еще и идеальным импульсом. Согласно общей формуле (1.24) для идеального усилителя при k = 1 имеем t У (t) = J 6(т) p(t — x)dx, t>0. (1.29) - о , < *) Здчастую эпитеты «операторная» или «комплексная» в дальнейшем бу- дут опускаться, если из вида формулы ясно, о какой п. ф. идет речь.
ГЛ. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ С другой стороны, такой «усилитель» просто осуществляет тожде- ственное преобразование входа в выход у(«) = р(0- Следовательно, верна формула t v (i) = J 6 (t) v (t — т) dx,- (1.30} о которую можно рассматривать как строгое определение 6-функции. Можно запомнить, что ^-функция есть весовая функция тожде- ственного преобразования*). Вычисление остальных весовых и передаточных функций с по- мощью таблицы, данной в Приложении 1, является полезным уп- ражнением. Типичные графики даны на рис. 2.4, а, б, в. *) Математически нестрогим является рассмотрение исходного уравнения (1.1) без дополнительных оговорок, если v(t) не является m раз дифференци- руемой функцией. Формальных неприятностей можно избежать, если считать, что фигурирующие в (1.1) производные должны пониматься как обобщенные- в смысле теории обобщенных функций (детальное обсуждение этих проблем применительно к рассматриваемым задачам дано в [2.4]),
§ 2. ОПИСАНИЕ СИСТЕМ 27 § 2. Описание систем 2.1. Структура и структурная схема. Перейдем к описанию си- стем, состоящих из взаимосвязанных звеньев. Для единообразия вход каждого i-ro звена будем обозначать t>,(£), выход y((t) и счи- тать, что для него задано описание в виде дифференциального уравнения а,(ОЫ0=МОЫ0 (2.1)' или в виде формального операторного соотношения (2.2) Взаимодействие между звеньями будем характеризовать соответ- ствием между их входами и выходами. Вход одного звена может совпадать с выходом другого, например Vz(t) = yl (i), или являться суммой (разностью) выходов нескольких других звеньев, а также внешних для системы в целом входных воздей- ствий, например vdt)*=ydt)~ ydt)+ г/з(г) + щ(О. где r4(i) обозначает внешнее воздействие, цриложенное к 4-му звену. В общем случае для i-ro звена (0 = 2J Ю (0 + »i (t), (2.3) тде Ко —числа, равные 0, если связь входа i-ro звена с выходом j-го отсутствует, равные 1, если связь положительна, и —1, если она отрицательна. Уравнения звеньев (2.1) и уравнения связей (2.3) дают полное описание системы. Если «плотность» связей не слишком велика (мало число нену- левых 7«), то удобно использовать наглядное описание с помощью структурных схем *). На схеме каждое звено изображается прямо- угольником,' входное воздействие — стрелкой, направленной в него, выходное — стрелкой, направленной от него (рис. 2.5, а). Внутри прямоугольника ставят либо номер звена (если хотят отобразить только структуру связей), либо соответствующую ему п.ф. (если желательно дать полное описание). Операция суммирования изобра- жается кружком, причем при отрицательной связи около стрелки, изображающей вычитаемое, ставится знак минус (рис. 2.5, б). *) Читатели, знакомые с теорией графов, легко узнают в структурных схе- мах вариант стандартного языка этой теории.
28 ГЛ- 2. операторный метод анализа линейных систем Если одно и то же воздействие прилагается к разным звеньям, то изображающая его стрелка может разветвляться (рис. 2.5, в). Следует отчетливо сознавать, что любая структурная схема, как бы запутана она ни была, отражает простейшие алгебраические связи типа (2.3). Рис. 2.6 Пример 2.1. Структурная схема, представленная на рис. 2.6, эквивалентна следующим уравнениям структурных связей: + v2 = yi + ya, v3 = yl-y2. о (2.4) Пример 2.2. Дадим формализованное структурное описание си- стемы, состоящей из усилителя, двигателя постоянного тока с не- зависимым возбуждением и вала нагрузки, связанного с ротором двигателя через редуктор. В традиционном для электромеханики виде система изображена на рис. 2.7. Ее можна рассматривать как состоящую из пяти физических элементов, один из которых имеет «электрическую» природу (усилитель), два — «механическую» (ре- дуктор и вал нагрузки), а -один — смешанную «электромеханиче- скую» (двигатель). Впрочем, в нем также можно выделить элект- рическую часть (цепь питания, включающая обмотку ротора и на- зываемая также цепью якоря) и механическую (ротор как враща- ющееся тело).
§ 2. ОПИСАНИЕ СИСТЕМ 29 Между элементами имеются взаимосвязи: а) выходное напряжение усилителя является напряжением пи- тания двигателя а выходное сопротивление усилителя вклю- чено последовательно с сопротивлением обмотки ротора; б) ток цепи якоря is(t) вызывает движущий момент ma(t) электромагнитных сил, приложенных к ротору; в) при вращении ротора в магнитном поле в его обмотке наво- дится электродвижущая сила ec(t) (противо-ЭДС); г) через редуктор передается момент тяв на вал нагрузки и обратно — момент противодействия твв. Запишем первоначально уравнения отдельных элементов, ис- пользуя традиционные физические обозначения и обычную идеа- лизацию. Уравнение усилителя, связывающее входное и выходное на- пряжение: ZkyHgx. (2.5) Уравнение цепи якоря (с учетом индуктивности цепи и проти- во-ЭДС) : LHDi0 = ид ес, (2.6) при этом в /?„ включено выходное сопротивление усилителя. Уравнение движения , ротора (без учета механического сопро- тивления) : /дОыд /Ид —~ <вд ~ D<p„, (2.7) где фд — угол поворота ротора двигателя, твв— момент проти- водействия. Уравнение вала нагрузки: JuD<o = шдн — тн, Вф = со (2.8) (ф — угол поворота вала, со — его угловая скорость, тав — движущий момент на валу). Уравнение редуктора' запишем в двух вариантах: а) для абсолютно жесткого редуктора ф = J_ фд1 тдн = гтпн> (2.9) где г — коэффициент редукции; б) для редуктора, обладающего конечной жесткостью с *), / 1 \ 1 = <Ч — <Рд — <РЬ тпн = — т№, (2.10) Кроме того, с учетом указанных физических взаимодействий имеем ид = ивыж, (2.11) ес-= с»(Од, (2.12) = cMi„, (2.13) ♦) Жесткость приведена к выходной ступени.
30 ГЛ. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ где се, см —константы (при постоянном токе в обмотке возбужде- ния, создающей магнитное поле). Структурная схема, соответствующая соотношениям (2.5) —(2.8) и (2.10) — (2.13), представлена на рис. 2.8, а. Рис. 2.8 Если же принято описание редуктора как абсолютно жесткого, т. е. используются соотношения (2.9) вместо (2.10), то невозможно непосредственное составление структурной схемы. Предварительно йз уравнений (2.7) —(2.9) следует исключить неизвестные пгая, тедн, записав уравнение движения ротора, редуктора и вала как одного физического элемента — механической системы с одной степенью свободы JnpDa) = гта — та, Dtp = со, <р = — фд, (2.14) где /Пр = г2/д + Jц — приведенный момент инерции. Структурная схема, соответствующая (2.5), (2.6), (2.11) —(2.14), показана на рис. 2.8,6. О Существенно отметить, что представленные на структурной схе- ме звенья не обязательно сопоставляются с каким-либо одним фи- зическим элементом: один элемент может быть представлен многи- ми звеньями, а часть звеньев отражает физические взаимодействия между элементами, отличающиеся от структурных связей между звеньями. Структурная схема — это отражение математического описания системы, лишь частично сохраняющее «.следы» исходного разделе- ния на физические элементы. Описание и структурная схема могут быть различными для од- ной и той же системы. 2.2. Соотношения «вход-выход». При изучении систем зачастую представляет интерес только знание связи между внешними входа- ми и выходами звеньев. Эти связи проще всего устанавливаются,
§ 2. ОПИСАНИЕ СИСТЕМ 31 если от исходных уравнений (2.1), (2.3) перейти к алгебраическим уравнениям, связывающим S’-образы переменных. При нулевых начальных условиях получаем: (2.15) ^(р) = 2т^(Р)+ W (2.16) 3 Это система линейных алгебраических уравнений, с помощью ко- торой можно любую неизвестную УДр) выразить через S’-образы внешних входов УДр). Продемонстрируем сначала процедуру исключения на примере. Пример 2.3. Вернемся к системе, описанной в П.2.2, и попыта- емся найти явную зависимость угла поворота вала ф(/) от внешних входов Перепишем уравнения в S’-образах (исполь- зуя для них соответствующие «большие» буквы и для простоты опуская аргумент р). Получаем из £2.6), (2.12), (2.7) . (L„p + Ня)1я = куиш — серФд, (2.17) а из (2.7), (2.8), (2.13) /дРаФд = Ск1я---г~с(~7~Фд — Ф^« (2.18) /нр2Ф = с ^-|~ФД —Ф^ — Мн. (2.19) Исключая сначала 1„ с помощью (2.17), приходим к системе двух уравнений относительно Фд, Ф: /дР2Фд == Д Д СерФд] — С фд — ф\; (2.20) Лр2ф = ^4-Фд-ф)-мн, откуда находим окончательное выражение в виде Ф = Яиф(р)С7ет + Яот,(р)Л/а, (2.21) где введены п. ф, НЯ1((р), от внешних входов w„, та к вы- ходу ф. Пропуская выкладки, приведем для них формулы в виде £ р р ( (уар + t) + уи2 (2> + + j.2^2 + i J , (2.22) н hu ——r(r^a+1W+1) + ^M p[?’m1p(?’o/ + 1)(?’sp+1)+WHa/'+O+^+l]’ (2.23)
32 ГЛ. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ где введены обозначения JJR„ ПЧ Ц н 2 М1 — е м 'Ля m __ mi _ At ——g, 1 э - , I 0 - с я сесмг я Тм2 = дя С С Г2 ' е м А’м = 7; С гсе * Ь = —. / М2 Если пренебречь нежесткостью кинематической передачи (с -* «>, То -> 0), то придем к упрощенным выражениям: Лс rr —/см(Тяр + 1) Яиф (р) = р (ГэР + + J J Нт<9(р) = р17’мр(Гэр + 1) +1]’ (2.24)' где Тм = Тм1 + Тм4. Если, более того, пренебречь самоиндукцией якорной цепи (£я->0), то получим передаточную функцию совсем простого вида к к Н^{р) == ^(Гмр + 1) ” = “ Р (Тмр + 1)• <2-25) Отметим также, что формуле (2.21) соответствует простая струк- турная схема, представленная на рис. 2.9. О В примере мы не переходим от «естественных» обозначений входов и выходов к единообразным. Для более сложных систем это следует сделать, а для исключения неизвестных исполь- зовать стандартные формулы, вытека- ющие из правила Крамера для реше- Рис. 2.9 ния систем алгебраических уравнений. Запишем их в общем виде. Пусть общее число звеньев равно N. Подставив Vt из (2.16) в (2.15), по- лучим систему N уравнений N _ Yi “ Pt (p) Pi (p) i = 1, • * * ;, N# (2.26) 3=1 или i = i., ...ж «=1 (2.27) где введены обозначения [ »i(p) — ₽i(P)Yiis I — Pi (p) Yi;» i = j, (2.28)
§ 2. ОПИСАНИЕ СИСТЕМ 33 Применяя к (2.27) правило Крамера, находим: 2 ма W № Ъ <Р) Л(Р) где Д(р) — определитель системы *), (P)t (р) 'Л (2.29) (?) LN2(p')fLNN(p) а Ма(р)— алгебраическое дополнение /-го элемента i-ro Пусть . Д (р) = det (2.30) ,столбца. ЯгДр)Д^Му(р)МР); тогда (2.29) запишется в виде У|(р)= 2Яу(р)й}(р). ;=1 (2.31) (2.32) Функции естественно называть п.ф. от /-го внешнего входа к i-му выходу. От (2.32) с использованием теоремы о свертке мож- но перейти к явному соотношению W t У г (0 = 2 J hij (т) Vj (t — <г) dxt (2.33) j 1 0 где Р.Дт) —весовые функции, соответствующие Я«(р)\ Формула (2.33) выражает принцип суперпозиции (наложения): реакция ли- нейной системы по любому выходу является суммой реакций на каждое из внешних воздействий по отдельности. В П.2.3 мы убеди- лись, в частности, что изменение угла поворота вала является сум- мой изменений (реакций), вызванных двумя внешними воздействия- ми—входным напряжением и моментом нагрузки**). Все п. ф. Hij(p) являются дробно-рациональными функциями, отношениями двух многочленов, причем многочлен в знаменателе Д(р) —один и тот же для всех H(j(p)- Его принято называть характеристическим многочленом системы. Подчеркнем, что знаменатели являются оди- наковыми и совпадают с Д(р), только если при вычислении всех /7ц(р) не производилось сокращение общих сомножителей в числи- теле и знаменателе. В ряде практических случаев представляет интерес только один из выходов или какая-либо одна комбинация выходов (сумма, раз- ность), рассматриваемая как внешний выход системы y(t). Оче- *) Всюду далее предполагается, что А (у) не равен тождественно нулю. **) В качестве упражнения полезно получить формулу (2.21) общим мето- дом. 3 А, а, Первозванекий
34 ГЛ. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ видно, что для S’-образа общего выхода можно записать соотноше- ние вида (2.34) у(р) = 2 Hi(p)VAp)t • 3=1 где Hjip'i — п. ф. преобразование от каждого внешнего входа к внешнему выходу. Также очевидно, что все Hj(p) имеют одина- ковый знаменатель, совпадающий с характеристическим многочле- ном, если не произошло сокращение. Обозначим через М/0 числители Н,(р). Тогда (2.34) перепи- . шется в виде: (2.35) A(P)K(P) = SMJ>) W- j От этого соотйошения, связывающего S’-образы, естественно перей- ти к дифференциальному уравнению в операторной форме *) A(D)y(t) = S₽j(D)^(i). (2.36) з . Приведем простой, но поучительный пример, демонстрирующий осо- бенности такого перехода от исходного описания к одно- му дифференциальному урав- нению. Пример 2.4. Пусть име- ется система (рис. состоящая из дйух звеньев, описываемых уравнениями (D + l)^1(f) = (D-l)r1(Z), (D-l)y2(i)=p2(Z), г>(О=ц(«) Р-1 1 У^-Ур.) Л+1 J9-1 Рис. 2.10 2.10), (2.37) а связь между ними задана условием v2(t) = yt(t). (2.38) Будем считать щ(1) внешним входом системы, щ==г, a y2(t) — y— внешним выходом. Переходя к S’-образам и последовательно исклю- чая «внутренние» переменные, получим т W- YM0»- г,И, так что Казалось бы, что можно теперь записать и дифференциальное уравнение (D + l)y(t) = i'(t), (2.39) .♦) Обоснование дано в [2.5].
§ 2. ОПИСАНИЕ СИСТЕМ 35 однако это неверно! В ходе выкладок было произведено сокраще- ние сомножителя (р — 1), и знаменатель и. ф. «внешний вход — внешний выход» не совпадает с характеристическим многочленом, который равен Л(р) = (р-1)(р + 1). Правильное уравнение, составленное согласно общему правилу (2.36), имеет вид , (D2-l)y(t) = (D-l)n(0. (2.40) Оно 2-го, а не 1-го порядка, и, как мы далее убедимся, его реше- ние при ненулевых начальных условиях резко отличается от реше- ния уравнения (2.39). О 2.3. Структурные представления. Для системы с одним внешним входом и одним внешним выходом описанная выше процедура мо- жет быть интерпретирована как способ «свертывания» сложной си- стемы в одно звено с эквивалентными свойствами. Интересна и обратная процедура — переход от описания одного звена в виде a(D)y(0 = ₽(DW), (2.41) где a(D), ^(D)—произвольные многочлены степени п и т соот- ветственно, к эквивалентной системе, состоящей только из простых типовых звеньев. Теорема 2.1. Если выполнено условие строгой реализуемости п>т, (2.42) то звено, описываемое уравнением (2.41), эквивалентно системе, состоящей только из звеньев типа идеальных усилителей и интегра- торов и имеющей внешний вход v и внешний выход у. Доказательство. Перепишем (2.41) в виде a„D"p + a„_tD«-iy + ... + ад = fSnDni> + +•... + р0», (2.43) где Зй = 0 при к — п — m + 1, ..., п, если m < п. Без ограничения общности можно всегда считать an = 1 (в противном случае на этот коэффициент мож- но предварительно разделить обе части уравнения). Рассмотрим теперь систему п уравнений .= х2 + &1Р, Dx2 = х3 + b2v, .............. ... . .......... (2.44) Drn_i = хп + bn-tf, I)#,, - —OCqX| ОС 1Х2 — ... 0-п~— Ctn —Ьп& и покажем, что если xt, ..., хп являются решениями этой системы, то y = *i + M (2.45) совпадает с решением уравнения (2.43), при соответствующем подборе коэффи- ч*
36 гл. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ циентов &!, •••> 6П и начальных условий. Из (2.44) имеем последовательно: «1 — у — М, . = Dzi — btv = Dy — (bit? + ММ, Xi*=I)X2-b2v==Wy~- (b2v+ bj)v + pnD2i>), ' xn = Dzr„_i — bn_,v =,,,== Dn""ly — (6„-ii> + ... + btDn-2v 4- pnDn->y). Подставив эти значения в последнее уравнение системы (2.46), получим D«y—(6„_1D4- +&iDn-1 4-pnD")a = —аоу — aiDy — ,..— an-iDn-1y4- + «oPnp + <Xi(&i + pnD)u-f- 4" an-i(^n-i 4- ••• + 61D’1-24-PnDn~’)y< Очевидно, что оно совпадает с выражением (2.43), если коэффициенты bh Ьп Рис. 2.11 удовлетворяют системе уравнений 6j' == Pn— I ~ Ctn—lPra, a»-i6i 4- Ъ3 «= pn-2 — an-2pn, (2.47) ai^i 4" «262 4- 11, 4- bn = Po — aopn,
g 2. ОПИСАНИЕ СИСТЕМ 87 из которой все они легко вычисляются последовательно. Если начальные зна- чения у, v и их производных нулевые, то в силу (2.46) и начальные значения переменных xt, ..., хп также нулевые. В противном случае они могут быть вычислены по явным формулам (2.46).. Таким образом, доказана возможность рассматривать вместо исходного описания звена эквивалетное ему описание (2.44), (2.45). Однако последнее может быть представлено в виде 1—1 Vhi к — 1, *«ч и, (2.48) где новые переменные % подчиняются условиям Vh = ж*+1 + к = 1, »,., п — 1, ' — o*o*^i ~~~ - ос»—-j- bnvt (2.49) У = Ж1 + f>n». Теперь уравнение (2.43) можно трактовать как уравнения п одинаковых иде- альных интегрирующих звеньев с входами vh и выходами хъ, а (2.49) — как уравнения связей, частично осуществляемых через идеальные усилители. Та- ким образом, доказательство завершено. Структурная схема системы представ- лена на рис. 2.11,а, где использованы коэффициенты bit .bn, вычисляемые по уравениям (2.47). Подчеркнем также, что это представление не единственно воз- можное. В частности, на рис. 2.11, б представлена структурная схе- ма, состоящая только из интеграторов и усилителей, которая также эквивалентна исходному описанию (2.41). Проверка этого утверж- дения может быть полез- ным упражнением по ме- тоду исключения. 2.4. Электронная модель (аналоговый интегратор). Рассмотрим блок, состоя- щий из электронного уси- лителя, резисторов и кон- денсаторов, электрическая схема которого представ- лена на рис. 2.12. Выяс- - ним связь между напря- жениями u,, u2, .... ип и напряжением ив на выходе усилителя. Для этого составим уравнения цепей в силу законов Кирхгофа — Ома. В операторной записи они имеют вид: 1 d «в) === к == 1, »»•, и, ( 1 \ ... '.I (2'50> I о h C0D j (u uB) — i6, iB = i0 + ix + ,,. -J- in = =— uE, \ о / лв где через 7?в обозначено входное сопротивление усилителя. Кроме того, примем, что 14 (2.51), где — коэффициент усиления усилителя, к3 > 0.
38 ГЛ. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ После исключения «внутренних» переменных ie, ..., in, нв по- лучим n и = — 2 1Г ин< (2.52) k=i * ~~ + C0D + j-l2yf- + 7f- + jr- + Предположим далее, что коэффициент к~ очень велик и можно пренебречь*) слагаемыми порядка ку\ Тогда (2.52) переписывает- ся в простом виде: (Х.ьсоп)и = Таким образом, данный электронный блок может быть рассмотрен как система, преобразующая входы и1( п2, ..., ип в выход и согласно п (2.53) б с, —Р1 а. Пусть п = 1 Рис. 2.13 (один вход), Сй~ 0, Rt = Ra (рис. 2.13, а) . Тогда U = — Ui (операция инвертирования, изменения знака). б.Пу сть С’о = О, R„ = Ro, к = 1, ..., п (рис. 2.13, бу. Тогда п и = — S uk k=i (суммирование с инвертированием). в. Пусть п = 1, Со = О, /г, =^R0 (рис. 2.13, в). Тогда и — — кгии = R^Ri1 >0 (умножение на постоянный коэффициент и инвертирование). *) Обоснование такого пренебрежения дается ниже (S 5 и тл. 3).
§ 2. ОПИСАНИЕ СИСТЕМ 39 г. Пусть п = 1, Ro 1 = .0 (рис. 2.13, г). Тогда ы= — Т = ед>0 (операция интегрирования с умножением и инвертированием). Таким образом, если имеются усилители с очень большим коэф- фициентом усиления, называемые операционными, то можно соз- дать блоки, производящие ряд простых типовых операций*). Вспомнив теперь Т.2.1, приходим к важному практическому выво- ду: любому звену со строго реализуемой п.ф. можно сопоставить устройство, состоящее из описанных выше блоков, у которого вход- ное напряжение связано с выходным так же, как связаны между собой вход и выход звена. Это устройство называют электронной моделью или электронным аналоговым интегратором **). Суще- ственно, что структурным схемам, представленным на рис. 2.11, а, б, можно непосредственно сопоставить схему электрических соедине- ний блоков. В частности, блок-схема электронной модели, соответ- ствующая структурной схеме (рис. 2.11, б), представлена на рис. 2.14. При этом принято п = 3и предполагается, что а0, а»,-«а, Pi, р2 положительны, р3 = 0, а величины Re, Со (в соответствующих единицах измерения) равны единице. В модели используется всего п + 2 == 5 усилителей, причем три входят в блоки, выполняющие одновременно функции сумматоров и интеграторов, а два — в бло- ки-инверторы. *) Операционные усилители с ky = 105 4- 10е выпускаются промышленно- стью серийно. **) Электронная модель является основной частью (процессором) аналого- вых вычислительных машин (АВМ). Более детальные сведения об электрон- ном моделировании даны, например, в [2.2],
40, ГЛ. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ В заключение сделаем два замечания. Замечание 1. Электронные модели могут использоваться для исследовательских целей, в частности, для анализа процессов, про- исходящих в системах автоматического управления. При этом (а) собирается из стандартных блоков схема, соответствующая имею- щемуся математическому описанию САУ *), (б) от внешних источ- ников (генераторов) вводятся электрические сигналы, пропорцио- нальные внешним воздействиям, (в) производится запись (осцилло- графирование) выходных напряжений, пропорциональных изучае- мым процессам. С другой стороны, электронные модели можно применять и в качестве блоков преобразования информации в са- мих САУ. При этом на входы подаются сигналы от датчиков ин- формации, а с выходов снимаются управляющие сигналы. Тем самым имеется способ технической реализации любых законов уп- равления, для которых связь информационных и управляющих сигналов определена с помощью линейного дифференциального уравнения с постоянными коэффициентами. Это будет учитываться в следующей главе, где мы изучим возможности законов управле- ния этого типа. Замечание 2. В соответствии с Т.2.1 класс звеньев, которые могут моделироваться с помощью описанных выше устройств, огра- ничен формальным условием строгой реализуемости (степень чис- лителя п. ф. не превосходит степени знаменателя). Это обстоятель- ство оправдывает введенный термин. § 3. Устойчивость 3.1. Устойчивость звена по входу. Наличие Описания свойств звеньев и систем с помощью дифференциальных уравнений позво- ляет сделать ряд качественных выводов об особенностях их по- ведения. Наиболее важной характеристикой является свойство устой- чивости. Определение 1. Звено называется устойчивым по входу (осуществляющим устойчивое преобразование «вход-выход»), если при любом ограниченном входном воздействии p(t) и нулевых на- чальных условиях выходная реакция y(t) является ограниченной при любом конечном t > 0 и при t и называется неустойчивым по входу в противном случае. Об устойчивости по входу можно судить по свойствам весовой функции h(t). Теорема 3.1. Для того чтобы звено, описываемое уравнением a(D)i/(f)=P(D)i;(t), (3.1) *) При моделировании сложных систем можно пользоваться исходным описанием (2.1), (2.3), объединяя модели звеньев с помощью блоков, соответ- ствующих уравнениям связей.
§ 3. УСТОЙЧИВОСТЬ 41 было устойчивым по входу, необходимо и достаточно выполнение условия СО J | h (т) ] dx <Z оо, (3.2) о Доказательство. Согласно основной формуле (1.24) имеем t у (4) = J h (т) v (t — т) dx, t 0. (3.3) о Пусть v(t) —произвольная ограниченная функция, т. е. такая, что |г>(4)J sS cv < оо, 4^=0, (3.4) где с„ — некоторая константа. Тогда t t I У (О К У I h (Л 11 v U — T) I dx < Cv J I h (т) I dx < o o о Отсюда следует достаточность условия (3.2) для ограниченности выхода у (4), Для доказательства необходимости покажем, что найдется такая ограничен- ная функция v(t), что при нарушении (3.2) |у(4) | может стать сколь угодно большим числом. Примем v(4) такой, что 4 0, т > Т, 1’(Г~ т) “ { cBsign/j(T), х<Т, (ЗЛ) где Т — большое положительное число, а символ sign, читаемый «знак», вве- ден для обозначения функции, удовлетворяющей тождеству х signa: = |ж|« При воздействии (3.6) имеем |у(П1 =с„ т .. У h (т) о sign h (т) dx т = У | fe (т) | dx. о (3.7) Если условие (3,2) нарушено, то правая часть (3.7), а следовательно и | у (Т) |, при достаточно большом Т может оказаться больше любого наперед заданно- го числа. Если пользоваться Т.3.1 непосредственно, то для проверки ус- тойчивости придется вычислять весовую функцию, а затем прове- рять выполнение условия (3.2). Оказывается, что имеется прекрасная возможность обойти обе эти операции. Теорема 3.2. Для выполнения условия (3.2)' необходимо и до- статочно, чтобы передаточная функция была ограничена по модулю при любых значениях комплексной пе- ременной р с неотрицательной вещественной частью.
42 гл. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ Доказательство. Необходимость вытекает из определения весовой функции как оригинала для //(/>), т. е. Н (р) = J h (4) e~ptdt, (3.8) О и оценки | н (р) К J | e~pt 11 h (4) | dt = J e-ReP* I h (4) I dt < J I h (4) I dt. (3.9) о о 0 При этом использовано свойство экспоненциальной функции |e-pi| = |g-(Bep+i = g-.Be pt Rep>0, 4>0, (3.10) при стандартных обозначениях вещественной (Не р) и мнимой (Im р) части комплексного числа. Доказательство достаточности требует более детального анализа свойств Я(р) как дробно-рациональной функции и выяснения общего вида функции h (4). Обозначим Xv, v — 1, ..., п, корни многочлена а(р). Для простоты пред- положим, что все они различны. Тогда хорошо известно (см., например, [2.7]), что функция Я(р) представима в виде П(р)=₽М = Р(р) + У _A_, Cv = const, (3.11) а (р) Р — Xv где ]J(p) ts 0, если п > т, в противном случае ]J(p) — многочлен степени т — п (частное от деления ^(р) на а(р)). Ограниченность Н(р) при Re р 0 эквивалентна требованию, чтобы а) Г(р) — const, т. е. степень Щр) была не выше степени а(р); б) ReXv<0. Но тогда (см. таблицу S’-образов в Приложении 1) ft(4) = p6(4)4- 2 eveM (3.12) . ' v—1 И t J | h (т) 1 dt < о t n t ; IВ1J 6 (r) ar + 2 1 cv 1 f eRtAvTrfT = 0 V=1 0 = l?l+ 2 pvl(Re4-1(eReM-1). . V=1 так что r . - ( n , I I h (т) 1 dr < |BI + 2 1 Re M 1|cv|<°°- (3113) о ' V=1 В случае, когда имеются кратные полюсы, результат сохраняет силу, хотя выкладки и более громоздки.
§ 3. УСТОЙЧИВОСТЬ 43 Как следствие Т.3.2 можно сформулировать простой окончатель- ный результат. Критерий устойчивости по входу. Устойчивость по входу имеет место, если выполнены два условия: а) степень многочлена а(р) в знаменателе п.ф. Н(р) не меньше степени многочлена f}(p) в ее числителе (условие строгой реализуемости передаточной функции)-, б) многочлен а(р) (характеристический многочлен звена) не имеет других корней, кроме корней с отрицательными веществен- ными частями (условие устойчивости характеристического многочлена). В качестве приложения посмотрим, являются ли устойчивыми типовые звенья, описанные в табл. 1.1. Условие строгой реализуе- мости выполнено во всех случаях. Остается проверить корни а(р). 1. Идеальный усилитель: а(р)=1, и корней нет. 2. Интегратор: а(р)= р, и один вещественный корень Xt = 0. 3. Апериодическое звено: а(р) = Тр + 1, и один вещественный корень Xj = —Т~* < 0 при Т > 0. 4. Колебательное звено: а(р) = Г2р2 + 2gГр + 1, и имеются два комплексно-сопряженных корня Xi, 2 = Г-1 (—g ± iV 1 — g2), причем вещественная часть отрицательна (1 > g > 0, Т>0). Таким образом, все эти звенья являются устойчивыми по вхо- ду за исключением интегратора. Последнее ясно и из вида его переходной функции, которая неограниченно растет, хотя является реакцией на ограниченное воздействие l(t). 3. 2. Алгебраические критерии устойчивости. Акцентируем теперь то обстоятельство, что проверка условия устойчивости характери- стического многочлена не требует вычисления всех его корней, а лишь выяснения того, расположены ли они только в левой полу- плоскости комплексной переменной р. Нельзя ли установить этот факт, не находя корни? Ответ на этот вопрос положительный: еще с прошлого века из- вестно много эффективных методов проверки устойчивости много- членов*). . Прежде всего установим простое необходимое условие: Теорема 3.3 (критерий Стодолы). Если многочлен а(р) с а„>0 устойчив, то все его коэффициенты положительны. Доказательство. Используем разложение многочлена а(р) на про- стейшие вещественные двучлены и трехчлены. Каждому вещественному кор- ню Xv соответствует двучлен р — Xv, каждой паре комплецсносопряженных корней 6, ±i7v — трехчлен (р — 6v)24-y2. Если все X,< 0, ё, < 0, то ко- *) Алгебраическая проблема проверки условий устойчивости многочленов была впервые поставлена Максвеллом и привлекла внимание многих крупных математиков. Детальное и простое изложение этой проблемы содержится в книге [2.6].
44 ' ГЛ. 2. операторный метод анализа линейных систем эффициепты во всех двучленах и трехчленах положительны, а следовательно, положительны и коэффициенты в многочлене а (у), являющемся их произве- дением. Пример 3.1. Многочлен , «(р) = Д4 + 2р3 + р + 1 заведомо неустойчив, поскольку коэффициент а2 при рг равен нулю. О Выполнение условия Стодолы, к сожалению, не гарантирует устойчивости многочлена при любом п, хотя нетрудно проверить, что оно достаточно при и == 1 и га = 2. При больших га приходится использовать более сложные процедуры. По-видимому, наиболее удобен для применения вычислительной техники рекуррентный ал- горитм Рауса. Приведем его описание в готовой форме (доказатель- ство см., например, в [2.1, 2.6]) *). Процесс сводится к последова- тельному пересчету коэффициентов многочлена, и для его описа- ния удобно пользоваться символом алгола «:=», означающим «по- ложить равным». Алгоритм Рауса. Пусть заданы положительные коэффициенты 0*0) Oiij • • •) «п-1, Тогда, начиная с 7 = 1 до 7 = га —Г* **), 1) Рг = . (3.14) 2) Если pj < 0, то многочлен неустойчив. 3) Если р>>0, то перейти к следующему шагу и, начиная с1с ,Е==а 1, ’= ®2k+j-i р/Хгм-ь Ki :=0, I > га. (3.15) Если все рд>0, j = 1, .... га—1, то многочлен устойчив. ' Пример 3.2. Пусть исследуемый многочлен имеет вид а(р) = р-+5р4 + 9р3 + 10р2 +6р + 2. Тогда таблица вычислений по итерациям имеет вид***) 3 - 0 1 2 3 4 а0 2 2 2 2 “1 в 6 в 6 а2 10 7 7 7 а3 9 9 5 5 5 14/3 14/3 49/15 «5 1 1 1 1 Pj 1/3 6/7 7/5 49/15 Следовательно, многочлен устойчив. □ ♦) В [2.1, 2.6] принята обратная нумерация коэффициентов многочлена (коэффициент при старшей степени обозначается Яо) и т. д. **) Здесь / — номер шага алгоритма. ***) В начальном столбце выписаны исходные значения коэффициентов, в дальнейшем —значения, вычисленные согласно (3.15),
§ з. устойчивость 45 Для многочленов 3-й и 4-й степени алгоритм Рауса нетрудно реализовать и в «буквенной форме». Из приводимых таблиц для п = 3 3 1 2 а0 «0 «1 “1 а2 аа — а0 ах 1 а3 а3 а3 Pj а3 af1 а?<а1а2 “ а0аз)-1 и для п = 4 а0 «1 «2 а3 а4 вытекает, что кроме положительности коэффициентов для устойчи- вости многочленов требуется выполнение условий: п = 3: а1а2>а0а3, (3.16) п — 4: aja2a3 > аоа! — aia4. (3.17) Условия (3.16), (3.17) являются частными случаями ограниче- ний, налагаемых на коэффициенты характеристического многочлена для обеспечения его устойчивости, которые обычно именуют усло- виями Рауса — Гурвица (общий вид условий приведен в Прило- жении 2, п. 6). ’ 3.3. Устойчивость по начальным условиям. Оснойная формула (3.3) была выведена в § 1 в результате решения дифференциаль- ного уравнения при нулевых начальных условиях. При произвольных начальных условиях вид решения изменяется. Из теории дифференциальных уравнений известно, что его можно
46 ГЛ. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ записать как сумму решения ро(О однородного уравнения a(D)p = 0 (3.18) и любого частного решения неоднородного уравнения a(D)y = ₽(D)p. (3.19) Решение ye(t) представимо в виде*): Уо(0=2с^М, (3.20) где X, — корни характеристического многочлена а(р), a cv — либо константы (если все корни различны), либо многочлены от t, име- ющие степень ниже кратности корня. Если в качестве частного ре- шения взять решение, соответствующее нулевым начальным усло- виям, т. е. решение (3.3), то общее решение (3.19) приобретает вид t y(t) = y0(t) + §h(x)v(t — x)dx. (3.21) о Таким образом, наличие ненулевых начальных условий приво- дит к появлению фактора, искажающего’ характер связи (3.3) меж- ду входом и выходом. Определение 2. Звено называется устойчивым по началь- ным условиям**), если вызываемый ими эффект y0(t) исчезает при t -н- оо. Из формулы (3.20) сразу вытекает следующий результат. Критерий устойчивости по начальным условиям: устойчивость по начальным условиям имеет место, если характеристический многочлен не имеет других корней, кроме корней с отрицатель- ной вещественной частью, т. е. а(р) является устойчивым. Действительно, в этом случае любое слагаемое в (3.2Q) убывает со временем, поскольку убывающий экспоненциальный множитель «подавляет» возможный рост любого многочлена от t. Приведенный критерий устойчивости по начальным условиям совпадает с условием (б) устойчивости по входу, так что при выпол- нении обоих условий (а) и (б) можно употреблять более краткий термин — устойчивое звено. Соответствующую п. ф, Н (р) также на- зывают устойчивой п.ф. 3.4. Устойчивость системы. В соответствии с принципом супер- позиции (§ 2) реакция по любому выходу системы равна сумме реакций на каждое из внешних воздействий. В соответствии с этим естественно считать, что система осуществляет устойчивое преобра- *) С выводом можно познакомиться и по Приложению 1. . **) О связи этого определения с более общим понятием асимптотической устойчивости равновесного состояния по Ляпунову см. в гл. 8.
§ 4. УСТАНОВИВШАЯСЯ РЕАКЦИЯ И ЧАСТОТНАЯ ХАРАКТЕРИСТИКА 47 зование «вход-выход», если устойчивы преобразования от каждого внешнего входа к каждому внешнему выходу. Из Т.2.2 и принципа суперпозиции сразу следует, что это свойство имеет место, если а) строго реализуемы все соответствующие п. ф., б) характеристический многочлен системы Д(р) устойчив. Перейдем к анализу влияния начальных условий. По аналогии со случаем одного звена следует считать систему устойчивой по начальным условиям, если при любых начальных условиях и от- сутствии внешних воздействий процессы рА(0 на всех выходах стремятся к нулю при t -+ Однако при отсутствии воздействий для всех выходов справедливы одинаковые однородные уравнения /\(1))/A(Z) = O. Отсюда сразу следует, что система устойчива по. начальным усло- виям, если устойчив ее характеристический многочлен. В силу ска- занного при выполнении указанных выше условий (а), (б) система устойчива в смысле обоих определений. § 4. Установившаяся реакция и частотная характеристика 4.1. Вычисление выходной реакции. Если входное воздействие v(t) является известной функцией времени, то выходная реакция звена, определяемая уравнением a(D)y(t)=^(D)v(t), (4.1) при нулевых начальных условиях может быть вычислена любым из следующих способов: а) путем численного интегрирования уравнения по известным алгоритмам вычислительной математики с использованием циф- ровой ЭВМ; б) с использованием АВМ (интегратора); в) с помощью операционного исчисления, когда первоначально находится S’-образ входа V(p), а затем вычисляется оригинал S’-образа выхода Y(р), равного У(р) = Я(р)У(р), (4.2) где <«) г) с использованием того же операционного исчисление, но по формуле оо У (t) =» J Л (т) V (t — т) dx, (4.4) О . I причем предварительно находится весовая функция h(t) как ори-
48 гл. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ гинал п.ф. Н(р), поскольку оо Н(р) = ] h(t)e~ptdt, (4.5) о Все эти способы достаточно трудоемки, причем численное инте- грирование малоэффективно при больших t. из-за накопления ошибок*). Однако для некоторых видов воздействий, т. е. некоторых функ- ций v(t), удается указать очень простые способы вычислений вы- ходной реакции именно при больших t. Определение. Назовем установившейся реакцией на задан- ное воздействие v(t), £>0, такую функцию yw(i)> что lim | ух (£) — у (i) | = 0, (4.6) t-*oo где г/(t) — решение (4.1) при нулевых начальных условиях для любого £>0. 4.2. Установившаяся реакция на гармоническое воздействие. Пусть воздействие является гармонической функцией времени, т. е. v (£) = av cos (Ы, t> 0, (4.7)’ где av — амплитуда, ю — частота воздействия. Теорема 4.1. Если звено является устойчивым, то установив- шаяся реакция на гармоническое воздействие является гармониче- ской функцией той же частоты с амплитудой ау = |Я(йо)\а„ (4.8)’ и относительным сдвигом фазы Ф = arg#(ico). (4.9)’ Доказательство. Найдем сначала реакцию на комплекснозначную функцию v{t) = асе*ш(, t > 0, (4.10) называемую комплексной гармоникой. Согласно (4.3) имеем i t y(t) =av J h (т) J h (т) 0 0 Если выполнено условие устойчивости CO J 1 h (т) I dt < oo, 0 *) Аналоговым интеграторам также свойственно накопление ошибок из-за так называемого дрейфа нуля усилителей (подробнее см., например в [2.2]),
§ 4. УСТАНОВИВШАЯСЯ РЕАКЦИЯ И ЧАСТОТНАЯ ХАРАКТЕРИСТИКА 49 то существует предел lim 1 h (т) = Г Л (т) е-*штЛ = Н (/со), (4.11) f->O0 * . « О О причем последнее следует из (4.4). Теперь очевидно, что функция y„(t) = I](iv>)avei,ot — H(is>)v(t) (4.12) удовлетворяет условию (4.5) и является установившейся реакцией на комп- лексную гармонику (4.10). Выделим в р(1) и у„(с) вещественную и мнимую части! p(t) — а„ cos cot + й® sin и/, y»(t) = |Я(/<в) |a„cos (col 4 if) + 1|Я(/<в) |aB sin (cot-f- ip). В силу линейности преобразования (4.3) реакция на вещественную часть воздействия, а„ cos cot, и мнимую, а„ sin cot, является суммой реакций на каж- дую из них в отдельности. Отсюда вытекает результат, Даваемый формулами (4.7) — (4.9), а также его «дубль»: установившаяся реакция на воздействие v(t) = a„ sin cot (4.13) равна \ Уоо(1) — |Я(гсо) |a„sin (cot + ip), (4.14) и вообще, если u(t) = a„ cos (cot 4- <p), (4.15) где ф — произвольная фаза гармонического воздействия, то y«(t) = |Я(йо) |a„cos (cpt 4-ср + ip). И (4.16) Для демонстрации эффективности приема, содержащегося в Т.4.1, приведем иллюстративный пример. Пример 4.1. Пусть Н (р) =------2р±1------- W / 4- 2/ + р 4-1 ’ а p(i) = 3cos2i. Условия устойчивости выполнены (проверьте с помощью нера- венства Гурвица!), поэтому можно ^применять формулы (4,7) —(4.9). Имеем а® = 3, со = 2, а следовательно, (0 = ।_8г_sVat4-М 3cos{2t + cos+ где ip = arg--y5 = я 4 ardggj. □ Из теоремы 4.1 ясна особая роль комплекснозначной функции H(ico), называемой комплексной частотной характеристикой. Значе- ния этой функции находятся! при любом вещественном со как зна- чения п. ф. Н(р) при чисто мнимом p~i(£>: Я(1®).= Я(р)|р_<в. (4.17) Эта функция вводится не только для устойчивых п. ф., но и для любых, причем, если знаменатель Н(р) имеет корни на мнимой оси Xv = iPv, то H(ia) может обращаться в бесконечность при значе- ниях со = Р®. . 4 А. А, Первозванскив
50 гл. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ При фиксированном ® функция Я(ги) является комплексным числом, изображаемым точкой на комплексной плоскости. Кривую, являющуюся геометрическим местом этих точек, соответствующих значениям й от 0 до °°, называют годографом частотной характери- стики (или амплитудно-фазовой характеристикой). Поскольку вся- кое комплексное число можно задать двумя вещественными (моду- лем и аргументом или вещественной и мнимой частью), то комп- лексной частотной характеристике можно сопоставить либо пару функций А (и) = \H(i<a) I, 1|)(ш) = arg#(j(o), 0<й<® (4.18)' называемых амплитудно-частотной характеристикой (АЧХ) и фазо- частотной характеристикой (ФЧХ), либо пару функций Л(ы)=КеЯ({®), /(ш) = 1т#(йв), (4.19)’ называемых вещественной и мнимой частотными характеристиками (ВЧХиМЧХ). Если известны АЧХ и ФЧХ, то согласно Т.4.1 для определения амплитуды и фазы установившейся реакции на гармоническое воз- действие можно воспользоваться следующим приемом. Правило 1. Амплитуда реакции равна амплитуде воздействия,' умноженной на значения АЧХ на частоте воздействия. Сдвиг по фазе реакции относительно воздействия равен значению ФЧХ на частоте воздействия. Другие возможности использования частотных- характеристик раскроются в дальнейшем. Здесь же будет рассмотрена еще одна задача об оценке установившейся реакции. 4.3. Установившаяся реакция на полиномиальное воздействие. Назовем полиномиальным воздействие, представимое при t > 0 в виде многочлена (полинома) от t: v(t) = аЛ + аф + ... + aNtK, t>0. (4.2Q)’ Теорема 4.2. Установившаяся реакция устойчивого звена на по- линомиальное воздействие (4.20) также является полиномиальной функцией (многочленом), представимой в виде ya>(,t) = cov(t) + cliyv(t) + ... + cNDNv(t), (4.21) где , k = 0,l,...,N, (4.22) dp p=o Доказательство аналогично доказательству Т.4.1. Согласно (4.3) получаем t о N h N k y(t) = f h (T) v (t — t) dx = Гh (т) V Dfti> (<) dx = V щ .PM*). I J ^1 tC\ лшш fCi ft О k—Q k~Q (4.23)
§ 4. УСТАНОВИВШАЯСЯ РЕАКЦИЯ И ЧАСТОТНАЯ ХАРАКТЕРИСТИКА 51 где t Hfe W Д J (т) dr, (4.24) о причем использовано разложение функции v(t — т) в ряд Тейлора по степе- ням т и учтено, что этот ряд имеет конечное число слагаемых, поскольку v(t) — многочлен. С помощью (3.12) можно убедиться в существовании для устойчивой ве- совой функции пределов СО цк — lim (/) = Г Л (т) йт, (4.25) t-»oo V 0 обычно называемых моментами весовой функции. Отсюда сразу следует, что N |( = У Hh^-Dhp(i). (4.26) /ci fe=0 Это выражение совпадает с (4.21), (4.22), поскольку k ОС ОС . -..- кР) = Сл(т)-^-(е-»;т)1_йЛ= (-1)й f Л (т) тй Л = (-1)А dp р=о J dpk ; J • « ° Выделим особо два простых частных случая Т.4.2. Правило 2. Если воздействие является постоянным при t > 0 *), v(t)==a0, t > 0, (4.27) то установившаяся реакция устойчивого звена также постоянна и равна ' yn(t) = H(0)a„. (4.28) Она совпадает с воздействием, если /7(0)= 1. (4.29) Правило З.Если воздействие изменяется с постоянной скоростью v(t) = a0 + atl, t>0, ' (4.30) то установившаяся реакция устойчивого звена также меняется с постоянной скоростью У<*> (0 = Н (р) |р=0 («0 + а10 + ~Г~ I (4.31) . u/у |р=0 Если выполнено условие (4.29), то р«,(() —р (7) = const. Приведём иллюстративный пример. *) Поскольку все предшествующие результаты получены в предположении пулевых начальных значений, то (4.27) означает, что v(t) — скачок на вели- чину «о. 4 4*
52 ГД. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ Пример 4.2. Пусть Н(р} такая же, как в п. 4.1, a v(t}— 4 + 21. Тогда, учитывая, что Я(0) = 1, ?| =1, 4 ' 'dp |p=o ’ получаем у«> (t) = 6 + 2t — v(f)+,2. □ Простота правил вычисления установившейся реакции на типо- вые (гармонические и полиномиальные) воздействия определяет их широкое использование при исследовании систем управления, в чем мы также убедимся в дальнейшем. 4.4. Реакция системы на внешние воздействия. Все сказанное относилось к изучению реакции одиночного звена на его входное воздействие. Однако, в силу принципа суперпозиции, реакция лю- бого выхода yk(t) на совокупность любых внешних входных воз- действий Vi(t) является суммой реакций на каждое из них. По- этому все приведенные выше правила применимы и к анализу си- стемы. Следует лишь сначала использовать в них п. ф. Ял(р) от каждого входа к изучаемому выходу для изучения реакции на каж- дый вход по отдельности, а затем просуммировать результаты. Если же система имеет только один внешний вход и только один внеш- ний выход, то все правила применимы непосредственно. § 5. Анализ типовых структур Среди возможных структур связи между звеньями особо часто возникают некоторые простые структуры, которые будем называть типовыми. Все системы с типовой структурой имеют*один внешний вход v и один внешних выход у, так что преобразование «вход-вы- ход» может быть охарактеризовано одной п. ф. Н(р). Для каждой структуры дадим ответ на следующие три вопроса: (а) как найти п. ф. системы Н(р), (б) как найти частотную характеристику си- стемы Я(йо), (в) как построить характеристический многочлен системы а(р) и как можно судить об устойчивости системы по свойствам п. ф. или частотных характеристик звеньев. Для простоты записи ограничимся системами, состоящими из двух звеньев, описываемых уравнениями - ai(D)i/I(i)=Pi(D)yi'(i), a2(D)?2(0 = P»(D)n2(0, (5Л) хотя результаты легко обобщаются на случай большего числа звень- ев. После преобразования по Лапласу (при нулевых начальных ус- ловиях) уравнения (5.1) дают ’ aHp)Tft(?).= Мр)ТДр)> к = 1, 2, (5.2)’
§ 5. АНАЛИЗ ТИПОВЫХ СТРУКТУР 53 или Yk(p) — Hk(p)Vh(,p), Hh(p) = ^y A=l,2, где Яй(р) — и. ф. звеньев. По определению (см. § 4), формулы А(ы) = l#ft(ico) I, 4fft((o) = arg ЯА(со) = ВеЯД^со), 7*((o)== ПпЯДйо), k — i,2, дают выражения для АЧХ, ФЧХ, ВЧХ, МЧХ каждого из звеньев. 5.1. Последовательное и параллельное соединения звеньев. Структурная схема системы, называемой последовательным соеди- нением звеньев, приведена на рис. 2.15. В силу связи имеем У*(р)=Гг(р)’, Рис. 2.15 так что уравнения (5.2) переписываются в виде а1(р)У1(р)=₽1(р)У1(р), ЧМ?)У1(?) + аг(р)У2(р) = 0. Характеристический многочлен системы равен д Г (р) A(p) = detf_Mp) a2H = ai^)a2(^- (5.3) Для нахождения п. ф. системы выразим У (р) через F(p)'. Имеем у (?)=У2 (Р)=Я2 (?) У2 (?)=Я2 (?) У. (?)=Я2 (р) Я, (р) F< (р) = = Яа(р)Я,(р)Р(р), так что (5.4) Свойства .частотной характеристики следуют из формул Я (i©) А А (со) е™ = Ях (г®) Я2 (гео) = Аг (®) ?'?1(ю)А2 (со) №> = = А1ИЛ2(и)еЧ^<“)+’Р2<“)]( откуда А(<в)=А1(®)42(®)', ^(®) = W1(®) + W2(®J. (5.5) Приведенные формулы позволяют сделать следующий общий вывод. Вывод 1. Для последовательного соединения (а) п.ф. систе- мы равна произведению п. ф. звеньев, (б) АЧХ системы равна произведению АЧХ звеньев, (в) ФЧХ системы равна сумме ФЧХ звеньев. Соединение устойчиво, если устойчивы звенья. Допустимо также, чтобы п. ф. одного из звеньев не была строго, реализуемой, лишь бы строго реализумой была п. ф. соеди- нения. В противном случае система неустойчива.
54 ГЛ. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ Последнее утверждение прямо следует из условий устойчивости (§ 3) и того простого факта, что корни а (р) являются корнями либо а,(р), либо а2(р). Рассмотрим далее систему, называемую параллельным соедине- нием звеньев, структурная схема которой дана на рис. 2.16. Со- гласно схеме имеем: V = 17, = 172, у = у, + у2. Уравнения звеньев переписываются в виде а,(р)У,(р)=р,(р)У(р), ^(p)Yz(p)=Mp)V(p), откуда A(p) = a,(p)a2(p). Поскольку У (р) = У, (р) + у2 (р) = [Н1 (р) + нг (р) ] V (р), то . гт , ч , а2 (р) (р) + “i (р) Р2 (р) ,г Н(р).= НМ+НДр)~->-------2-- (5.6) Кроме того, H(ia) = Z7,(i®) + Я2(йо) = Я,(®) + ИД®)+ Я2(®)+ i/2(®) = = РМ<в)+ Я2(и)] + i[/4((o)+ 72(<о)], так что 7?((о) = 7?,(©)+Т?2((о), 7(щ)= 7,(a>)+72(<о). (5.7) Можно зафиксировать итоги анализа. Вывод 2. Для параллельного соединения (а) п. ф. равна сум- ме п. ф. звеньев, (б) ВЧХ (и МЧХ) равны суммам ВЧХ (и МЧХ) звеньев. Соединение устойчиво, если и только если устойчивы звенья. Приведенные результаты элементарны, но полезны при изуче- нии сложных систем, поскольку позволяют «свернуть» группу по- следовательно или параллельно связанных звеньев в одно с легко определяемыми характеристиками. При использовании этих резуль- татов возможны, однако, грубые ошибки. , Предупреждение 1. Термины «последовательное» и «па- раллельное» соединения, а также операторное описание характе- ристик элементов широко используются в теории электрических и механических цепей. Однако там они имеют другой смысл*). Контрпример. Рассмотрим электрическую цепь из трех после- довательно (в смысле теории цепей) соединенных элементов — активного, индуктивного и емкостного. Связь входного воздействия *) С точки зрения общей теории графов различие заключается в том, что теория цепей использует неориентированные графы, а теория управления — ориентированные.
§ 5. АНАЛИЗ ТИПОВЫХ СТРУКТУР 55 (напряжения) с выходом (током) дается уравнением и (£) = Ri (t) + L 4—— i dt пли, в операторной записи, (1 \ R Z/D -f- i (£)♦ П. ф. соединения, называемая операторным сопротивлением цепи, равна ./f(D) = /? + LD + ^5 и является не произведением, а суммой операторных сопротив- лений й, LD, А последовательно соединенных элементов. О Здесь нет противоречия с Правилом 1, поскольку в нем термин «последовательное соединение» использован в другом смысле. Рассмотрим также систему, блок-схема которой дана на рис. 2.7. С физической точки зрения она представляет собой последователь- ное соединение усилителя, двигателя, редуктора и вала. Однако составленные согласно правилам теории управления структурные схемы (рис. 2.8) отнюдь не являются схемами последовательного соединения. Рассматривая физическую «последовательную» схему, всегда следует помнить о возможном обратном воздействии одного элемента на воздействие от другого, что не предусмотрено фор- мальным определением последовательной связи между звеньями, характеризуемыми однонаправленным преобразованием «вход- выход». Предупреждение 2. При вычислении п. ф. системы по формулам (5.4), (5.6) возможно сокращение общих множителей в числителе и знаменателе. После такого сокращения знаменатель п. ф. уже не будет совпадать с характеристическим многочленом. Это, в частности, было видно из П.2.4, где фактически рассматри- валось последовательное соединение двух звеньев. Знаменатель п. ф. соединения был равен р +1 и устойчив, а характеристический мно- гочлен равен (р + 1) (р — 1), а следовательно, неустойчив. Таким образом, при суждении об устойчивости по знаменателю п.ф. следует проверить, не произошло ли сокращения сомножи- телей. В дополнение укажем, что в некоторых случаях полезной явля- ется процедура, обратная «свертыванию» последовательных и па- раллельных соединений. Пусть звено задано п. ф. Н(р). Тогда лю- бое представление этой п.ф. в виде суммы 77,(р) + Нг(р) или про- изведения Я,(р)Я2(р) может быть интерпретировано как разбиение звена на два, параллельно или последовательно соединенных. В ча-
56 гл. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ стности, представление (3.11) свидетельствует о возможности пред- ставления звена в виде параллельного соединения звеньев. Если Н (?) — строго реализуема, а знаменатель не имеет кратных кор- ней, то разложение на простейшие дроби дает п # (р) ° Ро + 2 ..И Ро = const. (5.8) Такую же п.ф. имеет система с п звеньями,. описываемыми уравне- ниями 1-го порядка (D Ху) yv ==г= CyVy, v == 1, .,тг, (5.9) и одним усилительным звеном Уо = Ро^о, (5.9')' если эти звенья соединены параллельно, т. е. vv = v, v = О, 1, ,.п, У-ЯУ' + Ум (5.10) V=1 где F — внешний вход, а у — внешний выход. Величины Ху, с,, вообще говоря, комплексные числа, так что переменные yv(t) —комплекснозначные функции времени. Поэтому разбиение на звенья 1-го порядка удобно лишь в случае, когда все Ху, Су вещественны. Более того, если все Ху < 0, то Г, —£>0, (5.11) Отсюда сразу следует возможность представления такого звена структурной схемой, показанной на рис. 2.17, которая включает Рис. 2.17 Рис. 2.18 можно сопоставить электронную модель, включающую не более, чем п + 2 операционных усилителя. 5.2. Соединение с отрицательной обратной связью. Структурная схема представлена на рис. 2.18, Звено 1 именуется стоящим в
§ 5. АНАЛИЗ ТИПОВЫХ СТРУКТУР 57 прямой цепи, звено 2 — стоящим в обратной связи. Согласно схеме имеем: Vt^V-уг, v-^y,, y = Vi. Тогда 7 (р) = Y^P) = Н^р) ИДр)= Н^Р) [7(р)-*V(p) 1 = = Я4 (р) 7 (р) - Я4 (р) Я2 (р) V2 (р) = Hl(p)V(p)-Hi (р) Я2 (р)Y (р), откуда следует формула для п. ф. соединения #(P)= i+H^p)H2(p) * <5*12) Введем обозначение Яр(р)=ЯДр)ЯДр)\ П. ф. НР(р) обычно называют п. ф. разомкнутого контура, и соот- ветственно Яр(но) —частотной характеристикой разомкнутого кон- тура. Из формулы Нг (гш) II г (г®) Н = 1 + яг (i(0) я2 (г®) = 1 + яр(г®) сразу следует простой качественный результат. Вывод 3. Частотная характеристика соединения с отрицатель- ной обратной связью принимает значения, близкие (а) к частотной характеристике звена в прямой цепи, если со таково, что |Яр(йо)| < 1. (б) к обратной частотной характеристике если |Яр(йо)|>1. Точный расчет ЯД®), Яр(г«в)' по ЯДгш), ЯДйо)’ требует не- сложных операций с комплексными числами, однако приведенный результат полезен тем, что при расчете Я (йо) на сетке значений (о он позволяет правильно выбрать шаг сетки и диапазон частот, где этот расчет необходим*). Напомним, что вычисление Я (г®) важно при нахождении уста- новившейся реакции системы на гармонический вход (см. § 4). Перейдем к изучению проблемы устойчивости системы. Из урав- нений звеньев элементов и связей получаем: а» (Р) Yi (Р) + Pi (Р) Yz (р) = (р) V (р)', -^(р)Т1(р)+а2(р)У2(р)=О. Характеристический многочлен («Др) ₽!<?)] А(р) = detj_p2(p) a2(?)j = ai(p)a2(p) + ₽i(p)₽2(p). (5.13) *) См, также гл. 3, § 5,
58 ГЛ. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ Из вида этого многочлена непосредственно неясно, следует ли из устойчивости соединенных звеньев устойчивость системы и, на- против, из неустойчивости хотя бы одного звена — неустойчивость системы в целом. Требуется более тонкий анализ, которому в ос- новном и посвящен данный параграф. Прежде всего установим сле- дующий важный факт. Теорема 5.1. Пусть соединенные звенья устойчивы. Пусть п.ф. их последовательного соединения Н^р^Н^Н^р), (5.14) называемая также п. ф. разомкнутого контура, является правиль- ной дробью, а соответствующая частотная характеристика ни при каких со, 0 со < °°, не является вещественным числом, меньшим либо равным —1. Тогда характеристический многочлен А(Р) устойчив. Доказательство. Обозначим ' <?р (р) А (р) а2 (р), Рр (р) А (р) Р2 (р); (5.15) тогда, согласно (5.13), характеристический многочлен системы Д(Р) =9р(р)+-Рр(р), причем по условию Qp(p)—устойчив и*) deg Ср (р) > degPp(p). Введем вспомогательный многочлен Д(Р, *) АСр(р) + *Рр(р), зависящий от параметра к. Очевидно, что Д(р, 1) = Д(р), Д(р, 0) == <?р(р). Как известно**), корни-XV(A:) многочлена Д(р, к) непрерывно зависят от вещественного параметра к. При к = 0 они ле- жат в левой полуплоскости. При увеличении к корни Xv(fc) перемещаются по непрерывным кривым (корневым годографам) и не могут вый- ти из левой полуплоскости иначе, чем через мнимую ось (рис. 2.19). Прохождение через мни- мую ось какого-нибудь корня Л, = ico, где со — вещественно Д (ico, к) — 0. означает, что И "При этом (5.16) каких со и ни Вместе с тем (5.16) эквивалентно Таким образом, если ни при при каких к, 0 sg к 1, условие (5.16) не выпол- няется, то корни остаются слева, так что Д(р) — = Д(р, 1) является устойчивым. или ^p(ico) -f- kPt(iio) = 0 — -у- = Яр (йв) = Re Яр (ico) +ilm Яр (гео), *) Символ deg означает «степень». **) См. также § 3 гл. 4,
g 5. АНАЛИЗ ТИПОВЫХ СТРУКТУР 59 откуда 1 Im Яр (iw) = 0, Re Яр (to) ----1, что противоречит условию теоремы*). Аналогичным образом рассматривается и следующий интерес- ный случай. ’ ’Теорема 5.1'. Если QP(p) = р$Лр), где (р) — устойчивый многочлен, выполнены условия Т.5.1 при всех со > 0, а кроме того, pHр (р) |р=0 = ~Р А > О»; Vp W то характеристический многочлен А (р) устойчив. Доказательство можно провести аналогично доказательству Т.5.1, заметив лишь предварительно, что при малых к > 0 выполнение условия frp > 0 обеспечивает переход нулевого корня Xi = 0 многочлена Д(р, 0) = <2р(р) в левую полуплоскость (рис. 2.20). Действительно, при малых к многочлен P^p(p) + fcPP(p) =0 имеет корень порядка величины к, а следо- вательно, выполнено условие bi [&>(0) + 0{к)} + Л[Р„(0) + <?(&)] = 0, так что Рр (0) \ = ~~ктГ+ 0 =— ккр+о W. Vp (v) т. е. А1 становится отрицательным при малом увеличении к от 0. Далее, при росте к вплоть до к — 1, A-i (&), равно как и остальные корни, уже не может выйти из левой полуплоскости в силу доказанного в Т.5.1. Результатам Т.5.1, Т.5.1' обычно дается следующая геометриче- ская интерпретация. Правило 1. Если годограф частотной характеристики не пересекает вещественной полуоси — 1], а кроме того, при со оо, (5.17) то характеристический многочлен системы, образованной соедине- нием устойчивых звеньев с отрицательной обратной связью, устой- чив. То же верно, если знаменатель п.ф. одного из звеньев имеет *) Функция Re#p(to) является четной функцией о>, поэтому в условии Т.5.1 указаны только неотрицательные ю.
60 гл. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ нулевой корень, а остальные устойчивы, и, кроме того, при малых ® Ап Я₽(ш>)~-^ fcP>0. (5.18) (Условие (5.17) эквивалентно требованию того, что Нр(р) — правильная дробь.) Примеры требуемого по правилу 1 поведения годографов пока- ваны на рис. 2.21 а, б. Приведем также конкретную задачу. Пример 5.1. Рассмотрим вопрос об устойчивости электромеха- нической следящей системы (ЭСС). Качественное описание систе- мы было дано в гл. 1 (рис. 1.5). Напомним, что простейшая ЭСС состоит из следующих физических элементов: (а) задающей оси, угол поворота которой обозначим ф“(£); (б) вала нагрузки, угол поворота которого обозначим q?(i); (в) датчика рассогласования, вырабатывающего электрический сигнал ue(t), который будем опи- сывать уравнением ue(t) — kse(t), ke>Q, (5.19) где е(0=ф<’(0~ ф(0—рассогласование между углами поворота задающей оси и вала; (г) усилителя, вырабатывающего электриче- ский сигнал управления, который будем описывать соотношением u(t) = kue(t), k>0, (5.20) и, наконец, (д)' исполнительного устройства, включающего усили- тель мощности, двигатель и редуктор, через который движущий момент передается на вал. Входное напряжение усилителя мощ- ности и является сигналом управления u^(t)=>u(t). (5.21)' Кроме того, напомним, что в П.2.2 и П.2.3 было приведено иссле- дование блока, состоящего из элементов «усилитель мощности», «двигатель», «редуктор», «вал». Его математическое описание в целом дается формулой (2.21), которую можно написать в
g 5. АНАЛИЗ ТИПОВЫХ СТРУКТУР 61 операторном виде: <p(i) = Я«<р(1>)ивх(0+ Ятф(£)игн(£)> (5.22) где пгн(£) — момент внешней нагрузки на вал. Совокупность со- отношений (5.19) —(5.22) может быть представлена структурной схемой (рис. 2.22), где не учтено лишь внешнее возмущение ma(t), не играющее роли при исследовании устойчивости. Рис. 2.22 Связь между внешним входом <pd(i) и общим выходом ф(£) представлена соединением звеньев, которое можно привести к стан- дартной структуре с отрицательной обратной связью, если по- ложить Hl(p}=kskvH^(p],. Нг(р^1. Примем первоначально упрощенную формулу (2.24) для п. ф. силового блока Р^Т^ + Т^р + 1) Тогда *с>0,; Тм>0, Гэ>0. Яр(р) кр Д кЕккс Z> 0. В данном случае QAp)=pQAp^ QAp't-r^ + T^p + i, pv^=k9 и можно использовать Т.5.Г. Условие &р>0 выполнено, <?р (р) — устойчив. Остается прове- рить поведение частотной характеристики Имеем к9 Нр (гео) = —7---------j-------- ш (1 - ТиТэ^ + iZM<0 “ (1-ТмГ8«>г) + (Гн®)2 + i (1 — 7’м7'э®2))^ откуда следует, что годограф пересекает вещественную ось толь- ко при ®=(Уад).-‘,
62 ГЛ. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛЙНЕЙПЫХ СИСТЕМ причем в точке пересечения (рис. 2.23) ReZ7p(i(D) = -к„Т,. Тем самым доказано, что характеристический многочлен4 системы устойчив, если кр <Z Т^1. Подчеркнем, что для данной несложной системы тот же результат проще получить, непосредственно за- писав этот многочлен в виде Д(Я=С₽(р)+Л>(р) = 4 = Т№Тар* + Тар* + р + к9 и использовав неравенство Гурвица (3.16), которое здесь имеет вид _ Отметим, что если положить Та = 0, т. с. использовать еще более простое описание (2.25) п. ф. силового блока ке = р(Тмр+1)‘ полученное в пренебрежении самоиндукцией якорной цепи двига- теля, то был бы сделан неверный вывод: ЭСС устойчива при любом значении коэффициента кр. Иначе говоря, пренебрежение малыми постоянными времени опасно при исследовании устойчивости. Од- нако, используя первый вариант описания, т. е. формулу (2.24), мы также упростили задачу по сравнению с более полным описа- нием, даваемым формулой (2.23). Анализ вопроса о том, когда это упрощение допустимо, отложим до следующей главы. О Теоремы 5.1, 5.1' дают достаточные условия устойчивости систе- мы с отрицательной обратной связью, если, согласно исходному определению, выполнено еще и условие строгой реализуемости п. ф. соединения Рх(р)«2(р) (Р) 1 + (Р) (р) (р) а2 (р) + (р) р2 (р) Поскольку в теоремах уже требовалось, чтобы deg {а;а21 > deg {0,02}, . то строгая реализуемость имеет место, если deg а, > deg т. е. звено, стоящее в прямой цепи, строго реализуемо, а это зара- нее предполагалось. 5.3. Обобщенный критерий Найквиста. Возникает вопрос, явля- ются ли условия теорем 5.1, 5.1' и необходимыми, т. е. обязательно ли при их нарушении система окажется неустойчивой?
§ 5. АНАЛИЗ ТИПОВЫХ СТРУКТУР сз В частности, особо существенно, может ли система быть устой- чивой, если характеристические многочлены звеньев имеют корни в правой полуплоскости и заведомо неустойчивы? Оказывается, что это возможно. Теорема 5.2 (обобщенный критерий Найквиста)*). Пусть вы- полнены условия: a) Hj,(p)—правильная', б) многочлены Рр(р), Qf(p) не имеют совпадающих корней & правой полуплоскости (несовпадающие корни назовем нулями и полюсами Hv(p)); в) число полюсов Нр(р) в правой полуплоскости задано и рав- но > 0. Тогда для устойчивости системы звеньев, соединенных отрица- тельной обратной связью, необходимо и достаточно, чтобы при из- менении со от 0 до °° точка Hv(ia>) на комплексной плоскости со- вершала ровно q~ полуоборотов вокруг критической точки с коор- динатами (—1,0), или, что то же самое, годограф Hp(ia>) ровно- q~/2 раз охватывал критическую точку. Не приводя пока достаточно громоздкого доказательства, дадим, пояснения и примеры. Случай 1. Qv(p) —устойчив (оба звена устойчивы). В этом случае критерий Найквиста сводится к требованию:: годограф ЯрО'со) не должен охватывать критическую точку. При этом возможны две ситуации (рис. 2.24, а, б). .Рис. 2.24 1а. Годограф не пересекает вещественную ось или пересекает ее правее критической точки. 16. Годограф столько же раз пересекает вещественную полуось (_оо, —1) снизу вверх, сколько и сверху вниз**). Ситуация 1а соответствует условиям Т.5.1, однако устойчивость имеет место и в ситуации 16. - Случай 2. Hv(p) не имеет полюсов на "мнимой оси, но есть q~ > 0 полюсов справа. В этом случае годограф должен охватывать- критическую точку, делая q~ полуоборотов. Например, при q~ = 1 *) Критерий был сформулирован в 1932 г. Найквистом применительно к задачам радиотехники для частного случая q~ = 0. **) Все диаграммы построены в предположении Л„(0) >0 или ffP(0) >0 (при наличии нулевого корня).
64 ГЛ. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ диаграммы на рис. 2.24, а, б соответствуют неустойчивой системе, а диаграмма на рис. 2.25 — устойчивой. Случай 3. Яр (р) имеет один нулевой полюс, а остальные кор- пи — слева. В этом случае годограф рассчитывается с исключением точки <в = 0, и ситуации За, 36, представленные на рис. 2.26, а, б, соот- ветствуют устойчивой системе. Первая из них рассматривалась в Т.5. Г. Случай 4. Яр (/?)' имеет нулевых полюсов, 2q„ чисто мнимых полюсов ±icov кратности q4 каждый и q~ полюсов справа. В этом общем случае следует учесть отсутствие непрерывности годографа Яр(йо) при w—0, со = со, и применить следующую фор- мальную процедуру его построения: а) построить годограф вне точек разрыва с ветвями, уходящими в оо при приближении к этим точкам; б) дополнить годограф до непрерывной кривой частями окруж- ности большого радиуса (много больше 1), связывающими ветви. При этом начальная точка обязательно располагается на веще- ственной оси, разрыв при ш = 0 заполняют дугой с поворотом на — <h t разрыв при ®v заполняют дугой с поворотом на — qvn.
§ 5. АНАЛИЗ ТИПОВЫХ СТРУКТУР 65 Правило 2 (геометрическая интерпретация обобщенного крите- рия Найквиста). Если годограф Hp(i<i)) (с учетом указанной про- цедуры дополнения) пересекает вещественную полуось левее кри- тической точки, но так, что разность между числом пересечений сверху вниз и снизу вверх равна q~/2, то система устойчива*). В противном случае устойчивость отсутствует. t Пример диаграммы, из которой следует устойчивость системы, дан на рис. 2.27, а. Из диаграммы на рис. 2.27, б следует неустой- чивость. Дадим теперь доказательство Т.5.2. Доказательство основывается на применении теории функций комплексной переменной, утверждающей справед- ливость так называемого принципа аргумента**): бг Arg Ф(р) = 2л(пг — рг), (5.23) где бг Arg обозначено изменение аргумента функции Ф(р) при изменении р по замкнутому контуру, Ф(р) предполагается дробно-рациональной, а пГ, рГ— число нулей и полюсов Ф(р), лежащих внутри Г. Примем Ф(р) в виде , , , . „ , . . . -Рр (р) <2Р (Р) + -Рр (р) = <5-24’ Построим контур Г. показанный на рис. 2.28. Он состоит из полуокружно- сти большого радиуса R, отрезков на мнимой оси и . полуокружностей малого радиуса р, охватывающих справа начало координат и точки ±гсо„, соответствующие полюсам Нр(р) на мнимой оси. Изменение аргумента Ф(р) на Г равно сумме изменений аргумента на указанных частях, причем па полуокружности R (при достаточно больших Я) Ф(р) ~ 1 в силу условия (а) теоремы, так что ар- гумент равен нулю, как и его изменение, а на полу- окружностях малого радиуса изменение аргумента равно где qv — кратность полюса (и —iwv), если (rtv =/= 0, и равно jiq0, если нулевой полюс имеет кратность «/о- С другой стороны, при условиях (б), (в) прин- цип аргумента устанавливает эквивалентность тре- бования устойчивости характеристического много- члена Л(/>) = <Ыр) + Рц(Р) Рис'. 2.28 я равепства бгАгдФ(р) = — 2лг/~, (5.25) поскольку пГ = 0, рг = если при достаточно малых р, Я"1 контур охваты- вает всю правую полуплоскость. С учетом данных оценок (5.25) эквивалентно переписывается в виде 6 Arg Ф (ico) + 3iqQ J- 2 2 nrlv = — 2лц~, (5.26) V причем 6 Arg означает изменение аргумента при изменении со от Л до —R, за вычетом малых участков размера 2р, где IJv(tw) претерпевает разрывы. *) Если годограф начинается на [—«>, —1), то это считается за 1/2 пересе- чения. **) См., например, [2.3, с. 298], Зла. Певвозванский
66 гл. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ Изменяя направление прохождения на противоположное (от —R к R) и учитывая, что Arg Ф(1<£>) = —Arg Ф(—йа), <0 (5.27) приходим к результату -15'Arg[l+/Z (ICO)] —Адо —V?v = g-, (5.28) V где символ 6' Arg означает изменение аргумента при пробегайте со «почти» от пуля (р) до «почти» беекоиечиости (R), а остальные слагаемые отражают, вклад изменений на разрывах. Выражение слева совпадает с числом полуоборотов годографа функции 1 + Яр(гсо) вокруг начала координат, или, что то же самое, годографа //P(ico) вокруг критической точки (—1, 0) (с учетом указанных выше дополнений па разрывах). Тем самым (5.28) доказывает, что условия теоремы гарантируют устойчивость многочлена А(р). Строгая реализуемость п. ф. соединения следует из условия (а) и предположения о строгой реализуемости п. ф. звеньев. Замечание. Утверждение Т.5.2 сохраняет силу и в том случае, когда условие (а) заменено более' слабым условием строгой реализуемости ЯР(р). Для обоснования достаточно рассмотреть ситуацию, где degP₽(p) =- = deg Qv (р) — п. При этом возможны два случая: (a) deg {Рр + <?₽} = п, (б) deg{Pp + Cp} <«• В случае (а) на полуокружности достаточно большого радиуса функция Ф(р) ведет себя как константа, а следовательно, изменение ее аргумента рав- но нулю, что позволяет перенести на этот случай ранее приведенное доказа- тельство. Случай (б) является вырожденным (при сложении многочленов взаимно уничтожаются старшие степени). Очевидно, что при этом изменение аргумента происходит, и формула (5.28) не верна, а следовательно, кажется неверным утверждение критерия Найквиста. Однако это не так: нетрудно убе- диться, что при условии, (б) п. ф, системы с обратной связью не является стро- го реализуемой, а следовательно, согласно определению, система неустойчива, о чем и будет свидетельствовать невыполнение равенства (5.28). 5.4. Приближенно дифференцирующие устройства. В качество полезного примера изучения структур с обратной связью проведем анализ некоторых устройств, построенных на базе операционных усилителей и приближенно осуществляющих операцию дифферен- цирования. Пусть zii(i) —напряжение на входе устройства, u(t) — на выходе. Идеальное дифференцирование имеет место, если u(t) = D«( (i). (5.29) Подчеркнем, что п. ф. дифференцирующего преобразователя не яв- ляется строго реализуемой. Поэтому ранее предполагавшиеся схе- мы (см. § 2) не пригодны для создания идеально дифференциру- ющих устройств. Рассмотрим вновь блок, состоящий из операцион- ного усилителя и ЛС-цепей (рис. 2.29, а), где У,(В) — операторная проводимость прямой цепи, F0(D) — операторная проводимость, цепи в обратной связи (операторная проводимость обратна опера- торному сопротивлению), Ув(В)—входная проводимость усилите- ля. Тогда уравнения цепей запишутся в виде y1(D)(u1-uB)+y0(D)(tt-uB)=yBuB. (5.30).
§ 5. АНАЛИЗ ТИПОВЫХ СТРУКТУР 67 Учтем далее, что усилитель не является идеальным, а обладает инерционностью, и примем для него описание в виде S U =-------птг ии, ау (О) (5.31) где ay(D) — многочлен Рис. 2.29 такой, что ау(0)=1. Свойства реальных операционных усилителей можно хорошо воспроизвести, считая ay(D) = (TD + l)\ При этом амплитудно-частотная характе- ристика усилителя равна к = (5.32) 1 + т со и быстро убывает при со > т-1 (диапазон Рис. 2.30 к Я (D) =— Я, (D) Я, (D) 1 + Я, (D) Я (О) ~ l + ff,(D)« частот от св = 0 до со = т-1 часто называют полосой пропускания усилителя). Для реальных усилителей ку имеет порядок 10е 4-10’, т_< — порядок 103 1/с. Исключая промежуточную переменную ие, запишем • ’ и = — где У, (D) 1 у r2 (D) ау (D) Уо<°> 1 ' * У2 (D) ау (D) y2(D)A^o(D) + K1(D) + yB, Я2Д^> Передаточной функции //(D) можно сопоставить структурную схе- му соединения с обратной связью (рис. 2.30), осуществляющую то же самое преобразование «инвертированный вход —и, — вы- ход и». Еще раз подчеркнем, что структурная схема соединения с обратной связью не отражает непосредственно свойств элементов электрического соединения с цепью обратной связи: п. ф. Я2 звена в обратной связи структурной схемы зависит и от проводимости
68 гл. 2. ОПЕРАТОРНЫЙ МЕТОД АНАЛИЗА ЛИНЕЙНЫХ СИСТЕМ Уо цепи в обратной связи усилителя и от проводимости прямот! цепи. Напомним теперь ранее полученный вывод 3. Из него сразу следует, что частотная характеристика соединения 7/ (гео) близка к обратной частотной характеристике звена в обратной связи . Y (ПО) Я(1-Со)-/72-Х(^) = 1Ат-у (5.34) па всех частотах, где - I Яр (но) I = ку -у./—^тт-г »1. (5.35) 1 pv 71 у У2(гш)ау(ио) г В частности, если У1 = 1/Я1, Уо = 1/Я0 (в прямой и обратной цепи усилителя стоят резисторы с сопротивлениями Ri, Ro), то /7(«в)«ф. 1 • Если же Yt — i/Rt, Уо = C0D (вместо резистора в обратной цепи стоит конденсатор емкости Со), то 77(io))«-^-^. Иначе говоря, эти устройства имеют частотные характеристики идеального усилителя и интегратора, однако такие свойства имеют место только в диапазоне частот, ограниченном условием (5.35). Даже при очень большом ку наличие убывающего множителя |ау(йо) I-' ограничит диапазон частот входных сигналов, для ко- торых верны ранее полученные результаты (§ 2) о свойствах схем с операционными усилителями. Рассмотрим далее другой важный частный случай, когда в прямой цепи стоит конденсатор емкости Ct, а в обратной — рези- стор сопротивления 7?0 (рис. 2.29,6). При этом yi(D) = CiD, У„ = 1/Яо и CiRoid), т. е. частотная характеристика близка к характеристике идеального дифференцирующего звена 77(D) = C1/?OD в диапазоне частот, ограниченном условием ку 1/Я0+С1Ш + У0 ----------; 1. | ау (ад) | ' Казалось, бы, с увеличением к? можно добиться хорошего качества дифференцирования с помощью такой простой схемы, и эта реко- мендация зачастую фигурирует даже в учебниках. Однако на са-
§ 5. АНАЛИЗ ТИПОВЫХ СТРУКТУР 69 мом деле она не верпа. Дело в том, что при больших /су схема теряет устойчивость! Имеем yjD) 7 1 1 Яр (D) = ку Ks(D) ay(D) = Лу i + 7ioCiD + yB/?o (TD + l)3,i и характеристический многочлен системы имеет вид А(р) = (тр + 1)2(1 + Тр) + ку ~ izTp3 + т(2Т + х)рг + (Т + 2т)р + кт, где принято обозначение Т = Z?0C, и для упрощения записи счи- тается, что УвЯо < 1 (входная проводимость мала) и ку > 1. Из критерия Гурвица (§ ’3) сразу следует, что система устойчива, только если (7 + 2т) (2Г + т) __ __ т_ е. при неограниченном увеличении ку устойчивость заведомо те- ряется. В силу этого обстоятельства описанная простая схема прак- тически не используется. Вместо нее применяют несколько моди- фицированную схему (рис. 2.29, в). При этом 1 4 44 Ух (D) = —Ц- = у0 (») =4 + w = 7Г (1 + ад* «х+ёД) 11 т^в.с., Та=В6С0, и в силу (5.34) II (гео) Tt<s> —— = - ч Ti® 4 ' (1 + 7огсо)(1 + 7’1г(0) при То& < 1, 7\и <с 1 и выполнении общего условия (5.35) . Таким образом, схема вновь имеет частотную характеристику, близкую к характеристике идеального дифференцирующего звена. Вместе о тем нетрудно убедиться, что постоянные Те, Тл всегда можно вы- брать так, чтобы сохранялась устойчивость и при неограниченно больших ку. Действительно, примем 7’1 = 7’0 = т, ЯОГВ<1; тогда Яр (D) = ку-------=----------------4—^ = ку-------L-----. 1+л у +г р + -...2Р..(tD+1)2 y(i + TD)2 + rD 1Т Vo TJ() Tl +rj) Характеристический многочлен системы равен А (р) = (тр + 1)2[т2р2 + (2т + Т)р + 1 + fcy] и заведомо устойчив при любых ку. Докажите то же самое с по- мощью Т.5.1, построив годограф Яр(г(о). Докажите также устой- чивость схем, использованных для реализации операций идеального усиления и интегрирования.
ГЛАВА 3 ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ § 1. Программа, обратная связь, стабилизация 1.1. Цель управления. Идеальные программы. Качественный смысл любой задачи теории управления всегда один и тот же — необходимо так выбрать управляющее воздействие, чтобы объект «вел себя» желательным образом. Однако для осуществления кон- кретного выбора из множества возможностей такого расплывчатого определения цели недостаточно. Попытаемся его конкретизировать. Пусть y(t) означает процесс изменения'управляемого выхода объекта. Тогда можно сформулиро- вать две основные задачи: 1) обеспечить близость выхода y(t) к желаемому постоянному значению ул (задача регулирования); 2) обеспечить близость выхода y(t) к желаемому процессу yrf(Z) (задача слежения). Очевидно, что задача регулирования является частным случаем задачи слежения, и в дальнейшем будем ориентироваться на более общую ситуацию. Обозначим e(t)=/(t)-y(f). (1.1) Близость у(1)и yd(t) равносильна малости величины ошибки сле- жения e.(t)*). Поставленная задача будет решена идеально, если управление удается выбрать так, чтобы e(t)^O (1.2) в любой момент t > 0 работы объекта. Систему управления, обладающую таким свойством, часто на- зывают инвариантной. Приступим к изучению возможностей достижения зтой цели, считая,* что объект управления описан с помощью линейного диф- ференциального уравнения a(D)y(t)=f,(D)u(t)+^w(D)w(t), (1.3) •) Иногда будут использоваться и частный термин — ошибка регулирова- ния и более общий — ошибка управления.
§ 1. ПРОГРАММА, ОБРАТНАЯ СВЯЗЬ, СТАБИЛИЗАЦИЯ 71 где u(t)—управляющее воздействие, ta(f)—возмущение, a <%(!)), P(D), ^w(D) — многочлены от оператора дифференцирования D. с постоянными коэффициентами. Запишем (1.3) в виде или a(D)e(t)= -p(D)u(t) + a(D)yd(t)- p»(D)w(t). (1.4); Примем предположения: а) начальные значения e{t) и ее производных вплоть до (п — 1)-й равны нулю (и — степень а); , б) многочлены a(D), P(D), pw(D) известны точно, равно как и значения функций yd(t), t S* 0. При этих предположениях управляющее воздействие u(f), обес- печивающее инвариантность, находим несложным образом. Дей- ствительно, вычислим w(i) как решение уравнения p(D)u(t)=a(D)yd(t)-pw(D)w(t). (1.5) Тогда при использовании такого u(t) в качестве задайной про- граммы управления ошибка окажется совпадающей с решением однородного уравнения a(D)e(t)=0 (1.6) при нулевых начальных условиях, а следовательно, е(/)=0, t>0. Особенно прост случай, когда p(D)= р0 = const. Здесь программа, обеспечивающая инвариантность, дается явной формулой: и (t) - Р'1 [a (D) у» ft) - рю (D) w (/)]. (1,7) Пример 1.1. Объект задан уравнением (7D + l)p(0=u(0, 1/(0)= 0 и требуется осуществить безошибочное слежение при t > 0 вы- хода за процессом yd(t) — C^i (t), Ci —const, #>0. Тогда по формуле (1.7)'имеем u(/) = (TD + l)yd(0=C1(7’ + f)l(i), i>0. □ В случае Р(П)=^ const для решения уравнения (1.5) удобно вос- пользоваться преобразованием Лапласа. Предположим дополнитель- но, что начальные значения yd(t), w(t) и производных соответ- ствующего порядка равны нулю, хотя возможно их скачкообразное изменение при t = +0. Тогда из (1.5) следует, что = (1.8)
72 гл. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ где использованы большие буквы для обозначения S’-образов функ- ций. Вычисление программы, обеспечивающей инвариантность, сво- дится к нахождению оригинала по заданному S’-образу. □ Пример 1.2. Требуется обеспечить сохранение начального рав- новесия у(0) = 0, Dy(0)=0 для-объекта, описываемого уравнением |7’1)“ + 2g7T> + l]p(0 = (D + l)u(i) + несмотря на наличие возмущения Поскольку требова- ние эквивалентно yA(t) = 0, то U (р) = — ..у-'Т (Р) = - I -Н4Г~> u' р 4* 1 (р + 1) р откуда u(t)= — (1 — е_<) 1 (t). Если же требуется обеспечить переход к новому значению выхода, prf(f)= 1(f), то согласно (1.8) 777Щ _ rV + 2^p+l 1________L. _L - т41 J- Р + 1 Р р + 1 р \ Р + 1 /’ так что и (t) = Г[6 (f) + (2gr-* - 1) е-‘ 1 (t) ]. Таким образом, для скачкообразного изменения выхода потре- бовалось импульсное неограниченное управляющее воздействие. Это ясно и из физических соображений: невозможно мгновенно изменить выход инерционного объекта с помощью ограниченной силы. □ Сделаем общее заключение. Вывод 1. При принятых предположениях возможно построить программу управления, обеспечивающую выполнение условия ин- вариантности (1.2), однако нельзя гарантировать, что это управ- ление окажется ограниченным. Как правило, импульсное управляющее воздействие неосуще- ствимо. Если функции yd{t), w\t) таковы, что их S’-образы Yd(p), W(p) являются дробно-рациональными функциями, нетрудно уста- новить условие, при котором инвариантность достижима без ис- пользования импульсов. Действительно, в этом случае. U(р), вы- числяемая по формуле (1.8), также окажется дробно-рациональной. Если степень ее знаменателя превосходит степень числителя, то оригинал u(f) не содержит импульсных функций*). В противном случае приходится отказаться от инвариантности либо, что почти то же самое, отказаться от исходного задания же- лаемого процесса yd(t), заменив его более «гладким». Пример 1.3. Рассмотрим тот же объект, что и в П.1.1. Нетруд- но видеть, что при yd(t) =С01 (0 для обеспечения инвариантности *) См. аналогичный результат в § 3, гл. 2.
§ 1. ПРОГРАММА, ОБРАТНАЯ СВЯЗЬ, СТАБИЛИЗАЦИЯ 73 требуется импульсное управление, (рис. 3.1), что Смягчим задание, принимая , , (V^i) 1 (0> I (1.9) Тогда, согласно формуле (1.5), можно вычислить управление u(0 = (TD+ l)^(t) = С(» (1,10) При ti > 0 управление оказывается ограниченной функцией. «Уже- сточение» задания путем уменьшения t, приводит к росту необхо- димого управления, причем при 0 управление стремится к опи- санному выше импульсному. Поскольку найденное при £, > 0 уп- равление (1.10) обеспечивает идеаль- ное следование «смягченному» зада- нию (1.9), то оно же по отношению к исходному скачкообразнему заданию приводит к ошибке исчезающей только при 2 • ' Отметим, что если заранее задана граница й возможного уровня управления |u(Z) I < и, t > 0, то и управление (1.10) может оказаться неприемлемым. Очевидно, что для его допустимости должно быть выполнено условие |С0|(1 + ^<й. \ 1 / Можно попытаться «смягчить» задание, все более увеличивая ft, ио при It’d > и желаемый процесс вида (1.9) окажется вообще неосуществимым *). О 1.2. Влияние неточности математической модели. Важно понять, что даже следование идеально рассчитанной программе может не дать эффективного решения реальных задач управления. Дело в том, что при расчете мы опираемся на математическую модель объекта, предполагая точно известными передаточные функции, возмущения и желаемый процесс изменения выхода. В действи- *) Общие методы построения программ управления при наличии ограни- чений излагаются в гл. 9.
74 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ дельности же все эти факторы известны неточно. При расчете мы вынуждены опираться лишь на их оценки. Любая же погрешность, несоответствие оценки и реальных значений могут привести к не- приятным последствиям. Пример 1.4. Пусть объект описывается уравнением (D —1)у = u(t)+ w(t). (1.12J Пусть требуется сохранить начальное состояние, у(0) = 0, а воз- мущение равно ш(£) = С1 (/).*Тогда, очевидно, следует принять с обеспечением инвариантности. Однако, если вместо константы С известна лишь ее неточная оценка С, то и расчет можно провести только на базе этой оценки, приняв u(t)=—Ci(t). Но при этом выход начнет изменяться согласно уравнению (D-l)p(O = (-C + 01(i), откуда = (113) Даже при малой погрешности С —С отклонение от желаемого состояния становится с ростом t сколь угодно большим. □ Особенность приведенного примера состояла в том, что объект не являлся устойчивым. Почти очевидным является следующее заключение. I Вывод 2. Программное управление непосредственно не при- I менимо к неустойчивым объектам, если время работы длительно. Действительно,' пусть начальные условия хотя бы незначитель- но отличаются от расчетных, принятых за нулевые, тогда, в силу неустойчивости, ошибка с течением времени сколь угодно отой- дет от желаемого нулевого значения. Если же начальные условия заданы точно, но неточно известно возмущение, то рассчитанная по его оценке программа не полностью компенсирует реальное воз- мущение, а даже малый остаток может сколь угодно «раскачать» неустойчивый объект. 1.3. Стабилизация с помощью обратной связи. Учтем теперь, что для формирования управляющего воздействия возможно ис- пользовать не только априорную информацию, заключающуюся в математической модели, но и текущую, получаемую в ходе работы управляемого объекта от измерительных устройств. Как уже ука- зывалось в гл. 1, использование текущей информации может по- зволить преодолеть неприятности, связанные с неточностью апри- орной. . Продемонстрируем прежде всего, что на основе измерений вы- хода объекта y(t), как правило, можно выработать такое управляю- щее воздействие (обратную связь но выходу), чтобы замкнутая
§ 1. ПРОГРАММА, ОБРАТНАЯ СВЯЗЬ, СТАБИЛИЗАЦИЯ 75 этой обратной связью система оказалась устойчивой, даже если сам объект неустойчив. Начнем с наглядного случая, когда уравнение объекта имеет вид ct(D)t/(0 = М({)+ ?w(D)w(t), (114)’ т. е. P(D)= р0 = const. Выберем u(t) в виде u(t) = Uj(t)+ u0(t). (1.15)’ Первая компонента uf(t) есть сигнал обратной связи* *), выра- батываемый на основе текущих измерений выхода y(t), а вторая задается любым другим образом, но не зависит от y(t). Пусть u,(n = -fc(D)y(i), (1.16) где &(D) есть многочлен от оператора дифференцирования fc(D) = 7c0 + /c1D+. ..+ /сДУ, (1.17) т. е. подразумевается, что при выработке управления либо, кроме y(t), измеряются и производные выхода вплоть до r-й, либо диф- фереццирование y(t) производится в -вычислительном устройстве (рис. 3.2). Подставив (1.15), (1.16) в урав- нение объекта (1.14), получим [a(D)+MW]y(*) = = Мо(О+ MD) (1-18) Вывод 3. Введение обратной < Рис. 3.2 по выходу и его произ-. водным позволяет изменять характеристический многочлен си- стемы- вместо исходного а(р) получаем А (р) А «(р) + Р«Л (Р)- (1.19) Пусть А"(/>) — произвольный устойчивый многочлен. Тогда при выборе *(D) = J-[Ad(D)-a(D)] (1.20) система, замкнутая обратной связью, окажется устойчивой. Более того, в принципе возможна не только стабилизация, но и произ- вольный выбор характеристического многочлена замкнутой систе- мы, а следовательно, и произвольное расположение его корней, т. е. обеспечение произвольной степени устойчивости. Пример 1.5. Пусть объект описывается уравнением (Л)3 + D2) у = и, 7 > 0. *) Индекс- / соответствует первой букве английского слова feedback, озна- чающего «обратная связь».
78 гл. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ Объект не является устойчивым. Его характеристический много- член а(р)= Тр3 + ps имеет кории pt = — 1/Т, pz = р3 = 0. Введем обратную связь и = —кеу — kfiy — k^D2y. Тогда выход будет изменяться согласно уравнению [TD3 + (1 + к2) D2 + ktD + к J у = 0. Характеристическое уравнение замкнутой системы имеет вид Тр3 + (1 + k2) p\+ kiP + ка = 0. Выберем коэффициенты усиления к3, kit к2 так, чтобы все его корни были одинаковы и равны а = а = а = т>0’ т. е. чтобы характеристическое уравнение имело вид (р + ±у = рз + 3-~р* + 3~р + ^ = 0. Очевидно, это достигается, если принять , т , зт , зт . fco=~3, /г2= —— 1. Изменяя величину т, можно добиваться различной скорости зату- хания эффекта от ненулевых начальных условий. О Отметим теперь следующие важные обстоятельства: а) всегда можно считать, что а(р) имеет вид а(р) = рп + +...+ а»,. т. е. считать, что .а,, = 1 (в противном случае можно предваритель- но разделить обе части уравнения (1.14) на коэффициент при стар- шей производной). Пусть желаемый устойчивый многочлен 1^{р) имеет вид Дй (?) = рп + . • • + До- Выбором п коэффициентов До, .. ., Дп-i можно задать любое рас- положение п корней. Тогда, согласно (1.20), к(р) является много- членом (и — 1)-й степени к(р)=ка + к1р+. ..+кп^рп~1, (1.21)' где к. = г = 0, 1, .... п-1. (1.22) Р»
§ 1. ПРОГРАММА. ОБРАТНАЯ СВЯЗЬ, СТАБИЛИЗАЦИЯ 77 Вывод 4. Для обеспечения произвольного расположения п корней характеристического уравнения замкнутой системы до- : статочно вводить обратную связь по выходу и его производ- ным вплоть до (п—Г)~й (именно так было сделано в Приме- ре 1.5). б) Попытаемся потребовать, чтобы желаемый многочлен Ad(p) имел степень ниже п, т. е. ниже порядка дифференциального урав- нения объекта. Формально это возможно, хотя из (1.20) ясно, что для этого как раз потребуется обратная связь по га-й произ- водной, с коэффициентом кп = — 1/р0. Пусть, однако, величина известна не совсем точно, т. е. при расчете мы располагаем ее оценкой Ро = Ро + б₽0 со сколь угодно малой погрешностью. Тогда, выбрав, кп = — 1/р0, получаем, что действительный характеристический многочлен за- мкнутой системы (о \ ... имеет все-таки степень п. Более того, в зависимости от знака по- грешности (который неизвестен!) коэффициент при рп может ме- нять знак, и система в действительности может оказаться неустой- чивой (см. критерий Стодолы, § 3 гл. 2). | Вывод 5. Недопустимо требовать, чтобы замыкание обрат- I ной связи приводило к уменьшению порядка системы. Подчеркнем также, -что собственно для решения задачи стаби- лизации пет необходимости во введении всех производных, вплоть до (п-1)-й. В частности, в П.1.5 можно взять и = — коу — кД)у, выбрав к9, kt любым образом, лишь бы было выполнено условие Рауса — Гур- вица ki > к9Т, кя >0, к, > 0, обеспечивающее устойчивость системы, замкнутой этой обратной связью. 1.4. Общий алгоритм стабилизации. Перейдем к рассмотрению общей ситуации, когда (3(D) является произвольным многочленом •степени не выше п (п. ф. «управление — выход» строго реализуема). При этом и закон управления примем в более общей, чем (1.16), форме: предположим, что сигнал обратной связи строится, как ре- шение дифференциального уравнения l(D)uf(t)= — k(D)y(t), (1.23) где Z(D) — произвольный многочлен, отличный от нуля. Ранее рассмотренный закон управления по выходу и его произ- водным является частным случаем (1.23) при Z(D)=1. Введение многочлена Z(D) создает новые возможности. Примером закона бо-
78 . ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ лее общего вида, чем (1.16), является так называемый пропорцио- нально-интегралъно-дифференциалъный закон управления или, ко- ротко, ПИД-закон, когда ' uj(t) = — k1y{t) — ki'^ — k0^ydt, поскольку это соотношение эквивалентно дифференциальному урав- нению Du(i) = -(A!o + A1D + A:2D2)p(Q, (i:24)i записываемому в виде (1.23) при Z(D)= D. Уравнение объекта (1.3) и уравнение обратной связи образуют систему a(D)y(Z)=₽(D)[u/(0+un(0] + ₽w(D)n>(Z), . l{V)u,(ty= —k(D)y(t). ' ( 1 Исключив из нее «/(f), получим уравнение [a(D]Z(D)+p(D)A(D)]p(Z)=Z(D)[HD)un(Z)+^(D)«’(O]- (126> Таким образом, характеристический многочлен замкнутой системы принял вид < A(p)=a(p)Z(p)+ $(p)k(p). (1.27> Теорема 1.1. Пусть многочлены а(р), Р(р) являются взаимно простыми. Тогда многочлены к(р), 1(р), определяющие вид обрат- ной связи (1.23), могут быть выбраны так, чтобы характеристиче- ский многочлен замкнутой системы Д(р) имел произвольные, на- перед заданные коэффициенты, т. е. произвольное расположение корней. Доказательство элементарно следует пз известного алгебраического- факта [3.5]; по заданным взаимно простым а(р), Р(р) можно найти многочле- ны к(р), Цр) такие, что а(р)Цр) + ₽(р)й(р) s 1. (1.27'> Пусть Д,!(р)—желаемый характеристический многочлен замкнутой систе- мы. Умножив (1.27') на Д''(р), получим а(р)Г(р)У'(р) + Р(р)й(р)Д''(р) = Д''(р). Следовательно, можно добиться результата Д (р) £ а (р) I (р) + ₽ (р) k (р) \d (р), (1.28) положив Цр) = 7(р)Д<Др), 1Цр) = й(р)Д'1(р). Практически нет необходимости в промежуточном вычислении к(р), Цр). До- статочно просто задать к(р), Цр) в виде многочленов с неопределенными коэф- фициентами, подобрав их затем из тождества (1.28). Многочлены к(р), Цр) можно найти и с помощью алгоритма Евклида» обычно используемого для доказательства указанного алгебраического утверж- дения. Пусть для определенности deg a > deg р. Разделим a(p) на ₽(р) с остат- ком aj (р), т. е. представим ' a(p) = P(p)^i(p) + аДр),
§ 1. ПРОГРАММА, ОБРАТНАЯ СВЯЗЬ, СТАБИЛИЗАЦИЯ 79 где аЦр) имеет степень ниже, чем а(р) и р(р). Тогда а(р)Цр) + $(р)к(р) = аЦр)Цр) + Р(р)Ыр), где к1(р) &к(р) + х^ (р) I (р). Далее разделим Р(Р) на аДр), представив ₽(р) = <Xi(p)pi(p) +fr(p), где Pj(p) имеет степень ниже, чем ₽(р) и а.Цр). Тогда a(p)Z(p)'+P(p)fc(p) = ai(p)Zi(p)+^1(р)й1(р), где 1Цр) — Цр) + Pi(p)Mp)- Последовательно производя эту процедуру, при- дем к тому, что либо аа(р), либо [J,(р) станет константой. Пусть для определен- ности аа (р) = а, = const и получено, что а(р)?(р) + $(р)к(р) = а.ТЦр) 4- $Др)к,(р), Тогда, положив i3 = J_Ad(p), yp)sOi “s можно «обратным ходом» найти Цр), к(р). Пример 1.6. Пусть а(р) = р2 + 2, Р(р) = р. Потребуем, чтобы a(pH(p) + ₽(p)^(?)^(P + l)2AAd(p). (1.28') Положим l(p)=la, к(р)= к0 + ktp и выберем коэффициенты l0, kt, ki так, чтобы удовлетворялось тождество (р2 + 2) 10 + р (к0 + ktp) = р1 + 2р + 1. 1 t Отсюда 1а + kt = 1, к0 — 2, 2l0 = 1 или к0 =2, кх = -у, 10 = Тем самым закон управления приобретает вид ~u(t) = — 2y(t)— т. е. является ПД-законом. Получим решение с помощью алгоритма Евклида. Имеем а(р)~ рг + 2 = р-р + 2 = Р(р) • р + 2, и тождество (1.28') эквивалентно преобразуется к виду 2Z(p)+₽(p)[A:(p)+pZ(p)] = (p + l)2. Оно удовлетворяется, если Т(р) = 4д'(р) = 4-(р2 + 2р + 1), к{р)~-рЦр). 2 Тем самым Hj (D) = - g^.+ B±1 D, D2 + 2D + i ’
80 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ " и мы находим другой закон управления *) (D2 + 2D + l)u(Z)=-(D2 + 2D+l)Di/(0, обеспечивающий то же самое расположение корней характеристи- ческого многочлена замкнутой системы. О Из Т.1.1 вытекает следующее утверждение. Следствие. Пусть многочлены а(р), Р(р) являются взаимно простыми или имеют в качестве наибольшего общего делителя устойчивый многочлен. Тогда можно выбрать обратную связь вида (1.23), обеспечившую устойчивость замкнутой системы при не- устойчивом объекте. В противном случае стабилизация невозможна. Доказательство. Представим а(р), Р(р) в виде а(р) = а0(р)а(р), ₽(/>) = а0(р)№), где ао(р) — наибольший общий делитель, так что а(р), (J(p) взаимно просты. Тогда характеристический многочлен замкнутой системы имеет вид Д(р) = а0(р) [«.(р)Цр) + Р(р)*(р)]- Выражение в квадратных скобках, согласпо_Т.1.1, может быть сделано лю- бым, а следовательно, устойчивым многочленом Д'Чр), т. е. Д(р) = а0(р)\Л(р). Если ссо(р) устойчив, то и Д(р) устойчив. Из неустойчивости ао(р) следует не- устойчивость Д(р), причем выбор /г(р), /(р), очевидно, не может изменить это- го факта. Сделаем некоторые замечания к полученному теоретическому результату. При взаимной простоте а(р) и р(р) теоретически можно до- биться того, чтобы Д (/>)= Д"(/>), где Кл(р) имеет произвольную степень, в частности, равную нулю (согласно (1.27'))- Однако из вида тождества (1.2) ясно, что это, вообще говоря, возможно только за счет точного обращения в нуль коэффициен- тов при старших степенях р. Вместе с тем, как уже показывалось, в более простой ситуации, любая неточность в задании параметров объекта при. расчете коэффициентов обратной связи может приве- сти к неточному обращению в нуль старших коэффициентов харак- теристического многочлена замкнутой системы, а следовательно, чревато потерей устойчивости. Не останавливаясь на доказательстве, укажем, что сокращения старших коэффициентов не произойдет, если принять deg Д''(р) = п +' m - 1, где п — степень а(р), а тп — степень р(р). При этом многочлены 1(р) и к(р) можно разыски- вать как многочлены степени ш — 1 и п— 1 соответственно. Сформулируем в качестве итога алгоритмы стабилизации объ- екта, заданного уравнением (1.3). *) Сокращение числителя и знаменателя W/ здесь недопустимо. Оно при- ведет к системе с другим характеристическим многочленом.
§ 1. ПРОГРАММА, ОБРАТНАЯ СВЯЗЬ, СТАБИЛИЗАЦИЯ 81 1. Найти наибольший общий делитель а0(р) многочленов а(р) и Р(р). Если таковой неустойчив, то стабилизация невозможна. Ес- ли а0(р) устойчив, то выделить взаимно простые многочлены а (р) = —р (р) = Пусть deg(a) = n, deg(p) = ?nf а(р) = рп+... 2. Выбрать п + т — 1 чисел А.х, ..., Х-+-_1 с отрицательными вещественными частями и составить многочлен (р) = (р - Хг) (р - Х2)... (р - К-+-^ = = р»+--1 + Д-+__2рМ-т-2 + . . , + До._ 3. Из тождества a(p)Z(p)+Р(р)А:(р)^ Ad(p) найти п + т линейных уравнений- относительно п + in неизвестных коэффициентов многочленов А-(р) = + *1Р + ... + ^-iP"-1, z (р) =~1а +7,р + ... + I-_jPm-1. * 4. Найти решение этих уравнений. 5. Записать многочлены к(р)= аа(р)к(р), Z(p)=a0(p)Z(p). 6. Записать стабилизирующий закон управления в виде диф- ференциального уравнения Z(D)w(Z)=-*(D)y(Z). Следует, конечно, понимать, что последнее уравнение однознач- но определяет закон изменения и(Z), только если заданы началь- ные условия, т. е. т — 1 начальных значений u(t) и его произ- водных. Однако задание этих значений не влияет на сам факт обеспечения устойчивости замкнутой системы. Подчеркнем такжё, что все описанные в данном параграфе законы управления не яв- ляются строго реализуемыми, если т < п, поскольку п. ф. преобра- зования —у (t) -> u(t) имеет вид а многочлены выбирались из условия deg к = п — 1, deg Z = т =- 1. Нетрудно, однако, убедиться, что если повысить степень желае- мого характеристического многочлена Ad(p) до 2п— 1, то тех же ® А. А. Первозианский
82 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ результатов можно добиться, выбирая Z(p) многочленом степени п — 1 с заведомым обеспечением реализуемости *). Пример 1.7. Пусть, как и в примере 1.5, «(?) = рг + 2, ₽(р) = р, т. е. п 2, т = 1. Положим Ad(p) = P3 +А*р2 +Afp +А?,. выбрав коэффициенты произвольным образом, лишь бы этот мно- гочлен был устойчив, т. е. А1А2>Ац. Найдем далее коэффициенты многочленов к (р) = ка + ktp, K.p'j — lo + liP степени п — 1 = 1, так чтобы а (р) I (р) + Р (р) Цр) = Ad(p)', т. е. (р2 + 2) (Zo + Лр)+ р(ка + ktp) = &.л(р\. .Для этого достаточно взять - = /ео = Дг-Л 4-1 = Al-4’At □ В заключение отметим, что если объект представим в виде по- следовательного соединения однонаправленных звеньев, то с по- мощью обратной связи может быть стабилизировано любое звено, если, конечно, возможно измерение его выхода и допустимо вве- дение управляющего воздействия на его вход. § 2. Основные законы управления. Инвариантность 2.1. Комбинирование управления по программе и обратной свя- зи по выходу. Из предшествующего ясно, что использование обрат- ной связи по выходу снимает основное препятствие к применению программного управления. Действительно, пусть объект описыва- ется уравнением a(D)p(*W(D)uW+MD>(0. (2.1): Выберем управление u(t) в виде суммы u(Z)= ti/(Z)+H0(Z), (2.2)} где ut{t) строится как обратная связь, согласно уравнению Z(D)tt/(O = -fc(D)p(f), " (2.3) а и0(£) задается согласно некоторой программе во времени. *) Другой подход к решению проблемы реализуемости будет описан в § 7.
§ 2. ОСНОВНЫЕ ЗАКОНЫ УПРАВЛЕНИЯ. ИНВАРИАНТНОСТЬ 83 Исключая переменную получим A(D)y(t)«Z(D)p(P)[uo(O+P»(D)w(f)], (2.4} где . A(D) = a(D)Z(D)+₽(D)fc(D). (2.5} Таким образом, после замыкания обратной связью объект «пре- образился», изменил свои динамические свойства. Формально эти изменения эквивалентны замене операторных многочленов: *a(D) на A(D), P(D) на Z(D)^(D), ₽«(D) на Z(D)pw(D). К «преобразо- ванному» объекту программное управление уже применимо, если обратная связь выбрана так, чтобы он был устойчив. В частности, если функции w(t), yd(t) известны точно, то программа u0(t)f рассчитанная из уравнения A(D)/(f)=Z(D)w0(i) + Z(D)MD)№(i), (2.6} гарантирует инвариантность e(i)—0, t > 0, если начальные усло- вия были нулевыми. Более того, программа, найденная по данным, мало отличающимся от истинных, приведет к малым ошибкам e(i). Пример 2.1. Вернемся к простейшей задаче, описанной в П.1.4. Пусть вновь объект задан уравнением - (D-l)y(«) = u(f)+ w(t), а величина С скачка возмущения w(t)= Ci(t) известна неточно. Как было показано в П.1.4, использование программы, рассчитанной по оценке С, приводит к сколь угодно большому уходу от желае- мого значения г/а(4)=0. Введем теперь управление в виде (2.2), положив — — 2y(t). Тогда выход будет меняться согласно урав- нению (D + l)p(0=uo(f)+u>(f). Ориентируясь на оценку возмущения, примем и0 (/) = ~С1 (£). Легко видеть, что после этого y(Z) = (C-Cj(l-e-‘), т. е. отклонение от желаемого значения окажется малым при малой погрешности оценки. □ 2.2. Управление по возмущению. Зачастую вид возмущающих воздействий заранее известен очень плохо или даже совсем не- известен, однако имеется возможность их непосредственного изме- рения в ходе работы системы управления. Такие измерения обычно удается эффективно использовать. Обратимся вновь к (2.1) и по- пытаемся строить управление u(t) не заранее, а как выход звена, описываемого уравнением ₽(D)u(f)=-^(D)wG). (2.7} Если deg р > deg то это возможно, например, с помощью ана- логового вычислителя (рис. 3.3). Так построенное управление осу- 6*
84 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ ществляет текущую компенсацию действия возмущений на объект. Коли желательно сохранить нулевое начальное состояние £/*(£)= О, то, очевидно, введение управления по возмущению согласно. (2.7) позволяет этого добиться. Имеются, однако, две неприятности. Первая из них уже зна- кома: если объект неустойчив, то малейшая неточность компенса- ции может со временем неограни- ченно далеко увести выход от же- лаемого значения. Способ преодоле- ния этой неприятности также изве- стен. Если дополнительно ввести стабилизирующую обратную связь, Рис. 3. 3 то выход объекта подчинится урав- нению (2.4). При выборе u0(t) как решения уравнения (2.7) с ограниченной погрешностью он останется ограниченным. Вторая неприятность менее заметна. Если многочлен $(р) имеет «плохие» корни, то при начальных значениях u(t) (или соответствующих производных), не равных нулю, решение уравнения (2.7) содержит неограниченно возрастающую компоненту. Эта «паразитная» ком- понента удовлетворяет однородному уравнению (J(D)u(£)=O, а по- тому не влияет на выход y(t). Однако неограниченный рост самого управляющего воздействия сам по себе, как правило, недопустим. Вывод. Управление по возмущению не применимо, если чис- литель р передаточной функции объекта Ни„ имеет корни в пр'а- вой полуплоскости*). Если многочлен (J устойчивого управление по возмущению (при необходимости — в сочетании со стабилизирующей обратной «связью) является эффективным и часто используется на практике. 2.3. Управление с обратной связью по ошибке. Наиболее важ- ным законом управления явлйется управление с обратной связью по ошибке. Пусть от измерительного устройства поступает сигнал, равный или пропорциональный ошибке e(t)=yd(t)-y(t). (2.8) € использованием вычислительного устройства его можно преоб- разовать в сигнал управления, подчиняющийся уравнению Z(D)n(f)=fe(D)e(O (2.9) или u(t) = Hf(D)s(t). (2.10) 'Очевидно, что этот сигнал можно рассматривать как суперпозицию двух компонент: и^)-Н,(Ъ)уЧЦ (2,11) “ u2(t)=-FIl(D)y(t). (2.12) *) Случай корней на мнимой оси требует специального рассмотрения.
§ 2. ОСНОВНЫЕ ЗАКОНЫ УПРАВЛЕНИЯ. ИНВАРИАНТНОСТЬ 85 Вторая компонента является уже изученным сигналом обратной связи по выходу объекта и может быть использована для стабили- зации. Первая же компонента содержит информацию о желаемом изменении выхода (/''(it). Если таковое заранее неизвестно, то эта информация совершенно необходима для обеспечения малости ошибки. Выясним, как ведет себя ошибка е(£) при использовании за- кона (2.9). Из (2.1), (2.8), (2.9) следует, что е(£) подчиняется уравнению A(D)e(0=/(D)a(D)i/tf(f)-/(D)₽„(D)w(0; (2.13) или, в краткой записи, е(0=[1-Яз(О)Ш, (2.14) где введены обозначения И ПВ А 1 - 1 (Р) a (D) - P<D)fc(D) _ Яр <Р> л . Д (D) ~ a (D) I (D) + 0 (D) к (D) 1 + Яр (D) ’ Я₽<°)^!ГЖПБГ = Huv(D)H9(D), (2.16) ' (2.17) ЯЧ(О)Д^, (2.18) Эти обозначения являются стандартными. Функцию ЯР(П) при- нято называть п. ф. передачи по разомкнутому контуру (р. п. ф.), функцию Н3 (D) — п. ф. передачи по замкнутому контуру (з. п. ф.). Проис- хождение названий ясно из структур- ной схемы (рис. 3.4) и соответствуют описанию соединений с обратной связью в гл. 2. Функцию s(Z) обычно именуют приведенным сигналом или отрабаты- Рис. 3.4 ваемым воздействием. Запись в виде (2.14) будет постоянно использоваться в даль- нейшем. Проиллюстрируем введенные термины на знакомом примере. Пример 2.2. Рассмотрим электромеханическую следящую систе- му, формальное описание простейшего варианта которой было дано в П.5.1 гл. 2. Заменим теперь соотношения (5.19), (5.20) из гл. 2, описывающие работу датчика и усилителя, на одно, более общее M(i) = /7/(D)e(0, где Ht (D) — некоторая п. ф., определяющая вид закона управле- ния, а е(£) — ошибка управления, равная в данном случае разно- сти угла поворота задающей оси q/(t) и угла поворота вала <p(t).
86 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ Структурная схема такой Системы представлена на рис. 3.5. Выходной здесь является переменная так что, согласно (2.5), п. ф. разомкнутого контура яр(В)=яи;(П)Я/(П), п. ф. замкнутого контура, согласно (2.17), H,iai (D) (D) тт /ГЬ\ иф X / 7 v ' * а сигнал определяется формулой s(i)= cp^i)—^m,(D)?nB(t). О Из (2.14) в частности следует, что с помощью закона управления (2.9) невозможно добиться инвариантности, т. е. выполнения ус- ловия e(i)-0, t > 0, для любого сигнала 3(f). Действительно, чтобы но в силу лентно Рис. 3.5 для этого требуется, 1-Я3(О>0, (2.19) (2.15) такое условие эквива- a(D)Z(D)^0, что не может иметь мёста, так как многочлены а, I отличны от нуля. В дальнейшем мы детально изучим, насколько возможно при- близиться к идеалу с использованием управления (2.9), но предва- рительно рассмотрим более общий класс законов управления. 2.4. Управление с внутренней обратной связью. Допустим, что имеется возможность измерять не только ошибку e(i), но и не- посредственно отслеживаемый процесс yd(i). Поскольку e(Z) = = yd(t)-~ y(t), это предположение эквивалентно предположению о возможности независимого измерения любой пары y(t) и pd(Z) или е(£) и y(t). Тогда возникает и возможность строить законы уп- равления в виде, например, u(t)= —Hf(D)y(t) + Нл(Т))у*Щ. (2.20) Сравним его с (2.10). Видно, что (2.10)—это частный случай (2.20), когда ЯДП) = ЯДП). Таким образом, получение новых из- мерений позволяет обеспечить большую свободу выбора законов управления. На практике чаще всего используется комбинация из- мерений ошибки и выхода . и(0=ЯЕ(О)е(0-ЯДО)у(0, (2.21)
8 2. ОСНОВНЫЕ ЗАКОНЫ УПРАВЛЕНИЯ. ИНВАРИАНТНОСТЬ 87 эквивалентная (2.20), если #,(D)+ #B(D), Z/d(D)= //e(D). Соответствующая (2.21) структурная схема дана на рис. 3.6. Она содержит внутренний контур обратной связи, охватывающий объект. Для того чтобы проще понять смысл введения этого контура положим Тогда различие ленными на рис. 3.4 и 3.6, све- дется только к одному: по отно- шению к компоненте управляю- щего воздействия, пропорциональ- ной ошибке, п. ф. объекта ЯИ„(В) заменяется на п* ф. соединения с обратной связью [1+//v(D)^(D)]-7ZU!,(D). (2.22) между структурами, представ- В частности, введение внутренней рис з.ц обратной связи позволяет пред- варительно стабилизировать объект, а затем уже использовать уп- равление с обратной связью по ошибке для того, чтобы приближать его выход к желаемому yd(t). 2.5. Комбинированное управление и инвариантность. Наиболее общая ситуация возникает, когда имеется возможность измерять независимо и выход y(t), и отслеживаемый процесс yd(t), и воз- мущение w(t), а слёдова- тельно, возможность постро- ения управления в виде U(t)= Uv(t) + Ud(t)+ uw(t)=* + Hd(D)yd(t)+Hw(D)w(t), e(t> (2.23) причем допустим независи- . мый выбор всех п. ф. Если вместо yd измеряет- ся ошибка, то, как уже Рис. 3.7 говорилось, остаются те жо возможности. Структурная схема, соответствующая их ис- пользованию, дана на рис. 3.7. В ней по сравнению с рис. 3.6, кроме внутренней обратной связи, присутствует еще звено с п. ф. //„.(D), обрабатывающее результаты измерения возмущений. С по- мощью этой дополнительной операции можно в принципе полностью или частично компенсировать действие возмущений, о чем уже говорилось в § 1. Выясним предельные возможности комбинированного управле- ния.
88 гл. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ Подставляя (2.23) в уравнение объекта (2.6), нетрудно полу- чить следующее выражение для ошибки ₽ _ <4-яиу(Р)(Я/(Р)-янР)] _ //вд(Р)+яед(Р)Яю(Р) eW~ 1-f-//р (D) У W 1 + Яр(Р) (2.24) Теперь оказывается осуществимой простая идея достижения ин- вариантности: а) выбрать #/(D) так, чтобы обеспечить устойчивость замкну- той системы; б) выбрать Hd(D) так, чтобы обратить в нуль 1-е слагаемое; тогда Hd(D) = I//(D) + ^-1(D); (2.25} в) выбрать //„(D) так, чтобы полностью компенсировать воз- мущение, т. е. принять ' (2.26) Действительно, полученная система окажется устойчивой и ин- вариантной, а потому слабо чувствительной к неточности задания начальных условий и параметров. Пример 2.2. Пусть объект описывается уравнением (D-a)y(t)=bu(t), р(0) = 0, где а, Ъ — положительные константы. Пусть, требуется, чтобы уп- равляемый процесс y(t) принял значение yd(t)=l(t). Объект не- устойчив. Введем стабилизирующую обратную связь, обеспечивая желаемый вид характеристического многочлена: A (D)= Ad(D)= D + а. Из условия (2.3), где следует принять a(D)=D — a, [3(D)=5, находим . 7r(D)=2ab-‘, Z(D}= 1. «Идеальный» закон управления (2.23), (2.25) приобретает вид u(Z) = Zr‘(D + a)e(Z) + b~'(D — а} у (t). - Подставляя его в уравнение объекта, получаем (D + a)e(Z)=0, т. е. при нулевом начальном условии действительно имеем e(Z)=O при t > 0, причем малые отличия е (0) от нуля приводят лишь к затухающим отклонениям. Управление, конечно, содержит им- пульсную компоненту: ведь вновь требуется мгновенно изменить выход инерционного объекта (см. § 1). В дополнение предположим, что в расчете вместо истинного значения коэффициента b использована его оценка Ь — (l + p)Z>,
§ 2. ОСНОВНЫЕ ЗАКОНЫ УПРАВЛЕНИЯ. ИНВАРИАНТНОСТЬ 89 где |р,| < 1, так что делается попытка применить закон управления u(t)=b~'(I) + a)e,(t)+b~l(D — a)y(t), Подстановка в уравнение •объекта дает [D + a + p(D-a)]e(0“P(D-a)/(0. Нетрудно теперь подсчитать, что e(i)= р.[2е_<1_ада‘— 1 + О(ц)], #>0, т. е. отклонение от нуля имеет порядок неточности в задании па- раметров и ограничено при любых t. О Конечно, важно понимать, что инвариантность*) является лишь идеалом: любые неточности в знании параметров объекта приво- дят к отклонению от нее. Особо чувствительными являются инвариантные законы управ- ления к ошибкам измерительных устройств, называемыми также помехами или шумами. Учтем теперь этот фактор, считая, что в законе управления (2.23) могут использоваться лишь приближенные значения y(t), yd(t), w(t), отличающиеся от истинных значений y(t) = y(t)+Nu(t), y4t) = yd(t)+N4t), w(t) — w(t) + Nw(t), (2.27) где Ny(t), Nd(t), Nw(t) — помехи в соответствующих измерительных устройствах. Подставляя выражение управления, искаженного помехами, u(t)=-IIf(D)y(t)+ Hd(D)yd(t}+ Ha(D)w(t) ' (2.28) в уравнение объекта и производя необходимые выкладки, найдем, что наряду со слагаемыми, указанными в формуле (2.24), ошибка управления будет содержать добавочную компоненту, порожденную наличием помех: «х (0 = - I- Uf (В) Nu (0 + Hri (D) Nd (t) + Hw (D) Nw (t)]. ' (2.29) Она ни в коей мере не исчезает, если применяется инвариантный закон с п.ф., задаваемыми (2.25), (2.26). Более того, в этом случае нетрудно подсчитать, что ед' (i) = Ну (0 Nd (t) + ф) Nw (f),: (2.30) т. е. наличие обратной связи не отражается на уровне помех Nd(t). *) Идея инвариантности была выдвинута в 1938 г. Г. В. Щипаповым, но применительно к управлению с обратной связью по ошибке, где в действитель- ности она не осуществима. Тем не менее дальнейшие исследования позволили • выявить в ней рациональное зерно*
90 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ Если помехи велики, то «инвариантное» управление оказывается практически неприемлемым. Вместе с тем это отнюдь не компро- метирует саму идею комбинированного управления, которое опять- таки широко используется, но с выбором определяющих ее ,п. ф., вообще говоря, отличным от «идеальных» (2.25), (2.26). § 3. Метод динамической компенсации Поставим перед собой задачу выбора (синтеза)’ закона управ- ления с обратной связью, опирающегося на измерение ошибки уп- равления. 3.1. Влияние помех. Заранее учтем, что измерения производятся с помехами, т. е. управление может строиться только в виде u(f) = ///(D)e(/), (3.1) где 8(Z)=e(i)+^(i) = /(0-Z/(0 + ^(0, (3.2) a (t) — заранее неизвестная функция, отражающая зависимость помех от времени. Равным образом заранее неизвестна и функция yd(0, описы- вающая отслеживаемый'процесс. - Используя уравнение объекта y(t) = KHB(D)u(t)+ (3.3) в которое также входит неизвестная функция w(t}, описывающая возмущения, запишем зависимость ошибки е(£) от всех указанных неизвестных объектов. Стандартные выкладки приводят к формуле 8(0=[1-Я,(В)1з(0+Я3(В)ЛГ,(0’, (3.4) где использованы ранее введенные обозначения для п. ф. замкнуто- го контура Я3(В) и сигнала s(Z): Я3(В)=[1 + ЯР(В)]-1ЯР(В), Яр(В)=Яив(В)Я/(О), (3.5) 5(е)=^(0-яшв(О)»(0. (3.6) Формула (3.4) отличается от (2.14) лишь учетом влияния помех. Выбор п.ф. обратной связи Ht(D) определяет только вид з. и. ф. ЯЭ(В), в то же время ошибка зависит и от неизвестных функций s(t), Nc(t) (сигнала и помехи). Поэтому затруднительно сформу- лировать задачу выбора исходя только из требования ма- лости ошибки. 3.2. Динамическая компенсация. Простейший подход к выбору обратной связи заключается в том, чтобы предъявить требования к самой Я3(О), например, потребовать, чтобы ff3(D)S^(D), (3.7) где Яз(В) — некоторая «образцовая» п. ф.
8 3. МЕТОД ДИНАМИЧЕСКОЙ КОМПЕНСАЦИИ 91 Если это удается сделать путем выбора ЯДБ), то замкнутая система будет реагировать на любые сигналы так же, как образ- цовая. Оставим пока в стороне вопрос о том, каким должен быть об- разец. Заранее ясно лишь одно — он должен быть устойчивым, т. е. если . ftrt (D) ^(D) = L^,; - (3.8) то многочлен ad(D) должен иметь корни только в левой полупло- скости, и ad(D)=# [У1 (D). Из (3.5) следует, что для выполнения тождества (3.7) требу- ется выбрать п. ф. обратной связи в виде ' IIе1 (D1 ЯДП) = яЯП)дН^(П)—(3.9) * *1 з \ и) Такой способ синтеза обычно называют методом динамической компенсации, поскольку в Я/ (D) входит сомножитель в виде функции, обратной п. ф. преобразования «управление — выход объ- екта». Тем самым формально осуществляется компенсация дина- мических характеристик объекта. Пример 3.1. Пусть объект описывается уравнением (TD + 1)р(1) = /ги(О, так что ^(О) = 7ПТТ’ h>Q' Г>°- Пусть «образцовая» п.ф. задана в виде Я1(П)=^, fc>°- Согласно (3.9), следует выбрать Закон управления имеет вид ПИ-закопа: 3.3. Ограничения на применимость. За внешней простотой ме- тода компенсации скрываются довольно тонкие проблемы. Продемонстрируем их сначала на простейшем примере. Пример 3.2. Пусть условия те же, что и в П.3.1, за исключе- нием того, что Т заменено на —Т, т. е. объект неустойчив. Фор- мула закона управления (с точностью до знака) остается той же
92 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ самой, и его использование, казалось бы, стабилизирует систему. Однако это не так. Запишем уравнения системы в целом: (- TD + 1) у (t) = hu (t), Du (t) = ± (- TD + 1) [yd (f) - у (£)]. Отсюда, исключая u(i), получим D (-TD + 1) у (t) == к (-Л) 4-1) [ул(i)-у (t) ] или (-TD + l)(D + A;)y(f)=A:(-rD+l)y‘i(t). Характеристический многочлен замкнутой системы оказался равным A(D) = (-TD + l)(D + fc) и неустойчив при Т > 0, хотя знаменатель образцовой п. ф. являл- ся устойчивым. О В примере выявилось, что при использовании метода компен- сации характеристический многочлен замкнутой системы не сов- падает со знаменателем Hds(p). В этом нетрудно убедиться и в общем случае. Действительно, в силу (3.9) #/(D) - m (ЗЛ0> если через <z(D), P'(D) по-прежнему обозначать знаменатель и числитель Ниу (D). В соответствии с обозначениями, принятыми в § 1, (3.11) так что метод компенсации сводится к специальному выбору чис- лителя и знаменателя п. ф. обратной связи /c(D) = a(D)HD), Z(D)= p(D)[ad(D)—pd(D)]. (3.12) Ранее было найдено общее выражение (1.27), для характери- стического многочлена системы, замкнутой обратной связью с п. ф. ’ (З.Н), A(p)=a(p)Z(p)+p(p)7<(p). (3.13) Подставляя в него (3.12), убеждаемся, что Д(р)= а(р)?(р)[ал(р)- Pd(P)] + Р(Р)а(Р)ИР) = = а(р)МР)а<!(Р)- (3-14) Вывод 1. Характеристический многочлен системы с обратной связью, найденной по методу компенсации, содержит кроме зна- менателя образцовой п. ф. еще и сомножители, совпадающие с числителем и знаменателем объекта. Поэтому метод компенса- ции непосредственно применим только при устойчивости этих многочленов. В противном случае замкнутая система неустой- чива.
g 3. МЕТОД ДИНАМИЧЕСКОЙ КОМПЕНСАЦИИ 93 3.4. Использование внутренней обратной связи. Область при- менения метода компенсации можно расширить, если дополнитель- но к измерениям ошибки e(i) мы располагаем измерениями са- мого выхода y(t) или отслеживаемого процесса pd(i). Действительно, в этом случае можно предварительно стабили- зировать неустойчивый объект с помощью внутренней обратной связи (см. рис. 3.6), а затем уже применять метод компенсации.. Пример 3.3. Вновь обратимся к задаче управления простейшим неустойчивым объектом (-TD + 1) y(t) = и (£), Г>0. Представим управление в виде u{t) = uv(t)+ где первое слагаемое используем для стаоилизации. Очевидно, что достаточно, например, выбрать u„(Z)= 2y(Z). Тог да с учетом этой обратной связи получим (-TD + l)p(Z)=2p(0+M0 или (Z’D+l)y(Z)=-«t(Z). Если желаемая п. ф. H'l (D) име- ет вид ^(D) = ^, Рис. 3.8 то можно применить метод компенсации для выбора обратной свя- зи по ошибке. Аналогично П.3.1 получаем (0 = — кТ^ъ (jj) + А 8 (£)j. Общая структурная схема представлена на рис. 3.8. Р Процедура построения закона управления неустойчивым объ- ектом ясна из примера, однако и в ней есть «подводные камни»,, которые необходимо выявить в ходе общего анализа. Пусть uy(t)+u,(t), (3.15) причем uy(t)~Hv(V)y(t)~-^y(t), (3.16) Подставив (3.15), (3.16) в уравнение объекта (3.3), найдем, что [a(D)Z„(D) + p(D)Av(D)]y(f)= ZP(D)[^(D)ue(t)+ ₽»(D)w(f)]. Таким образом, введение внутренней обратной связи оказалось
94 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ эквивалентным изменению динамических характеристик объекта, замене a(D) на a(D)Zv(D) +p(D)^(D), £(D) на MD)JJ(D), . MD) на Z„(D)MD)« Как было показано в § 1, всегда (при предполагаемой несо- кратимости а и Р) возможно так выбрать lv, kv, чтобы многочлен a(p)W+№)W) (3-17) оказался устойчивым. Именно такая процедура была проделана в П.3.3. Заметим, однако, что она не может «вылечить» неустойчивый числитель, поскольку числитель ZB(D)fi(D) п.ф. объекта, замкну- того внутренним контуром, содержит множитель P(D). Более того, вообще говоря, при произвольной процедуре стабилизации много- члена (3.17) не гарантировано, что lv(p) не окажется неустойчи- вым многочленом. Иначе говоря, «излечивая» от неустойчивости знаменатель, можно создать неустойчивость числителя, и вновь метод компенсации окажется неприменимым. Во избежание подобной неприятности рассмотрим специальную •процедуру стабилизации, при которой числитель п. ф. остается не- изменным. Пусть, в отличие от (3.15), принято н(«) = Яо(В)[и1(г)+u2(Z)], u1(f) = ^(D)y(f), и2(О“Я2(О)е(0. соответствует структурной схеме, представленной на рис. 3.9, внутренняя обратная связь охватывает где -Это где (3.18) (3.19)' не только объект, но и последовательно вклю- ченное с .ним звено с.п. ф. Я0(В). В качестве «нового объекта», преобразо- ванного с помощью этой обратной связи, будем рассматривать весь блок с входами u2(Z), w(t) и выходом y(t) (на рис. 3.9 — выделен пунктиром). Подставляя (3.18) в уравнение объекта (3.3) и исключая не- известную н2(0, получим у(0 = Я^(В)Ы2(0 Нуу (Р) Рис. 3.9 (3.20) где „(2) = '»' „(2)___________________________ (и) = ! + ЯШ7 (D) яо (Р)ЯХ (D) Д W - 1 + (D) ио (р) Я/D) • Яо (D) Ниу (D).
§ 3. МЕТОД ДИНАМИЧЕСКОЙ КОМПЕНСАЦИИ 95- Представим введенные п. ф. в виде отношений соответствующих многочленов Я°<0>“7Ж- (3'3,) Тогда ст(2) /т\\______Р(Р) йо (Р) 11-_____ (3 29) « (D)/0 (D)(D) +₽(D)A0 (DJ^D)* Потребуем, чтобы Z1(D)=*0(D), (3.23} a(D)l1(D)+p(D)J1(D)=fc.(D)aJ(D)', (3.24} причем /to, аг — произвольные устойчивые многочлены. В силу Т.1.1 при взаимно простых а, Р всегда могут быть найдены Zo, к, такие,, что тождество (3.24) будет выполнено. Но при выполнении усло- вий (3.23), (3.24) п.ф. Я^/Б) приобретает вид Я(«(Б) = ^р (3.25} Таким образом, удается так преобразовать объект, что числи- тельно новой п. ф. совпадет с исходным, а знаменатель станет устойчивым многочленом *). 3.5. Общий алгоритм. Подводя итоги, сформулируем алгоритм синтеза закона управления произвольным объектом с п. ф. Яи1,(В)== *=Р(Б)/а(В), где р— устойчивый многочлен. 1. Задать образцовую устойчивую п. ф. замкнутого контура Hd (D) = ’ ad(D)‘ 2. Если a — устойчивый многочлен, то принять закон управле- ния в виде u(t) =--------* (PjJ..l..(D)-_e(t). (3.26) Р (D) [ad (D) - pd (D)] W ' 3. Если a неустойчив, то принять a2(D)pd(D) MD) , - ----------- ko (D> “ ~ Zo (D) p (D) [ad (D)-pd(D)] (3.27) где k0, аг — произвольные устойчивые многочлены, а kt, 1д удовлет- воряют тождеству **) a/0 + рAr, ==/t0a2, И в том и в другом случае *) Можно проверить, что сокращаемые в (3.25) многочлены к0, h войдут сомножителями в характеристический многочлен замкнутой системы. Однако- в силу их устойчивости, никаких неприятностей не произойдет (см. также гл. 6, § 4). **) Во избежание сокращения старших степеней, вызывающего негрубость закона управления, требуется согласовать степень произвольного многочлена кйа,2 со степенями a, р (см. § 1),
96 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ введение управления обеспечивает выполнение тождества #3(D) = ^(D),. (3.28) хотя характеристические многочлены замкнутой системы различны: в первом случае имеем A(p) = a(p)?(p)ad(p), (3.29) а во втором случае А (Р) = (Р)<4 (Р)₽ (P)«ri (Р)- (3-30) Если р (р) — неустойчивый многочлен, то алгоритм неприменим. Несколько изменим задачу. Представим [J(p) в виде произве- дения . ' • ₽(/>)= Мр)Мр), (3-31) где в §+(р) соберем все простейшие сомножители вида р — Zv, отве- чающие корням X, с отрицательной вещественной частью. Можно доказать, что класс образцовых п. ф. #1(0), для ко- торых возможно добиться выполнения тождества (3.28) при обес- печении устойчивости системы в целом, ограничен п. ф. вида ' $(D) = ₽_(D)B(D), (3.32) где W) — произвольная п. ф. с устойчивыми числителем и знаме- нателем. В законах управления’(3.26), (3.27) следует при этом за- менить [J (D) на р+ (D). Подробнее этот вопрос изучается в гл. 4, § 4. § 4. Выбор желаемой передаточной функции по типовым воздействиям 4.1. Типовые воздействия и точность. Любая разумная форму- лировка проблемы выбора желаемой образцовой п. ф. связана с вве- дением гипотез о возможных сигналах и помехах и требуемой точ- ности. В инженерной практике чаще всего исходят из следующих пред- положений и требований: а) замкнутая система должна быть устойчивой; б) если сигнал имеет вид s(t') = a,i + a{t (4.1) л |at|Cat, (4.2) то установившаяся ошибка его отработки e»(f) должна удовлетво- рять условию _ le<„(i) I Во, (4.3) где а!; в»—заданные константы (предельная скорость изменения сигнала, предельная допустимая ошибка отработки сигнала);
§ 4. ВЫБОР ЖЕЛАЕМОЙ ПЕРЕДАТОЧНОЙ ФУНКЦИИ 97 в) если отрабатываемое воздействие имеет вид s(t) = ая cos at (4.4) И а, а, (4.5) при любых со из данной области то установившаяся ошибка его отработки должна быть ограничена Isool С е„ (4.6) где а, — заданная предельная амплитуда воздействия, Й, — область возможных значений частоты воздействия, а е, — заданная предель- ная допустимая ошибка; г) если помеха имеет вид Nt(t) — aNcos at, aN^aN, (4.7) при любых со из заданной области то вызванная ее наличием установившаяся ошибка должна быть ограничена [eool^e.v, юеЙл-, (4.8) где aN — предельная амплитуда помехи, со — ее возможная частота из области Q.v, а ех — заданная величина. Совокупность условий (б) — (г) обычно называют требованиями к качеству системы. Напомним, что в силу (3.4) преобразование «сигнал — ошибка» определяется п. ф. 1 —Я3(Р), а преобразование «помеха — ошиб- ка»— п. ф. Я3(В). Обе эти п. ф. по требованию (а) должны быть ус- тойчивыми, а потому к ним применимы простые формулы § 4 гл. 2 по расчету установившийся реакции любого устойчивого звена на гармоническое и полиномиальное воздействие. Рассмотрим первоначально требование (б). С учетом правила 3 (§4 гл. 2) имеем, что установившаяся ошибка, вызванная воздей- ствием (4.1), равна 8оо = [1 — Н3 (0)] (а0 + art) + -Д-[1 — Н3 (/>)] | a13 (4.9) «•н 1Р=о Ошибка может быть ограниченной при а, #= 0, только если выполне- но условие астатизма' Я.,(0) = 1. (4.10) Я3 = ЯР(1 + ЯР)“‘, так что для выполнения (4.10) должно быть Я₽1(0) = 0, но это возможно, только если р. п. ф. имеет нулевой полюс. Если он 7 А. А. Первозваиский
98 гл. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ простой, то можно записать представление Яр(р)= ^-ЖР(р), Яр(0) = 1, fcp = const. (4.11) При этом — [1 — Н3 (р)] |р=0 = [р + АряР(Р)] L=o = кр1 и Еоо == 1 = const. Таким образом, для выполнения требования б) можно принять же- лаемую р. п. ф. в виде (4.11), причем коэффициент кр должен удов- летворять условию (4-12) ео ~ ‘(величину б^1 часто называют добротностью системы)'. Обратимся теперь к требованию в), которое ограничивает допу- стимую ошибку при отработке гармонического воздействия. В силу Правила 1 (§ 4 гл. 2) имеем, что установившаяся ошибка также яв- ляется гармонической функцией с амплитудой ае = 11 — |а„. Следовательно, для удовлетворения требования а) желаемая п. ф. замкнутого контура должна подчиняться ограничению |1-Я3(г®)|< (4.13) при всех со е Q3, которое эквивалентно ограничению на р. п. ф., за- писываемому в виде |1 + Яр(гсо)|>6Г1, ®еЙ. (4.14) Требование г) также легко трансформируется в ограничение на выбор Н3(р). По формуле (3.4) преобразование «помеха—ошибка управления» определяется самой п. ф. Н3(р). Таким образом, имеем |ff3(i(o)|<^A 8n (4.15) aN при всех ® е &, или |1 + Яр (йо) б#1, (4.16) 4.2. Принцип фильтрации. Учитывая, что при достаточно высо- ких требованиях к точности, типичных при проектировании реаль- ных систем, величины б3, бя являются малыми, условия (4.14),
§ 4. ВЫБОР ЖЕЛАЕМОЙ ПЕРЕДАТОЧНОЙ ФУНКЦИИ 99 (4.16) можно заменить на более простые ограничения*) | Яр (йо) | :> 6Г* 1, «а е Qs, (4.17) | <Sw, cheQn. (4.18) Ограничения (4.17), (4.18) отражают противоречивые тенденции, если области допустимых значений частот отрабатываемого воздей- ствия и помехи, Qa и fi.v, перекрываются: в силу (4.17) амплитудно- частотная характеристика ра- , зомкнутой системы должна > принимать большие значения, i । а в силу (4.18) — малые. i Наиболее часто в инженер- । пои области О», Qn задаются i следующим образом: Й8 включа- — v..............., ? ет низкие частоты, удовлетво- s ряющие ограничению 0 со «S рис здо < и8, а область' включает вы- сокие частоты и >_con, причем границы диапазонов удовлетворяют требованию cow > ш8, обеспечивающему _неперекрывание й, и (рис. 3.10). Если потребовать, чтобы е„ = 0; 8W = 0, то условия (4.13), (4.15) приведут к необходимости выбирать Я3(4®) = 1, 0<<в=£йа, (4.19) Я3(гю) = 0, <в>й)», (4.20) иначе говоря, замкнутая система должна идеально пропускать гар- моники низких частот_(до ®s) и идеально подавлять гармоники вы- соких частот (выше w.v). При малых, но отличных от нуля е„, 8Л-, допускаются отклонения от этой идеальной характеристики. Очевид- но, что не существует дробно-рациональной функции Я3(р), облада- ющей свойствами идеального фильтра (вещественная и мнимая час- ти Я3(/и) могут принимать постоянное значение только в конечном числе точек). Тем не менее полезно понимать, что «.хорошая» замк- нутая система должна быть, как правило, близка по своим свойствам к идеальному низкочастотному фильтру. Теперь необходимо выяснить, как построить устойчивую дробно- рацйональную функцию Я3(р), удовлетворяющую предъявляемым требованиям. *) Очевидно, что I Яр I > 6Г1 I Яр12 * * + 21 На I cos if + 1 > 6; 2 - 25Г1 + 1 ” I г I I Р I О о 1 ири любых 6а и ф. Если if = Arg Hv, то последнее переписывается в виде: (1 + | Яр | cos if)2+ j Яр |2 sin4 = 11 + Яр |2> S72 (1 - 6S)2. Таким образом, из (4.17) следует выполнение (4.14) с точностью до малой ве- личины os. Аналогично, из (4.18) следует выполнение (4.16) с точностью до ё«. 7*
100 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ На практике используются два способа. Первый из них основан на выборе Я3(р) из семейства функций, обеспечивающих частотную характеристику типа низкочастотного фильтра. . 4.3. Фильтры Баттерворта. Опишем подробнее способ построения и использования низкочастотных фильтров Баттерворта. Примем l«(‘W----------(4-21> 1+ — k о/ \®о/ lim Ф* (—1 = .. ТЧ со I 71~>оо \ О J Очевидно, что при п -> °° амплитудно-частотная характеристика 1//3(йо) I стремится к идеальной низкочастотной I, оэ <; <о0, 0, (о>(0о, / т. е. величина <в0, обычно называемая характерной частотой фильтра, при п -*• оо определяет границу полосы пропускания. При конечных п характеристика фильтра отклоняется от идеала, однако эти отклонения невелики, что видно из рис. 3.11,
§ 4. ВЫБОР ЖЕЛАЕМОЙ ПЕРЕДАТОЧНОЙ ФУНКЦИИ 101 где в логарифмическом масштабе представлены графики Ф„(е)/©0) при п = 1, 2, 3, 4. Построим далее устойчивую Hs(p) такую, чтобы для нее вы- полнялось условие (4.21). Предварительно установим одно полезное алгебраическое по- ложение. Лемма (о факторизации'). Пусть многочлен Д2п(р) степени 2п содержит только четные степени п: Д2п(р) = р2п + агп-гР211-2 + .. . + а0. Тогда он представим в виде Дгп(р-) = Ап(р)Дп(-р). (4.22) Если &гп(р) не имеет корней на мнимой оси, то &п(р) может быть единственным образом выбрано в виде устойчивого мно- гочлена. Доказательство. Пусть — некоторый корень Д2п(р). Тогда и — является его корнем, поскольку Asn(p) =-Д2п(—р). Запишем разложение Д2п(р) на простейшие двучлены 2П А2п (р) — JJ (р = JJ (р Xv) JJ (р + Av)» v«=l V V . где произведено разбиение двучленов на группы, содержащие по п сомножи- телей и соответствующие корням, отличающимся по знаку. Обозначая АВ(Р) = (-1)П/21Г(Р-Ч). V убеждаемся в справедливости представления дп ю (- р) = (-1)” П' (р - Ч П (- р - ч = V V = 1Г(^“Ч1Г(Р + Ч==дг« {р}- V у Разбиение на группы неединственно. Однако, если корней на мнимой оси нет, то каждому корню Xv, лежащему в левой полуплоскости, соответствует корень —%v, лежащий справа от мнимой оси. Собрав в первую группу только двучле- ны, соответствующие «хорошим» корням, получаем устойчивый Дп(р). Теперь можно приступить к выполнению основной задачи. За- пишем тождество: /м.\ _ 1 1 W 1 + (-1)”(р/ф0)2п р=4й = Д2п(Р) P=i<B и найдем корни знаменателя, т. е. корни Xi, ..., Х2я уравнения П2П ^2п (р) — —п + (— 1)п = 0. (4.24) Фо Очевидно, что все корни располагаются на окружности радиуса и» «•
102 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ на равных расстояниях друг от друга и имеют аргументы л при п четном, — л при п нечетном, где v = 0, 1, ..., 2п — 1 п (см. рис. 3.12). Согласно лемме о факторизации можно записать представление (4.22), причем для рассматриваемого многочлена Л2п(р) устойчивый многочлен Д„(р) имеет вид 2, п 2V-1 -----зх 2П Дп(Р) = (— 1) 11 — —е V=1 Шо Многочлены x„(s) называются многочленами, Баттерворта. В силу симметрии корней они вещественны и табулированы для малых п [3.3] (см. табл. 4.1). Таблица4Л п 1 s + 1 2 s2 + 1, 41s 4-1 3 s3 2s3 2s-f- 1 4 ' s4 + 2,61s3 + 3,41s2 + 2,61s + 1 5 s5 + 3,24s4 + 5,24s3 4- 5,24s3 -j- 3,24s + 1 Нетрудно найти и общее выражение для коэффициента при 1-й степени $ в многочлене с любым п: at (п) — Таким образом, мы нашли, семейство устойчивых передаточных функций вида (4.26)
§ 4. ВЫБОР ЖЕЛАЕМОЙ ПЕРЕДАТОЧНОЙ ФУНКЦИИ 103 имеющих амплитудно-частотную характеристику, близкую к иде- альной низкочастотной (и быстро стремящуюся к ней при п-+°о), причем граница, вплоть до которой АЧХ близка к единице, почти совпадает с величиной <о0. К сожалению, с ростом п растут фазовые искажения (рис. 3.11), и на частоте (о0 аргумент i|)n частотной ха- рактеристики может существенно отличаться от нуля. В то же вре- мя близость к идеальному выполнению условия (4.19) требует и малости изменений аргумента вплоть до заданной частоты <о„ По- этому необходимо подбирать параметры п, св0 так, чтобы удовлетво- рить конкретным требованиям. 4.4. Выполнение требований к точности. Отметим, что условие астатизма (4.10) выполняется при любых параметрах, поскольку Хп(0)=1. Условие (4.12) сводится к ограничению Г (4-27> так как Яр1 = ягх —1 ==Xn(^ —l=>*p = a1(n)a>71. Условие (4.15) можно записать в виде •' I Яд (г®) -С) бдг, (О или, в силу (4.21), (4.26), 1 . ------------- O/V, (ОЗ$:(Олт. 1 +•(ф/<00)2,‘ N Учитывая малость б», заменим последнее условие на более про- стое ®о 'С б/у (On, (4.28) Несколько сложнее удовлетворить ограничению (4.13). Запишем его в виде - I, 1 2 яа “ или . |х„(1<о/шо)-д2 14-(ш/<00)2" Напомнив, что X» («) -1 = s[an_f (zi) s’1-1 + a„_2 («) sn~2 +... + at (n) ],
104 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ перепишем это неравенство в виде »м'<з.-“в’(В)х wr-la"-1(n) 2 Если <оа > (Os, то его можно затрубить, записав т. е. ®, , , ®о>7; «г (")• (4.29) Объединяя полученные условия, приходим к следующему пра- вилу. Правило 1. Для выбора желаемой передаточной функции замк- нутой системы Н%(р) из семейства фильтров Баттерворта (4.26) следует выбрать параметры ш0, п так, чтобы выполнялись условия sin Д ojn max 2я I ° — • (4.30) L «o ’ где величины af, ш8, а„ aN, ,ая характеризуют допустимые по тех- ническим условиям воздействия, а параметры е0, е, определяют тре- буемую точность. В целях упрощения реализации рекомендуется выбирать наи- меньшие ©о, п, удовлетворяющие (4.30). Ввиду приближенного ха- рактера оценок рекомендуется также проверить выполнение исход- ных условий для выбранного фильтра. Пример 4.1. Пусть предельные скорости_изменения отрабатывае- мых воздействий_равны а, = 5 1/с, ы^а.^а,, а требуемые точности отработки е0 — е, = 0,05. Тогда необходимо выбрать -значение (Во > 100/sin (л/2п). _ _ Пусть 8№=0,05; соя = 300 1/с; aw = 0,l. При этом требуется, что- бы (в0 < 300(1/2”). Очевидно, что условия удовлетворяются при п = 1, т. е. можно принять <D> - , + 1D/I00) °* ~ ТГ Выясним, какова предельная амплитуда помехи, при которой вооб- ще возможно удовлетворить ограничениям и подобрать подходя- щий фильтр.
§ 4. ВЫБОР ЖЕЛАЕМОЙ ПЕРЕДАТОЧНОЙ ФУНКЦИИ 105 Примем наименьшее возможное значение а>0 = 100/sin (л/2п). Тогда ew / to \n I тг \—п — — < =& I «= 3sin^- Дбл(и), “л к 2п' “ Значения величины 6« указаны в табл. 4.2. _ Меньшее обеспечивается при п — п0 = 2 (при п>3 величины 6к(п) заведомо возрастают^. При этом условие еЛ'г2е№=0,05 обеспечивается, если 0,05-9 Ду я у = —— = 0,225. Рекомендуемая п. ф. имеет вид ^(D) =—*—_---------------Ц------ 1 XX n + _L [)2 1 + 10~2D +-5-10~4D® “о Невозможность удовлетворить ограничениям при произвольном уровне ап — характерное следствие противоречивости требований к отработке воздействия и подавлению помехи. □ Т а б л и ц а 4.2 Т а б л и и а 4.3 п 1 2 ' 3 п 1 2 3 4 5 6Л-(п) 1/3 2/9 8/27 т(и) 3 2,5 6 7 8 — * бт (Л) 0 0,05 0,09 0,12 0,3 4.5. Учет требований к переходной функции. Наряду с описан- ными выше исходными условиями, на практике могут выдвигаться и иные требования к желательному поведению замкнутой системы. В частности, зачастую вводятся требования к характеру переходной функции, т. е. реакции замкнутой системы на единичное скачкооб- разное воздействие s(i)=l(i). Поскольку выполнено требование астатизма, то в установившемся режиме ошибка отработки такого воздействия стремится к нулю, т. е. y(t)-*l. Однако практически существенными могут быть время tn практического приближения (с точностью 0,05) к установившемуся значению и величина max y(t) — 1, обычно называемая перерегулированием. Пере- ходные функции фильтров Баттерворта для п — 1, 2, 3, 4 показаны на рис. 3.13. Приближенные значения величины т(п) — <o0tn(n), б,„(о) даны в табл. 4.3. Уровень перерегулирования несколько растет с ростом п, но, как правило, является практически удовлетворительным вплоть до
106 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ п — 5, а более сложные фильтры обычно использовать нецелесооб- разно. Время переходного процесса наименьшее при п — 2 Если в дополнительных ное допустимое время ta, = (4.31) технических условиях указано предель- то возникает дополнительное ограниче- ние на выбор параметров (4.32) Это неравенство следует ввести в Пра- вило 1. Пример 4.2. Пусть в дополнение к требованиям, указанным в П. 4.1, сле- дует обеспечить, чтобы время установ- ления не превосходило 0,05 с. Тогда ©о > 20т(п). Очевидно, что ранее принятые зна- чения (во = 100, п = 1 удовлетворяют этому условию, т. е. новое ограниче- ние оказывается несущественным. □ 4.6. Астатические системы с большим коэффициентом усиления. Выше бы- ла указана полностью алгоритмизированная методика построения «образцовой» п. ф. из класса фильтров Баттерворта. Однако подавление помех, конечно, мож- но улучшить, если расширить класс «образцов». Очевидно, что среди п. ф. вида где ^(s), a(s)—устойчивые многочлены степени т и п, п. ф. фильтра Баттер- ворта является лишь частным случаем, в котором j3(s) = l, a(s)=xn(s). (4.34) Пользуясь теми же приемами, что и выше, можно дать правило выбора па- раметров и для п. ф. общего вида (4.33). Приведем его без детального вывода, приняв обозначения a(s) ==s” + an_.1sn-14-...4-1, ~ . (4-35) +••• + !. n>№>0, причем сразу учтена необходимость выполнения условия астатизма, т. е. (0) = 1. ,
§ 4. ВЫБОР ЖЕЛАЕМОЙ ПЕРЕДАТОЧНОЙ ФУНКЦИИ 107 Правило 4.2. а) Условие (4.11) обеспечивается, если (4.36) б) Для достаточно точной отработки сигнала требуется, чтобы (4.37) в) Условие подавления помех требует, чтобы 1_ (6jy \n-m_ __ I й>№ Pm / (4.38) Условия (4.37), (4.38) получены как следствие довольно грубых оценок, которые могут служить только для ориентировочного выбора параметров {а„, [М- После такого выбора следует проверить выполнение условий (4.17), (4.18), т. е. условий Подчеркнем еще раз, что эти условия могут быть несовместимы при слиш- ком жестких требованиях (малых б„ 6,v или близких <ов, Ин). Поэтому, как уже указывалось в примерах, можно считать некоторые условия нефиксирован- ными, например, считать, что не задано бх (или ы.у), а разыскивается мини- мальное бх (или con), при котором условия (4.36), (4.39), (4.40) остаются сов- местными. Мы еще будем возвращаться к рассмотрению этой проблемы, однако зара- нее укажем, что она сложна с вычислительной точки зрения*). Поэтому по- лучение простых рекомендаций по выбору желаемых п. ф. является сущест- венным делом. Далее, в § 5, будет изложен другой эффективный прием вы- бора. Однако предварительно укажем на общую особенность п. ф. вида (4.33). Пусть п. ф. объекта HUV(D) имеет устойчивые числитель и знаменатель. Тогда после выбора Яд (D) метод компенсации позволяет сразу получить вы- ражение п. ф. ЯДП) закона управления в виде (D) = Я-J (D) Н* (D), где Н« (D) = (4.41) — ___________„ и \vz — Р *) При фиксированных степенях многочленов условия (4.39), (4.40) явля- ются неравенствами 2-й степени относительно неизвестных коэффициентов, ко- торые должны выполняться при всех допустимых значениях параметра <в. С точки зрения вычислительной математики это —задача нелинейного пара- метрического программирования (см. гл. 9, § 7). При нефиксированных степе- нях эта задача носит переборный характер.
108 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ Если ad (D) = <z ( —- D), pd (D) = р I — D 1, где многочлены а, р определены \ О I \шо ) согласно (4.35), то ~/_D \ ЯР <D) = ТТ “ПН- - <4’42> ? где и,, ftp А ~.:.Т(«) A 1+-V+ ... + Vn-Is”> „ «») a,+i — pi+i у. А —sc-к;----, i = 1, ..., п — 1. Г,= ai~-₽i Характерной особенностью (4.42) является наличие интегрирующего множи- теля 1/D, а также наличие большого -козффициента a>o(«i— Pi)-’« поскольку в силу (4.36) эта величина должна быть не меньше 6~х, где 60 мало. Таким образом, желаемая п. ф. разомкнутого контура должна включать интегратор (в силу требования астатизма!) и усилитель с большим коэффици- ентом усиления. Это не означает, конечно, что п. ф. закона управления должна обладать теми же свойствами. Если, например, справедливо представление h ~ ~ <0)7=1- (4.44) т. е. п. ф. объекта имеет нулевой полюс, то 0 м I —- • I гл (4.45) и не включает интегратор, причем статический коэффициент усиления к± ря- < .о вен к] д//( (0) =/ср//г0.Его величина зависит не только от требований к точ- ности, но и от свойств самого объекта. Выбор a, р может определяться не только требованиями качества, но и ус- ловиями реализации закона управления, о чем также будет детально сказано ниже, в § 6. § 5. Логарифмические частотные характеристики Опишем широко используемую на практике схему построения желаемых передаточных функций, основанную на использовании логарифмических частотных характеристик. 5.1. Свойства ЛАХ и ЛФХ. Определение. Логарифмической амплитудно-частотной ха- рактеристикой (ЛАХ), соответствующей передаточной функции Я(р), называется функция L(0) = 201g 1Я(щ>) I, (5.1)
§ 5. ЛОГАРИФМИЧЕСКИЕ ЧАСТОТНЫЕ ХАРАКТЕРИСТИКИ 109 определенная при любых вещественных значениях 0 = 1g со. Накло- ном ЛАХ именуется функция dL/dQ. Принято измерять значения ЛАХ в децибелах (дБ), а значения наклона ЛАХ — в децибелах на декаду (дБ/дек). Логарифмической фазочастот- ной характеристикой (ЛФХ) именуется функция ф(0) = Arg#(ico), (5.2) определенная как функция 0 s= = 1g о- Графики А(0), -ф(0), с точ- ностью до выбора масштабов сов- падающие с графиками обычных АЧХ и ФЧХ, принято именовать диаграммами Боде функции Я(р)*). Пример 5.1. Пусть Н(р) = крп, п = 0, ±1, ±2, ... Тогда Я(йо) = «= к (йа)п = кыпе 2 , так что 201g |Я(йо) I = 201g А: + 20га 1g со, £(0)== 20 lg Аг + 2Ога0; (5.3) f = 20ra, ф(0) = ^-га. (5.4) п-1 Я/2 п -1 0 77-0 -л/2 1 2 & 1 z Z7--1 -Л. п—2 Рис. 3.14 Диаграммы Боде для функ- ций вида крп представлены на рис. 3.14. £(0) — прямые, наклон ко- торых равен 20га дБ/дек, a ф(0)—прямые, параллельные оси-абс- цисс. □ Теорема 5.1 (теорема Боде). Пусть Н(р) дробно-рациональная функция, не имеющая нулей и полюсов в правой полуплоскости. Тогда значения Б (в) и ф(0) связаны между собой формулой оо со q|,(0) = J_ J gp.(u-0)du==^fJ (g_g^(u_0)du, — co —co где (5.5) Ж =jTlncthi’ M = \ge. Функция t£(G) определена и непрерывна при любых веществен- ных 0 за исключением точек вида 1g со*, где — нули (или по- люсы) Н(р) на мнимой оси. *) Принято использовать десятичные логарифмы. При разметке оси абс- цисс принято указывать значение со, а не 0,
110 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ Доказательство [3.2] основывается на теореме Коши [2.3]: j)F{p)dp=a, (5.6) если внутри контура интегрирования F(p) — аналитическая функция. Пусть Ф(р) —Ф Ф(/>)—Ф F(p)=—-,-v1 -.....Ф^ВеФ^), где Ф(р) — произвольная функция, аналитическая внутри правой полуплоско- сти и на мнимой оси за исключением особенностей в точках -Ысо*, <о*=#<оь к — 2, 3, ..., причем выполнены условия ' ’ ф (р) lim ——- = 0, lim (р + i<oh) Ф (р) =-• 0 " * IArgp|<- )С, \ (51) 1 Используем контур интегрирования, состоящий из полу- _0 у£а_______I круга бесконечно большого радиуса в правой полуплоско- 7 сти и мнимой оси (с обходом указанных точек по малым / полуокружностям Сп) (рис. 3.15). Используя (5.6), имеем УСЛ / оо / Г г 1 1 ] УС-к У J 1Ф(/’)'~Ф11[₽-гсо1“р + г<о1]1ЙШ + ,. —оо ‘ +2Пф(р)~М?^~л^Ьр==0’ (5-8) Рис. 3.15 kJch L 1 1J где штрих над интегралом означает, что участки мнимой оси вблизи точек ±ico* исключены. Представим Ф(р) в виде ряда в окрестности точки гац: Ф(р) = Ф(г(О!) + аДр — iwi) + о(р), р=|р — icojf, <ц = const пли Ф (р) — КеФ (iu>.) i Im Ф (ico.) ----------------р-7^.......p-icof +^х + °(Р)> так что р ф („) _ ф |--------L dp = — л Im Ф (ico.) — а;1лр + ро (р) —> — л Im Ф (ico.). J р—гео, \ 1/ i р^0 \ 1/ С1 . То же предельное значение будет иметь интеграл С ф (р) - ф J р + гео. с-1 если дополнительно предположить, что КеФ(гсо) — четная, а 1шФ(г<о) —нечет- ная функции. Очевидно также, что Г Ф (р) - Ф ' С Ф (р) - Ф I---------A. dp = I ---------±- dp = 0, J р-на»,. J
§ 5. ЛОГАРИФМИЧЕСКИЕ ЧАСТОТНЫЕ ХАРАКТЕРИСТИКИ Щ поскольку интегрируемые функции аналитичны в окрестностях точек —i«h и icoi соответственно. Остается оценить интегралы вида f _______Ej 2Цл dp, к = + 2, + 3, . J pa + <4 В силу предположения (5.7) о характере особенностей в точках ±га>&, к = — 2, 3, ..., эти интегралы пропорциональны длинам полуокружностей и стре- мятся к нулю вместе с их радиусами. С учетом всех построенных оценок из (5.8) следует ' -1 1 > для любого 1<»1, не совпадающего с полюсами Ф(р). В силу четности Re Ф и нечетности Im Ф это соотношение можно переписать в виде 2cot Г' Re Ф (ico) — Re Ф (ico J <7со. (5.9) со2 — со? о Положим далее Ф(р) = 1пЯ(р) => Ф(ссо) = 1пЯ(!со) => о Re Ф(гсо) = In |Я(йо) |, Im Ф(г<о) = Argff(ico). Если Я(р)—передаточная функция, то соответствующая фазо-частотная ха- рактеристика определяется через амплитудно-частотную: ОО 2 С' In I Я (гео) I— In I Я (гео.) I _ . Arg Я (icoA = — —!-----—---------J-----L—V I.. (5.10). 17 л J (w/co^2—1 — In I Я (ico) |] 1 , + , i Я (ico J |J 2 “co — co1dw- ' d Интегрируя по частям, получаем ОС Arg Я (icox) = А [ л J о Теперь остается перейти к переменной интегрирования w = lgco, положив также 0= 1g coi, для того чтобы получить желаемую формулу (5.5). Необходимо однако проверить, что принятые в условиях теоремы предпо- ложения о свойствах Я(р) соответствуют гипотезам о свойствах функции Ф(р) = 1пЯ(р), использованным в ходе доказательства. Согласно теореме Я(р) представима в виде. П (р ~ Н(р)=к —, V где Xv, Xv —корни числителя и знаменателя. Тогда ф(р) = in*+2ln (р — х;)- 2lnG?~M- V V
112 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ Выполнение первого из условий (5.7) очевидно. Если Xv, лежат в левой полуплоскости, то соответствующие слагаемые аналитичны вне ее. Если (или lv) лежат на мнимой оси, то Ф(у) имеет в этой же точке особенности, но независимо от кратности ?.v (или Xv) условия (5.7) в ней выполнены. Тем самым все требовавшиеся при доказательстве Свойства Ф(р) действительно имеют место. Формулировка (а тем более доказательство) теоремы Боде до- статочно громоздка. Однако из нее можно сделать важные и про- стые выводы. Вывод 1. Для передаточных функций, удовлетворяющих ус- ловиям теоремы, по графику ЛАХ можно восстановить график фазочастотной характеристики. Таким образом, такие п. ф. од- нозначно восстанавливаются по графику ЛАХ. Вывод 2. Значение ЛФХ в произвольной точке 0, не являю- щейся точкой разрыва, в основном определяется значением на- клона ЛАХ в той же точке, и эту основную часть дает слагаемое *<е>-йя Вывод 2 следует из того, что функция p(s), фигурирующая во втором, интегральном, слагаемом в (5.5), близка по свойствам к б- все корни в правой функцию функции — она почти целиком сосре- доточена в окрестности нуля (рис. 3.16). Поэтому влияние значе- ний наклона в соседних точках (в пределах одной декады) суще- ственно только при резких изменени- ях наклона. Пусть функция Д(Р) = Ь_(Р)Я(Р), (5.11> где Я(р) удовлетворяет условиям теоремы, а многочлен 6_(р) имеет полуплоскости. Рассмотрим наряду с ней НДр)~ЬД-р)Й{р), не имеющую нулей и полюсов справа. Очевидно, что |Я(Ё®)1 = [Я1((и)|, . (5.12) а Ь_ (гео) Arg Н (i®) = Arg Ях (г®) + Arg При одинаковых АЧХ функции Н(р) и НДр) имеют различные ФЧХ. Нетрудно убедиться (используя разложение Ь-(р) на
s 5- ЛОГАРИФМИЧЕСКИЕ ЧАСТОТНЫЕ ХАРАКТЕРИСТИКИ J13 простейшие двучлены), что при о > О Ь (г'ш) Arg < 0 => ArS н < Аг£ (М. <5ЛЗ> • Теперь можно сформулировать результат. Вывод 3. Передаточные функции, не имеющие нулей и по- люсов в правой полуплоскости, определяют меньшее отставание по фазе по сравнению с любой п. ф., имеющей ту же АЧХ, но часть нулей справа. Наличие этого свойства привело к появлению, следующего тер- мина. Определение. Передаточная функция называется минималь- но-фазовой (МФ), если она не имеет нулей и полюсов в правой по- луплоскости, и неминимально-фазовой (НМФ)—в противном случае. Заметим, что термин несколько неудачен, поскольку график ФЧХ минимальнофазовой п. ф. лежит выше графика ФЧХ соответ- ствующей (имеющей ту же АЧХ) неминимально-фазовой. Пример 5.2. Пусть Н,{р) = Тр + 1, Т>0. Тогда - Ш^гю) I = УТ2®2 + 1, Arg//j (гш) = Arctg юУ. Если ’ Н\р) = - Тр + 1 = ^±1Н1 (р), то = Arg 7/(iw) = - Arctg о>Т = ' = Arg Н, (i®) — 2Arctg ® T. Графики ЛАХ и ЛФХ для Hi(p) представлены на рис. 3.17. При- ближенный график ЛФХ, вычисленный только по 1-му слагаемому в (5.5), также представлен на рис. 3.17 и действительно близок к истинному. Важно отметить, что вдали от точки а — i/T (9 = 1g 1/Г) ЛАХ асимптотически близка к прямым. Низкочастотная асимптота имеет нулевой наклон, а высокочастотная — наклон +20 дБ/дек. Соответственно и ЛФХ слева стремится к 0, а справа — к +л/2. О* 5.2. Построение асимптотических ЛАХ и ЛФХ. Рассмотрим про- извольную минимально-фазовую п. ф. с вещественными нулями и полюсами. Она представлена в виде П 0 Н (р) = крп ----------, (5.14) П (г*р + о V где Tv, Ту—положительные постоянные времени. 3 А. А, Первозвавский
114 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ Для определенности будем считать также к > 0. Тогда соответствующие ЛАХ и ЛФХ даются формулами Z(0) = 2Olg& + 2On0 + 22Olg|l + (®7,;)2|1/2- — 2 201g 11 + (<b?v)2 |1/2„ (5.15) ' V зр(0) = + 2ArctgwTC—-^ArctgcoTV 0 = lg®,. (5.16) v V ' вытекающими из результатов, полученных в П.5.1 и П.5.2. Рис. 3.17 Явные зависимости £(0), ф(0) достаточно сложны. Поэтому це- лесообразно использовать свойство, отмеченное в П.5.2, а именно, близость кривой Z(0) = ±201g И +(®7’)21‘/2 ' (5.17) к ломаной, составленной из низкочастотной и высокочастотной асимптот, пересекающихся в точке со = 1/2", называемой сопрягаю- щей частотой. Введем теперь новое понятие. Определение. Асимптотической ЛАХ, соответствующей II(р) вида (5.14), называется кусочно линейная функция, получа- ющаяся из (5.15) путем замены выражений, типа Z(0) на асимпто- тические ломаные вида Lac (0) = ’ о, ±20 1g (5.18) т ’ д т •
8 5. ЛОГАРИФМИЧЕСКИЕ ЧАСТОТНЫЕ ХАРАКТЕРИСТИКИ 115 Асимптотическая ЛФХ есть лучаемая заменой в (5.16) кусочно постоянная функция, по- Arctg dT -> 0, л 24 (5.19) Замечательным свойством асимптотических ЛАХ и ЛФХ явля- ется возможность их построения по заданной передаточной функ- ции вида (5.14) без каких-либо вычислений. Правило 1. Для того чтобы построить асимптотическую ЛАХ, следует сделать следующее. 1. Построить низкочастотную асимптоту £в,(0) = 201g к + 2Ога0. (5.20) 2. Упорядочить все постоянные времени по возрастанию. 3. Положить £ас(0) = Лвч(О) вплоть до наименьшей сопрягающей частоты, соответствующей на- ибольшей постоянной времени. 4. Если указанная постоянная вида входит в числитель п. ф., то, начиная с сопрягающей частоты, провести прямую с наклоном, на 20 дБ/дек больше, чем у ранее построенной части графика LM(Q), если же сопрягающая частота определяется постоянной времени- вида Tv (входящей в знаменатель), то провести прямую с накло- ном на 20 дБ/дёк меньше. . 4, 5. Положить Z/c(0) совпадающей с построенной прямой на от- резке, вплоть до следующей по величине сопрягающей частоты, со- ответствующей меньшей постоянной времени, после чего повторить процедуру в п. 4,5 вплоть до исчерпания списка всех постоянных времени. Для построения асимптотической ЛФХ достаточно использовать формулу , эс 1 di-- ... Ч1 (9) — у 20 (5.21) и учесть, что каждый излом Z?°(0) дает разрыв в фас(0). Пример 5.3. Пусть W Р (7’1Р+1)(ГзР + 1)(Т4Р + 1)’ А->и. Следуя правилу, строим (рис. 3.18) низкочастотную амплитуду с наклоном —20 дБ/дек вплоть до частоты И1\, далее (непрерыв- но!) продолжаем ее под наклонов —40 дБ/дек (постоянная У,— в знаменателе!) вплоть до частоты i/T2. Далее проводим участок под наклоном —40 + 20 = —20 (Т2— в числителе!) до частоты 1/7’3> а затем участки с наклоном —40 дБ/дек и —60 дБ/дек (7+и — в знаменателе). 8*
116 гл. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ После построения £ас(0) асимптотическая ЛФХ строится немед- ленно: каждому участку £ас(0) с наклоном п 20 дБ/дек соответ- ствует участок ЛФХ с уровнем Пу. Z-W Ж Для сравнения на том же графике даны точные ЛАХ и ЛФХ. О При наличии современной вычислительной техники преимуще- ства асимптотических ЛАХ и ЛФХ кажутся несущественными: не- ч сложная программа выдает с ЭВМ графики ЛАХ и ЛФХ, построенные с точностью, пре- вышающей практические тре- в-1до> бования. Однако этот упрощен^ ный Способ построения частот- ных характеристик продолжа- ет успешно использоваться на практике не только в силу i склонности инженерного мыш- * 9 ления к установившимся тради- । циям, но и благодаря тем до- > стоинствам, которые имеют асимптотические ЛАХ в реше- нии следующей важной задачи: дан график амплитудно-частот- ной характеристики, требуется найти минимально-фазовую передаточную функцию, АЧХ которой близка к заданной. ч -Jt/Z •ЗЛ/2 Рис. 3.18 Действительно, достаточно аппроксимировать заданную кривую (построенную в логарифмическом масштабе!) ломаной, участки ко- торой имеют наклон, кратный 20 дБ/дек и по сопрягающим часто- там восстановить вид и параметры Н(р). От числа участков линей- ности аппроксимирующей ломаной зависит и сложность получае- мой Н{р) и точность приближения ее частотной характеристики я исходной, заданной, причем следует отметить, что инженерная практика отдает предпочтение простоте, а не высокой точности. 5.3. Построение желаемых п. ф. по заданным требованиям к ус- тойчивости при типовых воздействиях. Преобразуем требования, сформулированные в начале § 4, в ограничения на свойства ЛАХ разомкнутого контура. Условия (4.10), (4.11) на отработку линей- но растущего воздействия сводятся к ограничению на поведение Яр (г®) при низких частотах, близких ® = 0: к Hp(i®)~^=>Lp(0) = 2OlgAp-2O0. (5.22) Иначе говоря, низкочастотная асимптота Lp(0) должна иметь на- клон —20 дБ/дек, причем в силу (4.12) ее уровень определяется условием 20 Ig А:р >— 201g б0. (5.23)
8 5. ЛОГАРИФМИЧЕСКИЕ ПЕРЕДАТОЧНЫЕ ХАРАКТЕРИСТИКИ Ц7 Условия (4.17), (4.18) принимают вид £р(®)> — 201g6„ (5.24) £р(й))=С 201g6w, © > (o.v. (5.25) Первое из них задает ограничение на поведение в области низ- ких частот, второе — в высокочастотной области. Оказывается, что поведение Бр(ш) в промежуточной зоне иа*£ < и не может быть произвольным, а определяется требовани- ем устойчивости замкнутой системы! Для установления этого фак- та придется обратиться к критерию Найквиста, причем использо- вать геометрическую интерпретацию этого критерия в виде Прави- ла 2 (§ 5 гл. 2), предварительно переписав его на языке ЛАХ. Правило 2'. Для проверки устойчивости НДр) следует построить • ЛАХ и ЛФХ разомкнутого контура LV(Q), -фр(0). Если в области, где Бр(®) 5*0, разность между числом пересечений ЛФХ уровней —л(1 + 2к), к— 0,1,2,..., снизу вверх и сверху вниз равно полови- не числа полюсов НДр) в правой полуплоскости, то НДр) устойчива. Доказательство эквивалентности Правил 2 (§ 5, гл. 2) и 2' сводит- ся к наблюдению, что в точках пересечения луча (—1, —оо) годографом /fp(i<o) (см. Правило 2) должно быть |fip(iw)| 2s 1, Arg//P(io>) = —n(14-2fc), а кроме того, пересечение годографом этого луча снизу вверх происходит при уменьшении аргумента, а следовательно, при движении по ЛФХ сверху вниз (см. рис. 3.19, а и б, соответствующие одной и той же передаточной функции). Предположим далее, что НДр) является минимально-фазовой. Тогда, в силу теоремы Боде, наклон ЛАХ полностью определяет вид ЛФХ. Если, более того, наклон ЛАХ меняется мало, то, как было по- казано выше, значение ЛФХ в какой-либо точке определяется на- клоном ЛАХ-в той же точке ф(9) у а следовательно, усло- вия устойчивости НДр) определяются наклоном ЛАХ разомкнутого
118 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ контура в зоне, где Zp(e))>0 (и возможно, в ее небольшой окрест- ности) . Предположим, что эта зона есть область частот таких, что О «5 ® < <вср, £р(юср) = 0, где <вСр обычно называют частотой среза. Тогда можно сформулировать простое, хотя и несколько нестрогое утверждение: если Hv(p) минимально-фазова, то для. устойчивости п. ф. замкнутого контура Я3(р) достаточно выполнения условий dL„ — 40 дБ/дек при со-*-0 (9->—oo)t (5.26) > — 40 дБ/дек в окрестности <о = (оср. (5.27) Действительно, в этом случае ЛФХ выше уровня —л при малых частотах и вблизи частоты среза и число пересечений критических уровней сверху вниз и снизу вверх рав- но (рис. 3.20), так что разность чисел переходов двух типов равна нулю. В то же время, по определению, равно нулю и число полюсов в правой полуплоско- сти для минимально-фазовой Яр(р). Напомним, что при выборе желае- мой передаточной функции условие (5.26) выполнено, если выполнено ус- ловие астатизма (5.22). Ограничение же (5.27) дает новую информацию о требуемом поведении частотной характеристики разомкнутой системы. Действительно, при малых бх, т. е. достаточно высоких тре- бованиях к точности, должно быть £р(и)>0 при 0^co^(os, Lp(<o)< 0 при (B^cojv, так что о, < шср < cow, и условие (5.27) определяет допустимый на- клон ЛАХ при переходе от низкочастотной зоны, где для обеспече- ния высокой точности отработки необходим большой коэффициент усиления, к выскочастотной, где для подавления помех необходим малый коэффициент. Итак, все требования, которые были сформулированы в начале § 4, сведены к ограничениям на допустимое поведение ЛАХ разомк- нутого контура (см. диаграмму на рис. 3.21, где заштрихованы гра- ницы зон, в которые не может заходить ЛАХ). Остается подобрать передаточную функцию Яр (р) разомкнуто- го контура, для которой эти ограничения выполнены. Для этого и полезны асимптотические ЛАХ!
s 5. ЛОГАРИФМИЧЕСКИЕ ЧАСТОТНЫЕ ХАРАКТЕРИСТИКИ 119 Выбор, очевидно, неоднозначен и не всегда возможен. Однако при его осуществимости целесообразно стремиться к большей про- стоте, т. е. меньшему коэффициенту усиления и меньшим степеням числителя и знаменателя. В зависимости от соотношения парамет- ров можно использовать разли- чные аппроксимирующие лома- ные с наклоном участков, крат- ным 20 дБ/дек, стремясь прово- дить их не выше границ «за- претной зоны». Существенно лишь, что вблизи частоты среза недопустимо использовать уча- сток с наклоном —40 дБ/дек, т. е. по самой границе, посколь- ку это нарушит условие (5.27). Поэтому в окрестности частоты Рис. 3.21 среза допустимо проведение участка аппроксимирующей асимпто- тической ЛАХ только с наклоном —20 дБ/дек, причем длительность этого участка должна быть не менее декады*). 5.4. Типовые допустимые п. ф. Приведем в готовом виде сводку допустимых передаточных функций разомкнутого контура (провер- ка их пригодности по схеме, описанной ниже, является полезным упражнением). 1. Пусть тогда п. ф. 1 ' — Oq — I со5 (5.28) удовлетворяет всем ограничениям. При тех же условиях допусти- ма, но требует меньших усилений на частотах со > <о8 и обеспечи- вает лучшее подавление помех п. ф. вида Н * (D) = — —— (5 29) D (T^D-t-l)(r3D+1) ’ ( ' где __ ' = Л = Т2 = ^, Т3^0,1Т2, . (5.30) а параметр х, характеризующий расположение частоты среза, wjp = Xt> может выбираться в пределах 2 4-4. 1 2 *) Это условие прежде всего связано с тем, чтобы влияние соседних уча- стков, возможно, с большим наклоном не привело бы к уменьшению фазы ни- же критического уровня — л или ниже требуемого запаса по фазе (см. также §6). • .
120 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ 2. Пусть 60<=^ причем 60<—=—. . (5.31) Ws Ofirtotf Тогда допустима п. ф. вида (5.29), если исходные требования удов- летворяют добавочному условию т. е. требования по подавлению помехи не являются слишком жест- кими. В противном случае, но при условии й>Х7-, бл>4 (5.33) з X можно использовать функцию Tri (П\ _ fcP ______Г2Р + 1__________ /г -1/д Лр 14» D (T3D,+ ,1) (T4D + 1) с теми же параметрами, но при = (5.35) Все записанные выше формулы прямо вытекают из вида аппрок- симирующих ЛАХ, представленных на рис. 3.22. Рассмотрим не- сколько детальнее ситуацию, представленную на рис. 3.22, в. На каждом участке линейности Lp(0) совпадает с одной из пря- мых (относительно переменной 0 = lg<B!) вида 20 L(, причем ^o = lg^ L^lg^, L2 = lg^, L3 = Ig^ где константы ct и границы участков <i>fs=l/7’j, i = l, 2, 3, ..., оп- ределяются из следующих условий: а) условия непрерывности Ao (oij) = А, ((О,), £1 (ь>г) = ^2(<0г), Li(dig) = L3(<B3), б) условия на длительность участка вблизи частоты среза <оср: А2(®сР) = 0, <оср == /о)2, ®3 = 10®2, в) условия по точности Li (®s) — 1" р La (cojv) 1g 6jy. После этого получение (5.30), (5.31) связано с простыми алгебра- ическими выкладками. Не более сложны и ситуации, когда 60 > где расположе- ние «запретных зон» такое, как показано на рис, 3.21,
§ 6. РЕАЛИЗАЦИЯ ЗАКОНА УПРАВЛЕНИЯ 121 Очевидно, что все результаты носят лишь приближенный харак- тер — в той мере, в какой это свойственно методу ЛАХ,— однако они просты и практически эффективны. Подчеркнем вместе с тем, что все указанные типовые Н? (D) относятся к классу п. ф., описываемому формулами (4.42) , (4.43), (4.35). Нетрудно проследить и *связь между рекомендациями по выбору их параметров и условиями (4.36) 4- (4.38). Отметим также, что (5.28) соответствует фильтру Баттерворта при п = 1, <в0 — = 8~10. § 6. Реализация закона управления 6.1. Формула и реализация. Предшествующее изложение в дан- ной главе было, по существу, посвящено одной проблеме: как вы- брать закон управления в виде линейного динамического преобра- зования, задаваемого передаточной функцией 2Z/(D).
122 . ГЛ, 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ Пусть для определенности речь идет о законе управления с об- ратной связью вида B(Z) = /7/(D)e(0, (6.1) где е (/) —ошибка управления, a — дробно-рациональная п. ф. вида . #/(°) = тдГ (6-2) Уже указывалось, что для фактического получения.функции u(i) (сигнал управления) требуется решать дифференциальное урав- нение . Z(D)u(i) = fc(D)e(i), (6.3) причем значения правой части не известны заранее, а поступают от измерителя (датчика ошибки) в ходе работы системы. Реализация закона управления состоит в построении вычисли- тельного устройства (ВУ), осуществляющего такую операцию пре- образования постепенно поступающих данных. Принципы построения аналоговых вычислительных устройств (ВУ) типа электронных моделей, с помощью которых возможна реа- лизация закона управления вида (6.3), были описаны в гл. 2, § 2. Вместе с тем задача проектирования, а тем более создания необходи- мого ВУ не исчерпывается этими принципами, а является специаль- ной технической проблемой, которой посвящены многие руководства. Здесь целесообразно остановиться только на одном принципиаль- но важном ее аспекте. Давая конструктору задание на разработку ВУ для системы уп- равления, инженер-расчетчик обязан выдать не только желаемый за- кон управления — уравнения типа (6.3), но и требуемую точность его воспроизведения, допуск на возможные погрешности, отличия в свойствах преобразования сигналов в реальном ВУ от требуемого закона. . Дело в том, что ни одно реальное устройство не может быть точ- ным аналогом, поскольку реальная физическая система не может быть точно описана какой-либо конкретной математической моделью. Мы были вынуждены считаться с этим фактом при описании объек- та управления. В не меньшей степени он важен и при реализации закона управления. В конечном счете нас всегда интересует, как будет вести себя реальный объект под действием реализованного устройства управления. При этом в равной мере следует учитывать возможные отличия идеальных расчетных закономерностей от реаль- ности в обеих частях системы. Поскольку пока нам известны лишь некоторые методы линейной теории, то и при сравнении модели с реальностью мы вынуждены ограничиться только такой гипотезой: реальная система также может
§ 6. РЕАЛИЗАЦИЯ ЗАКОНА УПРАВЛЕНИЯ 123 быть описана линейными уравнениями вида (D) У (О ==-РГ (D) “ (0 + Pw (D) W (Or lr(D) и (t) = kr (D) e (£), e (t) = yd (t) - у (f),; но co свойствами, отличающимися от принятых при расчете. В дей- ствительности эти различия могут быть велики или малы, но необ- ходимым условием является требование грубости-, при малых отли- чиях характеристик реальной системы от принятых при расчете ее поведение не должно существенно изменяться*). С понятием грубости мы уже сталкивались в § 1. Более того, без качественного представления о необходимости обеспечения гру- бости вообще невозможно давать какие-либо разумные рекомендации по построению законов управления. 6.2. Уточнение рекомендации. Качество управления и точность модели. Напомним, что требования к поведению системы, определя- ющие выбор закона управления согласно § 4, сводились к следую- щему. 1. Сцстема должна быть устойчивой, а частотная характеристи- ка и. ф. замкнутого контура должна удовлетворять ограничениям |1-Яэ(г®)1 ^б., вей,, (6.5) !H3(io>) I 6N, (6.6) а кроме того, возможно, условиям - ' dll., 1 Яз(0) = 1, >Г. (6.7) “Р р=0 о Все указанные условия учитывались при расчете, и выбирался такой закон управления, чтобы они удовлетворились. Иначе говоря, нахо- дились такие fc(p), 1{р), что 1) многочлен - А(р) = а(р)Цр)+₽(р)/с(р) (6.8) являлся устойчивым; 2) п. ф. Нз = а (р) + /(р) к(р) (6-9) удовлетворяла условиям (6.6), (6.7). Вопрос лишь в том, окажутся ли выполненными те же требова- ния, если заменить многочлены а, {J, к, I на их реальные значения. Наглядный ответ на этот вопрос легко может быть получен с по- мощью метода ЛАХ. Из критерия Найквиста следует, что любые изменения Lp(e)) и •фр(и), такие, что остается выполненным условие ф>р(<в)> — я при *) Более строгое определение дано в гл. 4, § 3, см, также [3.6],
124 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ всех ®, где Ар(<о)>0, т. е. <в<<оср, не приводят к нарушению ус- тойчивости замкнутой системы. Вывод 1. Если отличия расчетной модели от реальности сво- дятся к малым изменениям коэффициента усиления или постоян- ных времени таких, что (б.Ю) то условия устойчивости не нарушаются. Более того, устойчи- вость не нарушается, если эти различия приводят к появлению малых постоянных времени таких, что 77>(0ср. (6.11) Чем больше введенный при расчете запас устойчивости, тем большие погрешности допустимы. В рамках метода ЛАХ в качестве меры запаса устойчивости ис- пользуют либо запас устойчивости по фазе (аргументу), т. е. ве- личину ДгЬ А л + -фр (соСр), либо запас устойчивости по амплитуде (модулю), т. е. величину &L = = —Lv(a), где а> таково, что ф(со) = = —л (рис. 3.23). Смысл введения этих величин ясен из критерия Най- квиста. В качестве меры запаса устойчи- вости можно принять и степень ус- тойчивости замкнутой системы, ука- зывающую, насколько должны из- меняться корни характеристическо- го уравнения, чтобы хоть один из них перешел в правую полуплос- кость. Такая мера особенно важна в ситуациях, характерных для применения динамической компен- сации, когда п. ф. Ht(p) не полностью определяет вид характери- стического многочлена. Далее учтем, что для минимально-фазовых систем £Р(®) пол- ностью определяет Нр(р), а следовательно, и Я3(р). Вывод 2. Малые изменения в коэффициенте усиления или по- стоянных времени типа (6.10) могут привести лишь к малым на- рушениям ограничений (6.5), (6.7). Появление малых постоянных времени типа (6.11) заведомо не изменяет выполнения условий (6.5), (6.7), определяемых видом Ар(ш) в низкочастотной обла- сти, и может лишь улучшать условия (6.8) подавления высокочас- тотных помех.
§ 6. РЕАЛИЗАЦИЯ ЗАКОНА УПРАВЛЕНИЯ 125 Принципиально важным является следующее положение. Вывод 3. Чем более жесткими являются требования (6.5), (6.7) по качеству отработки сигнала, тем более точным должно быть соответствие расчетной модели и реальности. Под увеличением «жесткости требований» понимается как умень- шение «допуска» 6„, лак и расширение области т. е. увеличение предельной частоты со, допустимых сигналов. Оба эти фактора при- водят к увеличению требуемой частоты среза <оср, а тем самым — к расширению множества существенных постоянных времени, удов- летворяющих (6.10), в задании .которых допустимы лишь малые не- точности. Полученному выводу можно придать и негативную форму. Вывод 4. В теории систем управления с обратной связью не- допустимо утверждать, что та или иная модель точно или при- ближенно описывает реальную систему, не указывая при этом, для какой цели используется модель, каково требуемое качество управления. Позитивные практические следствия также очевидны: при реа- заботиться далеко за закона уп- лизации рассчитанных законов управления можно не о точности воспроизведения частотных характеристик частотой среза. В частности, вместо любого желаемого равления Я/ (D) можно использовать закон вида Я/ (D) = Я?(В)-4т-----, } П(riD + О если постоянные Tt, Т\ являются малыми в смысле обстоятельство существенно облегчает создание анал (6.11). Это говых ВУ, обеспечивающих формирование законов управления. Действительно, вводя добавочные малые постоянные времени, можно преобразовать желаемую п. ф. закона управления в строго реализуемую*). Вместе с тем, как было доказано в § 2 гл. 2, стро- го реализуемой п. ф. можно сопоставить структурную схему, со- держащую только звенья типа идеальных усилителей и интеграто- ров, а таковые с желаемой точностью могут быть реализованы с по- мощью стандартных элементов — операционных усилителей. Напомним, что с помощью тех же блоков может быть воспроиз- ведена (с точностью до малой постоянной времени) и операция дифференцирования, не являющаяся «строго реализуемой» в фор- мальном смысле. Однако при наличии высокочастотных помех це- лесообразно избегать непосредственного использования дифферен- цирующих устройств: при дифференцировании амплитуда увеличи- *) Пример дан в § 7,
420 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ вается пропорционально частоте, и сигнал, искаженный помехой, может выйти за пределы зоны линейности последующего преобра- зования, полностью искажая его предполагаемые при расчете свой- ства. Подробнее о неприятностях, связанных с этим эффектом, бу- дет сказано в гл. 5, поскольку проблема не может быть освещена в рамках линейной теории. 6.3. Об использовании цифровых ВУ. Кратко остановимся так- же на проблеме реализации законов управления с помощью дис- кретных, цифровых ВУ. Выработка сигнала управления согласно (6.3) требует решения дифференциального уравнения, но, как из- вестно, существуют стандартные методы вычислительной матема- тики, позволяющие производить численное интегрирование диффе- ренциальных уравнений с высокой точностью. Более того, существуют и соответствующие стандартные про- граммы для цифровых ЭВМ. Если в качестве ВУ в системе управ- ления используется такая ЭВМ, то в принципе возможно применять и почти любую стандартную программу для выработки сигнала уп- равления, лишь бы она удовлетворяла следующим условиям. 1. Ввод данных о правой части, т. е. процессе e(t), должен про- изводиться по мере поступления информации от измерительных устройств, вводимой в ЭВМ через специальные устройства ввода. 2. Выдача данных о значении решения u(t) должна произво- диться лишь с малым запаздыванием относительно ввода информа- ции о значении ошибки 8(f) в тот же момент времени, причем дан- ные должны преобразовываться в сигнал (с-помощью специального устройства вывода), подлежащий дальнейшему усилению по мощ- ности. Необходимость этих условий почти очевидна, хотя на самом де- ле проблема не столь проста. Ее специфика будет систематически продемонстрирована в гл. 7. Здесь лишь стоит заранее заметить, что. требования к точности численного интегрирования и быстроте его осуществления (величина запаздывания в выдаче данных) опять-таки не носят абсолютного характера, а определяются тем, насколько отклонения от желаемого закона мешают выполнению за- данных требований по устойчивости и качеству системы в целом. § 7. Синтез обратных связей в электромеханической следящей системе 7.1. Описание и технические условия. В качестве развернутого примера к материалу, изложенному в § 4—6, рассмотрим задачу о выборе законов управления' в электромеханической следящей си- стеме (ЭСС). Принцип действия ЭСС был изложен в гл. 1, § 3; в гл. 2, § 2 приведены различные формы математического описания силового блока системы, включающего усилитель мощности, двига- тель, редуктор и собственно объект управления — выходной инер- ционный вал, угол поворота которого <р (£) должен отслеживать угол
§ 7. ЭЛЕКТРОМЕХАНИЧЕСКАЯ СЛЕДЯЩАЯ СИСТЕМА 127 HUZ(D) поворота задающей оси. Наконец, в данной главе (П.2.1) бы- ла приведена обпщ’я структурная схема ЭСС при произвольном ли- нейном законе управления с обратной связью по результату изме- рения ошибки 8(f)==<jp<i(i) —<p(f), задаваемому п. ф. Я/(В). Здесь же будет рассмотрена задача рацио- нального выбора при допол- нительном усложняющем предполо- жении, что результат измерения ошибки искажен наличием помехи N(t). Структурная схема ЭСС, дан- ная на рис. 3.24, учитывает этот фактор. Передаточные функции Я„Ф(В), Ятф(В) могут быть записаны в виде (см. формулы (2.22), (2.23) в гл. 2) «вхФ Рис. 3.24 (D) — Da0C(D) ’ Уо <D> Da0 (D) «• (7.1) Нщщ> (D) — где a0 (D) = TMD (T3D + 1) (T2D2 4-1) 4- TM2D (^D 4- 1) 4- T?D2 4- 1, Po(D) = (7’obD24- 1)^ 4 1)4- (7.Г) или, в пренебрежении нежесткостью кинематической передачи (при П = 0), a0(D)=7’MD(T9D4-1)4-1, (D) = TeD4-1, = ГИ14-Ти2. (7.1"> Смысл констант был указан в § 2 гл. 2. Подчеркнем лишь, что, по определению, ao(O)= 1, ро(О)=1, и многочлен а0 устойчив. Опишем сначала типичные технические условия, которыми оп- ределяется выбор п. ф. обратной связи т. е. п. ф. преобразо- вания результата измерения e(t) + N(t) в управляющее напряже- ние и (f): а) предельный постоянный момент нагрузки равен тв (нм); б) предельная угловая скорость задающей оси (или вала нагруз- ки) равна соа (1/с); в) предельное угловое ускорение равно р_(1/с2), а также зада- на предельная допустимая ошибка отработки е. Предположим также, что задана нижняя граница полосы час- тот гармонических помех Амплитуда таковых неизвестна, но желательно иметь относительную величину установившейся ошиб- ки = аУедоо, вызванной наличием помех (см. § 4), возможно более малой при любых <в > 7.2. Выбор желаемой и. ф. Первая фаза расчета состоит в оп- ределении желаемой п. ф. по типовым воздействиям. В техниче-
128 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ ских условиях воздействия описаны не полностью. Поэтому введем дополнительное предположение о том, что расчет должен произво- диться для двух режимов: 1) установившийся режим отработки вращения задающей оси •с постоянной скоростью с преодолением постоянного момента на- <рузки; 2) установившийся режим отработки колебаний угла поворота задающей оси с постоянной амплитудой и частотой. Выясним, каково поведение приведенного сигнала s(f) = (t) - Hmv(D) тв (t) (7.2) в расчетных режимах.’ В режиме 1) <pd(t)= &dt, mB(t) = mB, i'jne mB — постоянны. Поэтому при достаточно больших t s(t) = coat + kMmHt = axt, A + k№mn, что следует из вида п. ф. Hmv, указанного выше. Таким образом, приведенный сигнал в этом режиме меняется с постоянной ско- ростью, не превышающей а, = + кмтв > o)d. ' (7.3) В режиме 2) з(£) = ф4(t) = ad cos at, где ad, (л — постоянны, но неизвестны. Задано только, что |Пф'!(г) Wd, |D^pd(t) I *£ p, но отсюда следует, что ad(a < ©а, (7.4) и тем самым определяется ограничение на предельную частоту из- - р менения сигнала а также ограничения на амплитуду сиг- Чу нала, которые (в отличие от описанного в § 4) зависят от частоты. . — <0j - Заменим их более простым ай=С А при всех частотах <в < <о8 *), для того чтобы непосредственно воспользоваться рекомендациями, данными в § 4, 5. Потребуем также, чтобы в обоих режимах пре- дельная допустимая ошибка не превосходила заданной величины е, т. е. примем _ _ _ _ е0 = е, е, = е, (7.5) где 8о, е, — введенные в § 4 обозначения для предельных ошибок при отработке линейно растущего и гармонического сигналов. Вы- *) Нетрудно убедиться, что это упрощение не обязательно. Все результаты сохранят свою силу и при ограничениях (7.4),
§ 7. ЭЛЕКТРОМЕХАНИЧЕСКАЯ СЛЕДЯЩАЯ СИСТЕМА 129 берем первоначально Hds (D) из семейства фильтров Баттерворта (4.26), используя условие (4.30), которому должны удовлетворять значения параметров. С учетом (7.3), (7.5) оно приводится к виду 1 ^esin-^j (7.6) где п — порядок, а й0- характерная частота фильтра, значение 6„ не задано. Оно окажется наименьшим, если выбрать порядок п так, чтобы минимизировать величину Д1 \п т-2----а I * (7-7) а <о0 принять равной : (7-8) где По —порядок п, при котором минимальна (7.7). Перейдем далее к другому способу выбора желаемой п. ф. — методу ЛАХ. При этом также воспользуемся готовыми рекоменда- циями, данными в § 5. Простейшая п. ф. вида (5.28) я;И-А, <7.9) 0х “1 пригодна, если выполнено условие л _ % ё, “« “1 a.S®8 которое заведомо верно в данном случае, если е = е0 == е„ Однако предельный относительный уровень подавления помех 8я при этом ограничен величиной 1 в, = (7.10) Для уменьшения этого уровня попытаемся использовать п. ф. более сложного вида (5.29) с параметрами (5.30): //₽ (Р) = — (Г110+21)(ГдР + 1у (7-И) Т2 = ХЛ 1/-Л- = ^3 = ОД Z2t хе [2; 4]. (7,12) 9 а. а. Первозванский
130 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ Таким образом, выбор коэффициента усиления kv определяется заданной предельной угловой скоростью, а отношение опреде- ляется предельным угловым ускорением. Обеспечиваемое при таком выборе подавление помех оценивает- ся по формуле (5.32) 10и* юр — о * е<4 бдг = 6jy = (7.13) Сравнение различных вариантов Нр (р) возможно только при задании конкретных числовых данных. _ _ Пример_7.1. Примем ©а = 4 1/с; kNma — 1 1/с; $ = 20 1/с2; е = 0,05;. ©№=300 1/с. Тогда at = 5 1/с, и можно воспользовать- ся результатами расчетов фильтра Баттерворта из П.4.1, где были указаны те же значения е, ©N. В этом примере было установле- но, что = 2, ©о = 72 • 100, так что желаемая п. ф. замкнутого кон- тура рекомендуется в виде D 1 1+1бо + "2' D '2 * Тоб/ а следовательно, “o'-' D 0,01D+l При этом 6N = 2/9 0,22. В то же время фильтр 1-го порядка дает худшую величину 0,33, так что простейшая рекомендация метода ЛАХ менее эффективна (уже указывалось, что формула (5.25) при- водит к фильтру с п — 1, ©о = 1/бо). С другой стороны, более слож- ная п. ф., рассчитанная по формуле (7.11) (при %2 = 10), , х „ 100 (0,09р + 1) р ' (0,25р+ 1) (0,009р,+ 1) « обеспечивает лучшее подавление помех, чем лучший фильтр Бат- терворта! Действительно, при данных параметрах s Ю-20 4 _ппл °N~ 0,05-(300)2 90 U’- На рис. 3.25 приведены асимптотические ЛАХ, соответствующие двум рассматривавшимся вариантам Нр(р). Из него видно, что вариант (7.11) обеспечивает меньший коэффициент усиления за пределами заданной полосы пропускания о С ©,. О Даже без числовых прикидок ясно, что вариант, предлагаемый по методу ЛАХ, более гибок, так как имеет больше параметров для подбора аппроксимирующей функции, чем фильтр Баттерворта.
§ 7. ЭЛЕКТРОМЕХАНИЧЕСКАЯ СЛЕДЯЩАЯ СИСТЕМА 131 Дополнительно укажем, что исходные требования к качеству следящей системы могут задаваться и в иной, отличной от приве- денной выше, форме. 7.3. Дополнительные условия и формулировки. Часто задают до- полнительные требования к переходной функции. Их анализ при- менительно к фильтрам Баттерворта был дан в § 4. Для метода ЛАХ ситуация несколько сложнее. Аналитическая структура связи между характеристиками типа «время ta затухания» и «перерегулирование» с параметрами жела- емой п. ф. Нр (р), например вида (7.11), достаточно громоздка, хотя оценка этих характеристик путем прямого счета при заданных числовых значениях параметров производится несложно. Анализ численных расчетов *) показывает, что при рекомендуе- мом соотношении параметров Т3 = 107*2, иср = X у-, Xs [2, 4], пере- ча регулирование не превышает 30%, а время затухания ограничено величиной Правило. При наличии дополнительных требований на, время за- тухания вида ta С ta надлежит провести анализ исходного задания. Если (7-15) то дополнительное требование несущественно. В противном случае .можно применить ранее рекомендованную схему расчета, заменив исходное задание £ по допустимому ускорению на большую вели- чину бОёДц. *) Детальное описание результатов расчета можно найти, например, в (3.1].
132 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ Стоит также отметить, что популярность метода ЛАХ в инже- нерных кругах настолько велика, что зачастую исходное задание формулируется непосредственно в виде ограничений на поведение ЛАХ, например: а) наклон низкочастотной асимптоты равен —20 дБ/дек, б) добротность не ниже fc, в) частота среза равна <вср, _ г) запас по фазе на частоте среза не ниже Аф, д) уровень £р(ы) за частотой ан- не выше 201g6N. Ясно, что по этим требованиям также легко устанавливаются параметры желаемой п. ф. вида (7.11). Напомним, что из теоремы Боде следует: при достаточной дли- тельности участка асимптотической ЛАХ с наклоном — 20 дБ/деи в окрестности частоты среза фас(®ср) = —л/2, а следовательно, запас по фазе близок к я/2, что, как правило, считается практически удов- летворительным (обычно допускается снижение запаса до л/4). Таким образом, этап синтеза обратной связи, на котороги по за- данным техническим условиям выбирается желаемая передаточная функция, рассмотрен с достаточной полнотой. 7.4. Выбор п. ф. обратной связи. Второй этап состоит в постро- ении п. ф. обратной связи Я,(В). Общая схема была дана в § 4, 6.. Здесь важно выявить лишь некоторые специфические детали. Поскольку во всех вариантах Яр (D) представима в виде ^p(d) = M~, «о(О) = 1, Й(0) = 1, (7.16> а п. ф. объекта Я«(В) дается формулой (7.1), то для обеспечения тождества H^(D)fff(D)s^(D) (7.17) следует принять ^(0) = ^^^^, ' (7.18> Такая п. ф. строго реализуема, если deg ро + deg а0 < deg а*. (7.19> В противном случае придется воспользоваться приемом регуляриза- ции, описанным в § 6, т. е. введением малых постоянных времени, не искажающих поведения частотной характеристики в полосе су- щественных частот, определяемой частотой среза ®ср. Вновь обра- тим внимание на то, что само понятие «малости» зависит от требо- ваний к качеству системы, поскольку именно они определяют часто- ту среза. Для дальнейшего удобно иметь явное представление для корней многочлена а0(р), определяющего динамическое описание объекта.
§ 7. ЭЛЕКТРОМЕХАНИЧЕСКАЯ СЛЕДЯЩАЯ СИСТЕМА 133 Согласно (7.Г) этот многочлен имеет 4-ю степень, и корни можно оценить лишь приближенно. Используем практически приемлемую гипотезу, что Т’о^Т'э, Рп А Тя/Т№ 1. Тогда можно убедиться прямым перемножением, что справедливо представление «о (р) = {Тр + 1) (ц0Гр 4- 1)Шф Гр + Г + 1}( (7.20) I L * ь j где Т = Тм + О(щ), а=71()7’71, откуда явно вычисляются корни с точностью до величины р0. Будем ориентироваться на условия, приводящие к целесообраз- ности выбора 77p(D) в виде (7.11). Тогда следует считать малыми все постоянные времени, существенно меньшие постоянной Т3 такой, что Тд1 лежит за частотой среза в конце участка асимптотической ЛАХ, имеющей наклон —20 дБ/дек (рис. 3.22, б). Если ЦоР « Т3, то можно принять а0(р)= Т„р + 1 (физически это означает пренебрежение индуктивностью якорной цепи и нежест- костью кинематики), и „гы (Гмр + 1)(Г2Р+1) 27Z(D) kf 1) • (7-,21) Если р,,Т не удовлетворяет условию малости, но abp„T<z. Т,, (7.22) то можно принять а0(р)^{Тр + 1)(рвТр + 1) (7.23) (это равносильно пренебрежению нежесткостыо). Тогда И (D) - к ^р+1)(%?1Р + 1)(Г2Р + 1) . где малая постоянная Г4<Г3 введена для обеспечения реализуе- мости. Если же оба указанных фактора существенны, то приходится принимать Ht (D) в виде ______________%(Р)Г2Р + 0______________. П ’ a/(7’1D+l)(7’3D+l)(7’4D+l)(r5D + l)(7’eD+l)’ где обеспечение реализуемости достигается введением еще двух малых постоянных 7\, Те, поскольку deg а0 = 4. Пример 7.2. Примем щ = 0,1; « = 0,5; 5 = 0,5; ка — 0,1 1/(В с): Г™ = 0,5 с. Тогда а0 (р) = -L р {(0,025р)2 + 1] (0,05р + 1) + -t р (0,05р + 1) + + (02025р)2 + 1
134 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ или, в .соответствии с приближенным разложением (7.20), а, (р) = (0,5р + 1) (0,05р + 1) [0,025а (р + 11)2 + 1]. По данным П.7.1 r/d/rj'i 100 0,09D +1 D (O.,25D+1) (0,09D+1) ’ причем желаемая частота среза равна ®ср 35 1/с» 6 Гц. Требования к качеству являются достаточно жесткими, условие (7.23) не выполняется. Поэтому требуется использование обрат- ной связи, построенной по полной формуле (7.25). Предположим далее', что путем улучшения конструкции редук- тора удается существенно повысить жесткость кинематической свя- зи, так что Го = 0,001 с (это соответствует частоте свободных коле- баний вала нагрузки относительно ротора, равной 1000 1/с или 160 Гц). Предположим также, что с помощью других приемов (о ко- торых будет сказано чуть ниже!) удается уменьшить механическую Тя и электрическую Т3 постоянные времени до уровня Гм = 0,5 Тк = = 0,95с; Т'а — 0,05 Т3 —-0,0025с. Тогда п. ф. закона управления в обратной связи может быть построена в виде гг /т>\ — ~Ь О (0.25Р + 1) _ лпз 0.09D + 1 п (0)25D-р 1) (0,00gD +1) 0,009D + Г ' } Реализация такого закона управления существенно проще. О 7.5. Внутренние обратные связи. Упомянутые приемы уменьше- ния постоянных времени в сущности уже известны —это введение внутренней обратной связи. Действительно, если есть возможность измерения выхода иди какой-либо другой переменной, с ним связанной, то внутренняя об- ратная связь позволяет изменить динамические характеристики ох- ватываемого ею блока. Опишем конкретный способ построения такой связи, считая для упрощения, что нежесткостыо кинематической связи можно сразу пренебречь. Пусть с помощью тахогенератора измеряется угловая скорость двигателя, отличающаяся от угловой скорости вала нагрузки коэф- фициентом редукции г, т. е. вырабатывается электрическое напря- жение uTr(Z)=? &тг®дз(1) = krTra(t)= k„ruty(t). (7.27) П. ф. преобразования «управляющее напряжение пв1-> угловая скорость вала и» в силу (7.1) при 2% = 0 равна „ к„ кс ~(ГМ1> + l)(TaD+l)- (7.28) * > Примем изх^) = + ua(t), где ut(f) — сигнал обратной связи по ошибке, a иш (/) формируется на основе измерений угловой
§ 7. ЭЛЕКТРОМЕХАНИЧЕСКАЯ СЛЕДЯЩАЯ СИСТЕМА 135 скорости согласно уравнению ZB(D)a,(i) = —A«,(D)®(<). (7.29)' Подберем п. ф. внутренней обратной связи „ ,п, л к<№ 7Л>(В)Д так, чтобы и. ф. блока, замкнутого этой связью (рис. 3.26,6), т. е. HU/e>(D)^i + яй(п)Я.цм(О)’ <7-30) - совпадала с желаемой Нл (D) =........... ~.......-.-.... Г>(г>+1)+1 (Г>+ l)(TaD + l) Очевидно, что это возможно, если принять (2^0 4-1)(г;о+!)-/<’ 0<&с<1 (7.32) Тем самым введением реализуемой обратной связи удается, добиться желаемого изменения постоянных времени Т„, Та на Т\1г Тв„ Хотя при этом изменяется и коэффициент усиления (kc-^k'c)f это изме- нение легко компенсируется за счет коэффициента усиления в Hf(D). Пример 7.3. Для данных П.7.2 построим обратную связь по ско- рости в соответствии с формулой (7.32). Примем &0 =/сс=0,1» Тогда тг ___________(0,5D+D (0,05D+D “ ' ’ (0,25D + 1) (0.0025D + 1) — 0,1 » fj (В) = ~ '.. 1 ’ __________ ' (0,25D + 1) (0,00250 + 1) ' При этом ранее найденная формула (7.26) для H/(D) сохраняет силу. О Еще более эффективно введение двух внутренних обратных свя- зей — и по угловой скорости, и по току якоря. Построим управляющее напряжение в виде HBS(l) = H/(l)+HB(Z)+ui(l), (7.33) где wM(/) формируется, как и ранее, на основе измерений угловой скорости в>((), а щ(/)—на основе измерений тока i(i). Оказывает- ся, что теперь желаемая п. ф. блока, охваченного этими двумя об- ратными связями, может быть приведена к форме (7.31), если принять uB(() = — kua(t), = —kii(t) (7.34),
136 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ и соответствующим образом подобрать постоянные коэффициенты ki, ка. Для такого выбора придется «влезть внутрь» объекта, вспо- миная приведенные в § 2 гл. 2 уравнение (2.6) якорной цепи и со- отношения связей (2.5), (2.9), (2.11), (2.12). С их помощью мож- но записать, что (LaD + Ra)i„ + сеГ(в = куи№. (7.35) При наличии обратных связей (7.33), (7.34)' получим (LBD + Ra + kfiy) iR + ™ = M/- (7.36) Структура уравнений (7.35), (7.36) совпадает, изменились лишь коэффициенты к к 7?я Ля + kiky, се Се (7.37) (жесткая обратная связь по току эквивалентна повышению сопро- тивления якорной цепи, жесткая обратная связь по скорости — по- вышению противо-ЭДС).
§ 7. ЭЛЕКТРОМЕХАНИЧЕСКАЯ СЛЕДЯЩАЯ СИСТЕМА 137 Следовательно, структура передаточной функции совпа- дает с Яиш(р) в отсутствии внутренних обратных связей, а коэф- фициент усиления и постоянные времени, зависящие от R„, с„ (см. обозначения к формуле (2.22) гл. 2), изменятся: г . с кс->кс = кс-----7м = Т*-----------------fp-, (7.38) С + —7— се Т -7— гр гр' гр Я 7а->Гэ-^Э Дя + ^"« Пример 7.4. Вновь вернемся к данным, использовавшимся в предшествующих примерах. В отличие от П.7.3 введем внутреннюю обратную связь по скорости и току якоря согласно (7.33), (7.34). Примем тогда, согласно (7.38), имеем Тм = -g- Т№, Ta=-^TBf к'с =-^-к0. Тем самым достигается желаемое, согласно П.7.2, уменьшение пос- тоянных времени до несущественного уровня, и п. ф. обратной свя- зи по ошибке может быть взята в простом виде ы /т»\ о л m 0,09D + 1 J//(P)==2-lO30009DTi (различие с (7.-27) состоит только в коэффициенте усиления, и оно необходимо для компенсации снижения ке). Суммируем результаты, полученные во всех примерах. При одних и тех же исходных данных и требованиях к качеству построены три варианта динамических структур следящей системы (рис. 3.26). Соответствующие п. ф. равны*) rrd) /тм _ <Пз (0.09D + 1) (0,5Р +.1) (0.05D + 1) 7 w __ (0 25D + (0i0009D +:1) > /ТВ___1П3 9.09D 4~ 1 тт /П._____(0,5D'4~ 1) (0,05D 4~ 1) 7 ' ’ 0,00904-1’ (0.28D 4- 1) (0.0025D 4-1) * ^3)(W=2.1O3o°g±l, = ^ = 10. 7.6. Синтез и проектирование ЭСС. Уже в гл. 1 было указано, что проблема проектирования систем автоматического управления шире и многообразнее, чем проблема выбора, синтеза законов управления. Здесь на примере ЭСС по- пытаемся уяснить взаимосвязь различных аспектов общей проблемы. *) Во всех вариантах считалось, что То < Гэ, поэтому ZZj15 (D) опреде- лено согласно (7.24),
138 ГЛ. 3. ПОСТРОЕНИЕ ЗАКОНОВ УПРАВЛЕНИЯ Прежде всего отметим, что при синтезе предполагались уже известными характеристики датчика рассогласования и силового блока. В действительно- сти при проектировании ЭСС необходимо начинать с выбора этих элементов и определения их характеристик. Однако сам этот выбор должен подчиняться тем же конечным целям, что и выбор закона управления. Любой реальный двигатель в состоянии отдавать лишь ограниченную мощность, но требуемая мощность, зависит от режима движения вала и внешней нагрузки на него. Обычно при проектировании ЭСС [1.3, 1.6] первоначально исходят из двух простых гипотез: а) в дальнейшем будет обеспечена высокая точность слежения, а следо- вательно, движение вала будет повторять движение задающей оси; б) основная часть мощности затрачивается па преодоление внешнего на- грузочного момента на валу. В силу этого потребная мощность должна удовлетворять условию Рп > kamBa>d, (7.39) где тв — предельный момент нагрузки, o>d — предельная угловая скорость за- дающей оси, а следовательно (в силу гипотезы а)) и вала. Коэффициент к3 — коэффициент запаса по мощности, введение которого должно обеспечить не- который избыток мощности, необходимый для преодоления других компонент нагрузки. Главными из них являются инерционные нагрузки и механическое сопротивление (трение) в кинематической передаче от двигателя к валу (в ре- дукторе). Однако до выбора двигателя нельзя оценить ни тот, ни другой фак- тор, поскольку, во-первых, инерционность силового блока в целом зависит и от инерционности самого двигателя и редуктора, а во-вторых, необходимый коэф- фициент редукции зависит от диапазона угловых скоростей двигателй. При прочих равных условиях из множества доступных двигателей естественно вы- брать тот, который, удовлетворяя по мощности неравенству (7.39), имеет наи- больший допустимый движущий момент, минимальный момент инерции, хотя иногда решающую роль играют такие факторы, как вес, габариты, стоимость и пригодность к работе в окружающей среде. Если двигатель выбран, то для него (по техническим данным) становятся известными тав — допустимый движущий момент, — момент инерции рото- ра, о)дв — допустимая угловая скорость. Последнее позволяет рассчитать требу- емый коэффициент кинематической передачи (коэффициент редукции) причем, как правило, г > 1. Величины г и т„ — исходные данные для выбора или проектирования кинематической передачи, что составляет специальную- техническую проблему. В силу формул из П.2.3 (гл. 2) жесткость передачи оп- ределяет постоянную времени Го. Если передача недостаточно жестка, то Т,> сравнима с постоянными Гм1, ГМ2, Г8, и описанная в примерах схема выбора закона управления неприемлема. Если условие T^szO выполнено, ту от коэф фициента редукции зависит вклад инерции ротора двигателя в приведенный момент инерции всего механизма «ротор'—редуктор — вал», а тем^ёамым — в механическую постоянную времени Гм. * Согласно (2.14), имеем *) 7ар = ?н 4" Г2/д. Именно величина 7пр определяет момент инерционной нагрузки на валу, ко- торый для предельного допустимого режима равен (3/Ор, где 0 — предельное ус- *) Па самом деле требуется учесть и инерционность самого редуктора, что при предварительных оценках делают, увеличивая /д на коэффициент поряд- ка 1,25 [1.6]. '
§ 7. ЭЛЕКТРОМЕХАНИЧЕСКАЯ СЛЕДЯЩАЯ СИСТЕМА 139 корение, Таким образом, только после предварительного выбора двигателя и редуктора можно проверить, достаточен ли развиваемый двигателем момент, т. е. выполнено ли условие готдв тв + +/пр^, (7.40) где тс — момент сил сопротивления в передаче, приведенный к валу. Если это условие не выполнено, приходится пересмотреть весь расчет, выбирая дви- гатель большей мощности или меньшей инерционности. Подчеркнем, что от- нюдь не при любом соотношении р и <вд вообще возможен такой выбор, хотя конструкторы двигателей прилагают постоянные усилия к снижению их инер- ционности*). Напомним, что отношение p7<orf определяет и предельную частоту изменения сигнала, диапазон рабочих частот ЭСС. Не останавливаясь ид проб- леме выбора усилителя мощности, отметим лишь, что к. п. д. исполнительных двигателей обычно является низким и выходная мощность усилителя должна быть существенно выше полезной мощности двигателя. Зачастую существенной является и не учитывавшаяся выше инерционность усилителя. Перейдем к проблеме выбора датчика рассогласования. Основные требо- вания здесь связаны с уровнем помех и диапазоном работы. Выше уже указы- валось, что помехи (погрешности датчиков) в значительной мере определяют допустимую точность ЭСС, однако все рассмотрение велось в предположении высокочастотного характера помех. Вместе с тем из основной формулы (3.4) следует, что при наличии помех в рабочем диапазоне частот, где Н3(1ы) sa 1, в ошибку управления непосредственно входит слагаемое, величина которого близка к самой помехе, т. е. система не может подавлять низкочастотные по- мехи, в том числе постоянные (статические) или медленно меняющиеся (дрей- фы). Поэтому при выборе датчика прежде всего ориентируются на уровень статической помехи (погрешности), задаваясь соответствующим допуском**). Таким образом, те элементы ЭСС, которые считались уже выбранными до начала работы по синтезу закона управления, на самом деле в значительной мере уже предопределяют возможности системы. Более того, в результате сир- теза (см. 7.5) был построен ряд вариантов законов управления, являющихся формально равносильными. Однако их реализация может требовать различных технических средств. Так, например, для варианта 1 необходимо реализовать преобразование, задаваемое достаточно громоздкой п. ф. //'у1* (D). Для этой це- ли можно использовать устройство на базе операционных усилителей типа представленного на рис. 2.14. Последний вариант требует простой п. ф. преобразования сигнала ошибки (D), зато необходимо ввести в систему датчики тока и угловой скорости, которые, вообще говоря, также обладают погрешностями. Выбор того или ино- го варианта при проектировании должен вестись с учетом этих и многих дру- гих факторов, определяемых только конкретными возможностями схемотехни- ческих решений. Все вышесказанное может послужить лишь в качестве введения в пробле- му проектирования ЭСС, которую, конечно, необходимо изучать по специаль- ным руководствам (см., например, [1.6]), и в данном курсе преследует един- ственную цель: на конкретном примере продемонстрировать ту роль, которую играет теория управления в этой общей проблеме. *) В курсе из соображений технической простоты внимание уделялось только двигателям постоянного тока, хотя в высокоточных ЭСС большее при- менение нашли менее инерционные двухфазные асинхронные двигатели с по- лым ротором [1.3]. **) Роль второго фактора — ограниченности диапазона датчика рассогласо- вания — не может быть объяснена в рамках линейной теории, и мы вернемся к нему в гл: 5.
ГЛАВА 4 УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ § 1. Случайные воздействия и реакция иа них 1.1. Природа случайных воздействий и их характеристики. Пра- вила выбора законов управления, изложенные в гл. 3, базировались на основной гипотезе: сигналы и помехи являются гармоническими или полиномиальными функциями времени (см. § 4). Во многих реальных ситуациях эта гипотеза заведомо неприемлема. Например, при движении самолета в атмосфере возникают аэ- родинамические силы, зависящие от скоростей воздушных потоков, а эти скорости изменяются не по гармоническому закону, а случай- но, хаотически. Хаотическими являются и помехи, возникающие в электронных измерительных устройствах и усилителях. Такой характер процес- сов определяется их внутренней физической природой, и не учи- тывать эту природу при расчете систем управления столь же не- рационально, сколь нерационально не учитывать динамические свойства объекта. Задачи анализа и синтеза систем управления при наличии слу- чайных воздействий имеют свою специфику как с точки зрения применяемого математического аппарата, так и с точки зрения ин- терпретации формальных результатов при их применении. Предва- рительно приведем необходимый минимум сведений из теории слу- чайных процессов *). Случайный процесс x(t) есть семейство случайных величин, за- висящих от времени t как от параметра. Если зафиксировать одно из возможных значений (реализацию) каждой из случайных вели- чин, то получим некоторую неслучайную, детерминированную функ- цию времени, реализацию случайного процесса. Таким образом, x(t) можно рассматривать и как множество (ансамбль реализаций), для которого определены общие вероятностные характеристики. Простейшими из них являются математическое ожидание mx(t), дисперсия dx(t) и корреляционная функция Rx(t, т). *) Предполагается, что читатель знаком с основными понятиями теории вероятностей (вероятность, случайная величина, функция распределения, ма- тематическое ожидание и т. п.) хотя бы в элементарном изложении.
§ 1. СЛУЧАЙНЫЕ ВОЗДЕЙСТВИЯ И РЕАКЦИЯ НА НИХ 141 Математическое ожидание случайного процесса при каждом t совпадает с математическим ожиданием соответствующей случай- ной величины: mx(t) A М {x(t)}. (1.1) Дисперсия случайного процесса определяется аналогично:, dx(t) A М {[x(t) — mx(t ]2}. (1.2) Если mx(t) = 0, то процесс называется центрированным, и dx(f) = Mk2(0}. (1.3) Корреляционная функция при любых t и т совпадает с взаим- ной корреляцией двух случайных величин х(t) ш x(t + x), так что Rx(t, т) А М {[х(0 — mx(t)\ [x(t + x) — mx(i + т)]}. (1.4) Если mx(t) = mx, Rx(t, т) = 7?х(т), т. е. не зависят от t, то процесс называется стационарным в широком.смысле. Очевидно, что для такого процесса dx(t)-dx~Rx(O). (1.5) Если ' J |7?х(т) |dT< оо , V-6) —оо то существует фурье-преобразование корреляционной функции (со) A J Rx(x)e~ia>zdx. (1.7) — оо Функция £х(ы) называется спектральной плотностью процесса x(f). Если она известна, то, в силу свойств фурье-преобразования, можно вычислить /?х(т) по формуле ОО ч . Ях(т) = 4; f Sx^)eiaxda. (1.8) — СО Из (1.5), (1.8) следует, что оо dx = ~ J 5Д<в)й(о. (1.9) —ОО Можно также убедиться, что R*(x) = Rx(-x)^dx, «Др) = &(-©)> 0. (1.10) Если для случайного процесса x(t) заданы только его математиче- ское ожидание и корреляционная функция, то говорят, что он опи- сан в смысле корреляционной теории.
142 ГЛ. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ 1.2. Линейные преобразования Случайных процессов. Процесс y(t) = h(t)v(t)+h0(t), ' (1.11) где h(t), h0(t) — детерминированные функции, является случайным процессом, если процесс v(t) случаен. Согласно определению имеем ms(0 = ^M(0+M0, Ry(t, x) = h(t)h(t + x)Rv(t, т). > Более интересным видом линейного преобразования случайного про- цесса является интегральное преобразование*) t y(f)= ^h(x)v(t — x)dx. (1.13) о При этом, если v(f) — стационарный процесс, то t - t mv (0 = J (т) М {v(t — т)} dx = mv\h (т) dx-, (1.14) о о 7?^ (tj т) А М h (тх) v (t — Ti) — rriy (t) X t t+r = J J h(x1)h(x2) M. {[v(t — Tj) — [p(f + г —t2) —mJdTidTa = 0 0 t H-r = j" J h (Xj) h (т2) Лв(т+ Ti — x2)dx1dxi. (1.15) oo Таким образом, если рассматривать v(t) как ансамбль возмож- ных реализаций входа линейного звена-с весовой функцией fe(x), то формулы (1.14), (1.15) позволяют дать описание процесса y(t) в смысле корреляционной теории'по такому же описанию входа. При стационарном v(t) выход y(t), вообще говоря, нестациона- рен. Однако справедливо следующее утверждение, играющее в даль- нейшем основную роль. ♦) Если подынтегральное выражение интегрируемо (в смысле Римана} на любой реализации, то интеграл от случайного процесса понимается как ансамбль интегралов от реализаций. Однако может быть дано и более общее определение интеграла от случайного процесса (см., например, [4.8]), прием- лемое и при неинтегрируемых реализациях. Известно, что для существования интеграла (1.13), понимаемого как предел в среднеквадратичном римановых сумм, необходимо и достаточно существования (в смысле Римана) интегралов в правых частях (1.14), (1.15).
§ 1. СЛУЧАЙНЫЕ ВОЗДЕЙСТВИЯ II РЕАКЦИЯ НА НИХ 143 Теорема 1.1. Пусть v(t) является стационарным случайным процессом и J | h (т) | dx с < оо, (1.16) 0 Тогда процесс y(t), определяемый преобразованием (1.13), таков, что существует предел х) = Ry{x)f (1-17) /-♦со называемый корреляционной функцией установившейся реакции. Спектральная плотность, соответствующая Rv(x) в силу (1.7), дает- ся формулой 5Д®)==|Я(г®)|25»(®), (1.18) где S,,(а) — спектральная плотность v(t), а Н(ico) —частотная ха- рактеристика преобразования H\i&)^h{x)e~imdx. о Доказательство, Используя (1.10), (1.14), убеждаемся, .что ^(i, т) ограничена при любых т: t t+x j Ry(t, т) | < J j |fe(TJ|| h (r2)11 R„ (t + x. -t2) | йт/т2< 0 0 t t+T < d JIh (T1) Idx! j P (T2) Ps < V- о 0 Следовательно, оо оо J JIh (4) I\h (s) 11 Rv (t+- ы рь dx2:< dvc2, 0 0 -откуда вытекает существование предела (1.17): = j Ja(ti)a(t2) MT + Ti“T2)dTidT aA Rv <T)- W°° .00 Справедливость (1.18) следует из непосредственных выкладок: Sy (a) = J Ry (т) e-1WT dx = J dx J j йт2е_{®т x —оо —оо 0 0 Х^(т1)Л(т2)Яв(т4-^-д2) = co oo oo = j А(Т1)е’“Тд<1Тх Jft(T2)e-l“T^r2 J /?c(T + r1-T2)e“tM(t+Xi_x-)(/T = = H - (la) И (iw) Sv (<o) = | H (ia>) |a Se (<o).
144 гл. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ Формула (1.18) исключительно проста. Она и внешне и по су- ществу*) сходна с формулой связи "между амплитудами входного гармонического воздействия и установившейся реакции на него: ' а% = |Я({©0)|2 al где ©о — частота воздействия. Учтем также, что в силу (1.9) 00 '00 dv = Rv (0) = f Sy(<a)d(i) = f |Я(гсо)|25в((о)(йо. £3Ti -J -~oo - oo (1.19) Пример 1.1. Рассмотрим случайный процесс к(0, построенный следующим образом: он является кусочно постоянным, причем зна- чения At на каждом i-м интервале постоянства являются случай- ными, взаимно независимыми величинами, имеющими одинаковую плотность распределения рА(а), М {4(} = 0. Длительность 0( интер- валов постоянства —' также случайные, независимые между собой г-----I-, ‘--- 1 I । . h----I I I . ... (D ।-----------• Рис. 4.1 и независимые от всех At неотрицательные величины, распределен- ные одинаково с плотностью рв (х) — \е~Кх, х^О. (1.20)" Реализации v(t) имеют вид, показанный на рис. 4.1. «Прыжки» совершаются через случайные интервалы и имеют случайную вели- чину, что объясняет зачастую используемое название для v(t) — процесс типа «кенгуру». Можно установить, что рассматриваемый процесс является стационарным, причем ЛДт) = ^е-Х|11, (1.21) где „о ' йв = о!аД J a*pA(a)da. (1.22) —оо *) Доказано (см., например, [4.8]), что стационарный случайный процесс представим в виде суперпозиции гармонических процессов.
§ 1. СЛУЧАЙНЫЕ ВОЗДЕЙСТВИЯ И РЕАКЦИЯ НА НИХ 145 Действительно, пусть t, и t + т — два произвольных различных момента вре- мени. Возможны ситуации: (1) оба момента принадлежат одному и тому же интервалу постоянства (для определенности — i-му); (2) они относятся к различным интервалам (рис. 4.1). Пусть pi — вероятность 1-й ситуации, а 1 — pi — вероятность 2-й. Тогда М {р (t) v (t + т)} = М {4|} Р1 + М (1 - рх) = М [Af] Pl = dApv (1.23) поскольку значения At, Ар относящиеся к любым различным интервалам, не- коррелированы. Остается оценить pt, иначе говоря, условную вероятность того, что если ti t < t4 + 0г, где tt — начало i-го интервала постоянства, а 0< — его длительность, то и ti t + т < tt + 0,. По определению условной вероят- ности имеем Z;i = р г + т< zi+0i/zi <г < zi+GJ = где в числителе указана вероятность одновременного выполнения обоих не- равенств. Пусть т 0. Тогда оо ) Хе- ''xdx _ Р {°i > * Т ~ _ t+i-tj________ _Хт s ' pi~ ~~е ’ J t.e ^dx Аналогично при т<0 получим, что pt= еКх. Объединяя оба результата, за- пишем, что при любых т Pi = (1.24) Подстановка (1.24) в (1.23) доказывает (1.21). Вычисляя по формуле (1.7), найдем выражение спектральной плотности оо /со О X So (и) -- dv J e~i(axe ~xItI<Zt — dv [ J е~гах e~%xdx + j j == — oo \ 0 — oo / _ A I 1 . 1 \ 2Л , Отметим, что в силу (1.20) ОО М {0,} = | xKe-^dx = v J А о Таким образом, спектральная плотность определяется только диспер- сией значений уровней Л( и математическим ожиданием длитель- ности интервалов постоянства 0<. Пусть v(t) является входным воздействием на систему с опера- тором Н (D) = у2) 1- Тогда с помощью ,(1.18) можно найти Ю А. А. Первозванский
146 гл. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ спектральную плотность установившейся реакции к2 ,2гл2 _1_ 1 /у»2 _±_ l2*' <М®) = а далее вычислить дисперсию , к2 2kdv du = -^~ и 2я —5-5--------х-----jdco. О 7’2ш2 + 1 ш2 + Л2 1.3. Вычисление дисперсий при дробно-рациональных спектраль- ных плотностях. В приведенном примере спектральная плотность оказывалась дробно-рациональной функцией со2. Если ограничиться только классом входных воздействий р(£), имеющих дробно-рацио- нальную (по и2) спектральную плотность*), т. е. Sv — Sv (<02) = (1.25) p=i(i) где Р„, Q„ — многочлены, то можно существенно упростить решение задач анализа и синтеза линейных систем. Лемма (о факторизации спектральной плотности). Если S„ — дробно-рациональна и сЬ<°°, то возможно представление: „ . 2. В0(р)Вг(-р) Оу (СО ) — a i \ л i.. 1 / ' Av(p)Att(—p) где А„(р) — устойчивый многочлен, а В„(р) кроме корней в левой полуплоскости может иметь только корни на мнимой оси. Доказательство сводится к применению леммы о факторизации мно- гочленов (§ 4 гл. 3) к многочленам ГД—Р2), Qv(—p2)- Отметим лишь, что из ограниченности дисперсии v(t), (1.26) ОО joo d« = 2л J S* da> = J SB{~p2)dp —-OO — too следует, что St,(—p2) по имеет полюсов па мнимой оси, так что Qv(—р2) не име- ет корней на мнимой оси. Пример 1.2. Пусть 4Ш2 P„(<o2) М®3)- ш+ + 3(й2 + 4 -^2)- Тогда Рс(-р2) = -4р2 = (2р)(-2р)=>ВДр) = 2р, и <?0(—р2)=> — р4 — Зр2 + 4 = (р2 — 1) (р2 — 4) = (р + 1) (р + 2) (—р + 1) (—р + 2)=> => Лк(р) = (р+1) (/> + 2). □ *) Практически это предположение не является ограничительным. Обычно выражение спектральной плотности является результатом аппроксимации оце- нок,Получаемых по экспериментальным данным (см., например, [4.8, 4.10]) на этом классе функций.
§ 1. СЛУЧАЙНЫЕ ВОЗДЕЙСТВИЯ И РЕАКЦИЯ НА НИХ 147 В силу (1.18) спектральная плотность установившейся реакции равна S, («,’) - Я (,) Н (- р) |р_„ S, (») - U, где В(р) = р(р)В„(р), Л (р) = а(р)4„(р), причем учтено, что Я(р) Ввиду устойчивости системы, а(р) — устойчивый мно- гочлен, так что А(р) также устойчив. Таким образом, справедливо представление оо <ОО di/= J М®2) J P2W == — оо ~joo loo 2л t J А (р) А (- р)ар' — too Это представление позволяет указать простой способ вычисления dv. Предполагая, что А(р) не имеет кратных корней, можно записать V в (pv)в £ dA (р) I , V dp |P=Pv А Pv) (1.28) где pv —корни A(p), a суммирование ведется по всем корням. Доказательство формулы (1.28) основывается на теории функций комплексной переменной. Отметим первоначально, что deg Л (р) > degB(p), поскольку deg а(р) deg Р(р) в силу устойчивости системы, a deg4„(p) > >degB„(p) в силу ограниченности интеграла (1.26). Таким образом, на по- луокружности бесконечно большого радиуса, охватывающей левую полуплос- кость, подынтегральное выражение убывает не медленнее, чем |р|~2, а следо- вательно (см., например, [2.3]), ioo —joo В (р) в (- р) А{р)А{- р) 1 В (р) В (—р) , = 2л1 J Х(р) 4 (—р) где интегрирование ведется по контуру, охватывающему левую полуплоскость. Значение такого интеграла равно сумме вычетов подынтегрального выражения во всех полюсах, лежащих внутри этого контура, что и приводит к (1.28). * Пример 1.3. Пусть Я (/>)= -2^, S„ (to3) = — ., Тогда Ра~ ° со + Зсо +4 а(р) = р + 3, $(р) = р, Л(р) = (р + 1)(р + 2), Яв(р) = 2р, 4(р) = (р + 3)(р+1)(р + 2), 5(р) = 2р2, „ о „ _ 4 „ О . 27 . 1 16 11 „ Pi-----р2-------1, ра-----2, ау — 20 + 42 — 15 = 30’ □ Для малых степеней п многочленов А(р) интегралы вида (1.27) та- булированы в виде функций непосредственно от коэффициентов 10*
148 ГЛ. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ А(р), В(р). Приведем формулы, удобные при расчете простых при- меров. Пусть А (р) = апрп + an-iPn~l +... + а0, В(Р) == Ьп-.Р"'1 + Ъп-гРп~2 + ... + Ь0. Тогда значения интегралов вида (1.27) таковы: Ьо(2аоа1)-1 при п = 1, (bla0 + Ьов2) (2н0а1я2)-1 при п = 2,; (1.29) (6? ~ 2Ь<А) Va + b2aoai + ьоа2аз ППИ » — 3 ... п------7----—----г---------- ПРИ TI = О» 2аоаз(аА-°оа3) Указанные формулы прямо вытекают из (1.28)*). Пример 1.4. Вычислим в явной форме дисперсию установившей- ся реакции, интегральное представление для которой дано в П.1.1: гоо _A_ = J_ Г dp - 2jti J (-zV + l) (-/ + ??)' —i<x> Здесь Л(р) = (7’р + 1)(р + Х)==7’р2 + (П+1)р + ^, 5(p)=l. Имеем n =2, a2 = T, ai — Tk + 1, a0 = K, bi = 0, b0 = 1, так что _^.=_JL=>d □ 2>.d,;k2 2a0^ y ™+i' В дополнение рассмотрим ситуацию, когда выход является сум- мой реакций на взаимно некоррелированные случайные воздейст- вия, т. е. У (t) = S Р(о (0 = 2 f W (* - т) dr,: (1.30) о где bk{vw(f)vm(t +т)}— Q, Iк, при любых t, т. Из взаимной не- коррелированности воздействий вытекает взаимная некоррелирован- ность величин yw (/) при любых t, а тогда By(t,x) = ZB(yl)(t, т), (1.31) i *) При п > 3 для вычисления интегралов типа (1.27) можно использовать рекуррентную процедуру типа алгоритма Рауса, описанную, например, в [4.5, с, 152],
§ 1. СЛУЧАЙНЫЕ ВОЗДЕЙСТВИЯ И РЕАКЦИЯ НА НИХ 149 я для установившейся реакции имеем —- Sy (<В) = 2 Syl) (®) = 21 Я(г) (io) |2 S? (со), I I 00 ^-4 f Sra^i^V)^. -00 I (1.32) 1.4. Распределение вероятностей. Нормальные процессы. Корре- ляционное описание случайного процесса является весьма бедным. Одну и ту же корреляционную функцию могут иметь процессы с совершенно различными реализациями. Пример 1.5. Рассмотрим случайный процесс, задаваемый форму- лой x(i) = a cos(Qt + Ф), (1.33) где а — детерминированная величина, a Q и Ф- случайны. Каждая реализация x(t) является гармонической функцией с некоторым фиксированным значением Q и Ф из множества возможных реали- заций этих величин. Вычислим некоторые характеристики x(t), предполагая, что О и Ф независимы и плотности их распределения равны p0(v), рФ(ф), причем Рф(ф) = ^-, 0<ф<2л. (1.34) В каждый момент t значение х(i) является функцией случайных величин Й и Ф, так что по определению оо 2Л = Mo,® {a cos (Qi + Ф)} = J dv J a cos (vi + ф) pa (v) р<ь (ф) йф = —оо о оо 2Л .= у- J Ра J cos (vt + Ф) ^Ф = О- / “ОО . о Таким образом, x(t) —центрированный процесс. Найдем далее кор- реляционную функцию Дс (i, т) Д М {х (i) х (t + т)} = = Mo,® {a cos (Qi 4- Ф) a cos (Q (t + т) + Ф)} = ОО 2Л 2 (* Q = ) PQ(V) dv I cos (vi + ф) cos(v(i+r)+ф)йф== — oo 0 oo == -y J Pq (V) cos vxdv Д Rx (tL (1.35) — 00
150 ГЛ. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ Следовательно, x(t) стационарен (в широком смысле). Вид его кор- реляционной функции зависит от распределения частоты Q. Пусть, например, х>°- . <‘-36> Тогда подстановка (1.36) в (1.35) дает dxe=^_, (1.37) £ и Убеждаемся, что корреляционная функция имеет точно такой же вид, как и для процесса типа «кенгуру», описанного в П.1.1, хотя форма их реализаций не имеет ничего общего. □ Поскольку случайный процесс есть семейство случайных вели- чин, то для более полного описания процесса можно использовать совместное распределение значений процесса, относящихся к раз- ным моментам времени. К сожалению, даже если. задано такое многомерное распределе- ние для входного процесса n(f), подвергающегося линейному преоб- разованию (1.13), то вычисление соответствующего распределения выхода р(£) затруднительно. Единственным исключением является ситуация, когда входной процесс — нормальный, т. е. совокупность его значений п(#«), ... ..., v(tn') в любые моменты времени tb ..., t„ совместно распреде- лена по нормальному (гауссову) закону. Можно доказать (см., на- пример, [4.8]), что и выходной процесс y(t) также оказывается нормальным. В пределах данной главы мы будем интересоваться только одно- мерными распределениями выходных процессов, т. е. распределения- ми величин y(t) для любого t. Если y(t)— нормальный процесс, то плотность одномерного нормального распределения дается формулой 1 (' 1 o'! р«» <’> “ Tspi “p Гм”" ““ <‘)| Г <L3S) Таким образом, вычислив математическое ожидание и дисперсию выхода, мы устанавливаем и одномерный закон распределения*). В частности, если my(t) = Q, dy(t) = dv, то 1 ( 11 и также не зависит от времени t. Тем самым можно ответить на основной вопрос анализа систем управления: какова вероятность того, что в любой момент времени работы системы в установившемся режиме выходной процесс не *) Для задания любого конечномерного распределения нормального про- цесса достаточно иметь его корреляционное описание [4.8],
§ 1. СЛУЧАЙНЫЕ ВОЗДЕЙСТВИЯ И РЕАКЦИЯ НА НИХ 151 выйдет за пределы допустимого диапазона, например, за пределы отрезка [—6, 6]. Обозначим ее р6. Тогда, если известно, что входной процесс v(t) является нормальным и центрированным с заданной спектральной плотностью 5„, то установившаяся реакция также нор- мальна и центрирована с дисперсией вычисляемой согласно (1.19), а тем самым 6 6 Ре A [/ш(Р)$/ = f ,4-т- exp Uy = Ф (j-Y (1.39) где о,, Д Ydv и использовано обозначение для интеграла вероят- лостей __ х Ф (х) Д J е~?^. (1.40) о _ Если б = Зо„, то pt = Ф(3)> 0,99, 1-ft <0,01. (1.41) Конечно, это справедливо только для нормального процесса. Если же распределение иное или вообще неизвестно, то мы можем лишь дать оценку вероятности выхода из допуска по известным математи- ческому ожиданию и дисперсии. Эта оценка следует из классической теоремы Чебышева: P{jy(i)-znJ>6K-^ = (^)2. - (1.42) В частности, при б = 3ov и mt = 0 имеем 1-р6 д P{|i/(0l>6}<4-* (1.43) Оценку (1.42) можно уточнить. Если, например, известно, что кри- вая плотности распределения симметрична и «одногорба», то [4.4, с. 207] * • 1 — Pe<— J. (1.44) Тогда при б = ЗОу имеем: 1 —ps<0,05. (1.45) На практике зачастую отождествляют величину 3av— утроенное среднеквадратичное отклонение — с величиной возможного «размаха колебаний» процесса*), хотя, конечно, адо не вполне верно: зная математическое ожидание и дисперсию, мы можем дать лишь вероят- ностную оценку возможного «размаха» и невыхода его из допуска, *) Такой подход иногда называют правилом За,
152 ГЛ. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ § 2. Оптимальный выбор передаточных функций 2.1. Минимизация дисперсии ошибки. Рассмотрим систему с об- ратной связью по ошибке управления, измеряемой с помехами. Согласно формуле (3.4) из гл. 3 имеем, что ошибка является ре- зультатом линейного преобразования сигнала s(f) и помехи Ne.(t), задаваемого операторным соотношением 6(£) = [l-#3(D)]s(£) + If3(D)2V8(£), (2.1) или в явной форме, при нулевых начальных условиях, t t e(i) = J/ise(t) s(f — т) dx + ^hNi{x)Nz(t— x)dx,. (2.2) о о где hse, hNe — весовые функции, соответствующие п. ф. Hse(p) Д1 — На(р),, HNe(p) ЛН3 (р). Предположим, что сигнал и помеха являются стационарными центрированными взаимно независимыми случайными процессами со спектральными плотностями 5„(<в), 5к(<в) и ограниченными дис- персиями. Если система является устойчивой, то в установившемся режиме ошибка e(f) является стационарным процессом и ёе дисперсия dc дается формулой типа (1.32): dE = 2^ У {11 — Я3 (йо) |2 iSs (<о) + | Н3 (йй) |2 Sn (со)} do. (2.3} -00 • Дисперсию ошибки можно считать хорошей мерой точности системы управления, работающей при случайных воздействиях. В частности, чем меньше дисперсия, тем меньше и гарантированный допуск, из которого не может выйти ошибка с требуемой малой вероятностью. Поэтому естественно попытаться выбрать п.ф. замкнутого кон- тура так, чтобы дисперсид ошибки выла минимальной. Оказывается, что эта задача имеет эффективное решение, если спектральные плотности сигнала и помехи являются дробно-рациональными функ- циями со2, а следовательно, допускающими факторизацию: С / 2\_ Bs(P'lBA-P} . о , 2\_ (р) р} I /О л (Р).А, (- р) P=i(a’ Sn ) An (р) An (- р) |р==.и- <2-4> В силу (2.3) дисперсия ошибки ds зависит от задания п.ф. Я3(р). Представим эту зависимость символически в виде: d6 — J{Hs(p)}, (2.5)
g 2. ОПТИМАЛЬНЫЙ ВЫБОР ПЕРЕДАТОЧНЫХ ФУНКЦИЙ 153 Теорема 2.1 *). Пусть многочлен А (р) = ва (р)Bt (-p)AN (р)An (-р) + Вя (р)Вя(-р)А, (p)4s (-р)’ '(2.6) не имеет корней на мнимой оси. Тогда, каковы бы ни были устойчи- вые Н3(р), имеет место неравенство 7 {Я3 (/>)}> У {Я3* (/>)}, (2.7) где Н * (р) вычисляется согласно алгоритму. 1) произвести факторизацию многочлена А(р), представив его в А(р) = А+(р) А+(—р), ' (2-8) где А+(р) является устойчивым; 2) произвести сепарацию функции Bs (р) Bs (— у) An (— р) As(p)A+(—p) (2-9) представив ее в виде Z(p) = Z+(p) + Z_(p), (2.10) где Z+(p) имеет полюсы только в левой полуплоскости, a Z-(p) не имеет таковых; 3) записать На (р) в виде тт* / \ AS Г7 / \ /п Л t \ Яз (р) = д + (р) Z+ (р). (2.11) Доказательство вновь базируется на теории функций [2.3]. Пред- ставим произвольную Н3(р) в виде Я3 (р) = Я* (р) + Л (Р), (2.12) где т](р) также обязана быть устойчивой. Рассмотрим, подынтегральное выра- жение в J{H3(p)}, обозначив его G{P3(p)}, так что |оо 7 {Яз И A 2b J G (Нз (Р)> dp- (2ЛЗ) — too *) Автором теоремы 2.1 и содержащегося в ней алгоритма построения оп- тимальной п. ф. является Н. Винер, которому принадлежит заслуга введения вероятностного подхода в теорию управления. Доказательство, данное Н. Ви- нером, основывается на построении интегрального уравнения Винера — Хопфа относительно весовой функции. Приведенное доказательство более просто, од- нако сам алгоритм весьма громоздок. Существует много способов его упроще- ния. В частности, в [42] предлагается использовать для получения решения лишь тот факт, что все полюсы Н* (р) совпадают с «хорошими» корнями Д(р). При знании этих корней остается найти лишь коэффициенты числителя Ня (р), от которых минимизируемая дисперсия зависит как квадратичная функция.
154 гл. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ Непосредственные выкладки дают: е{Я8'(р)} = б{Я*(р)}+С1{|](р)} + г1(Р)Я(-р) + П(-Р) Я(р), (2.14) где' ' ‘ / Gi W д Ч (р) Ч (— р) Rs (- Р2) + SN (— р2)], . „*,. А+ (р) А+ (- р) Б' № в* (- р) ЩР) ДЛа (P)jis(p) An(p) At(-p) An(-p) As (p) As (—p) • С учетом (2.9)—(2.11) получаем: Д, (— P) A4. (p) A 4- (- P) . ~~ As (— P> AN p) Z~ Следовательно, R(p) не имеет полюсов в левой полуплоскости. Поэтому j) Л (р) R (— р) dp = 0, (р т] (— р) R (р) dp = 0, (2.15) если -в первом случае интегрирование ведется по контуру, охватывающему правую полуплоскость, а во втором — по контуру, охватывающему левую полу- плоскость. Нетрудно проверить, что /?(р), а следовательно д(—p)R(p), убывает на полуокружности большого радиуса р ие медленнее, чем р~2, и из (2.15) сле- дует, что J Ч (Р) R (— Р) dp = О, J Д (— р) R (р) dp = 0. (2.16) •-{сю —{оо Тогда в силу (2.13), (2.14), (2.16) имеем /{H3(p)} = /{//*(p)}+/J{r]}, {оо {сю J1 A 2Hi f Gi = 2л7 f Т1 I5* -Р2) + SN Р2)] dP’ — {оо г —{оо (2.17) и, поскольку Л{т]} > 0, устанавливаем (2.7). В Приведем простейший пример приложения Т.2.1. Пример 2d. Пусть 8. (®2) = A, 5/V (®г) = dN. w*5 + л; <»> + л]у Тогда . 8 ' р - Р2 + й2 Р + — р + л4 г-
g 2. ОПТИМАЛЬНЫЙ ВЫБОР ПЕРЕДАТОЧНЫХ ФУНКЦИЙ 155 так что Ва(р)= У2Аа<А, 4,(р) = р + Х<„ и, аналогично, BN (р)в Y2Xwdw, Hjr(p) = p + Xw. Составим согласно (2.6) Д (р) = 2%sds (— р2 + А#) + 2A;vdtf (— р2 + As)= = —2(Asds + Ajvdjy) р2 + 2XsXjv (X^s + Asdjy), Тогда в результате факторизации получаем Д+(р) = а(р + А), а>0, Х>0, где а3 Д 2(Xsds + Хд^-у), А2а2 Д 2AsXjv (Xjvds + А8<2Л-), Сепарации подле- жит функция //п\_ 2Ms(— p + ^n) (Р + Х5)а(-Р + Х) * Разлагая ее на простые дроби, получим 7 (п\— Г + 1 а [ А. + А р+Аа По определению 1-е слагаемое есть Z+(p), 2-е — Z_(p). Таким обра- зом, можно записать согласно (2.11), что ' и* ( \ + м As + 1 ,P + Xjy a{p + K) a Xs + X p + X8"°p + X« , . xs + b~—T+r- Вычислим минимальное значение дисперсии установившейся ошибки: <Й = Ж*(р)) = Xjy А» 1 1 Xs + X — p + Aj 2л 6) р + X bt.N р , t 622X,JvdJV ----:--------------. Н “т (Р + А) (р + Л8) |2 1(Р+Х)|2 do. р—im Это стандартный интеграл типа (1.27). Используя формулы (1.29), находим, что (1-&)2М, + (Х~ЬМ2 , , п - ds ш + м ds+ Ь dN" ° 2.2. Оптимальный закон управления. Если числитель и знамена- тель п.ф. объекта являются устойчивыми, то метод динамической компенсации дает простой способ построения п.ф. закона управ- ления: Hd (D1) Hf (D) = Я"1 (D) * 3 V...... > uV\. / ^^d (D) по заданной .желаемой п.ф. замкнутого контура. Естественно было (2.18)
156 гл. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ бы принять Я2(П) = Я3‘(Г>), ' (2.19) где IL, (D)— п.ф., обеспечивающая минимальное значение диспер- сии установившейся ошибки. Однако здесь возможны неприятности, связанные с поведением управляющего воздействия. Из 'уравнений е = [1-Я3(В)]а(1) + Яе(П)Я(«), и = Я/(В)[е(0 + Я(«)] (2,20^ следует, что и (0 = Hf (В) [1 - Я3 (В)] [s (0 + N (0] = Я*1 (В) Я3 (D) [s (0 + N (i)], (2.21) где учтены стандартные обозначения Я3 (В) Д Яр (D) [ 1 -f- Яр (D)]-1, Яр (D) Д Ниу (В) Hf (В). В силу (2.21) дисперсия управления в установившемся режиме равна оо du = J | Я3 (to) |2 ] Ниу (г®) |~2 [5, (ы) + (ю)] d&. (2.22) — ОО Для того чтобы' дисперсия управления была ограниченной, не- обходимо убывание подынтегрального выражения при to2 -* а это не гарантировано при выборе Я3(В) согласно (2.19). Пример 2.2. Пусть сигнал и помеха имеют характеристики, ука- занные в П.2.1. Там же была найдена соответствующая оптималь- ная п. ф. Я3 (D) Пусть объект задан простейшим уравнением: (7В+1) у (Z) = «(*) Согласно (2.18), (2.19) получаем ЯДВ) = 6 (7’P+D(P + i — b (^ ~ 1 — 6 Эта п.ф. не является строго реализуемой, и, что более существенно, дисперсия u(t) оказывается неограниченной, поскольку порядок числителя и знаменателя в (2.22) оказывается в этом случае оди- наковым. О
§ 2. ОПТИМАЛЬНЫЙ ВЫБОР ПЕРЕДАТОЧНЫХ ФУНКЦИЙ 157 Вывод: возможны ситуации, когда использование оптималь- ной п. ф. Н3 (D) оказывается неприемлемым, поскольку оно при- водит к неограниченной дисперсии управления. Во избежание этого следует изменить постановку задачи выбора п. ф. Потребуем, чтобы желаемая Яэ(О) доставляла минимум установившейся дисперсии ошибки , ОО = i J {|1-Я3(М12‘5.,Н + |Я3(М|25;уИ}^ (2.23) —оо * при дополнительном условии, что дисперсия управления не превы- шает заданного уровня (2.24) «Правило Зо» позволяет утверждать, что при би =-у и выполнение условия (2.24) гарантирует невыход управляющего воздействия на пределы допуска ±й с вероятностью выше 0,99 в любой момент ра- боты в установившемся режиме, если сигнал и помеха распределены нормально. Для решения задачи на условный минимум используем извест- ный из анализа метод множителей Лагранжа, но в несколько изме- ненной форме. Составим выражение 2’(0) = (l-0)ds + 0du, (2.25) где 0 — неотрицательный множитель, О<0=?1. Очевидно, что 2’(0) = de, S?(l) — du, а при любом промежуточном значении 0 вы- ражение (2.25) является «взвешенной» суммой d„ и du. . Справедливо следующее утверждение*). Лемма. Существует такое 0*, что решение задачи минимизации величины Z (0*) путем выбора Н3 эквивалентно: решению задачи минимизации de при ограничении (2.24) на величину du. При этом 0* удовлетворяет условиям: либо 0* = 0, d*u<Z б2, ' * ’ , (2.26) либо 0* > 0 и du — б2, где dtecn значение du при Н3 = Н*3. Выпишем подробнее выражение 9? (0) с учетом (2.22), (2.23): оо (0) = J {|1 - яз (to) I2 §s (or2) + IЯ3 (to) I2 SN (со2)} d®, (2.27) *) Доказательство можно найти, например, в [4.7, с. 546]. Если 0 ¥= 1, то величину р = 0(1 — 0)—1 можно рассматривать как обычный множитель Лаг- ранжа (см. также гл. 9, § 1),
158 гл. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ где S8(«>2) A(l-0)Ss(«>2), ~ (2.28) Sn (и2) А (1 — 0) SN (®2) 4- 01 Ниу (г®) |-г [S, (®2) + SN (®2)]. ’ Таким образом, формально ^(О) связано с выбираемым Н3 точно таким же образом, что и de, с той лишь разницей, что выражения Я,(®2), 5я(иг) заменены на S,(a2), SN(a>2). Поэтому для оптимального выбора Яа можно применить алгоритм, описанный в Т.2.1, если в нем заменить многочлены А„ Ая, В„, BN на соответствующие многочлены Д„, В3, Вя, получаемые в ре- зультате факторизации 3„, 8Я*). При этом значение параметра 0 не фиксируется, т. е. выбор производится для произвольного 0, ко- торый затем определяется из условия (2.26). в ходе Изложим модифицированный алгоритм непосредственно решения простейшего иллюстративного примера. Пример 2.3. Пусть 2Х 5s(®2) = -~-ds, ® + X, и Ниу (Р) ~ Jip т. е. сохранены условия П.2.2, но помеха отсутствует. Решим минимизации d, при ограничении (2.24) на du. Согласно имеем 3. «л -и - s. <»> - 1ТУ задачу (2.28) 35 p==i(o 3N (®2)i = о | ниу (i&) ]-2 s8 (®г) = /2Ц(Гр+1) 'КЖ/Д-Гр-Ц) Р + — Р + xs так что ___________ Б3(р) — У2(1 — Q)ksd„ А3(р) = р + Х„ SN(p)=y2Qksd,(Tp +1), /Tv(p) = р + XS = J„(p). . Составим по аналогии с (2.6) многочлен 1(p) = Bs(p)Bs(-p)AK(p)2N(-p) + BN(p)BN(-p)A,(p) А„(—р), (2.29) *) Имеются некоторые трудности в обосновании применимости алгоритма, поскольку нет гарантии убывания Sjv(co) на бесконечности. Это свойство по- стулировалось для SN(<o) и косвенно использовалось при доказательстве Т.2.1 при исследовании поведения Щр). Однако доказательство можно изменить, учитывая, что на самом деле необходимо лишь гарантировать подходящее по- ведение на бесконечности произведения ц(—р)Я(р).
.§ 2. ОПТИМАЛЬНЫЙ ВЫБОР ПЕРЕДАТОЧНЫХ ФУНКЦИЙ 15ft принимающий в данном случае вид д(р)=(р+М(-р + М2М8[(1-е)+е(-Гр2 + 1)]; произведем его факторизацию: Д(р) = Д+(р)Д+(-р), где _ ___ _ Д+(р)=У2М.(р + М(^0р + 1). По аналогии с (2.9) определим Z(P)^^(p)Bs (~р) (2.30) v Мр)&+(-р) так что в данном случае ~ , (1-0)1<2ЛА z = (Р + м (- Т Уё р +1)* В результате сепарации получаем: ? ( > 0"6)У^А 1 + W (туе^ + 1) p+V откуда находим выражение я:(р)=^24^2+(р)1; ~ (2.31) д+ (р) или ГТ* / \ 1 — 6 1 Ня (р) —--=.------. v ’ т У0х8 + гт У0р + 1 Для определения 9 по условию (2.26) необходимо предварительно вычислить значение дисперсии управления du, соответствующее, согласно формуле (2.22), Н3(р) = Н3 (р). Имеем для данной задачи • , г 1 f Тр +1 2 J 2лД (гУ0р + 1)(р + а8> р=^Ло’ где 2 Си- (ТУ0М-1)2*2КА = C°nSt* Интеграл имеет стандартный вид (2.13) при п — 2. Воспользовав- шись соответствующим выражением, найдем (1 _ о)2 (тк, + Уб) du = d.ro (9), Ф (9) А —. u п 44 '= У0(тУел8+1)3
160 ГЛ. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ Теперь предстоит определить 6 = 0* из (2.26). Очевидно, что 1-й вариант невозможен, поскольку при 0 = 0* = 0 имеем dZ = = ds<p(O) = оо, что было выяснено еще в П.2.4. Во 2-м варианте 0* находится как положительный корень уравнения с?6ф (0) — 6?,- Найти его точно даже в данной простейшей задаче не удается. Ориенти- Подставляя его в Н* для оптимальной п.ф.: ровочный вид функции <р(0) показан на рис. 4.2. Штриховая кривая асимптотиче- ски близка к ф(0) при малых 0. Ясно, что при достаточно больших значениях би^Г1Х71Т-1 необходимый корень 0* мал и близок к величине, соответствующей абс- циссе точки пересечения асимптоты с за- данным уровнем: (р), получим приближенное выражение Это п.ф. типа фильтра Баттерворта 1-го порядка с = (ТУ0*)_‘, т. е. с большой полосой пропускания. Последнее понятно из качест- венных соображений, поскольку помехи не учитывались, а ограни- чения на уровень управления принимались «слабыми» (допускалось большое би). Ниже будет показано, что при аналогичных условиях п.ф. типа фильтров Баттерворта всегда дают результат, близкий к оптималь- ному, независимо от поведения спектральной плотности сигнала. § 3. Грубость и коэффициенты чувствительности показателей качества 3.1. Основные понятия. Чувствительность корней. Еще раз вер- немся к проблеме, поставленной в § 6 гл. 3: если свойства системы окажутся отличающимися от тех, которые предполагались в ходе расчета, то как будет вести себя реальная замкнутая система? Здесь мы произведем систематический анализ этой проблемы, считая отклонения этих свойств малыми. Ясно, что возникновение существенных отличий в поведении даже при сколь угодно малых изменениях свойств делают метод расчета практически непригодным. Поведение системы оценивалось различными величинами, пока- зателями качества, и целесообразно изменение поведения характе- ризовать именно через изменения этих величин. Любые малые изме- нения свойств системы сведем для простоты к появлению отличий в ее описании, пропорциональных малому числовому параметру р > 0.
g 3. ГРУБОСТЬ И КОЭФФИЦИЕНТЫ ЧУВСТВИТЕЛЬНОСТИ 101 В связи с этим введем следующие формальные понятия. Определение. Показатель J называется грубым по парамет- ру р, если он непрерывно зависит от р в точке р — 0, т. е. limJ(p)=/(0). (3.1) в-»о Если зависимость 7(р) дифференцируема при р = 0, то показа- тель J груб по р, а величина /{0)д^-| (3.2) называется его коэффициентом чувствительности. Если J' (0) = 0, то показатель называется нечувствительным, ин- вариантным «в малом». Разъясним эти понятия для ряда важных показателей. Предварительно приведем без доказательства один классический результат из анализа. ' Лемма 3.1. Пусть А(р, р) —многочлен от р, коэффициенты ко- торого являются аналитическими *) функциями р в окрестности р = 0. Тогда, если ХУ—простой корень многочлена &(р, 0), то су- ществует корень %v(p) многочлена &(р, р), аналитический по р и такой, что 7.У(0) = Ч и чдфй = _('2Мр^Г1ец^|Р=ч (з.з) , = dy ||х=о \ др ) ду |ц=о > Если же. Ч— корень кратности г, то существует г корней ХУ(р) многочлена & (р, р), вообще говоря, различных, но таких, что А.у(0) = = 4 Функции ХУ(р) не аналитичны пор, но любая из них анали- тична по параметру pt A |p1/,n|, m^r. Пусть многочлен А(р, р) является характеристическим много- членом системы. Значения его корней являются важными показа- телями качества. Из леммы следует, что если degA(p, p) = degA(p, 0), (3.4) т. е. число корней этих многочленов совпадает, то все корни Xv(p)’ многочлена А(р, р) грубы по р, но коэффициенты чувствительности могут быть определены только для простых корней и даются фор- мулой (3.3). . , Пример 3.1. Пусть А (р, р) = р2 + 2рр —1. Многочлен А(р, 0) имеет два простых* корня, ==1, %2 =• —1. Их коэффициенты чувст- вительности, в силу (3.3), равны Ч = — (2р + 2р)~г 2р |р=1 =i — 7с2 = — 1. |ц=о *) Здесь и далее в этом параграфе аналитичность означает существование разложения в ряд Тейлора. Основной результат леммы — непосредственное следствие теоремы о неявной функции. П А, А. Первозванский
162 ГЛ. 4..УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ Если же А(р, у)~р2 + у, то А(р, 0) имеет двукратный корень Xj = = 0, которому, очевидно, соответствуют два различных корня А (А у): X1(y) = iVy, Х2(у) = —iVy, причем оба недифференцируемы по у при у = 0, так что коэффи- циенты чувствительности не определены. □ 3.2. Сингулярный случай и системы с большим коэффициентом усиления. Для приложений особо интересен случай, в дальнейшем называемый сингулярным, когда условие (3.4) не выполнено, т. е. при ц = 0 обращаются в нуль г > 0 старших коэффициентов много- члена А (р, у). В этом случае нет даже гарантии грубости всех корней Xv(у). Пример 3.2. Если А(р, у) = цр2 + (1 + у)р + 1, то Xt = —у-1, Х2(у) = — 1, и первый из корней не имеет предела при у -* 0. □ Важную информацию о сингулярном случае дает следующее ут- верждение. Лемма 3.2. Пусть А(р, у)=уЛ(р) + В(р), (3.5) где А (р) А апрп + an-iP"-1 +...+«()> В(р) Д bmpm + bm-ip™-1 +...' + b0, гЛп-т>0. Тогда, при достаточно малых у>0, m корней &(р, у) близки к m корням В(р), а остальные г корней имеют асимптотическое пред- ставление вида («V ч-О(И1)],; (3.6) где P j Ау1/г>0, a sv — корни уравнения ansr + bm — 0. (3.7) Доказательство. Первая часть утверждения прямо следует из лем- мы 3.1. Для доказательства второй введем замену переменных р = у~ 1«. Тог- да нетрудно получить представление: (5’ ^i) A I1™4 (Р’ М = ans” + + • • • .• + мГ% + ^га + д1ьт-15"1~1+•• + рГ»0- (3.8> Многочлен Ai(s, щ) аналитичен по yi, причем Ai(s, 0) = sm(ans’' + bm), так что Ai(s, 0) имеет г корней sv. Согласно лемме 3.1, многочлен At(s, уД при достаточно малых yi имеет г близких корней Sv(yi) = sv-|- O(yi)> v = 1, г. Теперь из (3.8) сразу следует, что при достаточно малых у > 0 (yi > 0) мно- гочлен Д(р, у) имеет г корней вида (3.6), i
§ 3. ГРУБОСТЬ И КОЭФФИЦИЕНТЫ ЧУВСТВИТЕЛЬНОСТИ 163 Прямым следствием лемм является следующий результат. Теорема 3.1. Пусть характеристический многочлен \(р, ц) ана- литически зависит от параметра р. в окрестности р, = 0 и устойчив при р = 0. Тогда, если в этой окрестности выполнено условие (3.4), то &(р, р.) также является устойчивым при малых р,>0. Пусть 6(р) —степень устойчивости \{р, р), т. е. 6 (р) A min{—-ReXv(p,)}; (3.9) v тогда при выполнении указанных условий степень устойчивости — грубый показатель свойств системы. Если, более того, существует единственный корень hi многочлена А(р, 0) такой, что ReM = = —6(0), то может быть определен коэффициент чувствительности этого показателя-. /«б А 98 (р) др = Re Рд (р< и) /дД (р, р) \~1 < др I др I ц=о I (3.10) а=о . Если же условие (3.4) не выполнено, но &.(р, р) удовлетворяет ус- ловиям леммы 3.2, то сохранение устойчивости при малых отклоне- ниях от нуля гарантировано только при г = 1, апЪ^ > 0, а при г > 2 многочлен \ (р, ц) неустойчив. Доказательство. Справедливость (3.10) следует из определения (3.9) и формулы (3.5). Последнее утверждение вытекает из асимптотического пред- ставления (3.6). Можно считать, что апЬ~^ >0 (в противном случае неустойчивость следует из критерия Стодолы). В силу (3.6) имеются корни вида: 00 — ът |1/гГ —ехр anH I L я (2v — 1) г V = 1, г, (3.11) равномерно расположенные на окружности большого радиуса порядка |[i~1/r|. При г = 1 имеется только один такой корень, расположенный в левой полупло- скости. При г = 2 два корня близки к мнимой оси, и требуется дополнитель- ный анализ знака величин меньшего порядка малости, для того чтобы выяс- нить, йе являются ли они «плохими». При г > 2 заведомо имеется хотя бы один «плохой» корень с большой положительной вещественной частью. Практически существенным является вывод: малые сингулярные возмущения, вызывающие изменение степени характеристического многочлена более, чем на 1, могут вызвать катастрофические по- следствия: из устойчивой система превратится в неустойчивую с очень быстрым уходом от состояния равновесия. В качестве важного приложения рассмотрим систему с обратной связью, описываемую уравнениями a(D)y = P(D)u, l(D)u = —k(D)y, (3.12)' и примем, что ^D) = TMD)t М°) = 1, (3.13) г* 11*
164 гл. -4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ т. е. будем считать сигнал обратной связи пропорциональным боль- шому коэффициенту усиления у,-1. Характеристический многочлен замкнутой системы имеет вид А (р, у) = а (р) 1(р) 4- 4" ₽ (р) ко (р)« г* При у ¥= 0 его корни совпадают с корнями многочлена типа (3.5), !ш(рМр)+₽(р)Мр)- Если deg {а (р) I (р)} - deg (р) к0 (р)} = г > О, то при увеличении коэффициента усиления (уменьшении у) часть корней приблизится к корням р(р), ка(р), т. е. к корням знамена- теля п. ф. Яр(р), но остальные г корней будут стремиться по моду- лю к бесконечности, и при г >2 система заведомо потеряет устой- чивость. Не следует, однако, думать, что любые сингулярные возмущения приводят к катастрофе. Это ясно, например, из следующего почти очевидного утверждения. Лемма 3.3. Пусть справедливо представление &(j>, у)==Д0(р, у)р(ур), (3.14) где p(s~) — многочлен такой, что р(0) = 1, a &i>(p, у) —многочлен от р, аналитический по у, и при любых достаточных малых у deg А0(р, ц) = deg Д0(р, 0). Тогда при у -* 0 часть корней А (р, у) приближается к корням Д0(р, 0), а остальные— к корням вида y_15v, где s„— корни р(в). Если &t>{'p, 0), p(s) — устойчивые многочлены, то при достаточно малых у> 0 многочлен Д(р, у) устойчив, В Рассмотрим вновь систему с обратной связью типа (3.9). Пусть «(р), §(р) — устойчивые многочлены, а для выбора обратной связи применен метод компенсации, в силу которого fc(p) «(р) УЧр) ю. _Нр) ₽(р) ad(P)-₽d (P). * " } где <zd(p), ^(р) — заданные многочлены, причем ad(p) устойчив. Примем ,r(p)s 1, C6d(p) = p(pp), где p(s) — многочлен, описан- ный в условиях леммы 3.3. Запишем также p(s) А 1 + sp0(s), Тогда * (р)___1 a (р) 1 (3 Цр) “ У ₽(Р) РР0(НР) ’ Л ' Таким образом, при малых у вновь предлагается введение обратной связи с большим коэффициентом усиления. Однако в этом случае характеристический многочлен замкнутой системы равен А(р, у) = а(р)^(р)р(ур) (3.17)
§ 3. ГРУБОСТЬ Й КОЭФФИЦИЕНТЫ ЧУВСТВИТЕЛЬНОСТИ ’165 и устойчив при сколь угодно малых у,, т. е. при сколь угодно боль- ших коэффициентах усиления.' Напомним, что именно такая схема предлагалась в гл. 3, § 4, где было рекомендовано выбирать п.ф. замкнутого контура в виде = , (ЗЛ8) где %п (а) —устойчивые многочлены Баттерворта, а (о0—«большая» величина, определяющая полосу пропускания фильтра. 3.3. Чувствительность частотных характеристик и интегральных показателей. Очевидно, что если н »*> - <зл9> где Р, Q — многочлены от р, аналитичные (при фиксированном р) по у, вблизи р, = 0, причем Q[p, 0)^0, то и Н(р, у) при нтом зна- чении р аналитична по у.. Коэффициент чувствительности находится прямым дифференцированием по параметру: = др . р=0 J ц=о = Н(р,О)^11пЯ(р,И)]|(л=о. (3.20) Отсюда почти сразу следует простое утверждение. Теорема 3.2. Пусть Н(р, у) —передаточная функция устойчивого при всех у, 0 < у «2 у, преобразования. Тогда при любом а опреде- лен коэффициент чувствительности частотной характеристики k(iai') = H(i<o,, 0) ~ [In H(ia, у)] I , (3.21^ vp 1Ц"0 Если Hp(p, у)—п. ф. разомкнутого контура,,то коэффициент чувст- вительности частотной характеристики замкнутого контура L 0) (3.22) и определен при любых ®, если H3(p, ц)’ окрестности у, == 0. Доказательство элементарно: = Я3 A In 3д|Г устойчива в некоторой дН. I 9 --2. = Я А(1пЯ3] Sp 3 &X 1 3J )|X= о Перепишем (3.22)' в виде 6HS (iffl) д=о Я3------- — 14-Я-1 дц и=о 1 u=e (1 + Яр(«ф))2 и=о ggp(to) дц ц«=О (3,23) 1 Р i___ А. Я-1 - - "р
1G6 ГЛ. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ Вывод. На всех частотах, где |Я,,(цв)| > 1, частотная характе- ристика замкнутого контура слабо зависит от изменения пара- метров в разомкнутом контуре. Перейдем далее к исследованию влияния параметров на интег- ральные показатели качества, использовавшиеся в § 2, Лемма 3.4. Пусть <р(р, р) — дробно-рациональная функция Р, коэффициенты числителя и знаменателя которой аналитически за- висят от параметра р,. Пусть <р (р, ц) устойчива и строго реализуема при всех р из малой окрестности р = 0. Тогда показатель 7(р), представимый в виде {оо . - = ( Ф (А> Н) Ф (—P-W* (3-24) —foo является грубым по р и существует его коэффициент чувстви- тельности. Если при всех достаточно малых р > 0 существует интеграл {оо 1 (* а J ^-[ф(Р» И)ф(— Р, (3.25) —{оо то коэффициент чувствительности равен /гДО). Доказательство опирается на возможность представления J(р) в виде отношения полиномиальных функций от коэффициентов числителя и зна- менателя <р(р, ц) (см. § 1, а также [4.5]), откуда следует, что J(ц) — отношение двух аналитических по ц функций. Более того, знаменатель не обращается в нуль при = 0. Поэтому /(ц) дифференцируем по р при ц = 0. Второе ут- верждение тривиально. Получим ряд полезных следствий из леммы 3.4. 3.4. Требование астатизма и синтез желаемой передаточной функ- ции. В § 2 не предполагалось, что в допустимое множество сигна- лов входят полиномиальные, в частности, изменяющиеся как линей- ные функции времени. А если такие сигналы возможны? Из гл. 3 известно, что в этом случае для обеспечения ограниченности ошиб- ки необходимо наложить на желаемую п.ф. замкнутого контура Яз(р) требование астатизма. Более того, следует добиваться того, чтобы соответствующая Й^(Р) не только содержала нулевой полюс, но и имела достаточно большой коэффициент усиления (см. гл. 3). В то же время Н3(Р), получаемая при синтезе по интегральным показателям, но обязательно удовлетворяет этим требованиям. Мо- жет быть, принятые постановки задачи синтеза надо радикально изменить, чтобы учесть требования на их отработку уже при син- тезе? Ответ на поставленный вопрос отрицателен. Докажем это, ис- пользуя следующую схему.
§ 3. ГРУБОСТЬ И КОЭФФИЦИЕНТЫ ЧУВСТВИТЕЛЬНОСТИ 167 Пусть на основе какой-либо из постановок задач синтеза по интегральным показателям построена желаемая п. ф. замкнутого контура //Ji (р) и соответствующая ей п. ф. разомкнутого контура Яр(р)- Пусть #t(0)A&e<oo, (3.26) т. е. условие астатизма не выполнено. Тогда для обеспечения желаемого поведения попытаемся исполь- зовать иную п.ф. вида Н«(Р, И) = Н^РЪ. (3.27) р(р + н)« % где а — ад — малый положительный параметр. Очевидно, что при (г ¥= 0 построенная п. ф. ведет себя необходимым образом: при малых р к г Вместе с тем Ш0)~Ш Таким образом, остается проверить грубость показателей качества по параметру р. Поскольку все показатели имели одинаковую структуру вида ОО {Н3 (р)} == J [1 - Я3 (р)Ц1 - Н3 (-Р)1 Ф1 (р) Ф1 (- р) da (3.28) —00 p==£j{0 либо вида СО J2 {Нз (р)} = j яз Ср) Н3 (~ Р) (р) Фа (— Р) —со da, P=i«> (3.29) где Ф1(р), Фа(р) устойчивы, то достаточно исследовать функции ЛФ)ЛД{Яаа(р, р)|, /2(|*)Д/3{Я^(Р, Ц)}, применив лемму 3.4. Однако предварительно следует выяснить, не нарушается ли при ц 0 устойчивость преобразования. f Пусть РР(р), <?р(р) — многочлены в числителе и знаменателе исходной п• Ф- Hdp {рР Тогда знаменатель Н3 (р, р) представим в виде ^{Р, М) = <?р(д)р(д + Д2) + Р₽(р)(р + рл)2 = == Р2КМР) + Рр(Р)1 + р[2адРр(р) + Д(р<2р(р) + «2Рр(р))1. Многочлен Д(р, 0) не является устойчивым (имеется двукратный нулевой корень). Поэтому теорема 3.1 также непосредственно неприменима.
168 ГЛ. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ Однако, используя лемму 3.1, можно доказать, что нулевому корню Ad(p,O) соответствуют два корня A'z(p, jx) в левой полуплоскости, имеющие вид М1[1 + 0(У7)], . (3.30) где Pt, Рг удовлетворяют квадратному уравнению (1 &о)р2 "Ь == 0 и при ка > 0 имеют отрицательные вещественные части. Тем самым устойчи- вость при достаточно малых ц > 0 доказана. Эвристически этот результат ясен с самого начала, поскольку при малых ц введение корректирующего сомножителя существенно искажает ЛАХ разомкнутой системы только на малых частотах (по- рядка р) и слабо влияет на поведение ЛАХ вблизи частоты среза, определяющее условие устойчивости по критерию Найквиста. Можно теперь формально доказать грубость показателей типа (3.28), (3.29) по отношению к низкочастотным искажениям и, бо- лее того, установить, что коэффициент чувствительности, вычисля- емый согласно формулам типа (3.25), равен нулю. Вывод: при синтезе желаемой п. ф. по интегральным, показа- телям качества можно не учитывать требования, связанные с ус- тановившейся точностью при отработке линейно растущих воз- действий, поскольку после синтеза эти требования могут быть учтены путем введения коррекции, сколь угодно мало искажаю- щей значения интегральных показателей. 3.5. Влияние точности задания закона управления на дисперсию ошибки. Проведенный в 3.4 анализ обосновал возможность измене- ния п.ф. разомкнутого контура, если таковое влияет на поведение частотной характеристики только на очень низких частотах, порядка jx. В гл. 3 с помощью ДАХ было качественно исследовано влияние высокочастотных искажений на поведение замкнутой системы. Те- . перь возможно провести строгий асимптотический а'нализ чувстви- тельности показателей качества к такого рода возмущениям. Пусть Hv{p, ц) зависит от малого параметра ц>0 следующим образом: Яр(Ар) = Яр(Л0)^ (3.31) гдер(0) = 1.~ t На частотах со «С— наличие многочлена р(цр) «почти» не ме- н няет частотную характеристику, поэтому р(рр) можно трактовать как модель высокочастотных искажений. Формальное исследование может быть осуществлено по той же схеме, что и в 3.4. Во-первых, несколько модифицируя лемму 3.3, устанавливаем, что соответствующая (3.31) п.ф. замкнутого контура Н3(р, ц) ус- тойчива при всех достаточно малых ц, если р($) —устойчивый мио-
§ 3. ГРУБОСТЬ И КОЭФФИЦИЕНТЫ ЧУВСТВИТЕЛЬНОСТИ 1С9 гочлен, а Н..(р, 0)—устойчивая п.ф., представимая в виде правиль- ной дроби. Более того, останутся в силе утверждения леммы 3.3 о поведении корней, если под Д0(р, 0) подразумевать знаменатель Я3(р, 0). Во-вторых, если ограничены значения показателей (3.28), (3.29) при Я3(р) = Я3(р, 0), то как следствие леммы 3.4 устанавли- ваем грубость этих показателей. Вывод. Если закон управления с обратной связью обеспечи- вает выполнение условий устойчивости замкнутой системы и тре- бований к значениям показателей качества, то искажения в п. ф. закона управления, равносильные искажениям в п.ф. разомкну- того контура типа (3.31), не могут привести при малых ц к на- рушению устойчивости или существенным изменениям показате- лей качества. При этом важно лишь выполнить добавочное усло- вие: Я3(р, 0) должно быть правильной дробью. □ 3.6. Асимптотическая форма оптимального закона управления. При рассмотрении П.2.3 оказалось, что при слабых ограничениях на дисперсию управляющего' воздействия и отсутствии помех опти- мальная п.ф. замкнутого контура приобретает простой вид. Этот факт верен в общем случае. Теорема 3.3. Пусть <W2> причем А^р} — устойчивый многочлен deg (р) — deg Я5 (р) А г„ > 0. (3.33) Пусть установившаяся дисперсия управляющего воздействия ограничена " • (3.34) причем би — большая, но конечная величина. Пусть п.ф. объекта Huv(p) задана в форме у (п\____Р (р) где устойчивые многочлены а(р), Р(р) имеют вид ®(р) — Рп + an-iPn 1 + .. • + а0,: Р (р) = PmP + Рт-1Р 1 + ... + Ро» (3,35) г А = п — тп > 0,: г < rs. Тогда использование закона управления с п. ф. *) _______________ <3'36> *) Здесь и ниже Xr(s) — многочлены Баттерворта (см. гл. 3, § 4)(
170 ГЛ. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ обеспечивающего нм - (3-37> вместо оптимального закона, определяемого Т.2.1, приводит к повы- шению дисперсии ошибки на величину, стремящуюся к нулю при 6и -> оо [способ оценки параметра ш0 указывается в ходе доказа- тельства) * *). Доказательство достаточно сложно. Наметим лишь его основные этапы: а) составляется многочлен Д(р) в виде (2.39); б) в предположении, что величина 0 мала, оцениваются корни Д(р) с ие- пользованием леммы 3.2; ' в) производится факторизация Д(р) с учетом того, что «хорошие» его кор- ни совпадают при малых 0 с корнями многочлена Баттерворта Хг(р/о>0) при I ______i_ I юо ~ jРт"Г® 1Г |>также с корнями многочленов В,(р), А,(р), В(р); таким пу- тем устанавливается асимптотическое (при малых 0) представление Д~+(р) » -В,(/>)Д«(₽)хг(р/<во)^(р); г) сепарация функции Z[p), задаваемой в виде (2.40), производится с той же точностью, с учетом того, что />’. (/•> Z * 4S (Р) Хг (- р/ш0) ’ а следовательно, поскольку Хг(0) — 1» ЗД д) с использованием полученных асимптотических представлений согласно (2.41) находится (Р) ~ Хг(Р/О0)’ е) формула (3.36) следует из метода динамической компенсации, если в ка- честве желаемой п. ф. замкнутого контура принято приближенное выражение ж) величина о>о находится из условия Ч“оИ, (3.38) где ОО в) дается оценка ©о в зависимости от 6„ и показывается, что ©о-*00 при бц -* оо, а следовательно 0 -* 0, после чего производится оценка допущенных погрешностей. 5Т •) При S, = a2\Hutl\2 можно найти, что ©0 = 2rsin трр- 62а-а,
§ 3. ГРУБОСТЬ И КОЭФФИЦИЕНТЫ ЧУВСТВИТЕЛЬНОСТИ 171 3.7. Белый шум и высокочастотные искажения. Пусть спектраль- ная плотность стационарного случайного процесса v(t) дробно-рацио- нальна. Тогда, в силу леммы о факторизации (§ 1), ее можно пред- ставить в виде Sv = Av(p)Av\-Pp) р=ш = ।(г<й) (3'39) где Hv(p)b^^. (3.40) Функцию Ш(р") можно интерпретировать как п. ф. устойчивого ли- нейного звена, описываемого уравнением A(Z>)K(i) = ^(Z>)H;0(f). . (3.41) При этом из формального сопоставления (3.39) и общей формулы линейного преобразования 5в(®2) = |Яв(бш)|Х0(®2) (3.42) следует, что процесс we(t) должен иметь спектральную плотность SWq (<о2) = 1. (3.43) Определение. Случайный процесс, имеющий постоянную спектральную плотность на всех частотах, называется белым шу- мом *). Постоянное значение спектральной плотности именуют ин- тенсивностью белого шума. Линейное звено, установившаяся реак- ция которого на белый шум единичной интенсивности имеет задан- ную спектральную плотность, называется формирующим фильтром. Понятие белого шума кажется очень простым и широко исполь- зуется в прикладной теории случайных процессов, однако с ним связан ряд принципиальных трудностей. Прежде всего из формулы СО ОО d“0 “• 2^ J *5w0(<B2)^® =2^- J «•CO —00 следует, что дисперсия белого шума неограниченна. Вместе с тем соотношение (3.42) было выведено в § 1, исходя из предположения ограниченности дисперсии входного воздействия. Корреляционная функция белого шума, формально вычисляемая по формуле (1.8): СО ©о w = аг J -Wla,t - 2- J (3.44) *) По аналогии с белым светом, спектр которого имеет равномерную ин- тенсивность на всех частотах из видимого диапазона.
{72 ГЛ. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ не определена в обычном смысле и является обобщенной 6-функ- цией ([4.3], с. 425), заданной на (—°°, Обращение с таким слож- ным математическим объектом требует осторожности. Для более четкого понимания попытаемся прийти к понятию бе- лого шума иным путем. Рассмотрим случайный процесс w(t) с ко- нечной дисперсией и дробно-рациональной спектральной плотностью £^(<o2)i 8- (0) = 1. Сопоставим ему процесс н>в.(0 А (3.45) отличающийся от w(f)' масштабным преобразованием,, задаваемым малым параметром р>0. Свяжем его корреляционную функцию jRw(t) и спектральную плотность ‘S’w^C&j2) с корреляционной функцией Я„(т) и спектральной плотностью 5-(®2) исходного процесса: т~) / \ «1 ] 1 1^1 I -J- I I 1 ТУ I ] Rw М == М 1 — w I — ш :— П = — R- — и4 7 tn \ Н/ \ М- J) Н w\Н) 00 ' оо 8^(®2) =• J СОe~i(S>xdx = J е-г®^т = — ОО ' ' —ОО • оо ХЧ ; • —ОО > . Переходя к пределу, получим HmSw (<в2)= lim 5—(р2®2) = 5-(0) = 1, Ц-»0 ' ц-»о Таким образом, белый шум wa(t) можно рассматривать как фор- мальный предел процесса при р-* 0. Очевидно, что ^М>ц, Д (0) = — —9°f (3.46) а вместе с тем*) lim Rw (т) = 0 при т=/= 0, (3-47) иначе говоря, взаимная корреляция между значениями белого шума В'любые различные моменты времени отсутствует. Наглядное пред- ставление о характере предельного перехода можно получить из модели, описанной в П.1.1 (процесс v(t) типа «кенгуру»). Его спект- ральная плотность равна *) Последнее: следует-из того, что Лю(т), соответствующая дробно-рацио» вальной Sw(и2), убывает при |т| -*оо не медленнее, чем экспонента.
§ 3. ГРУБОСТЬ И КОЭФФИЦИЕНТЫ ЧУВСТВИТЕЛЬНОСТИ 173 Если положить % = р._* и приближать р, к нулю, но так, чтобы 2d„p = l, то 8„(<вг) приближается к единице, т. е. n(t) приближа- ется, по свойствам к белому шуму. Напомним вместе с тем, что п(?) является кусочно постоянным процессом с ожидаемой длительностью интервалов постоянства, равной л-1 = ц и дисперсией = 1/2ц~1. Таким образом, приближение ц к нулю означает приближение к нулю интервалов постоянства и возрастание дисперсии «прыжков». В дальнейшем рассмотрении понятие «белый шум» будет ис- пользоваться только в связи с получением таких результатов, кото- рые справедливы для воздействия типа допредельного процесса если предельный переход корректно осуществить уже в самом результате. В частности, формула справедлива для установившейся реакции линейного звена, на вход которого действует допредельный процесс w^t). Переходя уже в ней к пределу при ц-> О, строго получим (3.42). Аналогично выве- дем формулу для взаимной корреляции между входом и выходом линейного звена, первоначально считая, что входным воздействием является допредельный процесс w^{t): Ru^ (О Wy. («)} = M ч J h (t) Wg (t — t) dxw^ (£) 0 t t = f h (r) Rw (t) dx = f/г (?) -i- R- (-£-) dx = tJ ** t) " Ш \ Г* / о 0 = f h^x^R-ix^dXi. Переходя к пределу при ц ->0, получим ^ywQ (О “ (0 “ Ц->0 1 ОО R-txJdx^hlP)^ (3.48) г " О о поскольку оо оо 5»(°)= J R-{x)dx^=2\R-(x)dx •— оо О = lim I h (цтх) R- (rj dxv = h (0) и было принято, что S— (0) = 1. Реальный процесс не может иметь неограниченной дисперсии. В приложениях представление о внешнем воздействии как белом шуме используется в тех случаях, когда в действительности спект- ральная плотность входа близка к постоянной лишь в ограниченном,
174 ГЛ. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ но достаточно большом диапазоне частот. Возникает вопрос о том, какова погрешность такой замены при вычислении дисперсии выхо- да? С этой целью следует провести анализ зависимости оо оо 7 М = 2^ J \Н (М cto = f | Я (i®)|25- (р2®2) d® (3.49) — ОО —оо с учетом того, что 7(g) дает значение дисперсии при воздействии, спектральная плотность которого существенно отличается от 1 при частотах порядка р"’. Лемма 3.4 указывает, что J(p) непрерывна по ц в окрестности нуля, если оо j | Я (ico) |2dco <Z оо. — ОО Пусть г —разность степеней знаменателя и числителя Я(р). Тогда можно показать, что при г — 1 7(p) = J(0) + O(p), (3.50) а при г > 2 J(p) = J(0)+O(p2), (3.51) причем в этом случае оо gd =а2Г f 1^(М|2®2^, (3.52) ® — об где a A -j- . ' |ш=о Пример 3.3. Пусть Н (р) , а. S- (р2<о2) = —1^-5- = 7-^----г-1— I ; wVr ’ l-j-pV 1 + РР тогда непосредственное вычисление дает: Таким образом, относительная погрешность пропорциональна отно- шению постоянной времени р формирующего фильтра к постоянной времени Т звена. Если же Я (р) = ——то (тр+1) fc2 ( и2 \ I II2 \
§ 3. ГРУБОСТЬ И КОЭФФИЦИЕНТЫ ЧУВСТВИТЕЛЬНОСТИ 175 т. е. при более крутом фронте падения частотной характеристики звена порядок погрешности убывает, но зависит от соотношения тех же величин. □ Аналогичные рассуждения позволяют ответить и на другой прак- тически важный вопрос: если в высокочастотной области допущена неточность в описании спектральной плотности воздействия, какова окажется погрешность в оценке дисперсии? Действительно, если учитываемую при расчете спектральную плотность обозначить 50(®2), то истинную, отличающуюся от нее на частотах порядка у,-1, можно представить в виде S^S^S^, где 5,(0)=!. Очевидно, что оценка погрешности сводится к анализу зависимости J == 2^ J 1Я (г®).125о (®2) S1 (И2®2)d® — оо и проводится по той же схеме, что и выше, с заменой |Я(йв) I2 на |Я(га) PSo(®2). В технической литературе часто встречается утверждение о воз- можности изменять представление спектральной плотности воздей- ствий в высокочастотной области с целью упрощения процедуры синтеза желаемой п. ф. Эта рекомендация действительно полезна, но надо иметь в виду, что «высокочастотность» — понятие относитель- ное: искажения могут носить высокочастотный характер относитель- но полосы пропускания объекта, но оказаться низкочастотными от- носительно системы, замкнутой обратной связью с большим коэф- фициентом усиления. Следовательно, требуемая детальность описа- ния спектра при синтезе, вообще говоря, зависит от свойств синте- зированной системы, что является своеобразным парадоксом. Вывод: после построения оптимальной п. ф. целесообразно проверить адекватность исходного описания внешних воздей- ствий. 3.8. Заключение. Подчеркнем, что установление свойства грубо- сти какого-либо показателя или даже обнаружение того, что равен нулю коэффициент чувствительности этого показателя, совершенно недостаточно для того, чтобы говорить о малости его изменений при изменениях параметра на конечную величину. Например, если ад=/(0)+у, то показатель груб, его коэффициент чувствительности равен нулю, а с ростом у он быстро изменяется.
173 ГЛ. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ Вывод: формальное исследование чувствительности не может заменить конкретного анализа влияния конечных изменений свойств системы, который может быть проведен только путем прямой проверки условий устойчивости и вычисления соответ- ствующих изменений показателей качества. С другой стороны, анализ- чувствительности необходим, поскольку позволяет отбро- сить некоторые непригодные варианты законов управления. § 4. Управление неустойчивыми и неминимально-фазовыми объектами 4.1. Допустимые п.ф. замкнутого контура. Метод динамической компенсации позволяет выбрать закон управления с обратной связью, основанной на измерении ошибки, таким, что и. ф. замкну- того контура Яз(О) принимает произвольный желаемый вид Н3 (D). Однако, как было показано в § 3 гл. 3, такой выбор гарантирует устойчивость замкнутой системы, только если объект является ус- тойчивым и минимально-фазовым, т. е. в п.ф. объекта ' <4-<> многочлены a(D), p(D) являются устойчивыми. Поэтому приходится налагать ограничения на класс возможных Н,;(D). Для того чтобы выяснить, как могут повлиять эти ограничения на качество системы управления, напомним прежде всего основные формулы e(t>[l-H3(D)lS(f) + (4.2) u(0 = ff7;(D)^8(D)[s(0+JV(0L (4.3) определяющие характер связи внешних воздействий (сигнала и по- мехи) с ошибкой и управляющим воздействием. Поскольку все рассматривавшиеся показатели качества опреде- лялись через свойства процессов е(£) и u(i), то любые ограничения на вид Яа(В) могут повлиять на значения этих показателей только через три п.ф.: Я8е (D) Д 1 —- Я8(В),. Яле (D) Д Я8(О), Нгиф) Д Я’1 (D) Я3 (D). (4.4) Выразим их непосредственно через многочлены &tDJ, 1(D), оп- ределяющие п.ф. закона управления tf/(D) = |^, (4.5)
§ 4. НЕУСТОЙЧИВЫЕ И НЕМИНИМАЛЬНО-ФАЗОВЫЕ ОБЪЕКТЫ 177 и многочлены a(D), (3(D), входящие в п.ф. объекта (4.1)'. Имеем „ /ПХ _ „...........,пх _ (Р) Hf (Р) __ р (D) к (D) , - ЯлЕ(И) Я3(1)) 1 + Яиу (D) Яу (D) Д(О) л Я88(В) = 1-Я3(В) = 2>1^,; , (4.7) Hsu (D) = Н-1 (D) Я3 (D) = (4.8) где ’ А(р) А а(р)1р) + ^(р)к(р) (4.9) — характеристический многочлен системы. Отметим также, что три указанные п. ф. линейно выражаются через две дробно-рациональные функции *) ^i(D)(4.10) а именно, имеем . • Яз(И>Яке(О)= [3(D) Я,(О), Я„(О)=а(О)Я2(О), Я,В(О)== а(Ю)Я1(О). (4Л0<) Поскольку многочлены ct(D), [3(D) заданы, то тем самым все показатели качества могут быть выражены только через две выби- раемые функции Hi, Н2. Очевидно, что их нельзя выбирать незави- симо, так как в силу (4.9), (4.10) они должны удовлетворять тож- деству a(D)^(D) + p(D)^(D)=l. (4.11) Если же Я2(О) выбраны, то п. ф. закона управления нахо- дится немедленно: Я/ (D) = (D). .(4.12) Оказывается, что дело всегда можно'свести к выбору только од- ной определяющей функции. Справедливо следующее утверждение. Теорема 4.1. Выбор функций Я,(О), удовлетворяющих тождеству (4.11) и определяющих в силу (4.12) стабилизирующую обратную связь, ограничен функциями, представимыми в виде Я1(О) = Я?(Б)-а(В)Т(В); Я2(О) Я°2(О) + ₽ (D) T(D), (4.13) где T (D) — произвольно выбираемая дробно-рациональная с устой- чивым знаменателем, а Я)’(D), Я2 (D)— любая фиксированная пара устойчивых п.ф., также удовлетворяющих (4.11). Доказательство. Всегда можно записать, что Я^Я’+бЯр Я2 = Я02 + бЯ2, (4.14) *) Этот прием изложен в соответствии с [4.11], А. А, Первоэваиский
178 ГЛ. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ где 6ЯЬ 6Я2 произвольны •). Однако для выполнения тождества (4.11) необходи- мо ограничить произвол условием абЯ2 4- р6Я1 == 0, т. е, 5Я2 = ~|еяг t Это условие выполняется, только если 6Я2 = ₽Ч^, 6Н, = — a'F, (4.15) где W — какая-либо дробно-рациональная функция. Запишем ее в виде Т == «= PIQ. Остается показать, что для формирования стабилизирующей обратной связи необходима устойчивость многочлена О. к° /° Пусть Ну Д Я® = ^ц-, где по условию многочлены F, Z0, Д° должны быть связаны тождеством до = p/о + afee причем Д° устойчив. Тогда, согласно (4.12), (4.14), (4.15), имеем _ gi _ + _ fc°/A° - aP/Q _ k°Q - аРД® f “ H2 - я® + 6Н2 “ 1®/Д® + “ l°Q 4- ррд® & Г Подставляя найденные к, I в формулу (4,9), убеждаемся, что Д = a(PQ 4- ₽РД°) 4- р(k°Q - аРД°) = al°Q 4- ^°(? = Д°<2, а следовательно, для устойчивости Д необходима устойчивость Q. Следствие. 1. Если многочлен а устойчив, то, не уменьшая общ- ности, выбор Н3 можно ограничить заданием Яз = Р-1Р, (4.16)’ где — совокупность «плохих» сомножителей в [). 2. Если же устойчив многочлен [}, то выбор можно ограничить условием Я3 == 1 - а_Т, (4.17)' где а- совокупность «плохих» сомножителей в а. В обоих случаях W — произвольная функция с устойчивым знаменателем. Доказательство. В случае 1 можно удовлетворить (4.11), положив я» = 0, Я» =4- Тогда общий вид функций Яь Я2 таков: Н2 = ~ (1 4- офТ). Соответственно Яэ = -офТ, 1-Яз = 14-сф¥. Положив V = —оф+УР, получаем • Я, = р_'Ф, 1-Яэ = 1-р_^. Поскольку х, устойчивы, то V удовлетворяет тем яге условиям, что и ис- ходная Чг, а следовательно, можно опустить знак Аналогично рассматривается случай 2. *) Аргументы функций здесь и далее для краткости опущены.
§ 4. НЕУСТОЙЧИВЫЕ И НЕМИНИМАЛЬНО-ФАЗОВЫЕ ОБЪЕКТЫ 179 4.2. Оптимизация на множестве допустимых п. ф, Рассмотрим далее задачу оптимального выбора закона управления: минимизиро- вать дисперсию ошибки de = — Г {I Н№ (га) I2 5S (а2) + I HNe (га) |2 5Л- (a2)} da при ограничении ОО du = А Г | Нт (га) |2 [54 (а2) + SN (®2)] da < 6’. ZJl J Учитывая (4.10'), (4.13), можно выразить показатели через выби- раемую функцию Т: 2 , 1 ds~ 2Й Я® । |аР|25jy(со2) da, 2 , _ 1 Йи“ 2S ttQ |а|4 [5S (а2) + 5N (a2)] da. Согласно лемме 2.1 перейдем к задаче безусловной минимизации величины ^(0) = (l-0)d. + 0de с выбором согласующего параметра 0 = 0* по условию (2.28). 3?(0) представима в виде 2 Р 2 + Y 5S (а2) + -г - 5W (a2) da, (4.18) ₽ где введены очевидные обозначения. Задача минимизации Z (0)' в основном аналогична рассмотренной в теореме 2.1 и может быть ре- шена с помощью сходного алгоритма, использующего операции факторизации и сепарации. Для экономии места приведем алгоритм без обоснованйя (оно аналогично Т.2.1*)) и только для случая, когда объект является устойчивым (случай 1 в следствии). 1. Построить функции 5S (а2) = (1 — 0) (а2) А в (гео) A (ко) (4.19) г, SN (а2) = (1 - 0) 5W (а2) + 01 |2 [5S (а2) + SN (a*)] A I P I 2 Bjy (la) Av (ico) ' *) При обосновании возникают определенные и непростые проблемы, если Функции Se, SK не убывают при со2 -» оо, 12*
180 ГЛ. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ 2. С помощью факторизации получить представление С / . С 7 2\ А+ (Р)Д+(-Р) Ss(— р2) + 5п(— р2) = -я—-—-------------- A(p)^(-p)^n(p)an(-p) 3. Произвести сепарацию функции 2 (р) = ?-<->) А<р>в.(-р>>(-р) _ + - ₽_(р) Д+(- p)As(p} + г \Ph. (4.20) (4.21) выделяя в Z+(p) все простые дроби с «хорошими» полюсами. 4. Приняв В (с) X (р) А„ (р) ~ Я* (р) = Л- iff °...?LJL2L'. % (р) (4.22) u ₽_(— p) ь+(р) ’ доопределить входящий в это выражение параметр 0 согласно усло- вию (2.26). ' Если явные ограничения на управление отсутствуют (би-><»), -то можно положить 0 = 0. Пример 4.1. Примем спектральную плотность сигнала в виде Ss (со2) = , 2 Л" 2 । п\ ~ соп^« (со 4- 4) (со +9) Предположим также, что помехи отсутствуют, S^O и нет ограни- чений на дисперсию управления. Объект является неминимально- «фазрвым, но устойчивым: Ниу(р) = «~ P-i г р2ЩЗ/Н-1 так что (р) = —р + 1- Будем действовать согласно правилу, приняв 0 = 0: 1. Ss(-p2) = X(-P2), Bs(p) = G(p + l), 4.(р)«(р + 2)(р + 3), X(-p!) = Sy(-p!)=o,xw=o,x(p)=i. 2. А+(р) = СДр +1)==В,(р). „ •», . (р + 1)-с,(р + 1) » [ 1/з 1 1 3. 2(р)= (_p+1)(p + 2)(p + 3)f +(Р) Cs[p + 2 р + 3] = _____r 2/Зр + 1 8 (р + 2) {Р + 3) ‘ ; / TJ*/п\___ (~'Р + 1) (2/Зр + 1) 4> з(р) (р+1)2 Вычислим соответствующее этой п. ф. значение дисперсии ошибки D& = kz f 11 — (р) |p=ia>«Ss (со2) d® = ИЛ t) г —оо ОО ' ~С1 П w8+w+2 I2 d(j)t 2л J I (р 4-1) (р + 2) (р + 3J |р= ко +«> '
§ 5. РЕГУЛИРОВАНИЕ УГЛОВОЙ СКОРОСТИ ВАЛА ТУРБИНЫ 181 Это стандартный интеграл типа (1.27) при п = 3. Используя его выражение через коэффициенты многочленов, получаем D* = = 0,076С*. □ . Ясно вместе с тем, что это значение практически недостижимо, поскольку при найденной дисперсия управления оказывается неограниченной. Пример 4.1 приведен лишь для того, чтобы про- демонстрировать общий вывод. Вывод: даже при отсутствии ограничений на управление и идеальной точности измерения ошибки неминималъно-фазовостъ объекта не позволяет достичь инвариантности. Более содержательный пример дан в следующем § 5. Здесь же кратко остановимся на возможностях, возникающих в том случае, когда наряду с измерениями ошибки имеются измерения выхода y(t). С помощью внутренней обратной связи по y(t) не- устойчивый объект может быть стабилизирован, хотя неминимально- фазовость неустранима. Поэтому при $(р) устойчивом, а(р) неус- тойчивом допустима следующая процедура. 1. Выбрать произвольную стабилизирующую внутреннюю обрат- ную связь. 2. Найти в соответствии с правилами § 2 оптимальную п.ф. Я*(О), не учитывая каких-либо ограничений на ее структуру. 3. Применить метод компенсации для формирования внешней обратной связи (обратной связи по ошибке). Если ограничения на управление отсутствуют или заранее фик- сировано значение согласующего параметра 0 в минимизируемом выражении S’e, то минимальный уровень 3?» не зависит от выбора внутренней обратной связи (см., например, [4.11]). Если же явно задано ограничение Du^.8u с фиксированным бы, то проблема’существенно осложняется, поскольку корень уравнения Du — б® может зависеть от вида внутренней связи, а следовательно, от нее может зависеть и достижимая точность. § 5. Регулирование угловой скорости вала гидравлической турбины Задача регулирования гидравлической турбины была одной из первых технических проблем, исследованных с помощью методов теории автоматического управления многими авторами, начиная с А. Стодолы, и до сих пор представляет интерес как с теоретической, так и с прикладной точек зрения. На ее примере продемонстрируем ряд особенностей применения общих методов к конкретным проб- лемам. 5.1. Описание системы. Линеаризация. Принцип действия объек- та управления можно понять из схематического рис. 4.3. Плотина 3 создает перепад уровня воды между верхним 1 и нижним 2 бье-
182 ГЛ, 4, УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ фами. Поток воды подводится к турбине по закрытому каналу (во- доводу) 4 и через спиральную камеру. Набегая на лопасти рабочего колеса 5, поток создает движущий момент, приложенный к враща- ющемуся валу 8. Вал турбины жестко связан с ротором синхрон- ного гидрогенератора 7, вырабатывающего электроэнергию, отдавае- з 7 ,8 5 ’ Рис. 4.3 мую в электроэнергосистему. Управ- ление потоком осуществляется с по- мощью направляющего аппарата 6, выполняющего как ки, вентиля, так и мические задачи _скоростей потока. ляющего аппарата — ваться, в большей или меньшей мере /^открывая доступ воды <к турбине, причем поворот осуществляется гид- равлическим двигателем (сервомо- тором). функции заслон- чисто гидродина- изменения поля Лопатки направ- могут поворачи- Опишем динамические свойства гидротурбины как объекта управ- ления. В качестве управляющего воздействия будем рассматривать поворот лопаток направляющего аппарата или его открытие ос(£), а управляемым процессом считать угловую скорость вала <o(i)- Уравнение движения вала турбины (вместе с ротором генерато- ра) можно записать в виде J "dt =тПя — тС11 (5.1) где J — момент инерции, пгд — движущий момент, тс — момент со- противления. Движущий момент определяется соотношением где Рд(0 — мощность потока воды, затрачиваемая на вращение тур- бины, а ка — коэффициент полезного действия. В свою очередь, в си- лу законов гидравлики Рд(1) = М0<2(0, тл = кп^, (5.2) где h(t) —перепад давления на турбине, a Q(t) —расход воды че- рез турбину, связанный с h(t) и открытием-направляющего аппара- та следующим образом: Q(t) = Ca(t)l/h(t), C = const. (5.3)’ Для оценки перепада давления введем гипотезу несжимаемости жид- кости *) и воспользуемся уравнением Ньютона для столба жидкости, ♦) По поводу учета сжимаемости см., например, [4.1, т. 2, с. 18]. Соотно- шение (5.3) иногда заменяют более точной экспериментальной характеристи- кой турбины.
§ 5. РЕГУЛИРОВАНИЕ УГЛОВОЙ СКОРОСТИ ВАЛА ТУРБИНЫ 183 заключенного в водоводе. Пусть М — масса столба, v(t)— скорость потока. Тогда, не принимая во внимание сил сопротивления, можно записать ±(MV(t))~F(p-Pl(t)\ (5.4) где F — площадь сечения, р — постоянное давление на верхнем конце водовода, a Pl(t) — давление перед направляющим аппаратом. Пусть р —плотность воды, L — длина водовода; тогда M~FLp, Q(t) = Fv(t). Кроме того, учтем, что по определению h(t)^Pi(t)-p, (5.5). где р — постоянное давление за турбиной. С учетом введенных обоз- начений исходное уравнение перепишется в виде ' (5,6) Система соотношений (5.2), (5.3), (5.6) определяет связь движу- щего момента тя с открытием а и угловой скоростью ®. Момент сопротивления тв создается как за счет механического сопротивле- ния, так и, главным образом, за счет электромагнитных сил, про- тиводействующих вращению ротора. Эти силы зависят от электриче- ской нагрузки Рв на сеть и частоты тока в сети, пропорциональной угловой скорости ротора. Будем считать, что известна зависимость mc = mc(PH, ©), (5.7) вообще говоря, нелинейная. Нелинейны и приведенные выше соот- ношения для движущего момента. Для того чтобы применить линейную теорию, выдвинем гипоте- зу: все процессы в объекте происходят в малой окрестности неко- торого равновесного режима, в котором все введенные выше .вели- чины принимают постоянные значения со(0 = <во, <2(0 = <2», h(t) = ha, тл(^=тя9, И?е (0 7?2С о, Ра (0 — Ра о, причем выполнены условия Годо —mCo = O,. P — P — ho = 0t шо (Э.О/ <2о = eVЛ-о сс0, mco = mc(PBo, О>о), а соо соответствует желаемому значению угловой скорости.
184 ГЛ. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ Введем также относительные переменные «г е е 1 с. 1 е о .3 II 0s" 1 ?s- о „ _ - СТС0 Ч о £ т * V 0 "дсо тдо Рд- т » и- тяо а~«0 - Рт ‘ а « w ““ Р • о яо В силу принятой гипотезы все относительные переменные при- нимают малые (по сравнению с 1) значения, а их квадраты, произ- ведения и более высокие степени являются еще меньшими вели- чинами. Поэтому представляется возможной линеаризация всех ра- нее приведенных нелинейных функций. Для линеаризации, во-пер- вых, выразим все исходные переменные через соответствующие от- носительные, во-вторых, разложим все нелинейные, функции в ряд Тейлора, удерживая только слагаемые 1-го порядка. Из (5.2) полу- чаем линеаризованное соотношение путем следующих преобразо- ваний: \ (1 + ц) Qo (1 + <?) hnQ тдо(1 + Нд) = ^п----- -----== йп: (1 + Т) + g — р)( или, с учетом (5.8)*)', ця = т] + д-у. (5.9) Аналогично из (5.3) имеем <2о (1 + ?) = Са0 (1 + и) Vh0 (1 + ц) Са0 (1 + ^1 + “)« так что, вновь учитывая (5.8)', g = ±n + U. (5.(0) Наконец линеаризуем (5.7) : тс (РН1 со) = щс [Рно (1 + ^), соо (1 + у)] (^С| п ~(9тс\ др-] РН0® + 1-5- ) Ю0Уе откуда |хс === &cwco~f“ (5.11) где ь _(9тЛрт , _(9тс\ “о Лсу-\^)отсо- - *) Далее знак приближенного равенства всюду заменяем на точное, при- нимая за основу линеаризованные уравнения,
g 5. РЕГУЛИРОВАНИЕ УГЛОВОЙ СКОРОСТИ ВАЛА ТУРБИНЫ 185 Линейные дифференциальные уравнения (5.1), (5.6) также вы- разим через относительные переменные J п^~ % = ~ t*01 (5.12) МД0 0.1 ----Т1' Подставляя (5.9), (5.11) в (5.12) и вводя обозначения*)! т — к = 1 к — hcw Т — £р<?° получим систему уравнений объекта в виде (TD + 1) у = ки (ц + д) — Т№Т)у = — х\, д = ^-ц + '(5.14) где использован оператор диффер'енцирования D. После исключения промежуточных неизвестных q, ц можно за- писать одно уравнение в стандартной операторной форме y(t) = Huv(D)u(t)+Hwv(D)w(t), (5.15) где введены п. ф. объекта по управлению 1 — Т D ниуф)~ки-----------—2-------(5.16) (l + 7D)(l + ArwDj и по возмущению Яад(В) = -г^п. ' (5.17) Очевидно, что объект является неминимально-фазовым. 5.2. Синтез закона управления. Поставим теперь задачу синтеза закона управления, предполагая первоначально, что а) доступен сигнал y(t), т. е. датчик дает неискаженную поме- хами информацию о текущих значениях угловой скорости со (£) или ее отклонений от равновесного значения ш0; б) возможно формирование любой линейной обратной связи вида u(J) = -^(D)y(i); в) возмущение н>(«) (изменение нагрузки) является стационар- ным случайным процессом с заданной спектральной плотностью 5к(и2). Поясним смысл последнего предположения. Электрическая на- грузка на агрегат является суммой нагрузок, создаваемых многими потребителями электроэнергии. Некоординируемые между собой включения или отключения различных потребителей определяют *) Величины Т, Tw обычно называют постоянными времени турбины и водовода, -
186 ГЛ. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ хаотический характер изменения суммарной нагрузки. Возможность ее рассмотрения как случайного процесса подтверждена многими специальными исследованиями*)’- (см., например, [4.6]). Естествен- но также ввести дополнительное предположение, что процесс изме- нения нагрузки является процессом тйпа «кенгуру», описанным в § 1, где каждый скачок соответствует подключению или отключе- нию какого-либо потребителя, а длительности интервалов между скачками взаимно независимы. Поэтому примем, что 2Х = (5.18) где X®1 А т имеет смысл математического ожидания времени между скачками нагрузки. Поскольку желаемым значением управляемой переменной y(t) является yd~0 (напомним, что желательно поддерживать исходное равновесное значение угловой скорости вала несмотря на наличие возмущений), то из общей формулы (см. § 2 гл. 3) «(О = ул - ^(D) w(t) = -HW(D) wit) (5.19) и правила линейного преобразования стационарных случайных про- цессов следует выражение Спектральной плотности сигнала 58(<о2)= l-ffw(j®) |2£и(со2). (5.20) Кроме того, по предположению . 5„(<о2) = 0. (5.21) Напомним также, что объект является неминимально-фазовым. По- этому следует применить методику, описанную в § 4. Если ограни- чения на управление отсутствуют, то в основном правиле можно положить 0 = 0. Опуская стандартные выкладки, приведем лишь окончательный результат — вид оптимальной п.ф. замкнутого кон- тура: 4 _ Т D Н*а(р)- JT77/7 (ЪР + Vo).; (5.22) где- хТ \t~Tw T-Tw Y1“ т-г[т+Гю Г + rJ’ хТ Г T-Tw To-T_r^(x+2.w) x(T+Tw)\* *) На самом деле проблема значительно сложнее, поскольку в реальных электроэнергосистемах действует большое количество агрегатов, и нагрузка перераспределяется между ними. Сам процесс изменения нагрузки помимо случайной составляющей имеет и прогнозируемую (суточные и сезонные циклы).
g 5. РЕГУЛИРОВАНИЕ УГЛОВОЙ СКОРОСТИ ВАЛА ТУРБИНЫ 187 Соответствующее выражение для п.ф. закона /управления можно записать в форме (1 + W1+ * + 11, (р) = —---—1----f----1-----------.. (5.23) М VwP2 4^mY0 - Yx + Гю) р +1 - Vo] Произведем анализ этого результата. Отметим сначала, что при т/27 -* <», т/Гш оо получаем Т1->у + 7’щ« Ъ так что J ____________________. Т П ' я:(0)^с 1 ‘ х Таким образом, желаемая п.ф. при очень редких переключениях нагрузки близка к астатической, что естественно, поскольку аске- тизм — средство борьбы с постоянными возмущениями. Нетрудно найти асимптотическое выражение 1 (5.24) Таким образом, при редких пере- ключениях оптимальная система управ- ления успевает хорошо отработать каждый скачок нагрузки и почти все время система работает с почти нуле- вой ошибкой (рис. 4.4). Тем не менее полученное решение неприемлемо ни с теоретической, ни с практической точ- ки зрения. Во-первых, Н3 (р), даваемая (5.22), не является строго реализуемой, а потому неустойчива с точки зрения основного опре- деления. Во-вторых, что более существенно, ее реализация требует неограниченных управляющих воздействий. Действительно, по стан- дартной формуле имеем и (1) = Я’1 (D) Я3 (D) • s (1) = - Я’1 (D) Я3 (D) Hwy (D) w (t). (5.25) Если принять Я3(Б) = Я* (D), то = +То)'^(0- (5.26) Таким образом, п.ф. преобразования ir(l)-*u(l) также не явля- ется строго реализуемой, и при скачках нагрузки в управлении воз- никает импульсная компонента, Установивщаяся дисперсия и (1),
188 ГЛ, 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ оказывается неограниченной. Как было указано в § 3, можно изба- виться от этой неприятности, введя в п.ф. закона управления (5.26) «регуляризующий» множитель вида р-1(цр), где р, —малая положи- тельная величина (см. (3.31)), т. е. добавить малые постоянные вре- мени, делающие п. ф. строго реализуемой. При этом дисперсия ошиб- ки изменится мало, а дисперсия управления станет ограниченной. Однако она имеет порядок ц~‘, т. е. является хотя и конечной, но большой. Большой окажется и скорость изменения управления. 5.3. Синтез с учетом ограничений. Величина управляющего воз- действия-открытия направляющего аппарата —не превосходит единицы. Более того, скорость поворота лопастей направляющего аппарата не может быть большой как в силу сложности создания соответствующего двигателя*), так и в силу физических особенно- стей самого объекта. Интуитивно ясно, что попытка резко «задви- нуть заслонку» на пути набегающего потока жидкости вызовет его торможение, а следовательно, повышение давления перед «заслон- кой». Это повышение, обычно называемое гидравлическим ударом, может быть настолько большим, что вызовет поломку либо самой «заслонки», т. е. направляющего аппарата, либо стенок камеры, из которой к нему подходит вода. Таким образом, грамотная постановка задачи выбора оптималь- ного закона управления должна включать ограничения на u(Z), ii(f) = Da(i) и изменение давления T](i), Из (5.14) можно найти, что ц(0 =--------^—Du(t)ri (5.27) l + TrwD т. е. изменение давления связано со скоростью управления й(/)' инерционным звеном. Ограничив u(t), мы заведомо ограничим и бо- лее «плавный» процесс ц(£). Поэтому для упрощения задачи учтем только ограничения нав(<). - Ввиду случайного характера изменения возмущения (нагрузки)’, выход объекта меняется случайным образом, а следовательно, слу- чайно и изменение управляющего воздействия, построенного на ос- нове измерений выхода. Поэтому при принятой гипотезе о харак- тере изменения нагрузки возможно дать лишь вероятностные гаран- тии того, что lu(t)l (5.28)’ где v — заданный допуск. Воспользовавшись правилом «Зо», это ограничение можно свести к ограничению на дисперсию й (£); d • (4-VI А 6?. (5.29) и \ о 1 — *) Для закрытия направляющего аппарата за одну секунду в больших со- временных гидротурбинах потребовалась бы мощность порядка 1000 кВт,
§ 5, РЕГУЛИРОВАНИЕ УГЛОВОЙ СКОРОСТИ ВАЛА ТУРБИНЫ 189 Запишем выражение d-^ через п.ф. замкнутого контура Я3(р) в ви- де стандартного интеграла d. = A. f I Hs (гео) I21Н. (to) l~2Ss (со2) ейо^ (5.30) " . и *Л J I иу 1 ' — оо где введена Н. (р) — п. ф. преобразования «(#) -*-у (/)’, которую мож- но представить в виде fj (п\ — — ____(^ ~ ywP)___ /Е 31Л 'йу {Р> “ р (1 + ТР) (1 + l/2Twp) * Согласно общей методике, составим «компромиссное» выражение , 2’e = (l-0)de + 0d.i U где 0, 0^0^ 1, выберем в дальнейшем так, чтобы выполнялось (5.29). Это выражение можно переписать в виде оо 2*0 = f {|1 - Н3 (to) |2 % (со2) + | Я3 (to) |2 SN (со2)} cto, (5.32) «Л V — оо ' где . 38(со2) = (1-0)^(со2),; Sn(co2) = 9[ffUto)jSs(co2). При минимизации следует учесть, что выбор Я3(р) ограничен клас- сом функций вида Я3(р) = ₽-(р)Т(р), где Р-(р) — «плохой» сомножитель в п.ф. объекта. В данной задаче р_(р) = 1-Тяр. Вновь, не повторяя выкладок, проводимых согласно основному правилу из § 4, приведем результат: Ц* (р\____~ Гг°Р^ (^р+~7о) (5 зз\ JiaW- (Г1р+1)(Г2р+1)(Гзр+1)в _ где Tt, Тг, Т, — положительные постоянные, определяемые из факто- ризационного тождества 1-Прг-(ТТ^Р2(1-т2Р2)(1-^Пр2] = (т1Р +1) (У2/> +1) {таР +1) (- т1Р +1) (- т2р +1) (- тзР +1)# а "(и *f0 находятся в ходе процедуры сепарации и Т1 = То = + -yi
190 ГЛ, 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ где А ___________ 1 - V___________________ (1 + TJT) (1 + Тг1Т)(1 + та/т) (-1- А_________________~ р+тми-т^+т^ * __L \ Л V / Для вычисления согласующей константы 0 = 9* следует решить уравнение *) <Л=63,; (5.34) причем левая часть является функцией 9, заданной неявно с по- мощью (5.30), (5.31), (5.33) и формул, определяющих связь пара- метров На (р) с 9. Такое уравнение разрешимо численными мето- дами при конкретно заданных значениях исходных параметров объ- екта, спектральной плотности нагрузки и допуска v. Однако для по- нимания смысла результата полезно получить хотя бы приближен- ное решение, но в явной форме. Предположим заранее, что (5.35)’ где ________ Тогда можно дать приближенные оценки констант, входящих в Х(р),; 4 Т * Т Т f Т 1 *2 * % * з /R*Z 2 • Дополнительно предположим, что (5.36) т. е. ожидаемое время между скачками нагрузки является очень большим по сравнению с постоянной времени объекта. Тогда 71> ~ 1, Ъ « Т. При таких предположениях Я:(р)------------------- (5.37) (1 + 1/V) 1 + -Л/, *) В силу правила (2.26) возможен и случай, когда 0 = 0, d . < 6®, но в U данной задаче эти два соотношения заведомо несовместны: из 9 = 0 следует
§ 5. РЕГУЛИРОВАНИЕ УГЛОВОЙ СКОРОСТИ ВАЛА ТУРБИНЫ 191 Именно выражение в правой части и примем за желаемую п. ф. замкнутого контура Нз (р) при соответствующем подборе един- ственного оставшегося не определенным параметра А. Подстановка в (5.30) функции я8(г©) = я^(М приводит после вычисления стандартного интеграла к явной записи уравнения (5.34): -I 2 Л Ь2 л °wKw с2 —------------- == О» (1 + Хт) к^ или, при учете (5.36)', ь2 «2 X = (5.38) kwa» Отметим, что гипотеза (5.36) означает Ь2 Д2 Иначе говоря, предшествующие упрощения верны только в том случае, когда V kw 3 V 'К ~~~т^'кг (5.39) t. e. при сравнительно малой интенсивности колебаний нагрузки или широком допуске на предельную скорость изменения управляюще- го воздействия. Теперь желаемая п. ф. замкнутого контура полностью определе- на, а тем самым по методу компенсации можно найти и п. ф. за- кона управления 1 (D) 1 + TD X (5.40) где при вычислениях вновь использовано упрощающее предположе- ние, что 1. 5.4. Техническая реализация. При построении закона управле- ния в виде (5.40) мы исходили из предположения, что доступен сигнал y(t), безошибочно отражающий текущее значение угловой скорости, и возможно изменение открытия направляющего аппара- та в соответствии с требуемым законом. Техническая реализация должна быть такой, чтобы эти предположения выполнялись хотя бы приближенно.
192 ГЛ. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ А Aq Рис. 4.5 Для создания высокоточного датчика изменения угловой скоро- сти возможно, например, применение следующей идеи*). С валом турбины непосредственно связывается ротор специального измери- тельного синхронного генератора с постоянными магнитами. Часто- . та напряжения, вырабатываемого этим генератором, соответствует угловой скорости ротора. Это напряжение подается на резонансный контур, выполненный из высокостабиль- ных элементов, причем настройка контура производится так, что желаемой частоте (желаемой скорости вращения Ыо) соот- ветствует точка на склоне резонансного пика частотной характеристики (рис. 4.5). Даже малые изменения частоты приводят к существенным изменениям амплитуды ш тока в контуре. После выпрямления и сглаживания получается электрический сигнал ие, с достаточно высокой точ- ностью пропорциональный отклонению угловой скорости от желае- мой, или, что то же самое, пропорциональной относительной пере- менной у. Примем, что Не ksy. (5.41) Сигнал ие подвергается преобразованию в аналоговом вычислитель- ном устройстве (ВУ). На выходе ВУ получим, вновь маломощный сигнал с напряжением Однако требуется'с помощью этого сигнала управлять открытием направляющего аппарата, преодоле- вая очень большие усилия. Практически необходимое усиление мощности обеспечивается за счет гидравлического двигателя, кото- рый сам по себе является системой с обратной связью. Кратко опишем его действие, поскольку такие системы широко применяют- ся и в других областях техники, например, при управлении само- летами, судами, манипуляторами. Собственно гидромотор представляет собой цилиндр с движу- щимся в нем поршнем (рис. 4.6, а). Если жидкость под высоким давлением рв подведена в одну полость, а другая связана со слив- ным баком (давление р0<р„), то к поршню прикладывается сила FB(pn — Pt>\ (Fa. — площадь поршня). Для изменения направления движущей силы производится переключение подвода с помощью золотникового распределителя (рис. 4.6,6). При смещении иглы золотника относительно его корпуса открываются окна, через кото- рые полости цилиндра связываются либо с магистралью высокого давления, либо со сливом. Расход жидкости пропорционален откры- тию этих, окон о. Поскольку рабочая жидкость (масло) практически *) Здесь и далее описание технической реализации в основном следует принципам построения электрогидравлического регулятора скорости турбин Ленинградского металлического завода. Использование цифровых датчиков м мйкро-ЭВМ открывает и иные возможности,
g 5. РЕГУЛИРОВАНИЕ УГЛОВОЙ СКОРОСТИ ВАЛА ТУРБИНЫ 193 несжимаема, то она должна освободить себе место, сдвинув поршень как раз настолько, чтобы увеличить объем полости на объем вте- кающей жидкости. Таким образом, скорость смещения поршня про- порциональна расходу масла, а следовательно, открытию окон. Шток сервомотора связан с лопастями направляющего аппарата жесткой кинематической передачей. Поэтому можно считать, что бе Рис. 4.6 относительное смещение штока совпадает с относительным откры- тием направляющего аппарата, и записать формулу = k0<j, (5.42) гДе — коэффициент, определяемый конструкцией (прежде всего перепадом давления рв — Ро)*)- Если (рис. 4.6) корпус золотника связан со штоком гидромотора рычажной передачей, то о = щ — гу, (5.43) где пЕ — абсолютное перемещение иглы, отсчитываемое от неподвиж- ного основания, а г — отношение плеч рычага. Подставляя (5.43) в (5.42) и переходя к операторной записи, получим T-h- (5-ед На перемещение иглы золотника необходимо затрачивать лишь малые усилия. Поэтому перемещение может быть осуществлено с помощью относительно маломощной и почти безынерционной систе- мы, состоящей из электронного усилителя мощности с коэффици- ентом усиления по напряжению fcyM и электромагнита, причем на вход усилителя можно непосредственно подать сигнал uB(i) от ВУ,' *) На самом деле ка зависит и от внешней нагрузки, в том числе инерци- онной, но при больших силах, создаваемых перепадом, можно считать =». = const. 13 а. д, Первозванский
194 . 1*Л. 4. УПРАВЛЕНИЕ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ считая о. *= кеив. Остается выяснить лишь вид преобразования, ко- торое должно осуществлять ВУ. Передаточная' функция преобразования измеряемого процесса. —у(0 в управляющее воздействие и(t), т. е. п.ф. тракта датчик — ВУ — исполнительное устройство, имеет вид: к Mr где Яву(D) —п.ф. ВУ. . Вместе с тем п. ф. всего преобразования, как было установлено- выше, является оптимальной, если она дается формулой (5.40). Для обеспечения оптимальности достаточно выбрать Яву(О) равным JIBy(D) = ^(rsD+l)ii^A (5.45> ИЛИ Яву (Я) = кои + к[)1Уи + к[ -^-и, (3.46> где к0 = (Т, + Т)к„ кв = ТвТкг, kI — r‘k(ktktku)~l. Построение аналогового ВУ, реализующего этот стандартный ПИД- эакон управления, не вызывает практических затруднений. 5.5. Выводы. Оценим значение дисперсии ошибки регулирования, достигаемое при использовании этого закона. ~ Вновь вычисляя стандартный интеграл оо </:=J ।1 - я: (и|% —оо находим (при предположениях (5.36)), что “чет- Таким образом, достижимая точность регулирования определяется а) ожидаемой интенсивностью изменений нагрузки б) ожидаемой частотой 1/т скачков нагрузки, в) статическими характеристиками объекта ки, кю, г) допуском на возможную скорость управления. Остановимся подробнее на последнем факторе. Как уже указывалось, скорость управления ограничена в силу двух обстоятельств: во-первых, конструктивно, а во-вторых, из-за возможности гидравлического удара. Согласно^ (5.42) предельная ‘скорость штока сервомотора равна као, где о — полное открытие окон золотника, а к„ зависит от многих обстоятельств и в частно- сти — от перепада давления масла, создаваемого напорной установ- кой. Поэтому, в конечном счете, конструктивные ограничения па
$ 5. РЕГУЛИРОВАНИЕ УГЛОВОЙ СКОРОСТИ ВАЛА ТУРБИНЫ 195 скорость управления определяются мощностью напорной установки, а значит, предельным расходом масла через окна, умноженным на перепад давления («напор»). . Вывод 1. Достижимая точность регулирования зависит от энергетических характеристик исполнительного устройства. Рассмотрим теперь второе обстоятельство. При упрощающих предположениях (5.36) нетрудно оценить, что (5.48) где dn — дисперсия относительных колебаний давления. Если требованиями к прочности конструкции направляющего ап- парата и камеры ограничена предельная величина т] колебаний, то соответственно» ограничена и d„, а следовательно, задан и допуск <б„ на среднеквадратичное изменение скорости управления б» = • "у- (5.49) (если, конечно, использовано «правило Зп»). Если этот допуск жестче, чем конструктивный, т. е. и. — г-<С (о.50) “о1 W то именно он должен приниматься во взимание при расчете и вхо- дить в формулу для достижимой точности. I Вывод 2. Достижимая точность регулирования может зависеть | от прочностных характеристик конструкции самого объекта. В заключение отйетим, что описанная в данном параграфе ме- тодика типична для технических приложений теории управления. Характерной является процедура постепенного уточнения постанов- ки задачи оптимизации закона управления с выявлением новых •существенных факторов. Она отражает и обычный диалог между специалистом, более «сведущим» в формально-математических во- просах, и специалистом, лучше понимающим технические аспекты, но способным воспринимать только конечные результаты расчетов. В то же время конкретный полученный результат — закон управле- ния (5.45),—конечно, не следует рассматривать как окончательную рекомендацию к проектированию регуляторов гидротурбин, именно потому, что многие, очень важные особенности технической реализа- ции при его построении не были учтены. 43
ГЛАВА 5 ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ § 1. Необходимость нелинейной теории и ее возможности 1.1. Нелинейные эффекты. Проведя аккуратный анализ поведе- ния объекта управления и рассчитав необходимые законы управле- ния на основе линейной теории, инженер может столкнуться с не- ожиданными неприятностями при реализации системы на основе проведенных расчетов. Свойства «собранной» системы или ее экс- периментального макета, построенного на реальных элементах, мо- гут качественно существенно отличаться от расчетных. Предполагалось, что система является устойчивой, а на самом деле наблюдаются незатухающие колебания. Предполагалось, что система будет с -малой ошибкой отслеживать задающее воздействие,, а на самом деле ошибка оказывается значительно большей или даже неограниченно возрастает (объект слежения «теряется из виду»). Предполагалось, что переходный процесс занимает короткое время, а в действительности он оказывается существенно более затянутым. Система проектировалась как астатическая, а в ней наблюдается установившаяся ошибка. Причина всех этих неприятностей — несо- ответствие свойств реальных элементов их линейной модели, при- нятой при расчете. Приведем примеры. 1. Все «линейные» усилители на самом деле имеют ограничен- ную зону, где зависимость между входным, усиливаемым воздей- ствием и выходом сходна с линейной. За пределами этой зоны на-
§ 1. НЕОБХОДИМОСТЬ НЕЛИНЕЙНОЙ ТЕОРИИ 197 блюдается насыщение: выход u2(t) остается ограниченным, несмотря на рост входа щ(1). Типичная зависимость представлена на рис. 5.1, а или, в идеализированном виде, на рис. 5.1,6. Хотя огра- ниченность управляющих воздействий в определенной мере учиты- валась и при линейном расчете, но это касалось лишь установив- шихся режимов, а при отработке начального рассогласования не- линейность типа насыщения может играть существенную роль. Рис. 5.3 Рис. 5.2 Пример 1.1. Следящая система рассчитана по линейной теории с заданной добротностью &р. Электрические и механические по- стоянные малы или достаточно хорошо компенсированы корректи- рующими цепями. Таким образом, предполагаемое поведение долж- но описываться моделью, представленной на рис. 5.2. Однако в действительности усилитель имеет ограниченную-зону линейности. Для того чтобы просто разобраться в последствиях, представим характеристику усилителя идеализированно в виде кусочно линей- ной зависимости (рис. 5.1,6). Пусть начальное рассогласование равно е». Согласно линейной модели в (t) = еое ₽<, однако с учетом нелинейности (см. рис. 5.3, где выделен нелинейный усилитель НУ) результат будет другим. Пусть > й. Тогда начальное напряжение на выходе усилителя будет равно не kjc^, а й. Угол отработки под действием постоян- ного напряжения начнет расти по линейному закону q>(tj=k2ut, и так будет продолжаться, пока рассогласование не уменьшится настолько, что усилитель войдет в линейную зону (рис. 5.4), т. е. Рис. 5.4 вплоть до момента Л, когда &i&y(e0 — k2utt) — й. Только затем все пойдет согласно линейной теории и ошибка начнет уменьшаться по экспоненте е(£) = у-£-е где кр — расчетная добротность, равная произведению коэффициентов усиления звеньев kiksk2. Из рис. 5.4 видно, что время практического затухания (вхож- дения в 5 %-зону) из-за насыщения резко выросло и абсолютно не соответствует «линейному прогнозу» 3/kv при достаточно большом начальном рассогласовании. □
198 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ 2. Почти все «линейные» датчики рассогласования на самом дело имеют зону нечувствительности, т. е. при малых измеряемых ошиб- ках в выходной сигнал просто отсутствует (рис. 5.5, а). Поэтому установившаяся ошибка может быть любой в пределах зоны lei «5 Д, а отработка при этом происходить не будет, поскольку от- сутствует сигнал ошибки. Более того,, датчики имеют и ограничен- ную зону линейности (например, потенциометрические преобразо- ватели «угол—напряжение» имеют характеристику, близкую к по- казанной на рис. 5.5, б). Для индукционных элетромеханических преобразователей (вращающиеся трансформаторы, сельсины) ха- рактерна зависимость и, = к sin е, лишь при малых в близкая к Линейной (рис. 5.5, в). При этом ошибка может быть равна любому числу полуоборотов, а сигнал — отсутствовать; ошибка может нара- стать, а сигнал — убывать. Для многих оптических датчиков харак- терно исчезновение выходного напряжения при больших ошибках (рцс. 5.5,г). И без детального анализа ясно, что такие свойства датчиков могут приводить либо к возникновению больших устано- вившихся ошибок (из-за «ложных» нулей сигнала), либо вообще к потере возможности слежения. 3. На работу почти любых кинематических передач оказывает влияние сухое трение (при малых усилиях — нет перемещений), а также неидеальность соединений (зазоры, люфты). Ведущая ось поворачивается, а ведомая — нет, пока зазор в передаче не будет выбран. Ясно, что между их углами поворота нет линейной зависи- мости. В дальнейшем мы убедимся, что эта нелинейность Может оказаться «ответственной» за возникновение неугасающих колеба- ний в системе, которая согласно линейному расчету должна была
§ Г. НЕОБХОДИМОСТЬ НЕЛИНЕЙНОЙ ТЕОРИИ 199 быть устойчивой. Таким образом, реальные элементы, характеристи- ки которых считались при расчете линейными, в действительности обладают .существенно нелинейными свойствами. Их влиянием мож- но объяснить многие неприятности в системе, «правильно рассчи- танной» по линейной теории.• 1.2. Релейные системы и достоинства нелинейных законов. В ав- томатике издавна применяются переключательные (пороговые) эле- менты. Их функциональное назначение — изменять скачком выход- ную величину в момент, когда входная перехо- дит (убывая или возрастая) некоторый уровень, порог. Характеристика связи «вход — выход», сответствующая этому назначению, представ- лена на рис. 5.6 (и1п- — пороговое значение входа, и2, Й2 — различные постоянные значения выхода). Реально переключатели выполняются как электромеханические (электромагнитные реле), электронные или пневматические устрой- Рис. 5.3 - • ства, характеристики которых могут несколько отличаться от идеальной функции переключения. В электромагнитном реле, например, переключения связаны с движением механического элемента (якоря реле) под действием сил, создаваемых током в обмотке управления (рис. 5.7). Перемещаясь, якорь замыкает выходную цепь либо на источник с напряжением п2, либо на источник с напряжением и2. Очевидно, что переключе- ние происходит не мгновенно при пе- реходе входного воздействия и, через порог и, = 0. Время переключения за- висит / от инерционности элементов и создаваемых сил. Однако конструкцию можно выполнить так, что это время не превосходит сотых долей секунды, -о а следовательно, управляемые от реле и2 более инерционные звенья практически не изменят своего состояния за время переключения. Тем более предположе- ние о мгновенном, скачкообразном из- Рис. 5.7 менении оказывается справедливым для электронных, в частности, полупроводниковых переключателей, в которых время переключе- ния может быть на несколько порядков меньше. Релейные элементы просты и вместе с тем могут быть эффектив- но использованы в системах управления. Пример 1.2. Введем в следящую систему вместо усилителя с линейной зоной релейный усилитель РУ с симметричной характери- стикой (рис. 5.8,я). В пренебрежении инерционцостью динамика процесса может быть описана с помощью структурной схемы (рис. 5.8,6). При начальной ошибке рассогласования е0 > 0, какова бы она ни была по уровню, реле обеспечивает подачу на двигатель
200 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ постоянного напряжения й, а при е0 < 0— напряжения —и. При этом процесс отработки начального рассогласования идет по линей- ному закону нечное время усилителя с (рис. 5.8, в) e.(t) = ea — k2uzt и'заканчивается за ко- ip == —Это время меньше, чем при использовании зоной линейности, ограниченной величинами ±й2. □ «г 'й -iz 6 Рис. 5.8 е(Й fp*- t. в- а » Из примера ясно, что с помощью релейных элементов можно формировать законы управления в некотором смысле даже более эффективные, чем «линейные» с ограниченной зоной дей- ствия. Это обстоятельство плюс техническая простота обеспе- чивают широкую распространенность релейных систем управления. Вместе с тем переключательная функциональная зависимость (рис. 5.6) не только не является линей- ной, по даже не непрерывна. Для линей- ной теории просто нет явной «зоны приме- нимости»,’если проектант системы ориенти- руется на использование реле. Напбмним также, что любые преобразователи «аналог — код», служащие для ввода информации в управляющую ЭВМ, имеют характеристи- ку типа композиции переключательных (рис. 5.9), где «ступенька» равна «цене» Рис. 5.9 низшего разряда. При грубой дискретизации (малой разрядности ЭВМ) это обстоятель- ство может оказаться существенным, тем более что оно проявляется и в процессе «внутримашинного» преобразования информаций. По- тери точности при округлении и тем более переполнение разрядной сетки — типично нелинейные эффекты. 1.3. Необходимость нелинейной теории. Недостаточность линей- ной теории теперь очевидна: получаемые с ее помощью законы управления не могут быть точно реализованы, и заранее не ясно, не являются ли другие, существенно нелинейные законы более эффективными. Кроме того, важно и то, что линейные модели само- го объекта управления приемлемо отражают его поведение лишь в малой зоне изменения переменных. Они сами, как правило, стро- ятся на основе приближенной линеаризации физических законов ,(см. § 5 гл. 4). В рамках линейной теории неоднократно обраща-
§ i. НЕОБХОДИМОСТЬ НЕЛИНЕЙНОЙ ТЕОРИИ 201 лось внимание на важность учета даже малых отличий модели от реальности. Вместе с тем изучалось лишь влияние таких отличий, ври котором описание поведения оставалось линейным. Ответом на вопрос о влиянии нелинейных возмущений j мы пока не распо- лагаем. Итак, приведены существенные доводы в пользу нелинейной теории. К сожалению, возможности ее заведомо ограничены. Дей- ствительно, если линейная теория опирается на модели в виде ли- нейных дифференциальных уравнений, из которых легко находится явное представление управляемого процесса в зависимости от про- извольных входных воздействий, то нелинейная теория должна опи- раться на нелинейные уравнения. А для таковых, как правило, не существует способов получения подобных явных представлений. При анализе поведения для конкретных начальных условий и за- данных воздействий можно воспользоваться эффективными процеду- рами численного интегрирования нелинейных дифференциальных уравнений (см., например, [52]). Однако, и это уже неоднократно подчеркивалось, при решении задач управления, как правило, не- обходимо считаться с неполнотой исходных сведений об указанных факторах. Следовательно, основное внимание важно уделить таким подхо- дам, при которых можно получить хотя бы качественное представ- ление о поведении систем, описываемых нелинейными соотноше- ниями, при широком диапазоне начальных условий и возможных воздействий. Общая нелинейная теория управления достаточно сложна. Бо- лее полное знакомство с нею мы отложим до гл. 8—11. Здесь же ограничимся описанием основных подходов и полезных для практи- ческого использования результатов в рамках простейших нелиней- ных моделей. Наша первая и основная задача — понять причины возникновения различных нелинейных эффектов, о которых гово- рилось в начале параграфа, и выяснить, нельзя ли устранить не- приятности, возникающие в силу нелинейных свойств элементов, при формировании самих законов управления. 1.4. Системы с одним нелинейным элементом. Обратим внима- ние на то, что рассмотренные выше элементы систем управления (усилители, датчики) имели характеристику связи «вход-выход» в виде безынерционного, статического нелинейного преобразования. Если обобщенно обозначить вход через <т(£), а выход — через и(1), то значение выхода определялось значением входа в тот же момент времени !>(/) =/[<Ф)1, (1.1) где /[о]-та или иная функция (характеристика элемента). Огра- ничимся исследованием систем, где имеется только один нелиней- ный безынерционный элемент, а все остальные звенья системы мо- гут быть описаны линейными, возможно, динамическими соотноше-
202 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ .ТЕОРИЮ ниями. Это позволит выявить основные нелинейные эффекты, за которые «несет ответственность» выделенный элемент. Формальное описание систем с одним нелинейным элементом удобно дать . с помощью структурной схемы, представленной па рис. 5.10, а, где z(f) — внешнее воздействие, y(t) — выход системы, #t(D), 7/j(D) — передаточные функции, характеризующие линейные звенья системы. Структурной схеме соответствуют урав- нения в операторной форме р(0 = /Л(О)п(«) + //3(В)2(О, o(f) = z(i)-^(D)M(i), Если обозначить Я/ГН-М я fD) ^(Р) Я /т Вз(Р) AJD)’ (°) Л2(Ь)’ 4JD)’ где A(D), B,(D), 42(D), Z?2(D), Z?3(D)— многочлены от оператора дифференцирования, то тем же соотношениям (1.2) можно придать форму линейных дифференциальных ^равнений А, (D) у (0 - В, (D) v (t) = В3 (D)z (I), A2(D)a(t)+Bz(D)y (t) —A2(D)z(t) (1.5) относительно неизвестных функций y(t), o(t),t>(£), дополнитель- ная нелинейная связь между которыми дается с помощью (1.3). С другой стороны, исключив y(t) из уравнений (1.5), придем к соотношению . AL(D)o(t)+BL(D)v(t) = Bz(D)z(t), (1.6) ГДе (D) A A (D) Л (В), 2?b(D) = Bi(I>)^(»k 5I(D) = [4I(D)^l(D)-B2(D)Bs(D)J. С1-7)' Такое исключение равносильно преобразованию исходной структур- ной схемы к новому, иногда более удобному виду, представленному ла рис. 5.10, б, где введены обозначения и rm В'-(Р) Я - В*(Р) И 81
g 1. НЕОБХОДИМОСТЬ НЕЛИНЕЙНОЙ ТЕОРИИ 203 Приведем пример приведения описания системы с обратной связью к стандартной форме. Пример 1.3. В § 5 гл. 4 подробно рассматривалась задача син- теза закона стабилизации угловой скорости гидравлической турбины. Общая структурная схема построенной системы воспроизведена на рис. 5.11, где п.ф. Ниу, Hwy характеризуют свойства объекта, — свойства обратной связи. Обратную связь предлагалось построить как последовательное соединение чувствительного элемента, описываемого уравнением и,(0 = Ate(0 = -A.p(0» (1-9) ПИД-преобразователя с урав- нением — \к0 + kDD + kj — j иЕ (t) (1-10) Рис. 5.11 и гидравлического сервомеханизма, движение штока которого’ опре- деляет управляющее воздействие (открытие направляющего аппа- рата). Сервомеханизм также описывался линейным уравнением (TSD + 1)м =-|-arEt (1.11) где о. (смещение иглы золотника) равно o„ = /cuuB. (1.12) Во всем описании поставим под сомнение только уравнение серво- механизма (1.11). Напомним, что подача жидкости в цилиндр ме- ханизма осуществляется с помощью золотникового распределителя: Рис. 5.12 своими поясками игла золотника открывает или закрывает окна в его корпусе (рис. 5.12,а), через которые пропускается жидкость. При выводе уравнения (1.11) предполагалось, что открытие окон, «Которое здесь обозначим к, пропорционально относительному сме- шению о иглы и корпуса. Однако это неточно отражает существо
204 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ дела: при малых смещениях окно, размер которого меньше ширины пояска, остается закрытым, а при больших смещениях окно откры- вается полностью, и увеличение смещения перестает влиять на скорость подачи жидкости в цилиндр. Зависимость открытия окон от относительного смещения может быть описана нелинейной функ- цией, график которой дан на рис. 5.12,6. С учетом этого обстоятель- ства следует отказаться от уравнения (1.11), заменив его соотно- шениями ' Du — kav (1.13)' (пропорциональность скорости движения штока открытию окон), 0 = ог — ги (1.14)’ (относительное смещение иглы о определяется абсолютным о, за вычетом перемещения корпуса золотника, связанного со штоком ки- нематической передачей с коэффициентом г), и, наконец, нелиней- ным уравнением п = /(о). “ (1.15) Выпишем’ все линейные соотношения, сразу изъяв часть промежу- точных неизвестных. Согласно структурной схеме имеем y = tfu„(D)u + #w(D)«\ ' (1.16) Далее из (1.9), (1.10), (1.12) следует, что ое = — Ms + kt у, (1.17) а кроме того, к a = (js — ru, u = -~v. (1.18) Окончательно исключая ое, и, получим полное описание линейной части системы к + (1.19) о (£) = — + kDT) + kt + -jj—pjjJ у + г - (1.20) которое и переходит в (1.2) после очевидных переобозначений: г(0==ГЯ^Б)£р(^ /f1(D) = Hw(D)-ij-; H2(D) = feBfce^0 + *DD + + + н /пр. Я3 (D) = — Huy (В). □ / 22 иу 1
§ 2. РАВНОВЕСНЫЕ СОСТОЯНИЯ И УСТОЙЧИВОСТЬ 205 § 2. Равновесные состояния и устойчивость 2.1. Равновесные состояния. Первоначальная проблема, которая интересует нас при исследовании систем управления с обратной связью, это проблема устойчивости. Любая система регулирования должна быть организована так, чтобы при снятии возмущений ее выход стремился к желаемому значению, а при ограниченных воз- мущениях — оставался в ограниченной зоне вблизи него. В системах слежения эти требования остаются в силе, хотя вместо непосред- ственного выхода объекта они предъявляются к ошибке слежения. Запишем уравнения системы, ориентируясь на структурную схему рис. 5.10,6: - . а(0 + HL(b)v(t) = (2.1) ^0 = /[о(0], (2.2) y(0 = T/I(D)v(0 + ^s(D)z(0. (2.3) Последнее уравнение является линейным и отделяется от взаимо- связанных уравнений (2.1), (,2.2), исследованию решений которых мы и уделим основное внимание. Первоначально предположим, что внешнее воздействие отсут- ствует. Тогда поведение решений полностью определяется свойства- BL (D) *) мп п. ф. Яд (D) Д j—pjj- , которую обычно называют п. ф. ли- лейной части системы, и свойствами функции /(о), характеристики нелинейного элемента. Прежде всего выясним, какие имеются по- стоянные решения о (0 — о — const, v (t) — v = const. Будем говорить, что эти решения, если они существуют, определяют состояния рав- новесия системы ' 4t(D)n(0 + Sb(Z))p(0 = O, г(0 = Яо(0]. (2.4) Величины о, v должны удовлетворять соотношениям 4b(0)£ + Bt(0)v = 0, ? = /(о). (2.5) Если функция /(о) линейна, /(о) = /со, (2.6) то (2.5) имеет единственное решение о = 0, v = 0. (2.7) Нелинейное же описание может допускать и другие постоянные решения, что сразу видно из графической схемы, представленной па рис. 5ЛЗ, где решениям соответствуют точки пересечения харак- теристики нелинейного элемента и прямой *) Многочлены Лх,(О), Bl(D) далее считаем взаимно простыми.
206 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ Этот результат очень важен практически. Действительно, если функция /(о) является гладкой и имеет отчетливо выраженную «линейную эону» (рис. 5.14), то кажется возможным заменить /(о) линеаризованным описанием <2-8> т. е. принять формулу (2.6) с к= На этой гипотезе, в сущ- ности, строится вся линейная теория управления: система обычно строится так, чтобы единственное состояние равновесия соответство- вало нулевой ошибке управления, т. е. было бы желаемым состоя- нием. Вывод: нелинейность характеристики даже одного элемента системы может привести к возникновению в ней равновесных состояний, не Совпадающих с желаемым («ложных нулей»). Пусть, однако, эта неприятность отсутствует, т. е. статический коэффициент усиления линейной части системы (0) ЛЬ(О) Яь(0) = выбран так, что система (2.5) имеет един- ственное решение. Для определенности будем считать, что /(0) — Q, а следовательно, это ре- шение— нулевое (2.7). 2.2. Устойчивость. Критерий Попова. Пред- Рис. 5.14 положим теперь, что начальное состояние си- стемы не совпадает с нулевым, равновесным. Спрашивается, придет ли система к нему с течением времени, т. е. будет ли она устойчивой по начальным условиям? *) Опять-таки. *) Строгая формулировка понятия устойчивости дана в гл. 8. *
§ 2. РАВНОВЕСНЫЕ СОСТОЯНИЯ И УСТОЙЧИВОСТЬ 20.7 кажется возможным для «гладкой» нелинейности (рис. 5.14)' при малых начальных отклонениях в пределах линейной зоны считать и дальнейшее поведение близким к поведению линейной, а следо- вательно, использовать известные критерии. Однако это заключе- ние, вообще говоря, неверно: устойчивость не гарантирует моно- тонности процесса o(i), начинающегося в «линейной» зоне, в ходе итого процесса можно «вылететь» из этой зоны, и свойства системы перестанут отвечать предположению (2.8). Более того, как мы уже видели на примерах, линейная зона может вообще отсутствовать, и указанный простейший подход теряет смысл. К счастью, теория нелинейных дифференциальных уравнений располагает следующим замечательным результатом [5.10]. Теорема 2.1 (критерий В. М. Попова}. Пусть все полюсы п.ф. линейной части системы IIL(p) лежат в левой полуплоскости. Пусть \ .характеристика нелинейного элемента удовлетворяет условиям /(0) = 0, о#=0. (2.9) Пусть можно найти такое вещественное число q, что при всех о», О «£ со < оо, выполнено частотное неравенство Re[l + qi(aHL(ia>)] + -i>0. (2.10) к Тогда при любых ограниченных начальных отклонениях от нуле- вого равновесного состояния функция a(t) останется ограниченной при t > 0 и a(i)->-0 при (2.11) Говорят, что при этом имеет место устойчивость нулевого равновесного со- стояния в целом *). Доказательство справедливости кри- терия отложим до гл. 8. Здесь же огра- ничимся лишь пояснением смысла ус- ловий и конкретных способов их про- верки. Условия (2.9) геометрически означают (рис. 5.15), что график функ- ции /(о) должен лежать в секторе, Рис. 5.15 ограниченном осью абсцисс й прямой ко. Его часто называют условием принадлежности сектору [0, £]. Подчеркнем, что условие (2.9) никак не ограничивает конкретного вида функции /(а). *) Утверждение Т.2.1 и последующих в этом параграфе относится только к устойчивости системы, определяемой уравнениями (2.4). При этом’не учиты- валось соотношение (2.3), связывающее выход системы y(t) с выходом иели-- яейности »(0. Очевидно, однако, что из устойчивости в целом (2.4) следуез устойчивость всей системы (2.1)—(2.3), если Hi (О) — устойчивая и. ф.
208 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ Частотному условию (2.10) также можно дать простую геомет- рическую интерпретацию. Обозначим Яь(и)= ВеЯ£(гю), Л.(®)= ПпЯДг®). Тогда (2.10) преобразуется к виду Hl (®) — фя! l (®) + 4- > 0. к (2.12) Введем также обозначения 7l(®) A ®/ь(®)# Я^(г®) Д Я£(ы) + Яь((о). (2.13) Функцию Яь(г<в) называют модифицированной частотной характе- ристикой линейной части системы. С уче- том этих обозначений (2.12) можно запи- сать так: Re HL (г®) + -4 > q Im HL (г®). (2.14) k А это неравенство геометрически означа- ет, что годограф Я£(/®) лежит правее прямой ( Hl + -44 — qlbt (2.15) \ к] (1 \ — 01 и имеющей коэффициент накло- на l/q (рис. 5.16). Правило. Для того чтобы проверить выполнение критерия В. М. Попова, следует . ~ а) построить годограф модифицированной частотной характери- стики б) попытаться провести прямую, проходящую через точку f j \ ( —=г, 0 г и лежащую слева от годографа. , \ k I г Если это удается, то критерий удовлетворяется, а следовательно, положение равновесия устойчиво в целом. Применение критерия В. М. Попова не сложнее применения критерия Найквиста, с которым он имеет много общего. Однако следует подчеркнуть, что критерий В. М. Попова, лишь достаточное условие устойчивости-, он может не выполняться, и тем не менее устойчивость в целом имеет место. • При интерпретации критерия возможны два подхода: а) предполагается, что исследуется система с явно заданной характеристикой /(о) нелинейного звена, которую можно заключить в сектор [0, к], подобрав значение к.
5 2. РАВНОВЕСНЫЕ СОСТОЯНИЯ И УСТОЙЧИВОСТЬ 209 б) предполагается, что изучается сразу целый класс систем, раз- личающихся по виду нелинейности, но так, что все они удовлетво- ряют одному и тому же условию, например, условию принадлеж- ности заданному сектору. В последнем случае говорят, что критерий определяет абсолют- ную устойчивость указанного класса. Рассмотрение с позиций абсолютной устойчивости соответствует тому, что нелинейность считается возмущающим фактором, заранее не вполне известным, но все-таки лежащим в пределах, задаваемых условиями (2.9). Подчеркнем теперь, что к классу систем, удовлет- воряющих (2.9), относятся и линейные системы, для которых /(о) = ко, (2.16) если 0</сСй. (2.17) Поэтому простым необходимым условием абсолютной устойчивости является требование устойчивости всех линейных систем вида (2.1), (2.2), (2.16), т. е. расположение в левой полуплоскости всех корней уравнения А(р)+/сВь(р) = 0 при любых к, 0к к. В частности, при к = 0 это уравнение принимает вид А(р)=0, т. е. его корпи совпадают с корнями знаменателя критерию Найквиста следует, что годограф //L(i®) секать луча ( — 00, —= на вещественной оси \ К I Иными словами, HiAp). Далее по не должен пере- (см. § 5 гл. 2). (2.18) 7?t(<o) = Re^L(M>-T к при всех ы, для которых 7Ь(®)= Im/7L(j(o) = 0. . (2.19) Последнее условие эквивалентно 7t(®) = w/L(®) = 0, (2 20) если ® 0. Таким образом, справедливо следующее утверждение. Теорема 2.2. Необходимым условием*) абсолютной устойчивости систем, в которых линейная часть характеризуется п.ф. UL(D), а нелинейный элемент — функцией /(о), такой, что о#=0, У(0) = О,; *) В истории изучения проблемы значительную роль сыграло предполо- жение (так называемая гипотеза Айзермана) о том. -что указанное необходимое условие является и достаточным. Однако были найдены опровергающие при- меры. 14 А. А. Первозванскпй
210 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ • является устойчивость IIL(D), а также требование, чтобы годограф IIL(i(o) не пересекал луча I— оо,—у на вещественной оси, иЛи же требование, чтобы годограф модифицированной частотной харак- теристики Нь(1(л) не пересекал того же луча за исключением, воз- можно, значения w = 0. Рис. 5.17 1 1 = (рис, 5.17,а); • J — оо Таким образом, построив годограф Яь(г<в), мы можем столкнуть- ся с тремя ситуациями: а) годограф ЯДгы) пересекает луч б) годограф Йь(1(л) не пересекает луча, и можно провести через точку (— -i, О) прямую, лежащую левее годографа (рис. 5.17, б); * k j / в) пересечения луча нет, но провести указанную прямую не- возможно (рис. 5.17, в). В случае а) абсолютной устойчивости заведомо нет, в случае б) она заведомо имеет место, в случае в) мы не можем сделать никакого заключения. К сожалению, для систем высокого порядка последняя ситуация является скорее правилом, чем исключением, и теория нелинейных систем не может до настоящего времени построить условия, которые были бы и необходимыми, и достаточными для обеспечения абсо- лютной устойчивости в классе систем с произвольными нелинейно- стями из сектора [0, К]. Тем более отсутствуют условия, выполне- ние которых гарантировало бы устойчивость в целом для нелиней- ности определенного вида, а нарушение — свидетельствовало о не- устойчивости. Поскольку обычно о нелинейности доступна более богатая ин- формация, чем" принадлежность ее сектору, то имеется возможность сузить класс допустимых нелинейных возмущений, но уменьшить разрыв между необходимыми и достаточными условиями. Наиболее
s 2. РАВНОВЕСНЫЕ СОСТОЯНИЯ И УСТОЙЧИВОСТЬ 211 интересным для приложений является следующий результат этого типа [5.14]. Теорема 2.3 (критерий Чо-Нарендры}. Пусть нелинейная харак- теристика является монотонной, точнее, выполнены условия /(0) = 0, при произвольных ох>-ста/ (2.21) Тогда устойчивость в целом положения равновесия гарантирована, если найдется прямая, проходящая через точку (— — t0j и лежа- ,, \ k J щая левее годографа HL(i®). Таким образом, критерий Чо-Нарендры рекомендует то же по- строение, что и критерий В. М. Попова, но относительно обычной (а не модифицированной!) частотной характеристики. Это и проще, и налагает менее жесткие требования на свойства линейной части системы (в «обмен» на более жесткое требование к свойствам не- линейности!). 2.3. Дополнения. Прежде чем переходить к примерам, сделаем несколько практически полезных дополнений. А. Пусть вместо условий (2.9) или (2.21) нелинейная функция удовлетворяет неравенствам ‘ (2.22) или , о^Оз. (2.23) 1 2 Тогда сохраняют силу утверждения Т.2.1 и Т.2.3, в которых, одна- ко, следует заменить А на к2 —к„ a HL(p) па /Jb1(D) = /7b(D)[l + №(Ь)]-\ (2.24) Справедливость дополнения следует из того, что из нелинейности /(о) можно выделить линейную часть, представив /(о) = /,(о)~ А-,о. Тогда условия (2.22), (2.23) записываются относительно новой не- линейности /До) в виде , О<у; -1/— ]сл — или О < 71 ^к2- kt А к, °1-°2 “ т. е. приобретают вид, указанный в теоремах, но при этом изменя- ется и линейная часть. То, что ее п.ф. дается (2.24), проверяется простыми выкладками. 14*
212 / ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ Б. Результат Т.2.1 верен не только для непрерывных /(о), но и для нелинейных функций с конечными разрывами (рис. 5.18,а). График функции должен быть дополнен вертикальными отрезками, дополняющими разрывы. Разрыв может приходиться, и па точку о = 0 (рис. 5.18,6), как это имеет место для идеального реле. Тогда Рис. 5.18 в условии (2.10) следует положить И — °° (одним из лучей, ограни- чивающих сектор, становится ось ординат); более существенно, что в этом случае нет «настоящего» равновесного состояния: ведь при о = 0 выход реле не определен. Формальный анализ указывает на существование равновесного скользящего режима, при котором про- исходит бесконечно частое переключение реле с одного выхода на другой. Если же учесть малую реальную инерционность реле, то такие переключения неосуществимы, и на деле имеются высоко- частотные колебания вблизи положения равновРсия. Однако при достаточно инерционной линейной части, описываемой п. ф. //i(D) (см. рис. 5.10), эти колебания не проявляются на выходе системы, и равновесный скользящий режим не отличим по выходу от «на- стоящего» (несколько подробнее об этом — ниже, в § 3, а также в гл. 8). В. По условию Т.2.1 линейная часть должна быть устойчивой, если нелинейная характеристика «зажата» в секторе [0, /с]. Если Hl{p) имеет корни знаменателя, лежащие справа, то абсолютной устойчивости заведомо нет. Если же все корпи слева, за исключе- нием одного нулевого, то критерий Попова сохраняет силу при небольшой модификации. Перед тем как формулировать результат, обратим внимание на то, что при наличии нулевого полюса условия равновесия (2.5) принимают вид v = 0, P = f(a), т. е. положениями равновесия являются любые точки, в которых характеристика проходит через ось абсцисс. В частности, может быть целый отрезок, состоящий из равновесных точек (рис. 5.19). Теорема 2.4 (критерий Гелига [5.4]). Пусть все корни знамена- теля Нь(р} .цежат слева, за исключением одного, ' равного нулю.
§ 2. РАВНОВЕСНЫЕ СОСТОЯНИЯ И УСТОЙЧИВОСТЬ 213 причем ИтрЯь(р)>0. (2.25) Пусть f(o) = 0 при o^o^Oz, (2.26) а вне этого отрезка лежит внутри секторов, заштрихованных на рис. 5.19, т. е. 0</(о)Ос(о-о2), а>02, ,2 27. Й(0 — Gi) «S /(<3) < О, О <01, причем во о J [fco - Ф (о)] (fc = оо, J [ф (о) — ко] do = оо, (2.28) О —оо Тогда если найдется О такое, что —q~l не является полюсом &ь(р), и выполнено условие Re[(l + qte)Н[,(йд)] + 4- ^0, 0<С®<оо, (2.29) к то при любых ограниченных начальных условиях процессы в си- стеме останутся ограниченными, и o(t) при стремится к од- ной из точек отрезка покоя Gt < о < <32 (выполнены условия пото- чечной устойчивости отрез- ка). । Частотное условие (2.29) совпадает с условием (2.10) основной теоремы 2.1 и име- ет ту же геометрическую ин- терпретацию с точностью до того, что допускается прове- дение прямой, проходящей / 1 п\ через — —, 0 и касаю- \ , к } Рас. 5.19 щейся годографа Яь(гю), Однако наклон прямой не должен быть отрицательным. Кроме того, условия (2.27) не допускают, чтобы /(о) касалась оси абсцисс вне отрезка покоя, а (2.28) равносильно требованию «неплотного прилегания»8 /(о) к лучам. 2.4. Примеры. Случай нулевого полюса является практически наиболее интересным. Приведем два примера. Пример 2.1. Пусть объект является телом (т = 1), движущимся в среде с вязким трением (5 = 1) вдоль оси у под действием силы МО. Тогда D2y + Dy = и. (2.30)
214 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ Управляющее воздействие и осуществлено в виде обратной связи по положению и скорости, однако датчик, измеряющий комбинацию " о = — у — aDy, а>0, (2.31) не идеален и имеет зону нечувствительности, а усилитель, усили- Рис. 5.21 полюс, следует применять Т.2.4. вающий сигнал датчика иа, имеет ограниченную зону линейности. Характеристики датчика и усилителя представлены на рис. 5.20, а и б. Из них следует, что преобразование о -* и можно описать од- ной нелинейной зависимостью (рис. 5.20,а). Из' структурной схемы (рис. 5.21) устанавливаем, что Поскольку Яь имеет нулевой Проверяем условия теоремы. Не- линейная характеристика подчиняется условиям (2.27), (2.28) при к = kY. - Проверим частотное условие (2.29). Имеем „ _____________ 1 — а г ____ 1 -|- «а>2 L Гн?’ <й(1 + ш2)‘ Запишем частотное условие в виде Яь — + 4->0=s—(1 —а) + <?(! + шв2) + 4- (Г+ <о2) > 0. к .. “у Слева в неравенстве стоит двучлен от ю*. Поэтому оно справедливо при всех ь) > 0, если и только если неотрицательны оба 'коэффици- ента двучлена, т. е. _ (1 _ «) + д + Л- 0=> <?>(! — а) — Ау 1 qa + ?->0=>ад> —
§ 2. РАВНОВЕСНЫЕ СОСТОЯНИЯ И УСТОЙЧИВОСТЬ 215 Величину д'> О, удовлетворяющую этим условиям, можно подобрать при любых ку > 0, а >0. Тем самым выполнены все условия Т.2.4, и отрезок [—01, 01] является поточечно устойчивым в целом, т. е. при любых начальных отклонениях установится режим, в котором <т(/)==о«о, lOoJsSOb В силу (2.31) и y(t) -*• у„ — — о». Иначе гово- ря, управляющее воздействие обеспечивает стабилизацию в окрест- ности точки у = 0 с точностью до I Oil.. За погрешность «несет от- ветственность» зона нечувствительности датчика. Мы обошлись .без построения годографа Яь(гю), использовав простые выкладки. Тот же результат, конечно, можно получить и геометрически. Годограф Hl = Rl + Ml = - . 1 + co целиком лежит в третьем квадранте (рис. 5.22), и легко провести прямую, остав- ляющую его справа. Дополнительно отметим, что если усилитель является релейным, суж- дение об устойчивости не изменится (доста- рис 522 точно положить kf -*<»). □ Пример 2.2. Исследуем поведение следящей системы, в которой датчик рассогласования имеет нелинейную характеристику, а ос- тальные элементы можно описывать линейными соотношениями. При предварительном расчете по линейной теории введение коррек- тирующих цепей обеспечило приведение п. ф. разомкнутого контура к виду #р(Р) Р(7\Р+1)(Т3р + 1)’ Ti > > Т3 > 0, к0 > О, с известными (§ 5 гл. 3) хорошими свойствами. Выясним, не на- рушаются ли эти свойства нелинейностью датчика. Представим структурную схему в виде, показан- ном на рис. 5.23, где о — сигнал ошибки, а и = /(о) — выход датчика. Для определенности будем предпо- Рис. 5.23 лагать, что характеристика та же, что и на рис. 5.20, в, но kT=i. Та- ким образом, при О] = 0, й -* <*> (отсутствие зоны нечувствительно- сти и насыщения) мы возвращаемся к линейной модели. Проверим условия устойчивости согласно Т.2.4. Имеем Нь(р) = Яр(р); Е = 1, так что частотное условие (2.19) можно записать в виде ЯДы)—д<в/ь(о))+1 > О, а» > О,
216 ГЛ. в. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ ИЛИ . 1 /1(<й) + дЯ1(<о) + ^>0,; (2.32) w «р где Hi, Ii — вещественная и мнимая части функции И (.-.Л л Т21<й + 1 Л1 {1(й) - (T1i<a+ 1)(2>> + 1)- Проведем необходимые выкладки. Имеем В = ,(2’1“2 + 0(г’>2 + 1) ’ 1 / = _ (^ + Г3-Г2) + »ЧУ3 +1) (Т>2 + 1) • Условие Т.2.4 сводится к выбору q > 0, обеспечивающего неотри- цательность квадратного трехчлена 1 + fl (Л2 + Tl) + q(TtT2 + - TJ.)] * + *p L p x J + <Z— (^’i + ^’з — + zA<o2^0« . «p Это всегда возможно, если выполнено условие а кр — любое, поскольку при достаточно больших q коэффициенты трехчлена будут положительны, а следовательно, трехчлен не мо- жет быть отрицательным при z>0. Таким j_. образом, и нелинейная теория подтверждает, ш 1 что большие начальные рассогласования будут уменьшаться, однако гарантируется не стремление ошибки к нулю, а лишь до- стижение погрешности, не превышающей --------------------*- размеров зоны нечувствительности датчика рассогласования. Стоит подчеркнуть, что вывод о возмож- ности неограниченно увеличивать коэффи- Рис. 5.24 циент обратной связи верен только для при- нятой модели линейной части системы. До- статочно учесть малую постоянную времени Tt < Т3, и возникнут ограничения на kv. Интересно, что условию (2.32) можно дать спе- циальную геометрическую интерепретацию. Если ввести условную частотную характеристику Ж (®) = 1Л (<°) + iRi (й)
g 3. АВТОКОЛЕБАНИЯ. ГАРМОНИЧЕСКИЙ БАЛАНС 217 и построить ее годограф, то (2.32) означает возможность провести прямую' с неположительным коэффициентом (—q) через точку (—1/&р, 0) так, чтобы годограф не заходил левее ее (рис. 5.24). В качестве самостоятельного упражнения предлагается исполь- зовать эту интерпретацию для исследования системы с дополни- тельной малой постоянной времени 7\. О § 3. Автоколебания. Гармонический баланс и гармоническая линеаризация 3.1. Автоколебания. Линейная система, при отсутствии внешних воздействий описываемая уравнением A(D)y = 0, (3.1) где A (D) — многочлен от оператора дифференцирования D, может иметь колебательное решение типа y(t) = acos &ot (3.2) только в том случае, если i(o0 является корнем характеристического уравнения, т. е. A(iffl0) = 0. (3.3) Это решение не грубо: стоит немного изменить параметры, и чисто мнимый корень приобретает вещественную часть, так что решение (3.2) превратится либо в затухающее колебание, либо в расходя- щееся. В нелинейных системах возможна и другая ситуация: в них мо- гут существовать грубые колебательные решения даже при отсут- ствии внешних воздействий. Реальные процессы, соответствующие этим решениям, принято называть автоколебаниями, поскольку они определяются внутрен- ними, собственными свойствами системы. Если система управления организуется так, что нулевое значе- ние ошибки управления совпадает с положением равновесия, то наличие автоколебаний должно рассматриваться как нежелатель- ное, паразитное явление. Однако если размах колебаний, т. е. наи- большее отклонение ошибки от положения равновесия, невелико, лежит в пределах допуска, то автоколебательный режим столь же приемлем, как и равновесный. Отсюда вытекает практическая важность. изучения возможности возникновения автоколебаний и оценки их размаха*). Подчеркнем сразу, что выполнение условий устойчивости в це- лом, конечно, гарантирует отсутствие автоколебаний, но при про- ектировании системы управления на базе реальных элементов они не всегда удовлетворяются. Выполнение же условий устойчивости *) Другой аспект проблемы — полезность автоколебаний для ряда, целей Управления — обсуждается в гл. 10, § 2.
218 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ «в малом», полученных на основе модели, линеаризованной в окре- стности положения равновесия,— недостаточная гарантия отсутствия автоколебаний. Напротив, в системах, устойчивых «в малом», может наблюдаться особо неприятный режим так называемого «жесткого возбуждения», когда система некоторое время работает стабильно, а затем под влиянием одиночного внешнего импульса почти вве- вапно переходит в режим больших колебаний, самовозбуждается. 3.2. Гармоническая линеаризация. Проблема существования ав- токолебаний и оценки их размаха является крайне сложной и не имеющей математически строгого решения в общем случае. Мы ограничимся здесь лишь описанием простейшего подхода, метода гармонического баланса (гармонической линеаризации)*), не претендующего на строгость, но обычно дающего разумные при- ближенные результаты**). Рассмотрим вновь описание системы с одним-нелинейным эле- ментом в виде o(t) + HL(H)v(t)=0, (3.4) v(t)^ (3.5)' Будем искать колебательное решение в виде гармонической функции о (i) = a cos cot (3.6) и попытаемся подобрать величины а (амплитуду) и со (частоту) так, чтобы уравнения (3.4), (3.5) удовлетворились тождественно. Имеем . оо у (£) = f[o(t)] = /[a cos cot] = 2 гъ cos A cot* (3.7) где 14 — коэффициенты ряда Фурье, вычисленные по известным формулам т Т 2Я v (t) dt = у- J / (a cos cot) dZ = 0 (3.8) f (a cos cot) cos kat dt =• о - о 2Л 2 л / (d'cos ip) cos kty dip, k^it T = —. ____________ - ° *) Для простейших систем 2-го порядка метод был предложен в 20-е годы ван-дер-Полем. Его обобщение дано в работах Н. М. Крылова, Н. Н. Боголю- бова [58]. В теории управления метод введен Л. Г. Гольдфарбом [5.5], который вридал ему современную форму (в зарубежной литературе гармоническая ли- неаризация называется методом описывающих функций). ** ) Дополнительное освещение проблемы автоколебаний дано в гл. 8. J / (a cos ф) dip, 2 С 2 *4 «= у i v (t) cos k(At dt
8 3. АВТОКОЛЕБАНИЯ. ГАРМОНИЧЕСКИЙ БАЛАНС 219 Подчеркнем, что коэффициенты vk зависят только от вида нелиней- ной функции /(о) и амплитуды а. Учтем только одно слагаемое в разложении (3.7), принимая p(t) = Vi cos at. (3.9) Тогда линейное уравнение (3.4) удовлетворится, если выбрать а и о так, что пЛ(®) = 0, (3.10) а + п1й4<в) = 0. (3.11) Действительно, подставляя (3.6) и (3.9) в уравнение (3.4), получим a cos at + plfft(D)cos at = a Cos at + ифЛДо^соз at — /До) sin cot] в силу известных правил линейной теории, но (3.4) тождественно равно нулю, если выполнены условия (3.10), (3.11). Эти условия можно записать в виде одного комплексного соотношения 1 + д1(а)Яь(1Ш) = 0, (3.12) где (3.13) Соотношение (3.12) назовем основным уравнением гармониче- ского баланса, а функцию ,qi(a)—коэффициентом гармонической линеаризации. Смысл этих названий прост. Приняв о(£) = a cos at, v(t) = p,cosat, мы удовлетворили соотношению v = f(о), отбросив все слагаемые ряда Фурье кроме одного, а следовательно, прирав- няли, сбалансировали только гармоники вида cos at слева и справа. С другой стороны, этот же прием эквивалентен предположению, что v (t) = a cos at = -J- о (t) = qt (а) о (£)> (3.14) т. е. выход и вход нелинейного элемента связаны коэффициентом q, (а). Замена нелинейного элемента линейным, коэффициент уси- ления которого зависит от амплитуды входа, естественным образом именуется гармонической линеаризацией нелинейности. Прием гар- монического баланса эквивалентен гармонической линеаризации, если этот коэффициент принят согласно (3.13), т. е. 2Л ?i(«) = J/(асозф)созфг/ф. (3.15) О Подставляя н = ?1(а)о в исходное уравнение (3.4), получаем - [1 + g1(a)fft(D)]o(t) = 0. (3.16) Тогда основное соотношение гармонического баланса (3.12) может интерпретироваться как условие типа (3.3) наличия чисто мнимого корня у характеристического уравнения гармонически линеаризо- ванной системы.
220 ГЛ. 5, ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ Вновь подчеркнем, что коэффициент гармонической линеариза- ции зависит от амплитуды а, которая заранее неизвестна, и в этом принципиальное отличие (3.16) от обычного линейного уравнения. Приведем еще одну интересную трактовку гармонической линеа- ризации. Обычная линеаризация гладких функций (линеаризация по Тейлору) может дать хорошее приближение к функции в окрест- ности точки равновесия (см. рис. 5.14). Если же изучаются колеба- ния, то естественно найти линейное приближение /(о) ко, выби- рая к из условия наилучшего приближения в среднем по всем зна- чениям, пробегаемым o(t) в процессе колебаний. Минимизируем среднеквадратичное отклонение т J А у J {/ [о (01 — ко (t)}2 dt о путем выбора к. Поскольку т т т / = yj’/2[o(t)Nt-yJ/[o(0]o(t)^ + yJa2W^ ' о "~о о л то из условия экстремума — и следует, что наилучшее значе- ние к равно т ---J/[o(t).]o(t)dt. (3.17) J а2 (0 dt Q о Если колебания совершаются по гармоническому закону, то т 2 С к* =—I f [a cos at] a cos at dt = q^a). о Таким образом, замена нелинейной функции на гармонически ли- неаризованную дает наилучшее приближение в среднем. Для того чтобы найти qt(a) в явной форме, необходимо вычис- лить интеграл (3.15). Это проделано для многих нелинейных функ- ций /(о), используемых при описании реальных элементов. Некото- рые результаты даны в табл. 3.1. Отметим также, что если /(о) = Ctfw (о) + с2/(2> (о), ct, с2 = const, то qx (а) — (а) + c2gl2) (а), где (a), ?i2)(a)— коэффициенты, со- ответствующие/(1) (о),/(2)(о). При известной функции qi(a) нахождение величин а, ю, удов- летворяющих условиям (3.10), (3.11) или эквивалентному условию
g 3. АВТОКОЛЕБАНИЯ. ГАРМОНИЧЕСКИЙ БАЛАНС 221 Таблица 3.1 /(о) 91 («) 1 /(а) = а3 3 2 91 (а) = -4 « 2 /(а)=(а±б’ 1а|>6 10, | а | < 6 / lj 2? о а | м И t^6 6 S / б2 arcSin-+-l/ 1--|,а>6 3 (1, а>0 4 9Д«) V 4 (1, а 1 /(а)=(а, |а|<1 (—1, о<— 1 91 (а) = 1, |а 1 < 1 2 • 1, 1, Л 1 -arcsin -+-у i--3 5 |1, а 5= б / (а) = <0, | а К 6 1—1, —.6 (0, а 6 а>5 (ла |/ а2 (3.12), удобно произвести с помощью той или иной графоаналити- ческой схемы. Вариант 1. а) Построить график /Дю) и найти ю — ш* > 0, при котором этот график проходит через ось абсцисс (рис. 5.25,а). Значение ю* / m 2Л \ аадает частоту I и период г = —j I искомого решения. б) Построить график qt (а) (рис. 5.25, б) и найти точ1ф пересе- чения этого графика с прямой, проведенной параллельно оси абс- цисс на уровне —/?ь* («»*). Значение а* задает амплитуду искомо- го решения, а следовательно, решение в целом o(t) = a* cos ю*£.
222 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ т. е. вычислить значения этой Рис. 5.26 Вариант 2 (диаграмма Гольдфарба). а) Построить годограф Я^(4(о), разметив точки на кривой соот- ветствующими значениями и. б) На вещественной оси расположить годограф функции — у?1 (а), шкции для различных а, изменяя а от 0 до <», и сопоставить каж- дому значению соответствующую точку на прямой (рис. 5.26). в) Значение параметров обоих годографов в точке пересечения дает искомые значения со*, а*. Вариант 3 (диаграмма Айзермана). а) Построить годограф Н~[* (со). б) Построить годограф —gja). в) Найти значение параметров в точке пересечения (рис. 5.27). Все указанные варианты являются следствиями представления условий в эквивалентных формах II (ю) •“ 0» 51 (а) “ — Нl (гео) =» =>-?Г1(«)**Я11(г®)--д1(а). (3.18) Конечно, можно избежать графических построений, применив любой аналитический или численный способ. Подчеркнем лишь, что значений (со*, а*), удовлетворяющих (3.18), может быть не одно, а несколько, каждому из которых могут соответствовать различные периодические решения исходного уравнения (см. диаграмму Гольд- фарба на рис. 5.28, где выделяются три точки пересечения годо- графов). Равным образом может оказаться, что нет, ни одного зна- чения а и <о, удовлетворяющего (3.12), а следовательно, метод не позволяет выделить ни одного периодического решения. Однако если пересечение (а не касание!) действительно имеется при каких-либо заданных параметрах системы, то оно будет иметь
§ 3. АВТОКОЛЕБАНИЯ. ГАРМОНИЧЕСКИЙ БАЛАНС 223 место и йри малых их изменениях, т. е. факт наличия колеба- тельного режима действительно является «грубым». 3.3. Примеры. Приведем примеры использования метода. Пример 3.1. Рассмотрим следящую систему, где линейная часть задается п. ф. IIl (D) D , Т\ > Т2, Tea > 0t а нелинейный элемент (усилитель) ного реле имеет характеристику идеаль- о > О,, а<0. Коэффициент гармонической линеаризации для такой нелинейности (см. табл. 3.1) (а) = —. Условие НЕ1 (ко) = — 91(a) принимает здесь вид - # I®2 (Л + Т2) - «о (1- Тг V)] = - А ft Jb€* и удовлетворяется при " * 1 * 4 kL ю = со* = —7=, а* —--------------1 так что метод дает периодическое решение вида ... 4 t О (t) ~------—-----r COS —7= . Л Г-1 + Г-1 Тот же самый результат можно получить и из геометрического по- строения в виде диаграммы Гольд- фарба (рис. 5.29). Подчеркнем, что годограф функции — q^1 (а) = — ~^а при 0 < а < «j занимает всю отри- цательную вещественную полуось. Вместе с тем из диаграммы следует и общий вывод-, если в системе име- ется релейный усилитель, то метод укажет на наличие периодических решений во всех случаях, когда го- дограф частотной характеристики линейной части пересекает эту полу- ось хотя бы один раз. Нетрудно убедиться, что в этих случаях нарушен критерий В. М. Попова устойчивости равновесного сколь- зящего режима о = о0 — 0. О
224 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ Пример 3.2. Рассмотрим вновь релейную следящую систему, но будем считать, что HL (В) = + (T*D + , Л > Т2 > Т3 > 1\, kL> 0. Как указывалось в П.2.1, при Tt — 0 система устойчива. Однако при малом Л*0 годограф HL(ia) пересекает отрицательную ве- щественную полуось. Несложные выкладки показывают, что в этом случае возможны автоколебания с частотой * 1 Ы* = —7^ 1____________1 t П гр Р I <“Z I m * 3 1 2 V * 1 и амплитудой =-------!_ + 01 — ) * 4 Т2 а* -------------- Однако автоколебания высокочастотны и имеют малую амплитуду, что делает систему практически работо- способной при малых Т\. Заменим теперь идеальный релейный элемент на релейный элемент с зоной не- чувствительности (в табл. 3.1 его харак- теристика указана под номером 5). По- 2 скольку то годограф — ?71(а) располагается лишь на части отрицательной полуоси, левее точки---7- Поэтому пересечение годографом ЯДгсо) отрицательной полуоси в любой точке егцо не свидетельствует о наличии периодиче- ских решений. Пусть lL(ca*) = Q, но уравнение (3.18) не имеет решений (рис. 5.30). Отсюда можно сделать практический Вывод: введение зоны нечувствительности позволяет избежать возникновения автоколебаний в системах с релейными усили- телями. Введем теперь вместо реле элемент с ограниченной зоной линей- ности (номер 4 в табл. 3.1). Поскольку 0<<л(а) =С 1, то те же построения (рис. 5.31) приводят нас к выводу: периодическое решение возникает, если годограф HL(i<o) пересекает часть отрица-
§ 8. АВТОКОЛЕБАНИЯ. ГАРМОНИЧЕСКИЙ БАЛАНС 225 тельной полуоси левее точки (—1, 0), т. е. нарушено достаточное условие устойчивости в целом положения равновесия о — 0. Подчеркнем, что возможна ситуация, представленная на рис. 5.32, когда расчет по линейной теории указывает на устойчи- вость системы (годограф не охватывает точку (—1, 0)), а в дей- ствительности — возможны автоколебания. Здесь мы как раз стал- киваемся с «коварной» ситуацией «жесткого возбуждения» авто- колебаний, упомянутой в начале параграфа. □ Пример 3.3. Используем более точную модель следящей систе- мы, учитывающую нежесткость кинематической передачи (ре- дуктора) и наличие люфта. Описание линейной модели было дано в § 2 гл. 2. Сохраним в силе основные соотношения (2.5) —(2.14), за исключением описания момента взаимодействия между валом двигателя и валом нагрузки через редуктор. В § 2 гл. 2 принималась гипотеза о линейной упругой связи. Тогда на (i \ нагрузиу действует момент пгднД — <рд — <p L а реакция нагрузки 1 равна ~-у'«дн, где с —жесткость редуктора, г — коэффициент пе- редачи. Обозначим через а относительный угол, я = - <рд — <р. При от- сутствии зазора (люфта) тЛЯ пропорционально о: угол о совпадает с углом скручивания v эквивалентной «пружины». При наличии зазора 28 (приведенного к выходному звену редуктора) имеем не- линейную связь Р==/(О) = О--6, О>б,; 0, | И I о + б, о<- б. Способ построения этой связи ясен из условного чертежа па рис. 5.33, а (вид «сбоку») и 5.33,6 (вид в направлении оси вра- щения). (Реально обычно используется не «вильчатая», а зубчатая 15 а. а, Первозваисний
226 ГЛ, 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ передача, и существен зазор между неидеально жесткими зубьями ведущего и ведомого колес выходной ступени редуктора [1.5].) Нелинейная связь описывается стандартной функцией типа «зо- ны нечувствительности» *). Используя гармоническую линеариза- цию, приходим к выражению /1 \ «гд=С51 {a)o=cqi (а) [уфдв —ф^ где qi(a) находится из табл.3.1 (номер 2). Формально уравне- ния гармонически линеаризо- ванной системы совпадают с уравнениями линейной модели,, построенной без учета люфта, и точностью до замены постоян- ной жесткости с на жесткость сд4(а), зависящую от амплиту- ды. Используя этот факт и фор- мулу (2.22) гл. 2, можно записать д. ф. силового блока в целом: Яи(р (р, 91) = кс = —р----1—т--------г—--------------------------------- I Т2 р2 \ T2d2 Р (W) + W(W) + t-+‘' («) / (а) которая теперь также зависит от а. Пусть датчик рассогласования^ усилитель и цепи последовательной коррекции описаны линейно и заданы п. ф. ЯЕи (р) = g Схема в целом показана на 7*5? рис. 5.34. Отметим, что мы не произвели стандартной про- цедуры выделения п. ф. линей- ной части системы. Для оценки частоты (о* и амплитуды а* возможных автоколебаний используем тот факт, что при а —а* характеристическое уравнение гармониче- ски линеаризованной системы должно иметь корень гео*. Запишем характеристическое уравнение в виде Ны(р) и. Н«Г(Р,<К) Рис. 5.34 ксВ(р) + А (р) р [Тмр(Т9р 4-1)4- 1] 4- Т2р3 I F [TmiP {Т.р 4-1) 4- 1][ == Oj Тм = Тдц 4- Тмг- ?1(«) J ♦) Иногда для описания люфта используют модель «гистерезисного» типа [5.5], но при этом способе приходится сталкиваться со сложным понятием не- однозначной нелинейной функции.
§ 3. АВТОКОЛЕБАНИЯ. ГАРМОНИЧЕСКИЙ БАЛАНС 227 Исключив pi (а), получаем представление 3 1 I \ 91 " Ярж (р) + 1 ф аде И /п\А *сЯви(Р) ₽ж [Р) = Р[Тмр(Т3р +!)+!] — п. ф. 'разомкнутого контура, найденная в предположении идеаль- ности кинематической связи (при отсутствии податливости и люф- та),, а Ф (п) Д Т'п2 Гм1Р(гэР + 1) + 1 Ф(Р)ДУ«Р УдМгэр+1) + 1 • Искомая частота о* должна удовлетворять условию Im= о Предполагая, что 1 получаем 1 м так что условие для определения частоты можно записать в виде Im//p,B(i®*) = 0. : Вывод: наличие люфта может приводить к возникновению автоколебаний*), но эти колебания высокочастотны, и их частота близка к частоте, где ФЧХ разомкнутого контура, рассчитанная без учета неидеалъности кинематической передачи, проходит че- i рев уровень —л. Амплитуда колебаний вала нагрузки относительно вала двига- теля легко вычисляется с помощью соотношения qt (а) = Т0<а* -~=Х==- А с* 1 ° V гм /ярж({<о*) + 1 “ . как абсцисса, на которой гармонический коэффициент линеариза- ции достигает уровня с*. □ 3.4. Дополнения. А. Метод гармонического баланса и эквива- лентный ему прием гармонической линеаризации является доста- точно грубо приближенным методом. В его оправдание обычно вы- *) Выше не учитывался постоянный момент нагрузки, который может ком- пенсировать люфт. 15*
228 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ двигается тезис [5.1] о том, что учет высших гармоник в разложе- нии (3.7) не дает существенных изменений в форме решейия o(t), если линейная часть системы обладает свойствами фильтра низких частот, т. е. |Яь(г/«о*)1 « |/fL(ico*)l, k>i. (3.19) Эта гипотеза действительно разумна, но нуждается в проверке после вычисления частоты со* по схеме гармонического баланса. Стоит отметить, что процесс n(f) на выходе нелинейности заведомо не гармонический и его форму можно уточнить, используя, например, несколько слагаемых ряда (3.7), подставив в него а —а*, <о = со* (так называемая процедура «улучшенного 1-го приближения»), Б. При переходе от разложения (3.7) к гармоническому прибли- жению (3.9) отбрасывались не только высшие гармоники, но и ну- левое слагаемое ряда т р0 = j- J/(a cos <00 dt. (3.20) о Это разумно только в тех случаях, когда /(о) является нечетной. функцией (тогда va = 0) либо когда !Яь(0)1 « |Ях(1(о*)|. Поскольку последнее условие редко соблюдается, то при наличии нелинейной характеристики, не обладающей свойством нечетности^ основной вариант метода гармонического баланса можно заменить на улучшенный, учитывающий при поиске решения возможную не- симметрию колебаний. При этом решение ищется в виде o(f) = o0 + acosof, .. (3.21) где о» — постоянное смещение, а в разложении в ряд Фурье функции v (t) = /[оо + a cos (о/| учитывается два слагаемых, т. е. принимается v(t) = v0 + vt cos at, (3.22) где T 2Я ve = ~ J v (0 dt = J / [o0 + a cos ф] cty, (3.23) о о T л 2 C 1 C = y j у (0 cos (of dt = — j /[o0 + a cos ф] cos ф dty. (3.24> о 0 Коэффициенты i>0 и ?i = —V1 являются функциями от параметров Оо, а и могут быть вычислены в явной форме для типовых нелиней- ных характеристик (см., например, [5.11]).
§ 3, АВТОКОЛЕБАНИЯ. ГАРМОНИЧЕСКИЙ БАЛАНС 229 Подстановка (3.21), (3.22) в уравнение линейной части (3.4) показывает, что оно тождествнено удовлетворяется, если выполне- ны условия ое + Яь(0)п0(а, о0) = 0, (3.25) l + q^a, о0)HL(ги) = 0. (3.26) Решение уравнений (3.25), (3.26) дает значения неизвестных пара- метров о0, а*, <»*, характеризующих (в принятом приближении) возможный периодический режим. В. Колебательное решение разыскивалось выше как некоторое частное решение дифференциальных уравнений. Такое решение будет соответствовать установившемуся автоколебательному режиму только в том случае, если оно является устойчивым. Интуитивный смысл этого понятен, а строгое определение мы отложим до гл. 8, тем более что не существует строгих критериев устойчивости пе- риодических решений, приближенно находимых по методу гармо- нического баланса. Приведем лишь правдоподобные рассуждения, дающие простой критерий, выполнение которого, как правило, не- обходимо. Напомним, что при а —а* характеристическое уравнение гармонически линеаризованной системы Ль(р) + 5£(р)91(а) = 0 (3.27) имеет чисто мнимый корень 1а>* (годограф Я£(гоз) при <о = и* проходит через точку на вещественной оси с координатой — д’?1 (а*)). Увеличим амплитуду, а==а* + 6а, 6а > 0. Если при этом все корни станут «хорошими» (лежат в левой полуплоскости), то это свиде- тельствует о том, что движение с увеличенной амплитудой начнет затухать. Примем а = а* + ба, 6а < 0. Если при этом хотя бы один корень станет «плохим», то движение с уменьшенной амплитудой будет раскачиваться, пока амплитуда не приблизится к а*. Отсюда можно сделать следующий вывод. ’ • "• Критерий устойчивости в методе гармонического баланса. Если зависимость qt(a) в окрестности решения а~а* такова, что при росте а корни уравнения (3.27) оказываются в левой полуплос- кости, а при уменьшении а чисто мнимые корни ±г<а* приобре- тают положительную вещественную часть, то а* задает амплиту- ду устойчивого периодического решения. Этому критерию можно придать простую геометрическую ин- терпретацию с помощью диаграммы Гольдфарба, если вспомнить еще и геометрическую интерпретацию критерия Найквиста. Правило. Сдвинемся по годографу функции — gf1 (а) по веще- ственной оси, увеличивая а от значения а = а*. Если новая точка не будет охватываться годографом Hl(Ig>), то а* соответствует устойчивому решению, а в противном случае — неустойчивому.
230 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ Применение правила можно проследить на всех приведенных выше диаграммах, где устойчивые режимы выделены кружком, а неустойчивые — крестом. § 4. Реакция нелинейной системы на внешние воздействия 4.1. Постановка задачи. Обратимся к уравнениям ^(D)a(f)+Sx(D)vCt) = BI(D)Z(t), (4.1) = (4.2) описывающим изменение процессов на входе, o(f), и выходе, v(t), нелинейного элемента под действием возмущения z(f). ' Из теории нелинейных дифференциальных уравнений [5.7, гл. 5] известно, что выполнение критериев устойчивости в целом (по на- чальным условиям) обеспечивает устойчивость по отношению к внешним возмущениям, точнее, из ограниченности z(t), где z(t) Д (4.3) следует ограниченность o(f) и v(t). Более того, доказано, что, если z(t) является периодической функцией, то уравнения (4.1), (4.2) имеют единственное устойчивое периодическое решение того же периода [5.12], а если z (t) — ограниченная реализация стационар- ного случайного процесса, то ей соответствует единственное реше- ние, также являющееся реализацией стационарного случайного про- цесса [5.3]. Иначе говоря, и по отношению к внешним воздействиям устойчивые в целом нелинейные системы обладают свойствами, в основном сходными со свойствами устойчивых линейных систем. Конечно, это сходство неполное. В частности, гармоническому внешнему воздействию необязательно соответствует гармоническая установившаяся реакция, поскольку нелинейность порождает выс- шие гармоники. Тем не менее, если линейная часть их хорошо по- давляет, то можно с успехом использовать при расчете установив- шейся реакции метод гармонической линеаризации. 4.2. Гармоническая линеаризация. Заменим нелинейную связь (4.2) на гармонически линеаризованную (4.4) где а — пока неизвестная амплитуда колебаний па входе нелинейно- го элемента, и подставим это соотношение в (4.1). Имеем [4b(D)+5-1(a)Bb(D)]o(i)-Bi(D)z(t), (4.5) или о(0=Я(ПЛ1)г(0, (4.6)
§ 4. РЕАКЦИЯ СИСТЕМЫ НА ВНЕШНИЕ ВОЗДЕЙСТВИЯ 231 ГДС В (D) Н (D> Q1) 4 AL(D)+qi(a)fiL(b) — оператор, зависящий от параметра §t. Если z(t) = azcos at, (4.7) то уравнение (4.6) имеет частное решение о (f) = a cos (at + ip), (4.8), где а= \Н (i&, qi)\az, ip = Arg H(ia, q^. (4.9) Формулы (4.9) те же, что в линейной теории, однако имеется принципиальное различие: поскольку параметр q, сам зависит от ампли- туды а, то (4.9) не дает решения в явной форме, а лишь дает уравне- ние для определения неизвестной амплитуды, которое должно быть ре- шено тем или другим способом. Под- черкнем, что в отличие от расчета автоколебаний здесь ® — заданная Рис. 5.35 величина, частота, воздействия. . Классическая графоаналитическая процедура вычисления реше« ния представлена на рисунке 5.35. Первоначально строится график функции (со и аг — заданные параметры воздействия!). Затем ось ординат рассматривается как ось, на которой откладываются возможные значения а, и строится график <ь(а), соответствующий заданной нелинейной характеристике /(о). Ордината точки пересечения дает желаемое значение амплитуды колебаний на входе нелинейности. Приведем иллюстративный пример. Пример 4.1. Пусть Аь(В)=П) + 1, £b(D)=l, #z(D)=l, / (о) = sign о, z(0 = «zCos at. Тогда уравнение (4.9) приобретает вид _ 1 причем 91 = 91(а) = А, Графоаналитическая процедура показана на рис. 5.36, однако в
232 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ давно:.! случае можно получить и решение в явной форме: ° я (1 + TV) I1 + ]/~1 + (1 + Т“(о^ [("4 ) Яг ~~ Оно определено при условии, что 4 . Г 14-rV В противном случае метод не дает вещественного решения для амплитуды (на диаграмме отсутствует пересечение кривых). Это не означает, конечно, что колебания отсут- ф1а ствуют — недостаточно эффективен лишь • _а2 Xq^a.) сам метод, ввиду недостаточной фильтра- V) +ТУ < \ ’ ции высших гармоник линейной частью, имеюще® меДлепно падающую амплитуд- но-частотную характеристику*). Процедура решения может быть обоб- щена на тот случай, когда z(i) (или z(t)) у, содержит постоянную составляющую: Рис. 5.36 z (f) = z0 + az cos (at. (4.10); При этом предполагается, что **) о(1) = По + асоз(со1 + ф), (4.11)' v(t) = va + ViCos^t + ф) = p0 + qi[o(t) — o0], (4.12) где qr = причем Vo и qt являются функциями от параметров Go? d. Подставляя (4.10) в линейное уравнение (4.1), получаем Al (D) a (I) + Bl (D) {и, + gt[o (г) - о0]} = Bz (D) [z0 + az cos ®f]. Отсюда находим частное решение вида (4.11), где о», я, ф должны удовлетворять условиям A(O)ffo + ^(O)p(, = SI(O)ze, (4.13)' а = qt)\az, (4.14) ф = Arg H{i&, qi). (4.15) Уравнения (4.13), (4.14) взаимосвязаны, поскольку v0 = Но (Оо, a); gl = gi(o»,a). *) Определенные гарантии эффективности метода можно дать, если deg4t(p) — degBI.(p) >2 [5.1] (см. также гл. 8, п. 4.5). **) То же предположение целесообразно ввести для уточнения метода, ес- ли характеристика нелинейности не является нечетной функцией.
§ 4. РЕАКЦИЯ СИСТЕМЫ НА ВНЕШНИЕ ВОЗДЕЙСТВИЯ 233 Например, для идеального реле, где ( 1, о>0, о<0, w имеем . О, |о0|>а. □ Пример 4.2. Рассмотрим систему, структурная схема которой представлена на рис. 5.37. Ее можно трактовать как модель следя- щей системы, служащей для отработки воздействия z^i), при Рис. 5.37 наличии дополнительного возмущения z2(f). Пусть zt(f) = cf, z2 (/)==> «== аг cos co0f. Запишем уравнения системы й, V (0 = D(7’1D + 1)(7’2D4- 1) I~~ z2 (0 + (01, о (0 == ~k3Dy (t) + kfa (t)-y (f) ], V (t) = /[(J (i)]_ После исключения y(t) можно переписать их в стандартной форме AL(D)a(t) +BL(D)v(t} — z(t), (4.18) где Ль(В) = О(Г,О+1)(Г2П+1), Bb(D) = /c2(Al + AsD)’, z(7) = *MI,(D)z1(t)+ Заметим, что z(t) уже не содержит линейно растущего слагаемого, поэтому прием гармонической линеаризации непосредственно при- меним.
234 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ Уравнения (4.13), (4.14) принимают форму: Vo = V => v0 = р с, (4.19) а Al (но) + g Вь(но) • ' ' Предположим далее, что нелинейность является идеальным реле. Тогда, используя вид функции р0, даваемый (4.17), и предполагая, ЧТО iCFol < а, получим Отметим также, что постоянная составляющая в ошибке е0 связана с Ou и у» соотношением ео = г1®о+ Мз*>о1 ==г-[ст° + *зС1 (4-22) Ki Ki и также зависит от амплитуды гармонической компоненты. Формула (4.17) для qt с учетом (4.21) принимает вид 4 / л с \ . а о. = —cos I-у у-j А—. (4.23) “ ла 2 к j •= а ' ' Подставляя (4.23) в (4.20) и производя простые’ преобразования, получаем явную формулу: a^-aRL + az\HL\]/ 1 - —(4.24) где введены обозначения Вг (iw) Яь = Ль(ю) = 3^у,. Яь = ПеЯь(М, Il = Im Hl (йо), ос = — cos При большой частоте со можно получить приближенное выражение: а^-^-(аг-а). (4.25) Постоянная составляющая ошибки после этого легко находится но формулам (4.21),. (4.22), а амплитуда ошибки а, рассчитывается по формуле ’ -SL i ± ’ ___ _____ а® “ 1 + + 1)(Г2<й> 4-1) (4.26)
§ 4. РЕАКЦИЯ СИСТЕМЫ НА ВНЕШНИЕ ВОЗДЕЙСТВИЯ 235 Ясно, насколько наличие нелинейности «перемешивает» влияйие двух внешних воздействий на компоненты ошибки. □ 4.3. Метод медленно меняющихся амплитуд. Метод гармониче- ской линеаризации позволяет составить качественное представление о характере реакции на гармоническое возмущение и для систем, не являющихся устойчивыми в целом. Однако поведение решений здесь может быть очень сложным. Некоторые важные ситуации можно исследовать, введя гипотезу о том, что решение представимо в виде о(1) = .а0(1) + а(Осо8[(о01 + ф(1)], (4.27) где ос, а, ф— уже не постоянные, а медленно изменяющиеся вели-* чины, притом настолько медленно, что их изменением за период 2л/(о0 можно пренебречь. При таком предположении можно сохра- нить представление для переменной v(t) на выходе нелинейного элемента в виде (4.12), но f0, qi окажутся функциями от медленно меняющихся о0(1), a{t). Подставляя эти связи в уравнение (4.1), описывающее линей- ную часть системы, получим A (D){o0 (!) + «(£) cos (<й01 + ф)) + + BL (D) U’c + q,a (i) cos (a^t + ф)) = Bz (D) {z0 (t) + az cos (4.28) (считаем дополнительно, что z0(i) также является не постоянной, но заданным образом медленно меняющейся функцией). Для того чтобы добиться тождественного удовлетворения уравнения, прирав- няем сначала медленные слагаемые: A(D)a0(f) + flt(D)v0[oo(*), a(/)] = ^(D)z0(l)\ (4.29)’ Для остальных слагаемых должно быть: HI_(D){a(l)cos(o)0f + ф(1))1 + 5г(П){дфа0(1), а(1)] X X a (i) cos (aoi + ф (t))} — Bz (D) {az (i) cos co0ih Далее учтем медленность изменения a(i), o0(f) и связанного с ни- ми <?,(£)= a(i)L ' Поскольку D{a(i)cos(<W + ф(1))} = acos(<B0t + ф) — — a sin (®of + ф) ф — шоа sin ((o0i + ФЬ ф I _ j пренебрежем при вы- 1a -— ®oa числении производных всеми слагаемыми, кроме последнего. Иначе говоря, дифференцирование будем производить так, как будто мед- ленно меняющиеся переменные являются постоянными. Такое до- пущение немедленно приводит к результату типа (4.9): a(l)== l//(i®,g1(l))|aJ, «i(*)“ 3i[<Mf)»e(0L (4.30J, I
236 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ с той разницей, что теперь эти соотношения связывают для любого t медленно изменяющиеся переменные a(t) и o0(Z). Если из (4.30) выразить a(t) через о0(0 и подставить результат в (4.29), то получим уравнение, содержащее только неизвестную функцию Оо (£): A(D)o0(Z) + Bt(D)E[o0(i)] = Bz(D)Zo(Z), (4.31)’ где Е[о0], обычно называемая функцией смещения [5.11], строится в результате подстановки в щ(о0, я) найденной из (4.30) зависи- мости я = я*(о0). Уравнение (4.31) имеет точно такую же «струк- туру, как исходные соотношения (4.1), (4.2), с той разницей, что функция /(о) заменилась на новую (также, вообще говоря, нели- нейную) функцию Е(о0). Из прямой части изъято колебательное слагаемое, но его амплитуда и частота входят как параметры в описание F(o0)- Основной особенностью функции является ее глад- кость. Даже для разрывной в нуле нелинейности /(о) соответствую- щая функция имеет ограниченную производную в нуле. Покажем это на примере идеального реле. Имеем в общем случае 5 («) A 1 = 2F {уо [сто, «*(<*«>)]} 1о0=о “ о |о0=0 “°0 9va , дао а0=0 да* доа |ао=о‘ Согласно (4.17) для реле так что д”о = _2_ 9ао о0=0 па ’ da |оц=о = 0, S(a) = 2 зга (4.32) и ограничена при я¥=0. Нетрудно убедиться, что для любой не- четной и почти всюду дифференцируемой /(о) имеет место равен- ство 2Л 1 С df » 4 dq = 25FJ [aeosi|)]di|>] = ?Дя) + уя (4.33) о avo <J0=° что делает понятным обычное наименование величины S (а) как средней крутизны характеристики нелинейного элемента. Линеаризовав (4.31) по Тейлору, приходим к уравнению [Hb(D) + 5(a)S2,(D)]0o(O = ^(D)z»(f); (4.34) оказывается, что это уравнение дает хорошее описание для многих интересных нелинейных проблем. Пример 4,3 (вибрационный усилитель). Во многих системах управления и, в частности, в электромеханических следящих си- стемах [1.3] релейный усилитель используется в так называемом вибрационном режиме. Рассмотрим структурную схему (рис. 5.38), соответствующую такому способу. —
§ 4. РЕАКЦИЯ СИСТЕМЫ НА ВНЕШНИЕ ВОЗДЕЙСТВИЯ 237 Воздействие z2(i), вводимое на вход усилителя, является гармо- ническим: z2(i) = а>, cos ®ot, a Zi(t) медленно изменяется по сравнению с z2(i). Отработка Рис. 5.38 медленного воздействия приближенно описывается линейным соот- ношением 5 («) IIх (D) Я2 (D) 14-5 (a) Zl^‘ причем наличием в p(i) гармонической компоненты можно пре- небречь, если J/2(D) такова, что коэффициент усиления на частоте «И мал. При этом условии гармоническое воздействие почти не про- ходит по обратной связи, так что амплитуда а на входе реле совпа- дает с амплитудой аг. При фиксированном аг качество работы систе- мы близко к качеству работы при использовании линейного усили- теля с коэффициентом усиления S = —. Вместе с тем имеется возможность и перестройки этого коэффициента путем изменения амплитуды внешнего воздействия. О 4.4. Медленная потеря устойчивости. Нетрудно убедиться, что, если исходная система удовлетворяет условиям Т.2.3, то линейная система (4.34) для медленно меняющихся составляющих также устойчива. В противном случае это не гарантировано, и может возникнуть опасное явление, называемое медленной потерей устой- чивости под действием скрытых колебаний [5.11]. Для его описания предположим, что /(о) является ограниченной функцией с достаточ- но большой «почти линейной» зоной и невозрастающей производной (рис. 5.14). Из формулы (4.33) тогда следует, что = —+0. (4.35) аа [а—о ' а->» ' ’ Предположим, что первоначальный расчет выполнен по линей- ной теории, и параметры системы выбраны так, что уравнение Ль(р) + kBL(p}\ = 0 (4.36)' имеет только «хорошие» корни.
2Э8 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ Пусть на вход элемента с характеристикой /(о) проникают вы- сокочастотные внешние возмущения (помехи) z2(f) (вновь можно обратиться к. структурной схеме на рис. 5.38, хотя здесь рассмат- ривается иная ситуация). Если оставаться в рамках.линейного рас- чета, то влиянием таких возмущений на выход можно пренебречь при достаточной инерционности объекта, представленного п. ф. Яг(р). Однако наличие нелинейности приводит к необходимости учесть влияние высокочастотных помех па отработку медленного врздей- ствия. При использовании приближенного уравнения (4.34) полу- чаем, что эта отработка устойчива, только если «хорошими» явля- ются корни уравнения *) AL(p) +S(ax)BL(p) — 0, (4.37) но S (аг) убывает с ростом а-,. Вывод: если передаточная функция линейной части системы, имеет полюс в правой полуплоскости, существенно меньший по модулю, чем частота внешнего возмущения, то это возмущение при достаточно большой амплитуде может вызвать медленную потерю устойчивости. ’ ' - ' На техническом жаргоне иногда говорят, что помехи «забивают» канал управления с ограниченной зоной линейности, а снижение среднего коэффициента усиления не позволяет обратной связи стаби- лизировать собственно неустойчивый объект. «Коварство» этого яв- ления состоит именно в том, что на выходе объекта сама высоко- частотная компонента почти незаметна. Неустойчивость «в малом» по медленной составляющей может проявиться и как неограничен- ный рост Оо(0, и как переход в режим медленных автоколебаний (для оценки последних можно вновь применить прием гармониче- ской линеаризации, но применительно к уравнению (4.31) при 2(1 = 00081). Процесс изменения о(() в целом будет в этом случае представлен суперпозицией колебаний с частотой воздействия и низкочастотных колебаний, частота которых зависит от внутренних свойств системы. Амплитуда колебаний с частотой воздействия так- же медленно изменяется. Практически весьма интересно, что сходные явления могут воз- никать и при отсутствии каких-либо внешних воздействий. Рассмотрим систему (4.1) npnz(t)^O Ах.(П)а(г) + В4П)/[0(4)] = 0. (4.38) В § 3 колебательное решение этой системы разыскивалось в форме гармонических колебаний. Однако возможны значительно более *) По смыслу дела следует интересоваться только корнями (4.37), суще- ственно меньшими по модулю, чем частота воздействия шо, ибо в противном случае нарушается предположение о медленности соответствующей неустойчи- вой моды. .
§ 4. РЕАКЦИЯ СИСТЕМЫ НА ВНЕШНИЕ ВОЗДЕЙСТВИЯ 239 сложные колебательные режимы, не являющиеся даже периодиче- скими. В частности, можно попытаться разыскивать решение в виде (4.27) и применять описанную выше обобщенную схему гармониче- ского баланса. Не повторяя всех рассуждений, сформулируем про- цедуру в окончательном виде. а) Найти частоту как наибольший корень уравнения 1тЯь(г®) = 0, о> > 0. (4.39) б) Найти связь я*(о0) между амплитудой я(/)' <о0(0 в силу уравнения 1 + щ[щ(£), a(i)]Re #b(ico<>) = 0. и смещением (4.40) в) Найти функцию смещения F (сто) ” vo [Оо, а1 |а=а*(ав)« (4.41) г) Составить уравнение для смещения 4b(D)a,(f) + Bb(D)F[0o(f)]==O. (4.42) д) Найти ©и как наименьший корень уравнения <0м < <00, то продолжить процедуру. е) Представить a0(t) в виде (4.39). Если Оо (0 == йм cos-tihut (4.43) я найти функцию ?1.м (М А J F [ам cos ч|>] cos -ф 0 (4.44) ж) Вычислить ам как корень уравнения 1 + (ям) Re HL (/сом) = 0. (4.45) з) Представить окончательный результат в виде О (1) = Ям COS + Я*[ям COS <0м4] COS (Oof. (4.46) Не -приводя конкретного примера применения этой процедуры, укажем лишь, что она, в частности, может быть эффективной, если Hl(p) имеет комплексные полосы с малой вещественной частью, что характерно, для задач управления механическими системами, вклю- чающими слабодемпфироваиные колебательные звенья. 4.5. Статистическая линеаризация. Обобщением метода гармони- ческой линеаризации, используемым при исследовании реакции не- линейной системы на внешнее воздействие z(t), представляющее собой реализацию стационарного случайного процесса, является ме- тод статистической линеаризации [5.6], [5.9], [5.13].
240 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ Решение системы (4.1), соответствующее такому z(i), разыски- вается также в виде реализации стационарных случайных процес- сов o(Z), v(t), а нелинейная связь (4.2) заменяется ее линейным приближением, наилучшим в смысле минимума среднеквадратичного уклонения. Иначе говоря, принимается o(Z) ==/щ +о" (Z), (4.47) v(/) = m; + p°(Z) = mv + A1o"(Z), (4.48) где m<„ — постоянные величины, o°(i), v° (t) — центрированные составляющие, причем mv и hi выбираются так, чтобы была мини- мальной величина М{ (/ [та + о” (0 ] — [ш, + /г, о0 (/) ])2). Это достигается, если mv = M {f [та + а° (t)]} = J j[ma + l]pa(t,)d%s (4.49) —оо ОО ' hi=мктоя м {/ [т°+°0 {t)] °0 {г)}=я I Шт°+р° ® (4.50) где ро(£) — плотность распределения процесса o°(i), а d„— его дис- персия. Таким образом, величины тъ и А, оказываются зависимыми от заранее неизвестных параметров m0, da, а также, вообще говоря, от неизвестной формы закона распределения. Простейший вариант метода статистической линеаризации свя- зан с введением [5.13] дополнительной гипотезы о нормальности, процесса о°(/), т. е. с введением предположения, что X 1 ~ После вычисления интегралов (4.49), (4.50) для любой конкретной функции /(о) можно найти соответствующие зависимости (табли- цы можно найти в [5.6], [5.9] и др.) mB = m„(m0, d0), hi = ht (ma, da). В частности, для идеального реле *) имеем • _ - — ГО, = 2Ф ДД h^-^У ^е (4.52) \ V / V я •) Здесь, как и рапсе в гл. 4, Ф(ё) — интеграл вероятностей.
s 4. РЕАКЦИЯ СИСТЕМЫ НА ВНЕШНИЕ ВОЗДЕЙСТВИЯ 241 а для элемента с ограниченной зоной линейности тв = (14- та) Ф — (1 — т0) Ф (4.53) Отметим, что гипотеза (4.51) не единственно возможная, хотя и естественная, если воздействие z(t) является нормальным. Если же распределение z(i) отлично от нормального, то может оказаться целесообразным использовать иные предположения. Рассмотрим, в частности, случай, когда z° (i) = а2 cos (cof 4-ф), (4.54) где ах, ю — детерминированные величины, а ф — случайная констан- та, равномерно распределенная в интервале [0, 2л]. Каждая реали- зация такого процесса является детерминированной гармонической функцией. Поэтому разумно предположить, что и реализации о0 (г) близки к гармоническим с одной и той же амплитудой а и частотой <о, отличаясь лишь случайным сдвигом по фазе. Нетрудно показать, что плотность вероятности значений о°(£). в любой момент t равна 1410», (4.55: V Q, IB I > ах причем ао = -у а4. Подставив (4.55) в (4.49), (4.50), получим а л/2 т» = IT f ^т° + ~ = V j f(rno + a cos ф) dqt —а —л/2 ‘ а . л/2 1г1 = А ( U (та + £) («2 — i2)~1/2 dl = ~ 1 f(ma 4- a COS ф)созф йф. ла J па J, —а —л/2 Сравнивая значения интегралов в правых частях с выражениями для среднего значения и коэффициентов гармонической линеариза- ции, полученными в § 3, убеждаемся в их тождественном совпаде- нии (с точностью до замены обозначения т„ на о0). Таким образом, гармоническую линеаризацию можно трактовать как частный слу- чай статистической при гипотезе (4.55). Качественный характер по- ведения функций zraB(/n0, d0), d„) слабо зависит от гипотезы о А, А, Цервозваиский
242 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ распределении. В частности, для любой ограниченной функции с не- возрастающей производной имеет место свойство, аналогичное (4.35): df 1 С* rt-f г J f *0. (4.56) — оо Основная процедура метода статистической линеаризации также близка к процедуре метода гармонической линеаризации и заключа- ется в следующем. а) Составить уравнение для средних составляющих AL(Q)ma + — Bz(0)mz. (Л-Ы) б) Составить линеаризованное уравнение для центрированных составляющих [4t(D)+M^, А)ВДП)]о’ = Вг(П)2’. (4.58) в) Предполагая известной спектральную плотность 5, (ы) внеш- него воздействия z°, вычислить da: ОО J (г<о)+Агь(г®) Sz^d®* <4,59> —- ОО рассматривая при этом hi как параметр. г) Найти решение системы уравнений , , . - А(°) та ,, mB(rria, da)— BL(0) * (4.60) da[ht(ma, da)] = da. (4.61) Пример 4.4. Рассмотрим простейшее уравнение (TD + l)<j(f) + kv(t) = kz(t), p(i)“ signo(Z). Тогда для средних составляющих имеем та + кт„ = kmz, а для центрированных If °° (0 = I’D + 1 + kh^ Z° Предполагая, что &(©)=!, получаем _ 1 Г . fc2rf<o ___________________к_________ 2,12» r2®2 + (l + ^x/ 2T^4- + fexj
5 4. РЕАКЦИЯ СИСТЕМЫ НА ВНЕШНИЕ ВОЗДЕЙСТВИЯ 243 Используя формулы (4.52), приходим к системе уравнений к = ктг — та, 2Т 1 ~ + 2 __ _та 1 1/_2_ « 2do — Результаты решения Этих трансцендентных уравнений при тг = 1, 5, Л = 1 для различных значений параметра у = 1/(27’) представлены на рис. 5.39. □ При воздействии стационарного случайного процесса на систе- мы, не обладающие, устойчивостью в целом, возможны весьма слож- ные режимы, теория которых недостаточ- но разработана. Формальное применение метода статистической линеаризации мо- жет, например, выявить несколько реше- ний с различными значениями диспер- .sit) ---F ''ЛАЛ f Рис. 5.39 Рис. 5.40 сии d„. Прямые вычисления на ЭВМ показывают, что наличие таких решений свидетельствует о возможности реализаций, характер ко- торых представлен на рис. 5.40 (средняя «мощность» колебаний остается на отрезках случайной длительности близкой к одному из найденных значений дисперсии), однако даже правдоподобного до- казательства справедливости этого предположения в общем слу- чае нет. Случайные возмущения, основная «мощность» которых сосредо- точена в области высоких частот, могут вызывать точно такие же явления, что и гармонические высокочастотные возмущения, в част- ности, медленную потерю устойчивости. С детальным описанием различных модификаций метода статистической линеаризации, по- зволяющих анализировать подобные процессы, можно познакомить- ся по книге [5.9]. В заключение приведенного краткого обзора методов приближен- ного исследования колебательных процессов в нелинейных системах подчеркнем, что их главным достоинством является возможность получения наглядных качественных представлений. При расчете режимов в конкретных системах с полностью задан- ным описанием в настоящее время эффективнее использовать про- цедуры численного интегрирования на ЭВМ. Однако и в такой си- 46*
21Л ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ туации ориентировочные представления о характере решения, дава- емые методами типа гармонической или статистической линеариза- ции, исключительно важны, поскольку без них трудно правильно выбрать шаг сетки по времени и даже сам метод численного инте- грирования. § 5. О выборе законов управления с учетом нелинейных факторов 5.1. Постановка задачи. В предшествующем изложении мы явно или неявно считали, что закон управления с обратной связью вы- бран на основе линейной теории» и изучали лишь те «неприятно- сти», которые могут возникнуть в силу нелинейности элементов, с помощью которых реализуются «линейные рекомендации». Конеч- но, естественнее было бы подходить иначе: предварительно выявить возможные нелинейности и выбирать закон управления с их учетом так, чтобы цель управления обеспечивалась наилучшим образом. Четкая постановка этой очень трудной задачи дана ниже, в гл. 9 и 10, причем заранее можно сказать, что универсальных рецептов ее решения не существует. Рис. 5.41 Здесь же мы • ограничимся несколькими замечаниями и при- мерами. Предположим, что целью управления является обеспечение мало- сти ошибки е(0 (рис. 5.41). Заранее известно, что нелинейными яв- ляются либо характеристика датчика рассогласования /,(о,), либо ха- рактеристика /2 (ог). усилителя в силовом блоке, оказывающей управ- ляющее воздействие на объект. В первом случае невозможно исполь- зовать для формирования закона управления непосредственно сигнал ошибки — доступен лишь выход датчика v (t). Во втором — невозмож- но произвольно задавать сигнал управления, поскольку формируется лишь вход 02 (0 нелинейного усилителя. Выбору подлежат преобра- зующие свойства р о2 блока П. Поскольку известны Способы фор- мирования эффективных, законов управления при отсутствии нели- нейностей, то естественна первая и практически основная тенден- ция — при выборе преобразователей обеспечить близость поведения системы к линейной с желаемыми свойствами, определяемыми п. ф. Нр(Р) от ошибки е(0 к выходу y(t). Обеспечить точное совпадение поведений линейной и нелинейной системы, как правило, невозмож-
§ 5. О ВЫБОРЕ ЗАКОНОВ УПРАВЛЕНИЯ 245 ио; однако цель выбора состоит в том, чтобы сделать различия воз- можно менее существенными. При этом можно использовать не- сколько простых приемов. 5.2. Последовательная линейная компейсация. Закон преобразо- вания в блоке П выбирается линейным, задаваемым п. ф. Ht(p). Структурные схемы с таким блоком, при различных возможных расположениях нелинейного элемента (мы пока умеем анализиро- вать только систёмы с одной нелинейностью!) представлены на 6 Рис. 5.42 рис. 5.42, а, б. В обоих случаях уравнения системы представимы в стандартной форме, причем Н^-Н^Щр). (5.1) Пусть нелинейная характеристика удовлетворяет требованиям, сфор- мулированным в одной из теорем 2.1, 2.3 дибо 2.4. Тогда Hi(p) может быть выбрано так, чтобы Нь(р) удовлетворяло соответствую- щему частотному условию, если Н(р) удовлетворяет условиям при- менимости метода компенсации (гл. 3, § 3). При этом по крайней мере гарантируется устойчивость в целом нелинейной системы. Рас- смотрим также прием [5.9, § 2.5], связанный с методом статистиче- CKoii линеаризации. Пусть s(t), N(t)— некоррелированные случай- ные процессы с дробно-рациональными спектральными плотностями <Ss(©2), 5К(®2). Используя метод, описанный в § 2 гл. 4, можно найти п. ф. Я3(р) такую, что достигается минимум дисперсии ошибки в линейной системе, представленной на рис. 5.42, в, при
246 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ ограничении на дисперсию управления и(г)=Я"1(В)у(0. Попытаемся приблизить поведение нелинейной системы, представ- ленной на рис. 5.42,6, к этой оптимальной линейной. Функцию /(а) будем считать нечетной. В пределах точности метода статистической линеаризации нелинейная система будет иметь ту же дисперсию ошибки, что и оптимальная линейная, если Я1(р)/г1(й<,)я(р)=я:(р)[1-я:(р)]-1г. (5.2) где Л, (do)' —коэффициент статистической линеаризации нелиней- ности /(о), a da — дисперсия процесса на ее входе. В том же при- ближении du = hf (da) da. (5.3) Если ограничение достигается, т. е. du == ёц, то для определения da имеем уравнение tdahi (do) = 6U. (5.4) Пусть его решение d* существует, тогда Я4(р) определяется фор- мулой компенсации: , ях (р)=я: (р) [1 - я: (р)] -1 ь, (d:) я (р)]-\ (5.5) Однако решение может не существовать, если нелинейная функция ограничена, 1/(о)1Сгг. Действительно, в этом случае при любом входном процессе o(t), d„Cu2, и назначение би > й заведомо недо- пустимо. Более того, можно доказать справедливость оценки hr Г~2~ - х . -i/T - ,=С "1/ —y~ut откуда следует, что недопустимо ou> у" » л Поэтому ограниченность нелинейности, т. е. возможного уровня управляющего воздействия, приводят к сужению класса линейных систем, приближение к которым возможно. Для гарантии разреши- мости при не слишком больших da обычно принимают 8и‘=О,7й<У~й. (5.6) В случае нелинейности типа идеального реле дисперсия управления (выхода реле) фиксирована, du = 1, что и следует учесть при реше- нии линейной задачи. Передаточная функция Я4 (р) определяется формулой ях (р)=я: (р) [1 - я: (р)]-1 я-1 (р) (5.7) с точностью до постоянного сомножителя, от которого зависит лишь дисперсия сигнала о (г) иа входе реле, но ле дисперсия ошибки.
ear § 5. О ВЫБОРЕ ЗАКОНОВ УПРАВЛЕНИЯ 247 Пример 5.1. Пусть нелинейная система имеет вид, представлен- ный на рис. 5.42, б, причем задано, что 2Х ' 4 sДш2) = dSf SN(со2) = О, Н(р) = уТ, , j. со *т* As ‘ а нелинейность /(о)—идеальное реле. Найдем оптимальную п. ф. замкнутого контура по критерию минимума дисперсии ошибки в ограничением на дисперсию управления, du = 1. Воспользовавшись результатами гл. 4 (П.2.3), имеем Н* (п\ = J______________!____ где согласующий параметр 0 находится из условия л. (1-е)г(п, + Уё) , du~yo(ry54s + i)8 5 Если dtK3T < 1, то У 0 « d„K,T, и можно принять, что Н* (р) = _ => н (р) = £р+1 ku , T4sdsp + 1 1 Р * где к, произвольно. □ . 5.3. Нелинейная компенсация. Этот простой прием сводится к следующему. Пусть характеристика нелинейного элемента /(о) та- кова, что /(0) === 0, и монотонно возрастает При lol +о. Тогда, введя последовательно с этим элементом другой, также нелинейный, но имеющий обратную характеристику, мы добиваемся линейности пре- образования в целом на этом отрезке. Пример 5.2. Пусть датчик имеет характеристику, аппроксими- руемую при loj + о, функцией Тогда можно преобра- зовать выходной сигнал n(t) датчика с помощью'нелинейного ком- пенсатора, задаваемого уравнением P1 = <p(p)^vI/s. Очевидно,, что vt = ktf*ot, т. е. нелинейность компенсирована. Есте- ственно, что последовательная компенсация невозможна на участках, где функция постоянна или начинает падать. Лучшее, чего можно добиться этим способом,— это расширить зону линейности в преде- лах монотонного изменения. Нельзя избавиться таким способом ни от зоны нечувствительности, пи от ограничений. 5.4. Вибрационное «сглаживание» зоны нечувствительности. Для ликвидации эффектов, связанных с наличием зоны нечувствительно- сти в датчике рассогласования, можно применить прием, близкий н уже описанному в П.4.3, Введем на вход датчика (рис. 5.43) допол-
♦ 248 ГЛ. 5. ВВЕДЕНИЕ В НЕЛИНЕЙНУЮ ТЕОРИЮ 41 де пительпый высокочастотный (по сравнению с отрабатываемым воз- действием) сигнал. Выходной сигнал датчика пропустим через фильтр, не искажающий частотную характеристику в рабочей поло- се часто?, но подавляющий высокочастотные компоненты. Тогда по ] a costaf • отношению к медленному отраба- тываемому сигналу преобразую- щие свойства датчика характери- зуются функцией i?o[e(£), «], по~ скольку б (Г) совпадает с медлен- ной компонентой в о (Г). Если амплитуда а больше полуширины Д зо- ны нечувствительности, то va как функция б (Г) не имеет такой зоны. В частности, если ГО,/ |о|<Д, (о±Д, jо|> Д,. то v0 (coi а) = — [а sin + (е — Д) фх — a sin ф2 + (е + Д) (л — ф2)], (5.8) a cos ф! = Д — е, асозф2=-(А + е), |Д —sl<a, |Д + е1<а, и 2 л —1 л 2,-1 = — arccos Да ~ 1-----Да . е=о л л Сглаженная характеристика п0(е, а) монотонна по е, и к ней может быть применена процедура последовательной нелинейной компен- сации. 5.5. Нелинейные обратные связи. Все описанные приемы служи- ли одной цели — по возможности уменьшить влияние нелинейных факторов на поведение системы в целом. Однако этот путь не явля- ется единственно целесообразным. В ряде ситуаций следует специ- ально вводить нелинейные элементы в систему для того, чтобы при- дать ей свойства, которых никакая линейная не имеет. В § 1 приводился пример, свидетельствующий о том, что релей- ное управление может иметь преимущество с точки зрения быстро- действия. В гл. 9 будет доказано, что этот пример иллюстрирует об- щее правило, в силу которого оптимальные но быстродействию за- коны управления имеют релейный характер. Здесь же мы на элементарном примере осветим другое достоин- ство некоторых нелинейных систем — возможность обеспечивать управление с малыми ошибками при очень плохой информации о параметрах объекта. Пример 5.3. Пусть объект линеен и описывается уравнением 1-го порядка (D — h)y = a. (5.9) Объект неустойчив (й>0)', но вначение h неизвестно. Если выбра- на линейная обратная связь и = —ку, то система будет устойчивой.
§ 5. О ВЫБОРЕ ЗАКОНОВ УПРАВЛЕНИЯ 249 только если k > h. Создать линейную обратную связь с неограни- ченно большим коэффициентом усиления невозможно; поэтому най- дется h, при котором замкнутая система окажется неустойчивой. Попытаемся использовать нелинейную связь и==— ку3, к>0. Замкнутая система описывается нелинейным уравнением Dy = hy - kys и, очевидно, имеет три положения равновесия 0, ± -% • Положе- ние равновесия у0 = 0 неустойчиво в малом, однако два других — устойчивы. Действительно, введем переменную V = у3. Тогда, ум- ножая (5.9) на у, получим yDy = уг (h — ку1) или lD7=V(/i — kV), а так что _ D7<0 при F>-|t т. е. |у|> DF >0 при F т. е. | у | < j/-p Таким образом, при любых отклонениях от нуля и любых h выход системы стремится к одному из положений равновесия ±.1h/k. При- мер иллюстрирует ту идею, что с помощью нелинейных обратных связей можно добиться стабилизации системы, хотя, как правило, без гарантии, что установившийся режим точно совпадает с же- лаемым. О Более полное освещение проблемы использования нелинейных законов управления в условиях большой неопределенности дано в гл. 10, И.
ГЛАВА 6 МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ В ЛИНЕЙНОЙ ТЕОРИИ § 1. Описание в нормальной форме 1.1. Основная модель. В данной главе мы возвращаемся к линей- ной теории, однако за основу возьмем другой подход, открывающий принципиально новые возможности анализа систем и синтеза зако- нов управления. В гл. 2 была выдвинута гипотеза о том, что описание системы может быть дано путем задания дифференциальных уравнений звеньев и алгебраических соотношений, выражающих связи между звеньями. Описанные в дальнейшем методы (гл. 2—4) можно на- звать операторно-структурными, поскольку первичное описание да- валось на >рыке операторов звеньев и структуры связей. Здесь же в качестве первичной математической модели примем систему урав- нений следующего вида: n m dx. — X1 т л ~ai •= 2l + bi^ 1 = ^...^, ,, hl (1-1) Dl== 3 = !_>; • » • > st i=l называемую описанием в нормальной форме или описанием в про- странстве состояний. Последнее название связано с тем, что при vk = 0 достаточно за- дать начальное значение переменных Xi(t) для того, чтобы опреде- лить их значения, а следовательно, и значения выхода в любой по- следующий момент, т. е. задание Xi(t0), i==l, ..., п, полностью определяет состояние системы Xt(t), i>i0. В модели (1.1) имеется п взаимосвязанных дифференциальных уравнений 1-го порядка, в правую часть которых входят пг различ- ных внешних воздействий щ, а также s алгебраических соотноше- ний, связывающих s выходных (управляемых) процессов yt с пере- менными состояния xt,_ число которых (и) совпадает с числом уравнений. Коэффициенты a4j, bih, Сц называются параметрами мо- дели.
§ 1. ОПИСАНИЕ В НОРМАЛЬНОЙ ФОРМЕ 251 Уравнения (1.1) удобно представить в матричной форме *) { = Ах Bv, у = Cxti (1-2) тде х = (хь х2, ..., хп) — вектор (матрица-столбец) переменных со- стояния, v = (vlt vu ..., vm) — вектор входных воздействий, у = = (у,, Уг, у„) — вектор выходов, А = {ау, i = l, 2, ..., ге; / = 1, 2, ..., п}, ' В = <дл, i = 1, 2, ..., ге; к = 1, 2, ..., т}, С = {с„, 1 = 1, 2, ..., s; 1 = 1, 2, ..., п} — матрицы параметров. Вся информация о свойствах объекта со- держится теперь в числовых таблицах-матрицах параметров. При анализе объектов и синтезе законов управления можно будет опи- раться па стандартные правила преобразования этих таблиц. Сопоставим (1.1), (1.2) с операторным описанием звеньев и си- стем, введенным в гл. 2. 1.2. Описание звена в нормальной форме. В §1 гл. 2 было при- нято, что любое, звено системы может быть задано с помощью одно- го дифференциального уравнения, которое в операторной записи имеет вид a(D)p(l)=?(D)v(l), (1.3) где ' a(D) = D" + an-iDn_1 + ... + a0; p(D)=M>’’l + pm-1Dm-, + ... + p0. Это уравнение полностью определяет изменение выхода y(t), если задано входное воздействие v(t), а также начальные значения y(t) и его производных вплоть до (п — 1)-й. Теорема 1.1. Если т<п, то решение у(t) уравнения (1.3) сов- падает с решением уравнения в нормальной форме (1.2), если при- нять **) . О 1 0 ... О О 0 1 ... О (1-4) где величины Ъ2, ..., Ьп находятся последовательно из системы *) Сводка обозначений и необходимых сведений из теории матриц дана в Приложении 2. **) Если матрица А имеет вид (1.4), то говорят, что она задана в форме Фробениуса.
252 ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ уравнений bi — Рп-Ь otn—ibi 4" b% = Pn—j, ......................................... (1.5) a,ibi + a.zbi +... + an-ibn-i 4- bn == p0, а начальные условия согласованы следующим образом! xi (0) = у (0), хг (0) = Ъу (0) - Ъщ (0), ..хп (0) = = D’‘-ij/(0)-b1D’‘X0)-...-bn_1p(0)'. (1.6)' Доказательство фактически содержится в доказательстве Т.2.1, гл. 2. Действительно, там было показано (формула (2.44)), что уравнение (1.3) эквивалентно системе Dxi — xi+i 4- biv, i — 1, ..., n — 1, t ’ (1.7) Dxn — —а0Ж1 — ... — an-ixn -f- bnv, причем при m <Z n у = хъ Раскрывая матричную запись (1.2) в предположении, что матрицы Л, В, С имеют вид (1.4), приходим именно к (1.7). Формулы (1.6) также были уста- новлены в гл. 2 (см. (2.46)). Пример 1.1. Рассмотрим электрическую пень как звено, связы- вающее вход (напряжение) к(/) = н(7) с выходом (током) y(t)=* ~i(t) с помощью уравнения (п* + ~D+ = — (1.8) Применяя правило, заключающееся в Т.1.1, дадим описание в нор- мальной форме. Здесь п — 2, т — 1, Л 1 я л и 1 а1 — ~£l а0 ~Ро — Р1 — и, согласно (1.5), р2 = рв_а1ь1 = _^.. Имеем в силу (1.2), (1.4): или, в виде системы скалярных уравнений, , 1 1 Л В .. п. -^ = а;2 + тщ —а = — хг~-2щ у = х„ □ (1.9) Вывод 1. От операторного описания звена можно перейти к описанию в нормальной форме, используя стандартную процеду- ру, если п. ф. звена является правильной дробью.
§ 1. ОПИСАНИЕ В НОРМАЛЬНОЙ ФОРМ и 253 Этот переход по существу содержится в описании звена с по- мощью структуры, содержащей только усилители и интеграторы, причем в качестве переменных состояния могут быть взяты выходы интеграторов. Структуры этого типа, как было показано в § 2 гл. 2, неединственны. Соответственно с этим неедииственно и описание в нормальной форме, которое может быть эквивалентно уравне- нию (1.3). В качестве примера другого описания приведем уравнения, сле- дующие из структурной схемы на рис. 2.11, б (при п>т): Dxi = — а^хп + 1)х2 — Xt — (Zi;rn + Рщ, •тп-4-1 CtjnXn "i РтУ, Подчеркнем, что переменные имеют здесь другой смысл, чем в системе (1.7). Тем не менее и (1.7) и (1.10) эквивалентны (1.3) в том смысле, что они определяют один и тот же выходной процесс y(t), если, конечно, прилагается одно и то же входное воздействие и подобраны подходящие начальные условия. 1.3. Описание системы звеньев. Покажем далее,, как привести к нормальной форме описание системы, состоящей из множества звень- ев, заданных операторными уравнениями ai(D)pi = pi(D)n<, (1.11) где i — индекс (номер) звена, Vi— его вход, yt— выход, a,(D), §i(D) — операторные многочлены такие, что deg a4 > deg 0,. Связи между звеньями зададим, как ив § 2 гл. 2, структурными соотношениями = ЕъзУз + Щ,. (1.12) i ' . где Vi — внешние входы, а — величины, равные нулю или ±1. От каждого из уравнений (1.11) по описанной в Т.1.1 процедуре можно перейти к эквивалентной записи в нормальной форме = AV + S(%, й = Л(й( (1.13) где введен индекс i для векторов переменных состояния каждого звена и соответствующих матриц.
254 ГЛ. в. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ Используя структурами связи, можно исключить все внутренние входы: = + B^Vi. (1.14) 3 Для объединенного вектора состояния всей системы х =» = (ж(|), хт, ...), рассматриваемого как матрица-столбец, состоящая из блоков-столбцов х(,), система (1.14) переписывается в стандарт- ном виде £~=Ax + Bv,: у = Сх, (1.15) где v2, ...)', у = (У1, у г, ...), В = diag C = diag{C<,)}, А = diag{A(i))+ ВГС. При этом использованы обозначения для блочно-диагональных матриц (см. Приложение 2, п. 36), а также введена матрица Г =• = {fij), обычно называемая матрицей инциденций .(«соседства») звеньев. - Если управляемыми являются не все выходы звеньев, а лишь некоторые из них или линейные комбинации выходов, то вводится вектор внешних выходов у, связанный с у алгебраическим соотно- шением у = Му, где М — матрица с постоянными элементами — ко- эффициентами влияния каждого звена на каждый общий выход; тогда . _______ _ у=МСх=*Сх, СЛМС, (1.16) Вывод 2. Структурно-операторному описанию системы может быть сопоставлено эквивалентное описание в нормальной форме. 1.4. Естественный характер описания в нормальной форме. Вы- ’вод 2 важен в теоретическом отношении (мы ничего не теряем, ис- пользуя описание в нормальной форме, по сравнению с ранее изу- ченным), однако во многих случаях в описанных процедурах пре- образования нет необходимости, поскольку нормальная форма явля- ется естественной для первичного описания реальных объектов управления. Пример 1.2. Вновь рассмотрим электрическую цепь, состоящую из последовательных соединений элементов В, L, С. Запишем урав- нение цепи сразу в переменных состояния, взяв в качестве таковых напряжение на емкости х, = ис (117) и поток через индуктивность (потокосцепление)’ х2 = Т. • (1.18) Тогда из уравнений теории цепей J-k Tt+Bi + uc^ut Ч-Li (1,19)
§ Г. ОПИСАНИЕ В НОРМАЛЬНОЙ ФОРМЕ 255 следует нормальное описание (v^u, yBi) ~dt — X1 ~‘Tx* + Vs У’я*'т;хя* (1.20> Оно не совпадает с (1.9), где переменные были выбраны в силу формальной процедуры Т.1.1, но, очевидно, приводит к той же опе- раторной связи «вход-выход» (1.8). □ Пример 1.3. Электромеханическая система (усилитель — двига- тель— редуктор —вал нагрузки) была описана в § 2 гл. 2 (П.2.2), причем первичным было описание именно с помощью дифференци- альных уравнений 1-го порядка и алгебраических связей. Рекомен- дуется проверить самостоятельно, что при введении переменных x = (xlt ж5), v = (vi, v2), где Xi = 1я, Ж2 = фд, = ®д, Xi = ф, х5 — •=-«>, Vi = ию, v2 = тв, эти уравнения могут быть записаны в виде (1.2), причем 7?„ г — _5 0 — е 0 0 ^я . ^я 0 0 1 0 0 (1 0 л = — — . гЬя rJa 0 0 0 в = '!о 0 0 0 • 0 ООО . 0 1 [о — wal С 0 ~ 0 rJH с J н 0 В качестве выходов системы могут рассматриваться либо только р, = = ф, либо также р2 = = <о, ys — xi = i„ (при построении «внутренних» обратных связей по угловой скорости и току, как в § 7, гл. 3), либо их комбинация = xt —р х2 == ф — у фд, имею- щая смысл упругой деформации выходной ступени редуктора, также представляющей интерес при построении «внутренней» обратной связи, улучшающей динамическое свойство системы. Таким образом, можно записать в матричном виде где Напомним теперь, что в аналитической механике (см., напри- мер, [6.1]) доказана возможность представления описания механи- ческой системы с помощью системы дифференциальных уравнений, включающей только 1-е производные фазовых переменных (обоб- щенных координат и обобщенных скоростей, или обобщенных коор-
258 гл. в. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ динат и импульсов). В линейном случае этим уравнениям можно придать вид (1-2), считая фазовые переменные переменными состоя- ния системы Аналогичным образом в «естественных» пере- менных типа «токи через индуктивные элементы и заряды на ем- костях» или «потокосцепления и напряжения на емкостях» сразу строится описание электрических цепей в нормальной форме, как это было сделано выше в простейшем примере. То же касается и смешанных электромеханических систем, где в основу могут быть положены уравнения Лагранжа — Максвелла, элементарно приво- димые к стандартному виду. Наконец, уравнения химической кине- тики (в том числе и кинетические уравнения теоретической биохи- мии и биофизики (см., например, [6.8])) обычно естественно имеют вид связей скоростей изменения концентраций (производных от фазовых переменных) с их текущими значениями (самими фазовы- ми переменными). При линеаризации этих связей вновь можно по- лучить уравнения (1.1) или (1.2). Мы не будем описывать конкрет- ных процедур «стандартизации» описания различных реальных про- цессов, поскольку они проще осуществимы в каждом конкретном случае. Отметим лишь, что уравнение (1.2) можно обобщить, запи- сывая y — Cx + CvV, (1.21) где — постоянная матрица. Это эквивалентно предположению, что входные воздействия мо- гут оказывать воздействие на выход безынерционно, через статиче- ское преобразование, коэффициентами которого и являются элемен- ты матрицы Cv. Доказательство того, что в таком виде представимо описание си- стемы, состоящей из любых строго реализуемых звеньев, по сущест- ву содержится в доказательстве Т.2.1 гл. 2. § 2. Анализ систем Изучение свойств линейных систем, описываемых уравнениями Dx(Z) = Ax(t) + х(0) = хт, y(t) — Cx(t), t>0, (2.1) где А, В, С — постоянные матрицы, можно вести различными спо- собами. 2.1. Применение операционного исчисления. Введем обозначения X(p) = S'{x(/)}, V(p} = S{v(t)}, Y (р) = 3?{y(t)} - (2.2) для S’-образов соответствующих матриц. Учтем при этом, что S’-об- раз матрицы есть матрица, составленная из S’-образов ее ска- лярных компонент. Поэтому для матриц справедливы те же формулы операционного исчисления, что и для скалярных величин. *) Термин «вектор фазовых переменных» часто используется применитель- но к вектору в (1.2) независимо от природы переменных.
§ 2. АНАЛИЗ СИСТЕМ 257 В частности, имеем &{Dx(t)} = pX(p)-x(0). (2.3) Тогда из (2.1) получаем алгебраические уравнения PX(p)-xw~AX(p)A-BV(pY Y(p) = CX(p), (2.4) откуда Х(р)~Ф(р)ж‘°> + Ф(р)ДУ(р), У(Р) = СФ(р)х^ + СФ(р)ВУ(р), (2.5) где *) Ф (р) Д (pl„ . — А) *. При х(0)= 0 получаем X(p) = Hvx(p)V(p), Y(p) = H^(p)V(p), (2.6) причем введены обозначения для матричных и. ф. Нсх(р) = Ф(р)В, НМ^СФ(Р)В. . (2.7) Очевидно, что формулы типа (2.6), (2.7) можно получить непосред- ственно из (2.1), если рассматривать оператор D как число. Тогда х (t) = [D/„ - A Y^Bv (t)^x(t)- IItx (D) v (t), , y(i) = 4DZB-4]-1fii;(Z)^y(0 = ^(D)i;(t), U } где HCX(D), Нху(Ъ) — операторные матричные n. ф., отличающиеся от введенных выше комплексных лишь аргументом. Используются и матричные структурные схемы с обобщенным изображением связей и матричными п. ф. Рис. 6.1 Так, непосредственно по уравнению (2.1) составляется структур- ная схема, представленная на рис. 6.1, а. Та же система мо- жет быть представлена и в виде, показанном на рис. 6.1, б или 6.1, в. Схема на рис. 6.1, а содержит п интеграторов (в блоке с п. ф. J_/n) и удобна для построения аналоговых ВУ, позволяющих вы- числить x(t), y(t) по заданным v(t). Она является матричным обоб- щением схем на рис. 241, которые были пригодны только для звена со скалярными входом и выходом. Уравнение (2.6') дают лишь формальное выражение x(t), y(f) через вход v(t). В них не видно влияние начальных условий. Явное *) Здесь и далее 7„ — единичная матрица размерности п X п, где п — раз- мерность х, называемая также размерностью системы (2.2), 17 а. а., Первозванский
258 гл. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ представление можно получить, применяя к (2.5) теорему о сверт- ке. Имеем; t х (t) — <p (t) х(0> 4- J hm (х) v (t — т) dx, ° t (2.8) у (t) = Сф (t) ж<°> + J hvy (т) v (t — т) dxf о где kvv(t), t 0,—матричные весовые функции, являющиеся оригиналами Hvx(p), Hxv(p) соответственно, ф(£) —оригинал Ф(р). Вычисление оригиналов для матриц сводится к вычислению ори- гиналов для каждой компоненты в отдельности. Обратим внимание на то, что все компоненты Ф(р), а следова- тельно, Н„х(р), Hvv(p) являются дробно-рациональными функция- ми р. Действительно, Ф (Р) = (р^п — -А)"1 — №п — ^)Пв (2.9) где через а(р) обозначен определитель матрицы р!п — А, а индекс «П» использован для обозначения присоединенной матрицы. Опре- делитель р1п — А является многочленом степени п, а присоединен- ная матрица имеет своими компонентами алгебраические дополне- ния элементов той же матрицы, которые также являются многочле- нами степени ниже п. Поэтому все компоненты Ф(р) являются пра- вильными дробями с одинаковым знаменателем а(р), называемым характеристическим многочленом матрицы А, или характеристиче- ским многочленом системы (2.1). При п — 1 имеем так что ф(£) = еА‘. (2.10) Это же обозначение сохранится при произвольном п>1, хотя ф(£) оказывается уже матрицей и называется матричной экспонентой. Из указанных выше свойств компонент Ф«(р) матрицы Ф(р) следует, что любая компонента ее оригинала фу (0 = 2 (2.11) V=1 где Xv — корни а(р) (многочлена, стоящего в знаменателе), a cOv — константы, вычисляемые при разложении Ф«(р) на простейшие дроби. При наличии кратных корней ci}4 могут быть многочленами от t степени, не выше кратности корня. Напомним, что корни характеристического многочлена а(р) называются собственными числами (с. ч.) матрицы А.
S 2. АНАЛИЗ СИСТЕМ 259 Представление (2.11) показывает, что матричная экспонента яв- ляется матрицей, каждая компонента которой — линейная комбина- ция скалярных экспонент e?‘vt, v = l, 2, ..п. Из (2.7), (2.10) следует, что hvx(t)^eA‘B, hvy(t) = CeAiB; (2.12) поэтому весовые матрицы вновь имеют своими компонентами ли- лейные комбинации тех же С использованием матричной экспоненты перепишем (2.8) в виде i х (t) = eAtx° + J eAxBv (t — t) dxf (2.13) у (t) = CeAtx° + J CeAxBv (t — r) dx, о Из свойств компонент qty(f) матричной экспоненты следует, что <po (t)-*0 при $-*<», если все с. ч. %» имеют отрицательные веще- ственные части. При том же условии устанавливается, что любая компонента весовых функций hvx(t), hvy(t) абсолютно интегрируема и существуют их моменты, причем доказательство сводится к при- менению рассуждений, данных в гл. 2, § 3, к каждой из компонент. Поэтому при условии ReXv<0, v = l, .... п (2.14) справедливы следующие свойства: 1. Система устойчива по начальным условиям, т. е. при v(t)sO и конечном ж" #= 0 имеет место ж(г)->0, у(1)~* 0 при t-+°o. (2.15) 2. Система устойчива по входу, т. е. из ограниченности воздей- ствий следует ограниченность всех фазовых переменных и всех ком- понент выхода. 3. Если у(£) = авегш', t>0, (2.16) то установившаяся реакция y„(t) дается формулой 4. Если у«, (t) — Нщ (ia)aveia‘. (2.17) v{t)= 2 akt\ (2.18) то h=o N k fe=o (2-19) 17*
260 ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ где (2.20) Мы убеждаемся в достоинствах матричных обозначений: все формулы, полученные в гл. 2, сохраняют свой внешний вид, если в них использовать соответствующие матричные п. ф. и матричные частотные характеристики. Неприятность заключается лишь в том, что построение матрич- ных п. ф. по формулам (2.7), (2.9) требует громоздких аналитиче- ских выкладок с полиномиальными матрицами. Поэтому в теории и практике вычислений широко применяется другой подход. 2.2. Изменение базиса. Введем в уравнениях (2.1) замену пере- менных я(/) = 5х(0, (2.21) где S— неособая постоянная (п X п) -матрица. Тогда уравнения (2.1) примут вид: иж(0=Аг(О+5п(о, оо, х(0)=ж<0), y(o = Cx(o, (2.22) где введены обозначения Л = 5-‘Л£, 5 = S-‘B, C = CS, (2.23) xw = 5-^(l”. (2.24) Переход от исходных уравнений (2.1) к (2.22) принято назы- вать изменением базиса внутреннего описания, а матрицу S — мат- рицей перехода к новому базису. Подчеркнем, что преобразованные уравнения эквивалентны ис- ходным. Зная x(t), легко найти x(t). Более того, матрица А. имеет тот же характеристический многочлен а(р), что и матрица А. Очевидно и то, что связь «вход-выход» никак не может зависеть от изменения базиса: в (2.22) входят те же функции v(i), y(t), что и в (2.1). Можно и формально проверить тождество*) Tltv (р) Д С (р!п - I)-1 В = С (Р1п - Л)-1 В д Нъу (р)х (2.25) т. е. п. ф. «вход-выход» не изменяется. *) Проверка сводится к цепочке тождеств: С(р1п-А)~'В == CSS-'1 (р1п - A)~‘SS~lB CS-!(pI„ - A'r'SB B C[S-'(pIn- A)$]~'B S C(pln - S-'ASy-'B= C (pin - A)-'Br где используются лишь свойства операции обращения УУ 1 =/п, (А^^А^ — А.л А2 At ,
§ 2. АНАЛИЗ СИСТЕМ 261 Вместе с тем новые переменные, т. е. новый базис, можно вы- брать так, чтобы уравнения (2.22) имели более простую структуру. Предположим, что все с. ч. X, матрицы А (а следовательно, и А) являются простыми. Из алгебры известно (см. Приложение 2), что тогда А = S~rAS = A A diag {Хх, Х2, ..., М, (2.26) если столбцами матрицы S являются собственные векторы, соответ- ствующие с. ч. матрицы А. Переход к такому базису будем назы- вать диагонализацией, а соответствующие переменные xv(t) основ- ными формами (модами). Уравнения (2.22) в новых переменных приобретают вид: Dxv (t) = kvxv (t) + Bvu (t), xv (0) = Xy°\ v = 1, ... j n, (2.27) - S cvxv (t), (2.28) V—I где — строки матрицы S, a С, — столбцы матрицы С. Каждая мода определяется своим уравнением 1-го порядка, ко- торое легко интегрируется: t xv (t) = eK^txv (0) + J (x)dx, v = l, о (2.29) (Справедливость (2.29) проверяется прямой подстановкой в уравне- ние.) Перепишем это решение в матричной форме t x(t) = diag ж(0) + J diag {eXv(i“T)} Bv(x) dx, о и, используя обозначения (2.21), (2.23), вернемся к исходным пере- менным t х (t) = S diag {eKvt} S~xx (0) -p [ S diag {eMJ S~rBv (t - x) dx. о Сравнивая c (2.13) и учитывая единственность решения уравнения (2.1), убеждаемся в том, что eAt = 5diag{e^]5-1. (2.30) Это спектральное представление *) матричной экспоненты будет ши- роко использоваться в дальнейшем. 2.3. Структурные свойства. Вернемся к описанию системы в фор- ме (2.27), (2.28) и изучим ее внутреннюю структуру. *) О матричной экспоненте и способах вычисления ее значений см. также Приложение 2, п. 56, где даны и примеры.
262 ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ Сначала рассмотрим простейший случай, когда вход и выход ска- лярны, т. е. система эквивалентна одному звену в смысле § 1 гл. 2. При этом скалярны и величины Вч, Cv, так что система может быть описана с помощью простой структурной схемы (рис. 6.2). Рис. 6.2 Определение. Назовем скалярный вход v{tj полным, если все величины Bv не равны нулю, т. е. v(t) оказывает воздействие на все моды. Назовем скалярный выход y(t) полным, если все Сг/=0, т. е. в выходе проявляются все моды. Если хоть одна из величин В„ Cv равна нулю, то будем говорить, что система содержит «висячие» звенья. В противном случае назо- вем систему невырожденной. Теорема 2.1. Скалярный вход является полным, если и только если * det {В АВ... Ап~1В} Ф 0. (2.31) Скалярный выход является полным, если и только если det {Ст ЛГСТ... (Лт) n-1CTJ ¥= 0. (2.32) Система с одним входом и одним выходом невырожденна, если одно- временно выполнены (2.31), (2.32). Это условие эквивалентно вза- имной простоте числителя j)(p) и знаменателя а(р) скалярной п. ф. НМ. Доказательство. Перепишем (2.31) с учетом (2.23) в виде det {SB SAS~lSB ... {SAS-'y-'SB} = det S X det {B AB ... An~'B}, причем использовано, что определитель произведения равен произведению оп- ределителей и (УЛУ-1)”-1 = SAS-*-SAS-1-.... SAS-1 = SA... AS"1. n—l раз n—1 раз *) Матрицы в (2.31), (2.32) квадратные и записаны в блочном виде по столбцам (в скалярном случае В, С1 — столбцы, равно как и их произведения на А или Ат). Индекс> «т» означает транспонирование. Условия (2.31), (2.32) являются частными случаями условий невырожденности пар матриц А, В и 41, С1 (см. Приложение 2).
§ 2. АНАЛИЗ СИСТЕМ 263 Если S — диагонализирующая матрица, то Л = А = diag {X,v} и det {В АВ ...А^В}^ = det вх х1в1...^~1в1' вп хА’-хгА 1 1 Bn det Поскольку все hv различны, то последний определитель, называемый опреде- лителем Вандермонда,-не равен нулю. Поскольку S неособа, то det S =^= 0. Таким образом, (2.31) эквивалентно требованию Bv=/=0, v= 1, ..., п, т. е. требова- нию полноты входа. Аналогично доказывается эквивалентность (2.32) и требо- вания полноты выхода. Запишем согласно рис. 6.2 скалярную п. ф. Яои(р) в виде Ci Р Невырожденность системы эквивалентна отличию от нуля всех коэффициентов в разложении Н^Ар) на простейшие дроби. С другой стороны, если предста- вить „ , . Р (р) ~ а (р) ’ то наличие нулевых коэффициентов возможно только, если ₽(/>) и а(р) имеют общие корни. Проведем такой же структурный анализ многосвязной системы, когда n(i), p(t) — векторы (матрицы-столбцы). Определение. Назовем вход v(t) полным, если на каждую моду воздействует хотя бы одна компонента входа. Назовем выход y(t) полным, если каждая мода проявляется хоть в одной компонен- те выхода. Система невырожденна, если ее вход и выход полны. В противном случае будем говорить о наличии в системе «висячих» звеньев. Теорема 2.2. Вход является полным, если пара матриц А, В яв- ляется невырожденной, т. е. *) rank {В АВ...= п. (2.33) Выход является полным, если пара Ат, Ст является невырожден- ной, т. е. rank {С1 4ТСТ... (Лт) == п. (2.34) Из невырожденности обеих пар А, В и А\ Ст следует невырож- денность системы. Доказательство можно произвести по аналогии с Т.2.1. *) В (2.33), (2.34) вновь используется блочная запись, но блоки, вообще го-' воря^ уже не являются столбцами. О понятии ранга матрицы см. Приложе-
264 ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ Можно также указать и требования к матричной п. ф. Hcv(p), обеспечивающие невырожденность системы [6.9]'. Наиболее полное представление о структуре многосвязной систе- мы дает следующее утверждение. Теорема 2.3 (структурная теорема Налмана). Существует неосо- бая замена координат x = Sc, такая, что система (2.1) эквивалентно преобразуема к виду Dgi = augt + a12|2 + aI3ts + «ub + р1п, Dg2== a22g2 + агЛ4 + р21>, . = «зз^ + а.Л4, (2>35) — G44 £4, . У = Нг^2 + Otg4, причем £lt |21 ts, t* — подвекторы £ такие, что *) dim(g„ g2) = v1, dim(£2, g4) = v2, где v, = rank4c, v2 = rankJ.v, АД (В AB... An~1B], AvA{Cr ... (2.36) Пары матриц агг, p2 и агг, о2 являются невырожденными, и Hvv (р) Д С (р!п -АГ1В^о. (plnt - а^у1 р2. (2.37) Доказательство, довольно громоздко, и мы кратко опишем лишь его основную идею. По свойству (2.36) в матрице А„ можно выделить Vi линейно независимых столбцов (векторов). Обозначим их Sv ,.., 5V , Добавим к ним еще какие-либо п—vt векторов Sv^+1, Sn так, чтобы матрица 8 Д • • • Aj • • • А} оказалась неособой. Используем S для преобразования базиса. Тогда можно ус- тановить, что преобразование согласно (2.23) матрицы А, В имеют специаль- ную структуру: первые Vi столбцов А и все столбцы В имеют равными нулю последние п — Vi компонент. Для этого сначала покажем, что любой вектор вида ASk, k = 1, ..., vb линейно зависим от Sv ..., Sv^. Действительно, любой 5», к = 1, ..., vt, является по определению столбцом А,» а следовательно, имеет вид A’Bi, где Bi — какой-нибудь столбец В, а сте- пень j может быть любой от 0 до п — 1. Тогда ASk = A>+'Bj. Если j < п — 1, то ASh также является одним из столбцов Дг и по предположе- нию линейно зависит от <Slt ...,5Vj. Если же / = n — 1, то 45» = AnBj и не является столбцом А„. Однако по теореме Гамильтона — Кэли **) Ап = —оСп-И"-1 — ... — а0/, (2.38) *) Символ dim читается как «размерность вектора». ♦♦) См Приложение II, п. Зд,
§ 2. АНАЛИЗ СИСТЕМ 265 где a,-, i == 0, ..п — 1,— коэффициенты характеристического многочлена матрицы А. Поэтому ASh — AnBj = — an-iAn-'B; — ... — a^Bj, т. e. представим в виде линейной комбинации столбцов А„. Таким -образом, можно записать, что vi • ASh = 2* = 1, ...,vr (2.39) i=i где jin — скалярные величины. Из определения единичной матрицы следует, что S-'S; = it, . (2.40) где it — l-й единичный столбец: i, A fo, ..., 0, 1, 0, ..., 0\. h i п) Из (2.39), (2.40) вытекает желаемое свойство первых vi столбцов Аь матрицы А, поскольку V V = 5 1А811 == 2 1SI = 2 FWV ;=i i=i Аналогично устанавливается свойство В, поскольку столбцы В совпадают с первыми столбцами Av. Тем самым доказано, что при Vi < п можно так вы- брать базис, что V i П—Vj 7 FnHiaf1 « pjvi где ненулевыми могут быть только компоненты блоков йи, «12, Й22, В. Далее установим невырожденность пары йц, Bi, т. е. выполнение условия rank а11В1 ... aii"1'®i} = vr (2.41) Поскольку ранг матрицы не меняется при неособом преобразовании, имеем rank {В АВ ... Ап~'В} = V1, или, с учетом структуры А, В, , (В а В, ... а,”-1#,] rank { 1 11 1 11 4==v, 10 0 ... 0 j 1 откуда rank {2?* a11g1...^1--1B1}=v1. (2.42) Применив теорему Гамильтона — Кэли к (vt X vO-матрице йц, легко уста- навливаем, что столбцы, входящие в последние » — v( блоков в (2.42), линей- но зависят от столбцов, входящих в предшествующие, а тем самым их изъятие не меняет ранга. Таким образом, условие (2.41) обосновано, и установлено, что при Vi < п имеется возможность выбрать базис так, что в новых координатах х = (xi, х2), где xi имеет размерность v(, исходная система приобретает вид D21 = Йп®1 + «12*2 + BtV, Dx2 = аггхг, у = cixi + ?2Я2, т. е. выделены часть размерности Vi, по отношению к которой вход v(t) явля- ется полным, и «висячая» часть, на которую он заведомо не действует.
266 ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ Точно так же можно установить, что при у2 < п найдется такой способ вы- бора базиса, что в новых координатах х — (хь х2), где размерность равна у>2, система приводится к виду Dx1 = ацх 1 + BtV, Dx2 = Д21Х| + 022X2 + у = CtXl, (2.44) Причем пара aJ1T с, является невырожденной. Тем самым выделены часть размерности v2, по отношению к которой выход y(t) является полным, и «ви- сячая» часть, не проявляющаяся в выходе. Основное утверждение теоремы устанавливается путем последовательного проведения описанных выше преобразований базиса и соответствующей сорти- ровки блоков. Формула (2.37) сразу следует из обобщенной структурной схемы, пред- ставленной на рис. 6.3, а. Если натальные условия нулевые, то связь «вход-выход» отража- ется упрощенной структурной схемой рис. 6.3, б. В скалярном изо- бражении она включает число интеграторов, равное порядку невы- рожденной части системы. Из структурной теоремы, в частности, следует: (а) нарушение условий полноты входа и (или) выхода приводит к появлению «ви- сячих» частей системы, наличие которых не оказывает влияния на свойства преобразования «вход-выход»; (б) изменение переменных
s 2. АНАЛИЗ СИСТЕМ 267 |4 (или любых «естественных» фазовых переменных, являющихся их линейными комбинациями) определяется только начальными ус- ловиями и не зависит от входных воздействий, инвариантно' по отно- шению к ним; (в) изменение переменных g3 не может быть обна- ружено по наблюдениям выхода; (г) невырожденная часть системы при Vi<n (va<«) имеет порядок и2, ниже порядка системы в це- лом, и свойство (2.37) может иметь место только при сокращении числителя и знаменателя п. ф. Hvv(p). Приведем простейшие примеры. Пример 2.1. Пусть система описана скалярными соотношениями 1)г. = х2, Dx2 = Xi + и, y = Xi — х2. Здесь fO 11 (0) „ А =* 0|» ^==hp С = {1,-1}. Устанавливаем, что det Лв д det {В АВ} — det 0j #= 0,, f—i _ n det Ay = det J l l | — 0. Следовательно, выход является неполным. Составляя и. ф., по- лучаем тт , , 1 р 1 p2_i- р+Р т. е. происходит сокращение числителя и знаменателя. Вычитая из 1-го уравнения 2-е,. получаем D (х4 — х2) = — (ж, — х2) — V. Таким образом, замена переменных = Xi — — х2, х2 = х„ приводит к уравнениям Dxt — ~Xt — V, Dx2 — Хг — Х1г у = Xi. Теперь явно видно, что второе уравнение определяет «висячую» часть: переменная х2 не влияет на выход. О Пример 2.2. Рассмотрим механическую систему с двумя степеня- ми свободы, модель которой представлена на рис. 6.4 (гантель с не- весомой жесткой ручкой на двух симметрично установленных упру- гих опорах, сила F приложена в центре инерции). Если взять за обобщенные координаты перемещения масс qt, q2, то кинетическая и потенциальная энергии примут вид /т, 1 2.1 2 тт 1 2.1 2 Т = у mqt + -gnq2, П = у cqt + у cq2, где пг — масса, с — жесткость, а уравнения движения окажутся
268 ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ симметричными: иг?! + = 4 m(h + cq2= -jF. ' Вводя стандартные обозначения = ^2 = 91, •г?з=?2, *4 = ?2» сот-1 = <»o> v=m~1Ft перепишем их в виде Dzx = а:г, Dx3 = х4Г Dx2 = — + 4 v, Dx4 = — + 4 v. За выход примем перемещения центра у = 4 (?i + 7г) = 4 + х^" Представляем читателю формальную проверку выполнения условии (2.31), (2.32) при п = 4. Здесь же «в лоб» убедимся в их нару- шении. Введение новых переменных I ~ J - Х1 =. ~2 (*1 + «з)> Х2 = У (Ж2 + Xi)t х2 — у \xl *з), хц— 2 \Х2 " Xi) позволяет записать'уравнение системы в виде Dx4 = х2, D#3 = ж4, ’ Ох2 = — ©„.Ex + 4 v, Dxi = — ИдЖ3, у = хг. Очевидно, что 2-я группа уравнений соответствует «висячей» части, не возбуждаемой воздействием и не проявляющейся в выходе. Физический смысл ясен: сила, приложенная в центре, не вызывает поворота гантели, а на перемещение центра этот поворот не влияет. О § 3. Управляемость и наблюдаемость Пусть описание объекта задано в нормальной форме *): х — Ах + Bv, х(0) — ха, у — Сх, (3.1) причем внешнее воздействие v(t) является управляющим, n(i)s ^u(i), а неуправляемые возмущения отсутствуют, *) Начиная с этого параграфа и до конца главы операторные обозначения для производных почти не используются. Для сокращенной записи ставится точка над переменной.
§ 3. УПРАВЛЯЕМОСТЬ И НАБЛЮДАЕМОСТЬ 269 В этой идеализированной постановке удается решить ряд прин- ципиально важных проблем, в которых проявляются основные осо- бенности систем с многими управляемыми процессами [6.2]'. 3.1. Проблема управляемости (ликвидация начального рассогла- сования). Требуется выбрать программу управления и (4) так, чтобы в момент Т > 0 выполнялось условие о:(Т) = 0. (3.2) Сложность проблемы состоит именно в том, что число управле- ний (размерность m вектора и), как правило, меньше числа управ- ляемых процессов (размерности п вектора х). Определение. Если проблема управляемости разрешима (при произвольном ограниченном х°) путем выбора ограниченных управ- ляющих воздействий, то система (3.1) называется вполне управ- ляемой. Теорема 3.1. Система (3.1) вполне управляема, если и только если пара матриц А, В невырожденна, т. е. rank Аи = п, Ац Д {В АВ ... Ап~1В]. (3.3) Доказательство. Первоначально установим достаточность условия (3.3), непосредственно найдя желаемое управление. Согласно (2.13) имеем t х (J) = еА1хй + f (т) dx, о так что т х (Т) = 0 44 J е~АхВи (т) dx = — х°. - (3.4) о Примем и (t) = (е~А1ВГ1 = Вте~АГ*1, (3.5) где I пока не определенный, но постоянный n-вектор. Покажем, что его можно выбрать так, чтобы уравнение (3.4) удовлетворялось тождественно. Подстанов- ка (3.5) в (3.4) дает e-AxBBTe~ATxdxl = ---za. 0 Таким образом, если возможно решить уравнение т Ы = - х°, L A J eAxBBxe~ATxdx (3.6) о при произвольном х°, то исходная задача решена. Для разрешимости требует- ся, чтобы det L =# 0. Докажем, что это так, от противного. Если det 6 = 0, то существует/0 0 такое, что т = 0 => lxLl0 = о => J <pj(т) <р0 (т) dx = 0, (3.7) ’ о
270 ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ где Фо (т) А 1хе АхВ. Условие (3.7) выполняется, только если <р0(т) а 0, 0 sg т < Т. Тождественно равны нулю и производные <ро(т), так что roAhe~AxB^O, * = 0,1,..., и, в частности, при т = 0 имеем lxAhB=0, * = 0,1,... или 1Х{В АВ ... Ап~гВ} = 0 при 10 0, (3.8) что противоречит условию (3.3), равносильному линейной независимости строк матрицы Аи. . Перейдем к доказательству необходимости (3.3). Предположим, что это условие не выполнено, т. е. rank Аи — vu < п. Тогда найдется Г ф 0 такое, что 1'Аи = 0 => VB = О, 1'АВ = 0, ..., VA*-*B = 0. (3.9) Однако по теореме Гамильтона — Кэли 1'АпВ = — а.01'В — ... — an-IZ'An-IB = 0. (3.10) Получая из той же теоремы тождество Ап+'В = — аоДВ — ,,. — ап-1Л"В, устанавливаем 1'Ап+'В = 0 и далее по индукции для любого * > п также име- ем l'AhB — 0. Но тогда °° h l'e~AxB = Z' V AhB -=S о (3.И) Ki fe=0 и из соотношения (3.4) следует, что для достижения цели необходимо выпол- нение условия 1'х° = 0, которое заведомо не выполняется при произволь- ном х°, Замечание 1. Если все с. ч. матрицы А различны, то условие (3.3) обеспечивает полноту входного воздействия u(t) в смысле § 2, т. е. с помощью управления можно воздействовать на каждую моду. Однако определение полной управляемости не связано с возмож- ностью модального представления (возможностью диагонализации А) и теоретически более удобно. Необходимость условия (3.3) сразу следует и из структурной теоремы, ибо при его невыполнении в си- стеме имеется «висячая часть», состояние которой нельзя изменить приложением управляющего воздействия. Замечание 2. Если rank В = г > 1, то условие полной управляемости (3.3) можно заменить на условие rank{5 АВ... Ап~гВ} = п. (3.12) В частности, при г=п (3.12) эквивалентно условию detB=AO, справедливость которого очевидна: например, задав желаемый
§ 8. УПРАВЛЯЕМОСТЬ И НАБЛЮДАЕМОСТЬ 271 процесс изменения состояния находим управление и (!) = - -у В-11/ + (Т - О A] А обеспечивающее этот процесс (ср. со скалярным примером в § 1 гл. 3). Доказательство справедливости (3.12) в общем случае предо- ставляем читателю. Пример 3d. Рассмотрим задачу о программном управлении мате- риальной точкой, движущейся вдоль оси q под действием силы /(/). Требуется выбрать /(J) так, чтобы точка, занимающая в начальный момент положение д° и имеющая скорость, q°, через время Т остано- вилась в заданном положении, которое можно принять за начало отсчета. Математическая формулировка такова: найти функцию /(0, t е [О, 71] такую, что удовлетворяется система условий mg = /> 9(0)=g’, g(O) = g°, g(T) = O, g(T) = O. Применим теперь способ построения программного управления, использованный при доказательстве теоремы 3.1. Предварительно запишем условия в стандартной форме. Обозначим Xi = q, х2 = q, и = —F. Тогда m a'i=x2, xl(0)=ql>, x2{0) = qa, x2 — u, Xi(T) — 0, x2(T) — 0. В матричной записи имеем ж=(Ж1, хг)т, х = Лж + 5и, где Условие полной управляемости здесь выполнено: (О 11 Аи = {В, А.В} = g|, det Аи = — 1 =/= 0. Можно искать и(£), подставляя заданные значения матриц А, В в формулы (3.5), (3.6). Однако для понимания сути дела лучше просто повторить для данного частного случая саму схему построе- ния. Интегрируя уравнения движения, получаем / (t) = х2 (0) + J и (т) dx, О (0 = (0) + (0) + J (t — т) и (т) dx. О
272 ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ Условия ж1(Г) = 0, ж2(7,) = 0 требуют, чтобы т У и (т) dx = — хг (0) = — q°, т ° (3.13) J (Т — т) и (т) dx = — х, (0) — Тх2 (0) = — q° — Tq°, о Разыскиваем u(t) в виде u(Z) = Z1i + Z2. (3.14) (Читатель может проследить, что это соответствует формуле (3.5), ft ) ч поскольку в данном случае е~А/5 ==-L |-) Подстановка (3.14) в (3.13) дает систему двух уравнений для определения 1„ 12: == — Q°>. = — 9° — Т<1\ откуда = Z2==-^^0 + ?°t4 ° Отметим далее, что проблема управляемости может быть сфор- мулирована и в более общем виде. Пусть внешние воздействия явля- ются как управляющими u(t), так и возмущающими w(t): y(Z) = (u(Z), Тогда уравнения (3.1) запишутся в виде х = Ах + Вии + Bww, где В„, Вю — соответствующие блоки матрицы В. Пусть требуется из произвольного начального состояния х° заставить систему в момент Т перейти в произвольное новое состояние хл. Нетрудно проверить, что при невырожденности пары матриц А, Ви задача разрешима, поскольку она сводится к необходимости решить относительно и(1) уравнение х (Т) — хл <=> т ха = е^тх0 + У еА1-т~х)1Вии (т) + Bww (т)] dx <=>, , о т т •<=> У е~АхВии (т) dx = e~ATxd — хй — У e~AxBu:w (т) dx, (3.15) о о которое имеет ту же структуру, что и (3.4). При этом (как всегда при построении программного управления) подразумевается, что возмущающие воздействия точно известны, так что правая часть (3.15) является заданным вектором.
§ 3. УПРАВЛЯЕМОСТЬ И НАБЛЮДАЕМОСТЬ 273 Подчеркнем все же, что задача выбора программного управления, обеспечивающего изменение состояния по произвольному заданному закону xd(t), вообще говоря, неразрешима даже при выполнении условия полной управляемости. Очевидна лишь ситуация, когда rank В„ = п, и легко найти решение н(1) системы £* = Axd + Вии + + Bwu? при заданных xd(t); w(t). Программное управление обладает уже известным недостатком — существенной зависимостью результата его применения от точности знания модели. Для изучения вопроса о возможностях построения системы с обратной связью по измерениям выхода объекта прин- ципиальную роль играет следующая проблема. 3.2. Проблема наблюдаемости. Определение. Если разрешима задача вычисления x(t) по точным измерениям выхода y(t), входа v(t) и их производных, то система (3.1) называется вполне наблюдаемой. Теорема 3.2. Система (3.1) является вполне наблюдаемой, если и только если пара Ат, Ст невырожденна, т. е. mvAs.Av=n, ЛУД{СТ 4TCT...(4T)n"1CTU (3.16) Доказательство достаточности (3.16) сводится к составлению по (3.1) системы уравнений p(|) = Ca:(t), Dy (t) = САх (t) + CBv (t), ..., Dn-1y (t) = = CAn~1x (/) + CAhBD^n-k~^ V (0 (3.17) h=0 и констатации ее разрешимости относительно x(t). Необходимость доказывается так же, как в Т.3.1. Замечание 1. Если возможна диагонализация (3.1), то условие полной наблюдаемости эквивалентно условию полноты выхода y(t), и необходимость (3.16) очевидна из структурного представления. Замечание 2. Если ранг С больше 1, то условие невырожден- ности может быть упрощено. В частности, если ранг С равен п, то x(t) — C~'y(t) (3.18) ’ и определение состояния не требует вычисления производных выхо- да. Если же ранг равен г, 1<г<ге, то x(t) находится из системы типа (3.17), содержащей только я —г производных выхода. Замечание З. Условие полной наблюдаемости является одно- временно требованием к свойствам системы (3.1), при которых по заданным начальным значениям выхода y(t) и его производных вплоть до (п —1)-й можно установить начальное состояние (поэто- му иногда употребляется термин «восстанавливаемость системы», эквивалентный термину «полная наблюдаемость»). Это свойство существенно, если сама система (3.1) строится по исходному описанию в виде уравнения «вход-выход» типа (1.3). 18 д. д, Первозванский
ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИИ Читатель может проверить самостоятельно, что конструкция, описанная в Т.1.1, всегда удовлетворяет условию полной наблюдае- мости (3.16). § 4. Размещение собственных чисел и стабилизация 4.1. Проблема размещения. Рассмотрим первоначально чисто ал- гебраическую задачу, называемую проблемой размещения собствен- ных чисел: заданы (вХ п) -матрица А и (геХ т)-матрица В; требу- ется найти (т X п)-матрицу К такую, что (n X и)-матрица А = А—ВК (4.1) имела бы произвольно заданный набор собственных чисел Х2, ... -, U Теорема 4.1. Необходимым и достаточным условием разрешимо- сти проблемы размещения собственных чисел является невырожден- ность пары матриц А, В, т. е. выполнение условия rank {В АВ... Ап-'В} = п. (4.2) Доказательство. Необходимость следует из Т.2.3. Используем мат- рицу S, фигурирующую в формулировке Т.2.3. Тогда = °12L S~ 1В = РЧ, 1° в221 I О J где нулевые блоки обязательно возникают при нарушении условия (4.2). Ис- пользуя правило перемножения блочных матриц, получаем Л I# к } = 0 а22) 10) = Рп ei2J РА ВД= (“11-^1 «12-2Л1 1° a22l ( 0 0 ) ( 0 «22 I’ где К Д = KS' Поскольку собственные числа матрицы А не меняются при неособом преобразовании, а матрица S~'AS оказалась блочно-треугольной, то собственные числа А совпадут с собственными числами матриц ац — и «22- На последние же выбор К не влияет, а следовательно, они не могут иметь произвольно заданные значения. Доказательство достаточности условия (4.2) более сложно, и мы полностью проведем его только для случая m = 1, т. е. случая, когда В является столб- цом (га X 1)> а %- ~ строкой (1 X га). Опо опирается на вспомогательное утверж- дение. Лемма 4.1 (о преобразовании к форме Фробениуса — Налмана). Если выполнено условие невырожденности, которое при m = 1 сво- дится к требованию det {В АВ... Ап~'В} Ф 0, (4.3) то (пХп)-матрица S со столбцами St, S2, ..., Sn, строящимися
§ 4. РАЗМЕЩЕНИЕ СОБСТВЕННЫХ ЧИСЕЛ И СТАБИЛИЗАЦИЯ 275 рекуррентно по формулам Sn = B, Sn-i — ASn'+a.n-iB — AB + an-iB, ..................................................... (4.4) Sh-t = AS. + a.-tB = An~h+iB + an_tAn~*B +... + а.-.Б, St = AS2 + atB « Л"-‘В + ап-1Ап-гВ +... + a,B, где an-i, ..at — коэффициенты характеристического многочлена- матрицы Л, а (р) — рп + an-iPn~l + + atp + а«, является неособой и такой, что Л Д S AS — {-т- <Zgin ot]in + » ctn—iin 4" in—1}» (4.5) B = S-iB = in, (4.6) где через i., k — 1, ..п, обозначены единичные векторы (столбцы единичной матрицы). Доказательство леммы. Матрица S получается из матрицы управ- ляемости Ли путем перестановки столбцов {Л»->5 Ап~2В ... ABB} (такая операция может изменить только знак определителя), и добавления к каждому из столбцов предшествующих, умноженных на числа а* (такие опе- рации не меняют определителя). Поэтому, если deMu=/=0, то и detS=AO, т. е. матрица S является неособой. По определению обратной матрицы получаем S~'B = s->s„ = in. Вычислим последовательно столбцы матрицы 5~'Л5 с помощью рекуррентных формул: S~lASn ~ 5~г(5Л_। — Un—,В) == S !5n—i —Un—iS~~lSn = in—i —Цп, S~lAS. = S-1 (S.-i — a.-iB) = S-IS*_| — as_iS_ISn = ik-i — a.-iin. Последнее верно вплоть до k = 2. Для k = 1 используем развернутую форму представления Si; имеем: S-’ASi = S-‘A (An~lB + an-iAn~2B + ... + оцВ) = = 5_,(Л" + an_iAn-1 + .,. + a.iA)B = —$~’а0В — —aoiPt поскольку по теореме Гамильтона — Кэли An + an-M"-1 + ... + aiA — —a0I. Тем самым лемма доказана. Вернемся к доказательству теоремы. Используя матрицу S, построенную в лемме, получаем S-SAS = S-'AS — S-'BKS = А- БК. Напомним, что в рассматриваемом случае К — строка, а следовательно, и К — строка, элементы которой обозначим Hi, ,,Кп. В силу свойств А, Б и правил 18»
276 ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ умножения матриц получаем S-14S = {—OCoinJ —CXdn + ill • • > —<Xn-Jn + *n-l}— . Un} — «= {—(ao + ®i)jn; (ai -f- Hz) in + 6; •••» —(®n-i + Un) + bi-i) — = {—ao'n; —«dn+h! • • —ocn-i + in-J. Таким образом, матрица S-14S имеет тот же вид, что и S-14.S, за тем исключе- нием, что коэффициенты характеристического многочлена а», к = 0, ..., п — 1, заменились на новые а* = а» + Ел+i, к = 0, 1, ..., п — 1, которые могут при- нять произвольные заданные значения при соответствующем выборе элементов кь строки К. Последние же, в свою очередь, однозначно определяют искомую строку К. Приведенное доказательство достаточности условия (4.2) кон- структивно, т. е. позволяет указать алгоритм решения проблемы раз- мещения собственных чисел при т = 1. Алгоритм 1. Пусть заданы (га X п)-матрица А и (га X 1)-столбец В. Пусть известны коэффициенты^, к —0, 1, ..га —1, характе- ристического многочлена Л и требуемые собственные числа Xv (v = = 1, 2, ..га) матрицы А —А— ВК. Тогда для нахождения А сле- дует выполнить следующие операции. 1. Вычислить требуемые коэффициенты характеристического мно- гочлена А, расположив по степеням К произведение JJ (X — Xv) = Xя + ссп~1Х 1 + ,.. + а0. V—1 ' 2. Вычислить величины йл+1 = ak — ak, к = 0, 1, ..., п — 1, и составить из них строку R = {%„ ..кп}. 3. Построить по формулам (4.4) матрицу 5. 4. Вычислить К, решив уравнение ✓ KS = R. 9'^'- Пример 4.1. Пусть, как и в П.1.2, (-Я/Д -1/L1 /П А “ t 1/с о J* u ~ (о г Здесь га = 2 и требуется найти K = {ki кА такое, что матрица А=А—ВК имеет собственные числа Xt = —1, л2 = —2. Характеристический мно- гочлен матрицы А равен ( 1 1 det Х + Т =Х(% + /?/В)+^=>ах = 4, t—1/C X J ас ь _ 1 “о “ LC
§ 4. РАЗМЕЩЕНИЕ СОБСТВЕННЫХ ЧИСЕЛ И СТАБИЛИЗАЦИЯ 277 Тогда, действуя по_алгоритму, получаем: _ 1. (X — Xt) (А. — Х2) = Х2 + ЗА, + 2 =* ai — 3, а0 = 2. 2, к± ==: O-g ССд :=== 2 &2 s== Otj CCj = 3 “ —J~« 3. 5-{Л SJ, c n______f11 о ату j ту______Г .д/ь1 , (r/l\ f о 1 °2 — "° — 1 0 г ° * — ‘ — 1 i/c j "г Г о J — \Д!Сг LKS-K^ {kt кМ s2} = а &} — к2 = 2 — = 3 — RjL fcj = 3 — RjL k% = 2C —□ Осталось теперь неясным, как решать проблему, когда m > 1. Естественно, что процедура здесь усложняется и в общем случае имеет достаточно громоздкий характер (см. различные варианты в (6.9]'). Опишем лишь простейшую идею, которая, впрочем, пригодна в большинстве практически возникающих ситуаций. Будем разыски- вать жедаемую (пг X ;г)-матрицу К в виде K = qK, где q — (zraX 1)-столбец, a K — (i X п)-строка. Тогда А = А — ВК~ A—BR, где В — Bq — (п X 1) -столбец. Зададимся каким-либо q^O, для ко- торого выполнено условие det {В АВ... ¥= 0. (4.8) Тогда, используя алгоритм 1 для матриц Л, В найдем строку К, обес- печивающую любое заданное расположение собственных чисел, по- сле чего желаемая матрица К вычисляется по формуле (4.7). Един- ственное осложнение в этой процедуре заключается в том, как подо- брать q, обеспечивающее условие (4.8) невырожденности пары А, В. Можно, однако, доказать (6.9, § 7.1], что, по крайней мере в случае, когда матрица А имеет простые собственные числа, такое q суще- ствует и, более того, при почти любом наугад взятом q условие (4.8) окажется выполненным, если, конечно, выполнено исходное предположение (4.2). Пример 4.2. Пусть (1 2} 5=1 2. (0 1]
278 ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ Здесь п — 3, т = 2, и ( 1 rank Аи = rank <12 2 10 1 0 8 1 32] 8 4 32 } в 3 4 0 16 ) поскольку 2 1) det <1 10 2 2> « — 1 0. 1 0) Примем q — ; тогда /3 В - Bq = 3 I 1 и нетрудно проверить, что 3 3 det {В АВ А* В} = det 9 33 10 36 4 16 =/=0. О 4.2. Стабилизация. После столь длительных алгебраических упражнений пора показать их полезность для решения задач управ- ления. Теорема 4.2. Пусть объект описывается основной моделью х — Ах + Ви, х (0) = х°, причем пара А, В невырожденна. Пусть в любой момент времени t>0 доступен для измерения вектор состояния x(t). Тогда может быть построена обратная связь и = —Кх (4.9) такая, что замкнутая система устойчива. Доказательство элементарно: замкнутая система описывается урав- нением а матрица коэффициентов усиления К может быть выбрана так, чтобы все соб- ственные числа А оказались в левой полуплоскости. Следствие. Если система вырождена, но матрица неуправляемой части, выделяемая в силу Т.2.3, является устойчивой, то стабилизи- рующая систему в целом обратная связь (4.9) также может быть Построена. Пример 4.3. Рассмотрим систему, описываемую уравнениями X, = Xi + 6х3 + и, + 2и2, х2 — 2хг + 4х3 + и, + 2нг, х3 = 4х3 + иг, Хз = — 2х4‘+ х5, Хь = — Хз. '
§ 4. РАЗМЕЩЕНИЕ СОБСТВЕННЫХ ЧИСЕЛ И СТАБИЛИЗАЦИЯ 279 Подсистема, характеризуемая координатами я4 и х2, неуправляема, однако она устойчива. Остальная часть системы задается матрицами А = 1 0 61 О 2 4} В = fl О 4J 1 2’ 1 2 .0 1; которые, как было показано в П.4.2, образуют невырожденную пару. Подчеркнем, что если принять и, = 0, то не удастся стабилизи- ровать координаты хи х2, а если принять а2==0, то нестабильным окажется изменение хг. Совместным же действием двух компонент управления, как было доказано в П.4.2, систему можно стабилизиро- вать. Рекомендованный в П.4.2 способ эквивалентен тому, чтобы ввести скалярное управление и такое, что uf = q,u, и2 = q2u, или (при gi = l, ?2 = 1) положить обе компоненты управления одина- ковыми. В результате управляемая часть системы приобретает вид х! — х, + 6z3 + За, х2 = 2хг + 4.г3 + За, х3 = 4ж3 + а. После этого можно назначить любое желаемое расположение соб- ственных _чисел замкнутой системы в левой полуплоскости, напри- мер, Х1=Х2 = %3 = —1 и применить алгоритм 1. Предлагаем проде- лать это в качестве упражнения. Вместе с тем из структуры рас- сматриваемой системы ясна возможность и более экономного спосо- ба. Действительно, поведение координаты х3 зависит только от управления и2. Примем и2 = —5х3. Тогда система, замкнутая такой обратной связью, приобретает вид xt = х, — 4х3 + Hi, х2 = 2х2 — 6х3 + Wj, х3 = — х3. В ней выделилась устойчивая неуправляемая часть, задаваемая ко- ординатой х2. Остается стабилизировать лишь управляемую часть с помощью выбора и,. Это возможно, поскольку характеризующая ее пара матриц (1 01 R j 1 ail“to 2J’ 1 1 - невырожденна: {1 1 2J °- Применим алгоритм 1 к этой задаче, задавшись Z, = X2 = — 1. Про- пуская промежуточные выкладки, запишем результат: К = {К„ К2} = {-4; 9},
280 ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ т." е. щ = 4ж, — 9х2. Поскольку ¥= u2, то мы заведомо получили ре- шение, отличное от того, которое находится по основной рекомен- дации. Таким образом, в случае двух управлений можно добиться одно- го и того же размещения собственных чисел, используя разные за- коны управления. □ 4.3. Оценка состояния. Перейдем теперь к более сложной поста- новке проблемы стабилизации, отказавшись от предположения о воз- можности полного измерения всех переменных состояния. Заменим его.гипотезой о возможности точного'измерения выхода y(t) = Cx(t) в любой момент £>0. Уже было показано, что при невырожденно- сти пары Лт, С* по измерениям выхода возможно восстановить «внутреннее» состояние, так что, казалось бы, новая постановка сво- дится к уже изученной. Однако напомним, что излагавшийся в § 3 способ требовал использования «чистых» производных выхода, т. е. операций, не являющихся строго реализуемыми. Более того, реаль- ная точность вычисления x(t) явно определялась точностью знания матриц Л и С (процедура имела типично «программный» характер!). Укажем теперь способ определения x(t), основанный на идее обрат- ной связи и лишенный указанных недостатков. Теорема 4.3 (о системе асимптотической оценки). Пусть вектор состояния x(t) объекта определяется как решение уравнения x = Ax-¥Bv(t), аг(О) = ж°. * (4.10) Тогда может быть построено устройство, называемое системой асимп- тотической оценки, использующее в качестве входных воздействий измеряемый выход объекта y = Cx(t) (4.11) и его вход v(t) и вырабатывающее оценку x(t) как решение урав- нения х = Ах + Bv(t) 4- L(y — Cx(t)), x(Q)=x°. (4.12) При невырожденности пары Лт, Ст матрица L может быть выбрана так, что ошибка оценивания e(t) = x(t) — x{t) (4.13) стремится к нулю при t-+ °° при любой ограниченной начальной ошибке е(0). Доказательство. Вычитая (4.12) из (4.10), получим уравнение, опре- деляющее изменение ошибки оценивания ^==(4—ДС)е. (4.14) Для того чтобы ошибка стремилась к нулю, достаточно выбрать L так, чтобы матрица (4 — LC) имела «хорошие» собственные числа. Но они совпадают с с, ч. транспонированной матрицы 4Т — Ст£т. Очевидно, что задача выбора L
§ 4. РАЗМЕЩЕНИЕ СОБСТВЕННЫХ ЧИСЕЛ И СТАБИЛИЗАЦИЯ 281 (или LT) отличается от уже решенной задачи размещения С. ч. матрицы Л —ВК лишь обозначениями, заменой А-*-Ат, В^>-Ст, К — LT, и разрешима с помощью уже описанных алгоритмов при невырожденности пары А\ С\ Если пара Дт, С1 вырождение, но ненаблюдаемая подсистема устойчива, то результат теоремы 4.3 сохраняет силу. При этом иногда говорят, что система является обнаруживаемой (детектируемой). Поясним неформально полученный результат. При построении системы оценки используются те же матрицы А, В, С, что и в описании объекта, и вводится то же самое внешнее воздействие v(t). Поэтому, если начальные условия Xе и ж® совпада- ют, то совпадают и дальнейшие траектории, x(t) = x(t), О 0, т. е. система оценки работает как модель объекта. Главное же достоинство системы оценки в том, что она позволя- ет оценивать изменение состояния объекта и тогда, когда его на- чальное состояние неизвестно. Именно для этой цели служит по- следнее слагаемое, вводящее в систему оценки сигнал обратной связи, пропорциональный раз- ности между истинным, непо- средственно измеряемым выхо- дом y(t) и его прогнозом у(0 = *=Cx(t). Подчеркнем также, что со- отношение (4.12) действительно определяет структуру строго ре- ализуемого (с помощью стан- дартных интеграторов и усили- телей) устройства (см. струк- турную схему на рис. 6.5). 4.4. Стабилизирующая обратная связь по наблюдениям выхода. С использованием системы асимптотической оценки можно пол- ностью решить задачу построения строго реализуемой стабилизирую- щей обратной связи по наблюдениям выхода. Теорема 4.4. Пусть объект, описываемый уравнениями у = Сх, х = Ах + Ви, х(0) = ж®, (4.15) замкнут обратной связью вида и = —Кх, (4.16) где х находится с помощью системы асимптотической оценки х = Ах + Ви + L{y — Сх), я:(0) = ж8 (4.17) по измерениям выхода у. Тогда при невырожденности пар матриц А, В и Аг, О’, возможен выбор коэффициентов усиления К и L та- ких, что замкнутая система является устойчивой.
282 ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ Доказательство. Исключив переменные и и у, запишем уравнения замкнутой системы в виде х — Ах — ВКх, (4.18} х — Ах — ВКх A-LC (х—'х). (4.19} Динамика системы характеризуется двумя векторными переменными х и х, имеющими одинаковую размерность. Перейдем от этих переменных к перемен- ным в = —х, в = х — х, характеризующим ошибку управления (отклонение x(t) от желаемого состоя- ния x(t) = 0) и ошибку оценивания. Такое преобразование координат являет- ся неособым и не меняет характеристическое уравнение системы. Имеем теперь е = Ле — В К (х — х) ВКх в = (Л — В К) в — В Кв & (4.20) "е — Ле'— ЬСъ b~(A—LC)b, или, в сокращенной записи, d ( в 1 ( в ) dt [ в ) ( в J Матрица Лсд[Л-^ (4.21) характеризующая свойства замкнутой системы, имеет блочно-треугольную структуру. Ее собственные числа совпадают с собственными числами блоков, стоящих на диагонали, т. е. матриц А— В К и А —LC. Вместе с тем было до- казано, что при выполнении условий невырожденности К и L могут быть вы- браны так, чтобы произвольно разместить собственные числа этих матриц. Тем самым доказана возможность (и указан алгоритм!) стабилизации замкнутой системы в целом. Следствие. Если условие невырожденности не выполнено, но «висячие» части модели объекта, выделяемые в силу структурной теоремы, являются устойчивыми, то возможность стабилизации с по- мощью обратной связи по выходу сохраняется. Доказательство следствия сводится к предварительному преобразо- ванию координат, обеспечивающему явное выделение структуры, и построению обратной связи только по оценкам координат невырожденной части. Структура замкнутой системы, описанной в Т.4.4, наглядно пред- ставлена на рис. 6.6. Система асимптотической оценки входит как часть в конструкцию обратной связи от измерений выхода y(t) к управлению u(t), причем обратная связь является динамической, задаваемой не алгебраическим соотношением, а системой дифферен- циальных уравнений, имеющей тот же порядок, что и порядок урав- нений, описывающих объект (если нет вырождения). Построенная обратная связь может использоваться и в тех слу- чаях, когда требуется стабилизировать не систему в целом, а лишь
§ 4. РАЗМЕЩЕНИЕ СОБСТВЕННЫХ ЧИСЕЛ И СТАБИЛИЗАЦИЯ 283 какую-либо ее часть, подсистему. Построение такой «внутренней» обратной связи отличается лишь тем, что управляющее воздействие u\t) разделяется на две части (ср. § 3 гл. 3): u(t) = uy(t)+ ut(t), (4.22) где uv(t} служит для стабилизации, a ue(t} — для воздействия через уже стабилизированную подсистему на остальные части системы. Не вводя лишних индексов, сохраним для подсистемы описание со стандартными обозначениями х = Ах + Ви, у = Сх и будем считать пары А, В и Ат, Ст невырожденными. Тогда обратная связь строит- ся согласно уравнениям иу — — Kxf х = Ах А- Ви А- + L (у - Сх} (4.23) и является стабилизирующей при соответствующем выбо- ре К и L. Без обратной связи пре- образование «управление — выход» определялось п. ф. вида Я(р) = С[р7-Д]-‘В. Выясним, какой окажется п. ф. после введения обратной связи. Для этого удобно вновь преобразовать уравнения, введя переменную е = х — х. Тогда имеем у = Сх, х = (А-ВК}х + ВКъ + Вие, t~(A-LC)Z {4'24) Отсюда сразу видно, что Ниъу(р} — С[р1— (А —ВК}}~гВ. (4.25) Она не зависит от свойств системы оценки (эта система оказывается неуправляемой по отношению к не!) и имеет точно такой же вид, как и в случае, когда возможна организация обратной связи по не- посредственным измерениям состояния «(<), т. е. при иу — —Кх. Это замечательное свойство описанной конструкции обратной связи по выходу и позволяет независимо использовать выбор коэффициентов К для формирования п. ф. от внешнего управления к выходу, а вы- бор коэффициентов L — для уменьшения влияния ошибок оцени- вания.
284 ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ Если y(t), u(t) скалярны, то для формирования стабилизирую- щей обратной связи можно использовать и простую методику, изло- женную в гл. 3, § 1, 3. Предоставляем читателю самостоятельно рас- смотреть связь между двумя подходами. Обратите внимание на то, что обратная связь, не меняющая числителя п. ф., также приводит к вырождению — возникает сокращаемый устойчивый многочлен 6(р) = k0(p)lt(p). Если его степень принята'равной п, то построе- ние в § 3 гл. 3 эквивалентно построению обратной связи по форму- лам (4.23) при стабилизирующем выборе L, причем б(р) совпадает с характеристическим многочленом матрицы А — LC. § 5. Оптимизация стабилизирующей обратной связи 5.1. Качество стабилизации и размещение с. ч. Вернемся к основ- ной постановке задачи стабилизации: дан объект, описываемый мат- ричным уравнением х = Ах + Ви, ж(0) = я:0; (5.1) требуется выбрать обратную связь и = —Кх так, чтобы обеспечить устойчивость замкнутой системы х = (А-ВК)х. (5.2) Решение этой задачи было дано в предшествующем параграфе, по- скольку был указан алгоритм, позволяющий (при невырожденности пары А, В) выбрать коэффициенты обратной связи К так, чтобы собственные числа матрицы А=А—ВК (5.3) размещались в левой полуплоскости. Однако на самом деле было установлено и большее: собственные числа можно размещать где угодно, а следовательно, неограниченно увеличивать и степень устой- чивости. Тем самым выбор обратной связи может обеспечивать не только устойчивость, но и качество процесса стабилизации — процесса пе- рехода из начального состояния х° в окрестность устойчивого поло- жения равновесия (а: = 0) замкнутой системы (5.2). В соответствии с формулами (2.8), (2.11) имеем*) x(0 = eJ^°= 2 erv,Cvx°, (5.4) V—1 где Xv — собственные числа матрицы A, а С, - матрицы, состоящие из постоянных элементов, если все X» различны. •) Иные внешние воздействия, кроме управления, использованного для стабилизации, пока не учитываются.
§ 5. ОПТИМИЗАЦИЯ СТАБИЛИЗИРУЮЩЕЙ ОБРАТНОЙ СВЯЗИ 285 Теорема 5.1. Из возможности произвольного выбора X» следует, что для любого Z > О и е > 0 можно обеспечить выполнение условия к(01<е, t>T. (5.5) Доказательство. Выберем К, = —xav, где av > б > 0, а х — большая положительная величина. По способу построения, основанному на разло- жении элементов матрицы [pl — 4]“‘ на простейшие дроби, вее элементы С„ являются дробно-рациональными функциями х и при больших х являются ве- личинами, растущими не быстрее, чем х”-1. Поэтому справедлива оценка |x(f) | скп~'е~йж*, где с > 0 — константа, не зависящая от х. Отсюда сразу следует, что путем увеличения х можно добиться желаемого результата, поскольку экспоненциаль- ный сомножитель с ростом х убывает быстрее, чем растет степенной х"-1. Таким образом, смещая собственные числа достаточно далеко «вглубь» левой полуплоскости, можно обеспечить сколь угодно бы- строе достижение равновесия с любой требуемой точностью. Этот формальный оптимистический результат скрывает, однако, некото- рые существенные детали, которые стоит пояснить на простейшем примере. Пример 5.1. Пусть объект описывается двумя скалярными урав- нениями = ^2, Х2 — U1 (0) = X?, r2(0)=Z2, Без управления он неустойчив. Введем обратную связь н = —kiXt — к2Х2. Выберем коэффициенты kt, кг так, чтобы обеспечить устойчивость замкнутой системы: х,=х2, х2 — —ktXt — к2х2 (5.6). и, более того, обеспечить быстрое приближение к состоянию х, = О, х2 — 0. Характеристическое уравнение замкнутой системы таково: V + + к, = 0. Потребуем, чтобы его корпи были равны X, = —х, Х2 = — 2х, что при больших х > 0 должно давать желаемый результат. При этом надо выбрать kt = 2х\ к2 = Зх, иначе говоря, коэффициенты обрат- ной связи должны быть также большими. Оценим процесс приближения к желаемому состоянию, найдя xt(t), x2(t) и «(<)• Применяя преобразование Лапласа к системе (5.6), получим: а> (х == р) „о ,_________1 го ' (Р + х) (р + 2х) 1 + (р + х) (р + 2х) 21 & 1Ж2 (0) = — + + 2к) Xl + {р + х) fp + 2х)
286 ГЛ. 6. МЕТОД ПРОСТРАНСТВА состояния откуда х2 (О = [2е~*‘ — е~™]х°,+ -t [е~* - е~^] x°Sf х2 (t) = 2х [-e~Ht + е~2М] x°t - [е~м - 2е~м\ х}. При больших к и nt главные слагаемые имеют вид Xjtt)да 2e~Ktxlf х2 (t) да — 2xe~xix?„ Пусть Xi — 1. Потребуем, чтобы при t >7 = 0,01 Щ/)|<0,1, Щ£)|<0,1 или 2е-°-’В * * 11‘ < 0,1, 2хе-0’01’1 0,1. Этого можно добиться, приняв х = 103, поскольку 2 X 103 X е-10 = — 0,09. Однако нетрудно оценить, что, прежде чем войти в малый допуск, координата x2(t) отклоняется от своего начального значения в 250 раз (в момент, равный 0,077), а отклонения от нуля процес- са u(i) достигают величины порядка х2 = 106. О Из приведенного примера можно сделать два вывода: Вывод 1.Тенденция к большому смещению в левую полуплос- кость собственных чисел замкнутой системы может приводить к большим «забросам» значений некоторых переменных, прежде чем они входят в желаемый допуск. Качество такого процесса стабилизации нельзя считать приемлемым. Вывод 2. Обеспечение произвольного расположения собствен- ных чисел может потребовать очень большого уровня управляю- щих воздействий. В силу первого вывода нельзя считать время практического за- тухания приемлемой мерой качества процесса стабилизации — важ- но, чтобы в течение всего процесса отклонения от желаемого состоя- ния были невелики. В силу второго выхода важно учесть ограниче- ния на допустимый уровень управляющих воздействий. 5.2. Интегральный показатель качества и его минимизация. Обе указанные тенденции можно формализовать, введя интегральный {энергетический) показатель качества процесса стабилизации в виде п m ” / = (5.7) i—1 о k—1 о ОО где qt > 0, rh > 0 — заданные коэффициенты. Слагаемые вида j х* dt о характеризуют «энергию» z-й компоненты вектора состояния (норму оо ее отклонения от нуля), слагаемые ^u^dt характеризуют «энер- 6
§ 5. ОПТИМИЗАЦИЯ СТАБИЛИЗИРУЮЩЕЙ ОБРАТНОЙ СВЯЗИ 287 ГИЮ» к-й компоненты вектора управления. Коэффициенты qt задают относительную важность отклонений по каждой координате (неко- торые из них могут быть несущественны и тогда q{ = 0), коэффи- циенты гк определяют важность «энергетических затрат» по различ- ным управляющим воздействиям. Оставим пока в стороне вопрос о том, как в конкретных задачах назначать коэффициенты соизмерения, и попытаемся установить, при какой стабилизирующей обратной связи достигается минималь- ное значение энергетического показателя. Перепишем его в матрич- ной форме; ОО оо J = J x^Qxdt + J u^Rudt, (5.8) о о где Q = diag{gi5 i = 1, ..., га}, 7? = diag{rs, &==!,...,т). Поскольку дальнейшее лишь несущественно усложняется, если считать Q про- извольной неотрицательно определенной матрицей, a R произволь- ной положительно определенной, то анализ будет проводиться имен- но в таких предположениях. Сформулированную проблему принято- именовать задачей оптимальной стабилизации, или линейно-квадра- тичной (ЛК) проблемой оптимального управления. Замечательной особенностью задачи оптимальной стабилизации является то, что в ней удается указать вид обратной связи, дающей наилучший результат при любых начальных условиях. Теорема 5.2. Пусть существует положительно определенная мат- рица Р*, являющаяся решением матричного квадратного уравне- ния*) А7Р + РА — PBR~'BTP + Q = 0, (5.9) и матрица К*, связанная с Р* соотношением K* — R~lB7P*. (5.10) Тогда при любых начальных условиях х° оптимальная стабилизация обеспечивается управлением и = —К*х, (5.11) причем минимальное значение показателя качества равно Jos>t=(x°)4>*x0. (5.12) Доказательство. Рассмотрим, как изменяется квадратичная форма- V(t) = x?(t)P*x(t), <5.13> *) В отечественной литературе принято называть это соотношение урав- нением Лурье, поскольку оно впервые было получено в исследовании А. И. Лурье (1951 г.) по теории устойчивости (см. гл. 8), в зарубежной это же- соотношение обычно именуется алгебраическим уравнением Риккати (причины возникновения такого названия см. в § 8).
288' ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ если х{1) изменяется в силу уравнений (5.1), a u(t) — произвольно. Имеем - dV . = хтР*х 4- х'!Р*х = (Ах + Ви)1Р*х + х'1 Р* (Ах 4- Ви). Интегрируя это соотношение, получаем t (W-dt = V(t)—V (0) = «т (t)P*x (t) — (x°)rP*x9 = J dt О t = J (ЛТР* + P*A) x + 2zrP*Bu] dt. 0 При любой стабилизирующей обратной связи ж(£)->0 при t->oo, так что j 1хт (АТР* + Р*А)х + 2xrP*Bu ]dt = — (х°)’гР*х°, о или, с учетом (5.9), (5.10), J [— x!Qx + х1 (K*)rRK*x + 2жт (K*fRu] dt = — (z°)TP*A о Добавляя и вычитая слагаемые uTRu, получаем — + ^Ru} dt +J [к’йц + x1 (K^RK^x-Jr 2xT (K*)Tu]dt = —G°)TP*x°.. 0 0 Таким образом, зависимость интегрального показателя (5.8) от произвольного стабилизирующего управления и представима в виде J = J (и + K*x)rR (и + К*х) dt + (х°)тР*х°, ' (5.14) о •откуда сразу следует, что минимальное значение достигается при и = —К*х, (5.15) поскольку R — положительно определенная матрица. Доказательство почти завершено. Осталось лишь убедиться в том, что об- ратная связь вида (5.11) сама является стабилизирующей. Доказательство спра- ведливости этого утверждения, равно как и доказательство следующей теоре- мы существования, мы отложим до более полного знакомства с теорией ус- тойчивости *). ♦) Доказательство устойчивости (гл. 8) основано на том, что Р* > 0. До- казательство же следующей Т.5.3, приведенное в Приложении 2, не только ус- танавливает этот факт, но и дает способ решения уравнения (5.9), использую- щий идею факторизации. Там же приведено описание итеративной процедуры решения (5.9).
§ 5. ОПТИМИЗАЦИЯ СТАБИЛИЗИРУЮЩЕЙ ОБРАТНОЙ СВЯЗИ 289 Теорема 5.3. Для существования единственного положительно определенного решения матричного квадратного уравнения (5.9) до- статочно, чтобы пара А, В была невырожденной, R>0 и, кроме того, выполнено одно из двух условий: либо a) Q положительно определена, либо б) Q^O.u представима в виде Q = CTC, причем так, что невырожденна пара матриц Ат, Сг. Описанная теория сводит задачу оптимальной стабилизации к чисто алгебраической задаче поиска решения матричного квадрат- ного уравнения Лурье. Отметим, что если размерность вектора со- стояния х равна п, то размер искомой матрицы Р* равен n X п. В силу симметрии Р* число неизвестных элементов равно n(n + 1)/2, для определения которых имеем систему такого же числа скалярных квадратных уравнений. Ясно, что решение этой системы само по себе является сложной вычислительной задачей (см. Приложение 2). Лишь при и = 2 ее можно попытаться решать «в лоб». Пример 5.2. Пусть для системы, описываемой скалярными уравнениями Xi — Хг, Хг = U, требуется найти стабилизирующую обратную связь и = —ktxt — kzx2, причем такую, что на траекториях -замкнутой системы при любых начальных условиях достигается минимум интегрального пока- зателя оо J = J (xl + ргг®) dt, о где р — положительный параметр. Задачу можно записать в стан- дартной матричной форме (5.1), (5.8), если обозначить А = (О 11 |0 о/’ в = <2 = [0 0), я==р. Затем предстоит решить уравнение Лурье (5.9), которое в этом слу чае имеет вид (О оП₽п Р12] М(0 Л M(°W U 0j(p12 Р23|/ V12 P22JIO OJ p (pla p22|(1Ja где введены естественные обозначения для элементов искомой сим- метричной матрицы Р. Перемножив матрицы в левой части урав- нения, получим: I 0 0 1 (° Рц1 _ £ Ь11 Ли» 1° Pi aJ Р Р12Р22 Р12Р22 /1 0) + (о о) = 0* "19 а. А. Первозванский
290 ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ I или 1 2 , . 1 } -7-Р12+1 Рп-Тр12₽22 _п _£ ,1г Рц р ^12^22 ^Р12 р Р22 Из равенства пулю всех элементов матрицы получаем: Р22 = ± /2РР12, РП = уР12Р22, Р12 = ± Кр. Искомое решение должно быть положительно определенным, при- чем заведомо р12. > 0, что дает правило выбора знаков: А2 = Р1/2, ^ = 2^/4, == 21/2pV4- Оптимальные коэффициенты усиления находятся по формуле (5.10): {♦ * \ Р™\ = ~~ {рЪ Р22] = {р-1'2,. 21/2p-V4j. Р12 P22J ₽ Замкнутой системе, описываемой соотношениями х, = хг, хг — —р-172#, — 21/2р-1/4а:г, соответствует характеристическое уравнение Х2 + 21/2р-1/^ + р“1/г = 0 с корнями Х1,г = p-‘/42~i/2(—1 ± i), расположенными в левой по- луплоскости. Более того, оно соответствует известному расположе- нию Баттерворта*). С уменьшением параметра р корни удаляются «вглубь» левой полуплоскости, причем с повышением степени устойчивости одновременно растут коэффициенты усиления и, как нетрудно подсчитать, энергия, затрачиваемая на управление. О 5.3. Построение критерия. Задание степени устойчивости. Вид оптимальной обратной связи зависит от выбора коэффициентов мат- риц Q и R, входящих в показатель качества (5.8) и определяющих характер «соизмерения» энергии различных компонент векторов состояния и управления. Проблема сведения различных требований, предъявляемых к системе, в единый показатель качества, имеющий к тому же специальную форму (5.8), не допускает однозначного' решения. На практике обычно используют прием приведения к относи- тельным величинам. Пусть известны величины xs, щ, превышение которых соответствующими компонентами векторов состояния и управления нежелательно. Тогда рекомендуется составлять критерий *) Общее исследование связи между многочленами Баттерворта и опти- мальными характеристическими многочленами дано в [3.3],
§ 5. ОПТИМИЗАЦИЯ СТАБИЛИЗИРУЮЩЕЙ ОБРАТНОЙ СВЯЗИ 291 жачества в виде т. е. принимать <2==diag — , R = diag (J-L MJ . К) Такой подход, по крайней мере, гарантирует соизмеримость всех компонент, хотя, конечно, нельзя утверждать, что оптимальная •стабилизация по указанному критерию действительно гарантирует невыход за ограничения xi; щ. Отметим также, что распределение собственных чисел матрицы оптимальной замкнутой системы также существенно зависит от выбора Q и R (см. гл. 9, § 4). Поэтому, стремясь гарантировать, чтобы распределение было не слишком плохим, зачастую вводят дополнительное требование при поиске оптимальной стабилизирующей обратной связи: она должна обеспе- чить степень, устойчивости замкнутой системы не ниже заданной величин^! б. Добиться удовлетворения этого требования несложно. Действи- тельно, решим задачу оптимальной стабилизации, использовав в расчетах вместо матрицы А матрицу А6 — А + 81. Тогда в резуль- тате решения уравнения Лурье получим матрицу й коэффициен- ты усиления Kt — R-'B'Ps такие, что матрица At,— Ль— В Kt, заведомо устойчива, т. е. все ее собственные числа лежат левее мнимой оси. Но тогда матрица А = А — ВК„ = А6 — ВКь — 81 = At, — 81 заведомо имеет все с. ч. левее прямой, сдвинутой относительно мни- мой оси на б, поскольку det [М - А] = det [KI - At, + 81] = del [(X + 8)1 - А5]. Таким образом, мы доказали справедливость следующего пра- вила. • Правило. Для построения оптимальной стабилизирующей обрат- ной связи, обеспечивающей заданную степень устойчивости 8 замкнутой системы, достаточно найти положительно определенное решение Р6 уравнения (А + 81УР + P(A + 8I)- PBR-'B'P + (? = 0 (5.18)' и принять u — —Kt,x, Ki^R-WPi. , (5.19) 49*
292 ГЛ. в. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ §6. Управление при наличии случайных возмущений 6.1. Постановка задачи. До сих пор в рамках метода простран- ства состояний делался акцент только на решение задачи ликвида- ции начального рассогласования, различия между начальным со- стоянием и желаемым. Введение обратной связи позволяет превра- тить это желаемое состояние в устойчивое положение равновесия. Если нет никаких внешних возмущений, то стабилизированная си- стема сколь угодно близко подойдет к цели. То же самое будет иметь место, если возмущения со временем сами по себе затухают. Однако, как уже указывалось ранее, типичной является ситуация, когда объект управления постоянно находится под действием внеш- них возмущений. - Наиболее .важно изучить влияние заранее непрогнозируемых возмущений, которые можно рассматривать как реализации случай- ного процесса w(t). При этом и изменение состояния x(t) ока- жется случайным процессом, отклонение которого от желаемого со- стояния xd = 0 можно оценивать только вероятностными харак- теристиками. Исследование односвязных систем при наличии стационарных случайных возмущений было проведено в гл. 4 с помощью метода передаточных функций. Здесь же мы продемонстрируем возмож- ности подхода, основанного на непосредственном использовании дифференциальных уравнений. Примем первоначально следующие предположения. а) Изменение состояния системы определяется уравнением х = Ах + Ви ± Gw (t) = Ах + Gw (t), х(0) — хл, (6.1) где А = А — В К при использовании обратной связи и — —Кх, (6.2) a (n X 1)-матрица G состоит из элементов, отражающих степень, влияния возмущения на скорость изменения каждой координаты состояния. б) Внешнее воздействие w(t) является белым шумом с единич- ной интенсивностью, т. е. M{w0(Z)}=0, М {wQ (t)W0(t+ т)} А/?Юо(т) = б(т), — оо<т<оо. (6.3) в) Начальное состояние- == (я®, i = 1, ,.., п) — центрирован- ный случайный вектор, некоррелированный с возмущением, причем вадаиа (п X w) -матрица О’ с элементами (х1х^}» (6.4)
S 6. УПРАВЛЕНИЕ ПРИ НАЛИЧИИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЙ 293- Зам ечанпе. Решение уравнения (6.1) понимается как линейное преоб- разование процесса w(t) и начального состояния х° в процесс х(г): t x(t) = h0 (t) x° + J hwx (t) w (t — T) dx, (6.5) - 0 где _ _ h0(t) = eAt, hwx(l) = eAtG, t^O. (6.6) Если u>(t) —белый шум, то операция интегрирования не может пониматься в классическом смысле [4.8]. Однако все дальнейшие соотношения .связаны толь- ко с корреляционным описанием x(t) и допускают строгое обоснование путем перехода от допредельного процесса и’Щ) с интегрируемыми реализациями к белому шуму w0(i) по схеме, описанной в гл. 4, § 3. 6.2. Вычисление матрицы ковариаций. Первая задача — научить- ся вычислять моментные характеристики процесса x(t). Очевидно, что M{z (1)} = 0 в силу центрированности w (4), х°. Введем (и X «) -мат- рицу Dx (4) с элементами dy(4)ДМ {^(4)^(4)}, 4,/ = 1, ,,., п. (6.7) Диагональные элементы daft) равны дисперсиям каждой координа- ты (4) вектора состояния, а внедиагональные равны взаимным корреляциям (ковариациям) различных координат. Матрицу Dx(t) обычно называют матрице!! ковариаций векторного случайного про- цесса x(t). Поскольку значение DX(O) = D<’ предполагается заданным, то следует указать способ вычисления Dx(t) для произвольного 4>0. Теорема 6,1. Пусть выполнены предположения а)—в). Тогда справедливо явное выражение _ _ t _ Dx(t) = eAtD°eAT‘ + G J е1 V4 dx GT,f (6.8) 0 совпадающее с решением матричного дифференциального уравнения DX^$DX + DXA* + GG\ Dx(Q)^=Da. (6.9) Если Л — устойчивая матрица, то существует предел Dx = const, Ds = lira DS(4) = G f^V^dxG^ (6.10) о матрица ковариаций установившегося процесса, удовлетворяющая матричному алгебраическому уравнению ADXA D^A1 + GG1 = ®. (6.11); Доказательство. По определению T)x(t} = М{х(г)х’'(0}- Подставляя в правую часть представление (6.5) и учитывая свойства г’ и »(!),
294 ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ доказываем (6.8): РЖ(О = ^(0М{ЖО(?)«ОТ(О} + t t + f f hwX (T1) C (S) M {U- (« - Tx) w (t - T2)} dT2 =» 0 0 J * = h0 (0 D°hl (t) + ^hwx (tJ dxr J h^x (x2) 6 (Tx - ra) dxa = 0 0 t ’ •= h0 (<) D°hl (t) + J hwx (Tj) hlx (т3) йтх = о To, что (6.8) дает решение (6.9), доказывается прямой подстановкой. Сущест- вование предела (6.9) следует из спектрального представления матричной экс- поненты и отрицательности вещественных частей с. ч. матрицы А. Поскольку D„ «= const и удовлетворяет дифференциальному уравнению (6.9), то Dx удов- летворяет и (6.11). Теорема 6.1 указывает удобную процедуру вычисления Д(Г) и в особенности матрицы ковариаций Dx установившейся реакции. Матричное уравнение (6.11), в силу симметрии Dx, эквивалентно п(п + 1)/2 линейных алгебраических уравнений относительно тако- го же количества неизвестных элементов dis, i, j = 1, ..., п этой матрицы. Пример 6.1. Пусть имеется устойчивая система Xi = x2, Х2 = —Xi — T/2x2 + w0(t), возмущаемая единичным белым шумом w0(Z). В матричной записи имеем Уравнение (6.11) принимает вид • ( 0 1 , Ии <Ц(0 -П (0 01 ГО 01 1-1 -VWh U + K UU -W + lo ij-lo op или _ _ cZ12 — 0, d22— du — V2d12 = 0, 2(—-d12 — y2d22)+1 = 0, откуда d14 = d22 = 1/(2 V2) . Напомним, что в гл. 4 для вычисления дисперсий установив- шейся реакции указывается путь, связанный с построением п. ф. и вычислением интегралов. В частности, здесь можно было бы найти £ н V 1(р) “ 7+уъ+7
§ 6. УПРАВЛЕНИЕ ПРИ НАЛИЧИИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЙ 295 и вычислить dit по формуле оо dll Sr f I Hwoxi Р —ОО что даст тот же результат. □ 6.3. Оптимизация обратной связи. Выбор любой линейной ста- билизирующей обратной связи вида (6.2) гарантирует ограничен- ность дисперсий отклонений координат системы от желаемого нуле- вого значения. Возникает естественный вопрос: как выбрать обрат- ную связь паилучшим образом? Примем за показатель качества величину т J = lim -i- f М {жт (t) Qx (t) + и1 (t) Ru (£)} dt^ (6.12) T->oo •* V 0 где Q и R — заданные матрицы весовых коэффициентов, осуще- ствляющих, как и в детерминированной задаче оптимальной стаби- лизации, соизмерение различных компонент векторов состояния и управления. Прежде всего покажем, что показатель 7 имеет смысл, т. е. предел существует и явно выражается через установившуюся ковариационную матрицу Dx = {dj. Действительно, М {жт (t) Qx (t)} = М [2 2 Qij*i (0 (t)l = 22 0Д I i i ) i i t. e. T lim -|r f M {«T (t) Qx (t)} dt — T-»oo * J 0 т = ZB ZB 1 j da (t) dt = Qijdn tr {QDx}t i i S i j где справа использовапо обозначение, читаемое «след матрицы QDxt> и означающее суммирование всех диагональных элементов матри- цы QDX. Аналогично имеем, в силу (6.2), что т lim -i- I М {uT (t) Ru (t)} dt = T->oo 1 J 0 = lim T-»oo Таким образом, показатель J представим в виде J = tr{(Q + KmK)Dx}, ‘ (6.131 у J М {xr(t)KrRKx (/)] dt = tr {K^RKDx}.
296 ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ Напомним, что матрица Ох также зависит от К в-силу уравнения (6.11), которое можно записать в виде (А - В К) Dx + DX(A — В К)т + = 0. (6.14) Таким образом, минимизация J путем выбора К эквивалентна ми- нимизации явно заданной функции (6.13) при Ограничениях (6.14). Для решения этой задачи используем косвенный путь, аналогич- ный тому, который был принят при решении детерминированной задачи оптимальной стабилизации в § 5. Теорема 6.2. Пусть выполнены предположения а) — в) и 7? > 0. Тогда оптимальное значение К* коэффициентов усиления в стаби- лизирующей обратной связи (6.2) дается формулой K* = R~'BTP*, (6.15) еде Р* — положительно определенное решение квадратного урав- нения * АЧ> + РА - PBR-'B^P + Q = 0, (6.16) если таковое существует. ; При этом минимальное значение J* показателя качества (6.12) может быть представлено в виде j*==QtP*G (6.17) Прежде чем доказывать теорему, подчеркнем замечательный харак- тер результата: вид оптимальной линейной обратной связи оказался тем же самым, что и в детерминированной задаче оптимальной ста- билизации (Т. 5.1) *). Д о к а з а т е л ь с т в о. В силу (6.1) М {хт (1) Р*х (1)} = М {(4® -f- Gw0)T/’*x] -f- М {.гтР* (Ах -f- Gu’o)], так что М {хт (т) Р*х (т)} — М {ж0ТР*г°} — т т = J М {хт (1Р* + Р*А) х} dt + 2GyP* J М {wx} dt. (6.18) о о Учитывая устойчивость А, имеем lim 4 М {хт (т) Р*х (т) - х0ТР*х0} = lim tr (Р* рх (т) - Dx (0)1} = 0. 2-,ОО * Т-»оо 1 ' л (6.19).. Используем также формулу (3.48) из гл. 4 для взаимной корреляции выхода и •) Имеется, тем не менее, существенное отличие в постановках этих задач. В § 5 разыскивалась наилучшая обратная связь среди любых стабилизирую- щих обратных связей, здесь же— только среди линейных, вида (6.2). В гл. 10 для аналогичной задачи показано, что при распределении возмущения, отлич- ном от нормального, оптимальная обратная связь может оказаться нелинейной.
§ 6. УПРАВЛЕНИЕ ПРИ НАЛИЧИИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЙ 297 белошумного входа: М{х («) ie0(t)}==-y fi,We3C(0y = -yG, (С.20) ‘ где учтено определение (6.6). Таким образом, из ((М8)—(6.20) устанавливаем тождество т li m 4г f м {хт (АГР* + Р*А) х} dt + G’rP*G = 0, Г^оо ' J 0 справедливое при любой устойчивой матрице А А А — ВК. Добавив тождест- венный нуль к выражению показателя (6.12), приведем его к виду т / = иш 4 Гм{хтитР*--ж'гвтр* + />м- , - * Т->со 1 J - , . 0 X — Р*ВК + Q + ICRK}х} dt + GTP*G. Поскольку Р* и К* в силу (6.15), (6.16) связаны соотношением • дгр* + р*А + Q — К*тк*, то дальнейшие выкладки позволяют получить представление г J = lim 4 Гм {«Т (к — к*)Тд — #*)4 dt + GTP*e. Т-»оо J о ;! - • ’ Поскольку при К =Н= К* первое слагаемое положительно, если Я > 0, и обраща- ется в нуль при К — К*, то К* доставляет минимум J, равный У* == G'SP*G. Пример 6.2. Пусть объект задан скалярным уравнением ^ = u + we(i), т. е. п = 1, А — 0, В — 1, G — 1. Примем Q=l, /? = рг. Тогда урав- нение (6.16) является скалярным й имеет решение р* = р =>/*==₽, \к* = р-*_ Чем меньше р, тем лучше достижимое значение показателя каче- ~ ства, но и тем выше требуемый коэффициент усиления. Замкну- тая система такова: х ——р~1х + w0(t), так что Я№х(р) = —2—., wox рр + 1 С уменьшением р растет полоса пропускания системы, а следова- тельно, погрешность от замены реального слабокоррелированного возмущения на предельный белый шум (ср., гл. 4, § 3). О 6.4. Синтез при возмущениях, отличных от белого шума. Не- смотря на замечательную простоту результатов Т.6.1, Т.6.2, их практическая значимость кажется сомнительной, поскольку они
298 ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ основывались на гипотезе б) о «белошумном» характере возмуще- ний. Однако при изучении установившихся режимов в линейной системе эта гипотеза не является особо обременительной. Действи- тельно, корреляционные свойства процессов x(t), и{1) определяются только видом корреляционной функции (или спектральной плотно- сти) возмущения w(t). Вместе с тем, как было показано в гл. 4, § 3, с точки зрения этих характеристик любой стационарный цент- рированный случайный процесс w(t) с дробно-рациональной плот- ностью Bw (Р) Bw (- Р) Aw (Р) Aw Р) p=i<a эквивалентен установившейся реакции формирующего фильтра, за- даваемого операторным уравнением Aw(D)w(t) = Bw(D)w0(t), (6.21) на внешнее белошумное воздействие Wt>(t). Согласно Т.1.1 урав- нению (6.21) можно сопоставить запись в виде Xw J AwXyj *f* B^lVq (/), W G^Xw, где матрица Аю имеет форму Фробениуса и задается коэффициен- тами многочлена AW(D), столбец Bw определяется коэффициентами многочлена BW(D}, а С„ = {1,..., 0). Начальные значения ж„(0) мо- гут быть взяты произвольными, поскольку, по определению, A„(D) — устойчивый многочлен, и мы интересуемся только установившимся режимом. Вывод: если исходное описание объекта дано в виде х = АхВи + Gw, где w(t)—коррелированный процесс с дробно-рациональной спект- ральной плотностью, то указанное описание может быть заменено эквивалентным (с точки зрения решения задачи управления по критерию (6.12)) 1 х = Ах + GCwxw + Ви, xw = Ал + Bwwa, где —процесс типа единичного «белого шума'». Введя блочные матрицы (4 GCw\ ~ fjB) т; (01 ~ (аП (0 Аш J1 (0)' \aw)' приходим к стандартной записи вида (6.2)1 х == Ах 4- Ви + Gw0.
§ 7. УПРАВЛЕНИЕ ПРИ НЕПОЛНЫХ И НЕТОЧНЫХ ИЗМЕРЕНИЯХ 299 Перепишем также показатель (6.10) в эквивалентной форме т ' J = lim 4г ( М + urRu} dt, (6.22) Т—> оо J Теперь оптимальная обратная связь дается в силу Т.6.2 в виде и = —R* *x, К* = Й-'ЁР, (6.23) где Р* — положительно определенное решение*) расширенного урав- нения Лурье Л'Р + РЛ-РШ1~'Й!Р + $ = Ъ. (6.24) Стоит подчеркнуть, что (6.23) предполагает знание координат xw(t) формирующего фильтра для определения текущего значения управ- ляющего воздействия и(0. В действительности в реальной ситуации или доступно для из- мерения само возмущение w(t), или вообще имеются измерения только координат системы x(t), или даже только одного, или не- скольких выходов ее. Координаты же xw недоступны, поскольку формирующий фильтр представляет собой лишь математическую конструкцию, введенную для преобразований условий задачи к стандартному виду. Путь преодоления этой неприятности будет указан в- следующем параграфе. § 7. Управление при неполных и неточных измерениях 7.1. Оценка при неполных измерениях. В предшествующем пара- графе было дано описание наилучшего (в смысле квадратичного показателя качества) выбора коэффициентов усиления К обратной связи u(t) = — Кх(1), (7.1) построенной на основе знания в каждый момент времени полного вектора состояния x{t). Как уже указывалось, гипотеза о возможности прямого и точного измерения x(t) практически мало приемлема. Примем теперь, как и в § 4, более естественное предположение, что измерительные устройства доставляют информацию о значениях только некоторых координат или их линейных комбинаций, т. е. что в каждый мо- мент t известен вектор измерений у(О=Сж(г), (7.2) *) Можно доказать, что для существования этого решения достаточно невырожденности пар А, В и Лт, Ст, если Q = СТС.
300 гл. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ где С — заданная матрица. Напомним, что для объекта, работающе- го без возмущений, по измерениям y(t) можно восстановить значе- ние x(t) с помощью системы асимптотической оценки: х = Ах+ Ви + L(y — Сх}, (7.3) причем при невырожденности пары Ат, Ст коэффициенты L можно выбрать так, чтобы обеспечить быстрое убывание ошибки оценива- ния е = х — х. Естественно попытаться применить ту же систему для оценки координат объекта, изменяющихся под действием слу- чайных возмущений согласно уравнению х — Ах +Ви +Gwe(t), (7.4) где wa(t)—белый шум единичной интенсивности, а управление, как и в задаче стабилизации (см. § 4), строить па основе оценок, принимая и----Кх. (7.5)’ Выясним сначала точность оценок. Вычитая (7.3) из (7.4), по- лучаем е = (4 — ЬС)8 + Gw0. (7.6) Введем в рассмотрение матрицу D(t) с элементами dn(t) = M{e,(Z)ej(i)}, которую будем именовать матрицей ковариаций ошибок оценивания. Если L выбрано, так что матрица 4 = Л — LC является устойчивой, то, применяя к (7.5) Т.6.1, получим: b(i)--*A 1~>сю где D удовлетворяет уравнению AD + DA' + GG' = 0. (7.7) Таким образом, в отличие от детерминированной задачи, ошибки оценивания с течением времени не исчезают. Тем более это имеет место, если сами результаты искажены случайными помехами. Рассмотрим детальнее именно эту практически важную ситуацию й покажем, как выбрать коэффициенты L, чтобы минимизировать дисперсии ошибок. 7.2 Оценка и управление при наличии помех. Примем вместо (7.2), что y(t)~Cx(t)+N(t), (7.8)
§ 7. УПРАВЛЕНИЕ ПРИ НЕПОЛНЫХ II НЕТОЧНЫХ ИЗМЕРЕНИЯХ 301 где N(t)— вектор случайных помех в измерительных устройствах. Справедливо следующее утверждение. Теорема 7.1. Пусть компоненты nt(t) вектора помех N(t) явля- ется белыми шумами, так что М {ni(t)nk(t — t)} = (7.9)' причем матрица У — {ол} является положительно определенной. Пусть возмущение w(t) также является векторным белым шумом, некоррелированным с N(t), bb{W?(t)uA(t + t)}A1P6(t), (7.10) причем W — заданная неотрицательная постоянная матрица. Пусть пары матриц A, G и А\ С1 невырожденны. Тогда при любых значениях коэффициентов L в системе оценки (7.3) дисперсии du установившихся ошибок оценивания е4 удовлет- воряют неравенствам da^d-iX), (7.11) где предельные значения d*, являются диагональными'элементами матрицы D*, которая представляет собой единственное положитель- но определенное решение уравнения AD + DAZ - DC^-'CD + GW = 0. (7.12) Значение D = Ь* достигается при L = L*—D*CV~l. Я (7.13) Доказательство этого утверждения приводить не будем. Отметим лишь, что для нахождения оптимальных коэффициентов усиления в устройстве оценивания требуется решить матричное квадратное уравнение (7.12), являющееся уравнением типа Лурье. Вместе с тем невозможность безошибочного оценивания состоя- ния по измерениям, искаженным помехами, заставляет усомниться в том, что сам способ управления по оценкам (7.5) является эф- фективным, даже, если оценки оптимальны. К счастью, это не так, и справедлив следующий замечательный результат, обычно назы- ваемый теоремой разделения. Теорема 7.2. Пусть для формирования линейного закона управ- ления с обратной связью для объекта, описываемого уравнением х = Ах + Ви + Gwv(t), доступны только измерения вида y = Cx + N(f), где w0(t), N(t)—взаимно некоррелированные стационарные случай- ные процессы типа белых шумов такие, что М [№о (i) wl (t + т)} = Wb (т), M [N (t) NT (t 4- t)} = V6 (t).
302 ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ Пусть пары матриц А, В и Ат, Ст, невырожденны, а матрица V — положительно определенная. Тогда закон управления , и = — К*х, х=*А'х+Ви + В*[у — Сх] (7.14) доставляет минимум показателю т 7= Нт^[м{^(/)<2ж(0 + ит(0д«(0}^. (7.15) Т-*оо 1 О О Матрица коэффициентов усиления в обратной связи К* находится в силу формул (5.9), (5.11) (при соответствующих условиях на матрицы Q, В), а матрица L* коэффициентов в устройстве оцени- вания— в силу формул (7.12), (7.13), так что оптимальный закон управления представляет собой соединение оптимального устройства оценивания*} и оптимальной обратной связи по оценкам состоя- ния. Вновь опустим доказательство**). Покажем вместе с тем, что сфера приложения конструктивного результата теоремы разделения может быть существенно расширена. 7.3. Задача оптимального слежения. Мы уже убедились, что тре- бование о «белошумном» характере возмущения w(t) может быть снято, если ввести искусственную конструкцию «формирующего фильтра» и расширить вектор состояний, дополнив его компонентами вектора состояния фильтра. Та же идея позволяет применить теоре- му разделения к следующей более общей задаче, обычно называе- мой задачей оптимального слежения. Пусть требуется обеспечить близость каких-либо координат объекта или их линейных комбинаций цх(1}, 7 = const, к случайно изменяющемуся вектору zd(t), определенному через решения xd(t) системы ? = A'!xd + Gdwd(t), = (7.16) где Ad, Gd, — заданные постоянные матрицы, a wd (() — процесс типа «белого шума» с единичной интенсивностью. *) Такое устройство часто называют фильтром Винера — Калмана. Если часть измерений осуществляется без помех, то структура фильтра может быть упрощена (см., например, [3.3]). **) Строгое доказательство достаточно сложно [6.4, гл. 6], обычно же при- водимые в качестве доказательства относительно простые рассуждения некор- ректны. Однако в дальнейшем (гл. 10) мы установим аналог теоремы разделе- ния для несколько более простого в математическом отношении описания объ- екта и, более того, покажем, что при нормально распределенных возмущениях и помехах закон управления типа (7.14) является наилучшим среди любых (даже нелинейных) законов,
§ 7. УПРАВЛЕНИЕ ПРИ НЕПОЛНЫХ И НЕТОЧНЫХ ИЗМЕРЕНИЯХ 303 Систему (7.16) можно трактовать либо как описание другого объекта, к выходу которого должен приближаться выход управляе- мого объекта, либо как формальную конструкцию формирующий фильтр,— с помощью которой описывается процесс zd(t), первона- чально заданный своей дробно-рациональной спектральной плот- ностью. С учетом целесообразности «сдерживания» затрат на управление показатель качества можно сформировать в виде г J == где первое слагаемое характеризует близость z(Z) и zd(i), а вто- рое—затраты на управление. Введем обозначения для блочных матриц I (О Ad) Ip J to Gd) Тогда уравнения (7.14), (7.16) объединяются в одно: х = Ах + Ви + Gw (7.18) и показатель (7.17) записывается в стандартной форме т J = lim-ф- Т~> оо 1 Предположим, что мы располагаем измерениями y(t) — Cx(t)+N(t), yi(t) = Cixi(t)JtrNi(t'), (7.20) где N(t), Nd(t)~ помехи, являющиеся взаимно некоррелированными «белыми шумами» с заданными положительно определенными мат- рицами интенсивностей V, Vd. Вновь вводя обозначения J М {(z — zd)TQd (z — zd) + u^Ru] dt,: (7.17) j M (xTQx+uTRu} dt. (7.19) Wj’ 10 vdr приходим к стандартной форме уравнения «объединенного» изме- рителя 1, у (О = Сх (t) + N (t). Теперь ясно, что для решения задачи оптимального слежения пол- ностью пригодна схема, указанная в теореме разделения, хотя это достигается при увеличений размерности всех фигурирующих в ней матриц.
304 ГЛ. в. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ Кратко остановимся на сопоставлении методов, описанных в данном параграфе и в гл. 4, где рассматривалась близкая по смыс- лу задача для односвязной системы. Пусть z(t), zd(t), u(t) —скаляр- ны, Qd ~ i, R — p‘, тогда (7.17) эквивалентно ] = D {е (t) } + pD {u(t)}, где е (t) Л zd (t) — z(t)—ошибка слежения. Такой же «составной» показатель рассматривался в § 2 гл. 4. Однако исходные предположения об описании объекта, возмуще- ний, помех и отслеживаемого процесса были другими. Приведение этого описания к форме, использованной теперь, в принципе воз- можно, однако важно проконтролировать выполнение формальных условий теоремы 7.2 прежде, чем применять методику синтеза. . Наряду с этим следует иметь в виду, что для многосвязных си- стем применяются и операторные методы, являющиеся непосред- ственным матричным обобщением процедур гл. 4 ([4.2, 6.5]), хотя необходимость аналитических выкладок с полиномиальными матри- цами делает их приемлемыми лишь для систем малой размерности. § 8. Системы с переменными параметрами 8.1. Описание и анализ. Методы анализа и синтеза, основанные на использовании представления в пространстве состояния, имеют несомненное преимущество перед операторными методами в том, что они сравнительно легко распространяются на значительно более широкий класс объектов, а именно, на линейные системы с пере- менными во времени параметрами. Основная модель принимается в виде . х — A (t)x + B{t)u + G(t)w, (8.1) где x, и, w — по-прежнему вектор-функции состояния, управления и возмущения, а А, В, G — матрицы соответствующих размерностей, элементы которых, однако, могут изменяться во времени. Эти изме- нения являются или внутренним свойством системы, или следствием внешних возмущений*). Далее мы будем считать законы изменения элементов А, В, G заданными функциями на весь отрезок времени работы системы от начального t = t0 до конечного t = tf. Используя (8.1), можно построить явное выражение для состоя- ния х (t) в произвольный момент i> t0 через начальное состояние x(te) и функции w(t), w(t). Теорема 8.1. Решение системы x = A(t)x + f(t) (8.2) *) Основным источником возникновения уравнений типа (8.1) при иссле- довании реальных систем является линеаризация нелинейных моделей в окре- стности нестационарных режимов,
§ 8. СИСТЕМЫ С ПЕРЕМЕННЫМИ ПАРАМЕТРАМИ 305 представимо в виде x(O = 1F(0x(fo) +JY (ОТ-Чт)/(T)drs (8.3} *0 где матричная функция 'F (/), называемая фундаментальной мат- рицей, по определению удовлетворяет уравнению ±W(i)^A(t)W(i)t (8.4} а обратная ей удовлетворяет уравнению ±[T-1(i)]T = -^W[,F-1(0]T, (8.5}, (II/ называемому сопряженным к (8.4). Доказательство справедливости формулы (8.3) можно проверить прямой подстановкой (8.3) в (8.2). Действительно, с учетом (8.4) имеем Начальное условие очевидно удовлетворяется. Уравнение (8.5) следует из тождества ^(/)Т->(«) =7, дифференцируя которое, получаем [ Т («) У-1 (0 ] = 0 [V(0IT"1 (0 + Т (0 [т-Ч)! = 0, или с учетом (8.4) А (0 V (0 У-1 (0.+ Т (0 V"1 (0 = 0 => Т-'1 (0 А (0 = - ’F-1 (0, что эквивалентно (8.5). Формула (8.3), обычно называемая формулой /Соши, сводит ре- шение неоднородного уравнения (8.2) к вычислению фундаменталь- ной матрицы т. е. к решению матричного однородного урав- нения (8.4) с единичным начальным условием. При переменной A(t) фундаментальную матрицу лишь* в редких случаях удается выразить аналитически через элементарные или специальные табу- лированные функции с хорошо изученными свойствами. Как правило, для определения Т (t) по заданной матрице A(tj и заданному начальному моменту t0 приходится использовать только процедуры численного интегрирования, что затрудняет качествен- ное исследование решений и, в частности, изучение проблемы устой- 20 д, а. Цервозвавский
306 гл. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ чивости. Поскольку фундаментальная матрица зависит от начально- го момента t0, то зачастую удобно ввести в обозначение второй аргу- мент, записывая ее в виде Т (t, t0). Вспоминая определение матричной экспоненты, можно убедиться, что при А (t) = А = const фундаментальная матрица имеет вид Т(/, t0) = eA^~4 (8.6) т. е. зависит только от разности t —10. Анализ поведения объекта, описываемого уравнением (8.1) при произвольных управляющих и возмущающих воздействиях, опирает- ся на формулу (8.3). Принимая в ней f(t)AB (t)u(t) + G(t)w(t), получаем г t x (t) = Ч*1 (t) x (t0) + J hu (t, т) u (t) dx + J* hw (tx x) w (t) dx, (8.7) f0 *0 где обозначено hu(t, x) (ty?-1 (x) В (x), hw(t,x)^W(t)W~1(x)G(x). (8.8) Формула (8.7) определяет x(t), t>t0, как линейное преобразо- вание совокупности х(t0), и(х), w(x), te[Z0, it]. Матричные функ- ции hu(t, т), hw(t, x) обычно именуют весовыми (или переходными) матрицами преобразования от управления и возмущения к состоя- нию системы, описываемой уравнением (8.1). В случае постоянных параметров hu(t, х) = еА^В, hw(t, т) = еА('~т><7, (8.9) -т. e. имеется зависимость только от разности t — х*). В этой главе мы ограничимся исследованием систем с перемен- ными параметрами только на. конечном отрезке времени [t0, tt]. "Тогда при любых ограниченных воздействиях x(t) ограничено, если абсолютно интегрируемы на [£0, t/] соответствующие весовые функ- ции, для чего достаточно [6.3] ограниченности элементов матриц А, В, G, что и будет предполагаться в дальнейшем. 8.2. Оптимизация закона управления. Введем обобщенный «энер- гетический» показатель качества работы системы (8.1) при детер- минированных u>(t): Ч ' • J {и} = j [жт (t) Qx (t) + uT (t) Ru (t)] dt + жт (tf) QjX (t/). (8.10) t0 - *) Читатель может заметить терминологическое несоответствие: в § 1 ве- совые функции для системы с постоянными параметрами определялись иначе (в (8.9) надо заменить t — т на t), однако это несоответствие почти общепри- нято в литературе.
§ 8. СИСТЕМЫ С ПЕРЕМЕННЫМИ ПАРАМЕТРАМИ 307' Его интерпретация та же, что для показателя (5.8), введенного ра- нее для оценки эффективности управления системой с постоянными1 параметрами при неограниченном времени работы. Особенностью яв- ляется лишь наличие внеинтегрального слагаемого, подчеркивающе- го важность уменьшения отклонения от желаемого состояния х = 0? в момент завершения процесса управления. Теорема 8.2. Пусть матрица R является положительно опреде- ленной, a Тогда управление u*(t), при котором достигает- ся минимум показателя (8.10), представимо в виде линейной об- ратной связи u*(f) = -ZT*(Ox(i) (8.11)' по измерениям состояния x(t) в тот же момент времени. Матрица оптимальных коэффициентов обратной связи K*(t) определяется" формулой R^B^^tyP*^), • (8.12> где P*(t) — симметричная матрица, являющаяся решением матрич- ного дифференциального уравнения ^t + AT(t)P + PA(t)-PB(t)R-1B^t}P + Q = Ot (8.13> удовлетворяющая условию P(tf) = Qf. (8.14} Минимальное значение показателя (8.10) равно J{u*) = xT(i0)P*(f0)x(/0). (8.15> Доказательство аналогично проведенному в § 5. Введем функцию V (х, f) = (t) х, (8.16) где Р*(1) удовлетворяет (8.13), (8.14). Дифференцируя (8.16), в силу уравне- ния (8.1) (при w = 0) получаем rfV . • — = хР*х + х'Р* х-{- х'!Р*х = dt . = [А (г) х + В («) itfPx + х^Р* [X («) х + В (/) и] + хгР*х или, с учетом (8.13), dV -рр = хтР*В (t) В-1 ВгР*х — x^Qx + 2utjBt (1) Р*х, откуда v (h) - V (Q Д Ы)р* х - *т (‘о)р* (М * (Q = = J |хт [Р^В (г) R-'B^ (г) Р* - <?] X +2 UTBT («) Р*Х [ dt. 20*
308 ГЛ. в. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ Используя определение показателя качества (8.10) и условие (8.14), можно те- перь записать tf + J рТ/>*В + «т^и +2uTBT (0 *о или tf Z{U) = xT(to)P*(io)a:(«o)+J[u + /<*«)a:lT^[M + /<*(0®]«, (8.17) где K*(t) = R~4F(t)P*(t). Из (8.17) сразу следует, что управление (8.12) явля- ется минимизирующим среди любых возможных управлений, причем верпа формула (8.15) для оптимального значения показателя. Существенным отличием от ранее полученного результата яв- ляется нестационарностъ оптимальной обратной связи, зависимость коэффициентов усиления от времени, что несколько усложняет ее практическую реализацию. Более сложным является и вычисление самих коэффициентов усиления, поскольку оно требует интегрирования матричного диф- ференциального уравнения (8.13), известного под названием мат- ричного уравнения Риккати. Оно нелинейно и эквивалентно системе п (га + 1) /2 нелинейных скалярных уравнений относительно соответствующего числа неиз- вестных элементов матрицы P(t) (как обычно, га — размерность век- тора состояния х). При больших п задача может не «поместиться» в стандартные программы численного интегрирования. Отметим так- же, что для использования стандартных программ условие (8.14) .следует преобразовать в начальное условие путем простой замены времени 0 = f/ —£. При этом (8.13), (8.14) приобретают вид ^=ЛТ((/-0)Р(0) + Р(0)А(1/-О)- -P(9)B(f/-0)P~1JBT(i/-0)P(0) + (2, ^|9=о = <?+, (8.18) где явно подчеркнута зависимость параметров от «обращенного» времени. Если эти параметры постоянны, то можно попытаться разыскивать частное решение (8.18) в виде Р = Р* = const. Если юно существует, то должно удовлетворять матричному квадратному уравнению ЛТР + РА - PBR-^P + Q = 0, (8.19)’ которое уже фигурировало в § 5 и именовалось уравнением Лурье. "Теперь становится ясным происхождение и другого его наименова-
§ 8. СИСТЕМЫ С ПЕРЕМЕННЫМИ ПАРАМЕТРАМИ 30 9 пия — алгебраическое уравнение Риккати, которое более распрост- ранено в литературе *). Приведем без доказательства следующий результат [6.3]. Теорема 8.3. Пусть существует положительно определенное ре- шение Р* уравнения (8.19); тогда при любой неотрицательно опре- деленной матрице Qf, задающей начальное условие, решение Р*(т) уравнения (8.18) стремится к Р* при % -> °° не медленнее, чем экспоненциально. Подчеркнем, что и для системы с постоянными параметрами ко- эффициенты усиления в оптимальной обратной связи являются пе- ременными, если качество управления оценивается показателем (8.10) при ограниченном tf. Лишь для моментов времени, доста- точно удаленных от конечного, оптимальными оказываются постоян- ные коэффициенты, определяемые, как и в § 5, с помощью по- стоянной матрицы Р* — решения уравнения (8.19). Реальные системы всегда работают ограниченное время, и этот результат, казалось бы, ставит под сомнение эффективность всей подробно разработанной в предшествующих параграфах методики, основанной на гипотезе, что Т — tt — £0 -*• °о. На самом деле эти сомнения необоснованны. Справедлив следу- ющий результат **) [6.7]. Теорема 8.4. Если вместо оптимального, зависящего от времени коэффициента усиления K*(t) использовать постоянный, получен- ный с помощью решения алгебраического уравнения (8.19), то эф- фективность управления, определяемая показателем (8.10), ухуд- шится не более, чем на величину AJ = щет™ + с А- е~™ + О Ш, (8.20) 1 \т / где Ci, с2 не зависят от Т = tf — ta, а « — величина, сколь угодно близкая к степени устойчивости замкнутой системы. Из оценки (8.20) ясно, что погрешность, связанная с исполь- зованием обратной связи с постоянным коэффициентом усиления, быстро убывает с ростом времени действия управления, и притом тем быстрее, чем выше степень устойчивости замкнутой системы. 8.3. Метод «замороженных» параметров. Вернемся вновь к си- стемам -с переменными параметрами, однако предположим, что их изменение происходит достаточно медленно, хотя за длительное время работы может оказаться существенным. Пользоваться обрат- ной связью с постоянным коэффициентом усиления, как правило, недопустимо. По здравому смыслу ясно, что если настроить регу- *) Я. Ф. Риккати (1676—1754) известен исследованием нелинейного диф- ференциального. уравнения 1-го порядка с квадратичной нелинейностью, обоб- хцением которого является (8.18). **) Доказательство Т.8.4 и Т.8.5 дано в гл. 7, § 3. Оценка (8.20) справедлива в асимптотическом смысле, т. е. существует такое Т, что (8.20) верно ири всех конечных Т
310 • ГЛ. 6, МЕТОД ПРОСТРАНСТВА СОСТОЯНИИ лятор, ориентируясь на начальные значения параметров, то со вре- менем они могут настолько «уползти», что настройка окажется не только не оптимальной, но даже не будет обеспечивать устойчи- вость. Возникает простая идея: в каждый момент времени выбирать обратную связь заново, ориентируясь на текущее значение парамет- ров, но использовать для выбора те же приемы, что и для систем с постоянными параметрами. Этот подход принято называть мето- дом «замороженных» параметров. Разрешается пользоваться любыми разумными приемами синтеза управления, в частности, частотными методами гл. 3. Однако наиболее ясную форму метод заморожен- . ных коэффициентов приобретает, если в каждый момент времени t настраивать регулятор, исходя из' требования минимизации инте- грального показателя / ОО со J<x> {«} = j [xTQx + uTRu] dt = J [xTQx + urRu] dt, (8.21) t 0 и при этом условно считать, что параметры A(t), B(tj останутся неизменными, «замороженнными», на все время от текущего t до бесконечности. Тогда коэффициенты регулятора окажутся равными К (t) = R~lBT (t)P (t), (8.22) где P(t) —решение алгебраического уравнения: AT(t)P + PA(t) —PB(t)R~lBT(t)P+Q = 0. (8.23) Спрашивается, какова эффективность этого простого подхода, насколько ухудшится значение исходного показателя качества (8.10), если вместо оптимального коэффициента усиления K*(t), рассчитываемого с помощью дифференциального уравнения Риккати (8.18), использовать коэффициент K(t), рассчитанный в каждый момент t с помощью алгебраического уравнения (8.23)? Асимптотическую оценку иогрешности дает следующее утверж- дение, аналогичное Т.8.4. Теорема 8.5 [6.7]. Пусть элементы матриц А, В медленно изме- няются во времени, т.е. A=A(pt}, B^B(pt), (8.24)’ где ц>0 — малая величина. Пусть длительность работы системы T = tt —10 достаточно велика, Т = —Го, так что за время Т мат- рицы А, В изменяются существенно. Пусть для любого t е [?0, tf] существует положительно определенное решение P(t) уравнения (8.23). Тогда существует такое у >0, что при любых fl, использование обратной связи u(t}=—R(t)x(t} (8.25) при К(е)^в-'в\е)рщ (8.26)
§ 8. СИСТЕМЫ С ПЕРЕМЕННЫМИ ПАРАМЕТРАМИ 311 ухудшает значение показателя качества (8.10) не более, чем на величину Ы =с1ё2хГ + сг|лё-кТ + О(ц2), (8.27) где с^ сг не зависят от р, и х -— минимальная из величин х0, 2х_/, причем х0, X/ сколь угодно близки к степеням устойчивости замкну- той системы с параметрами, «замороженными» при t — ta и t — tt соответственно. Теорема 8.5 показывает, что метод «замороженных» параметров действительно «почти оптимален», если* время работы системы су- щественно больше времени затухания переходных процессов в замкнутой системе, а скорость изменения параметров настолько ма- ла, что за время затухания они меняются незначительно. Пример 8.1. Рассмотрим одномерный объект . х = ах + Ъи, ж(0)=1, t е [0, Т], параметры которого линейно изменяются во времени, так что а = — v (0, Ь = v (0, v (0 = 1 + у- 0 и приведем анализ влияния скорости у изменения параметров объ- екта на эффективность управления, строящегося по методу «замо- раживания». В качестве показателя примем т J = f(x2 + ua)di. о Тогда, согласно (8.22), имеем й(0 — bp(t), где p(t) —положительное решение квадратного уравнения 2ар — bzp2 + 1 = 0, —н2р2 — 2vp + 1 = 0, так что й(0 = £ = У2—1, т. е. метод замороженных параметров в данном случае приводит к,_ постоянному коэффициенту усиления в обратной связи. Оптимальный же коэффициент переменен и нахо- дится путем решения уравнения Риккати —р = 2ар — Ъгр2 + 1, р(Г) = 0, k*(t) = bp*(t). Зависимость k*(t)/k, полученная путем численного интегрирования при различных у, представлена на рис. 6.7. Ясно, что k*(t) близок к постоянному к в течение почти всего периода времени лишь при весьма малых у и больших Т. Вместе с тем сравнение значений показателя качества 7, полу- чаемого при использовании к и Jopt, показывает, что проигрыш нич- тожен в широком диапазоне у, Т, Величина (J — J Opt) /opt не пре-
312 ГЛ. 6. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЙ вышает 1% при Т > 2, —0,3 < ч С1, а также при Т = 1, 0 <4 «S 1 *)', что дает хорошую иллюстрацию к оценке (8.27). Заодно можно- убедиться, что при 7 = 0 (постоянных параметрах объекта) исполь- вование постоянного к дает относительную погрешность, меньшую 0,2ехр(—2,87’) (ср. с оцен- кой в теореме 8.4). □ Построение регулятора по методу «замороженных» параметров имеет сущест- венные преимущества с точ- ки зрения технической реа- лизации. Действительно, из уравнения (8.13) видно, что. для вычисления значения P*(i), а следовательно, опти- мального коэффициента уси- ления необходима знать, как меняются пара- метры А, В в будущем, пос- ле данного момента t (инте- грирование ведется «вспять». рис. в.7 01 заданного конечного зна- чения). Для вычисления «почти» оптимального коэффициента K(t) требуется знать только значения параметров в тот же самый момент времени. Поэтому, если информация о будущих изменениях отсутствует или. неточна, оптимальная процедура не проходит, а метод «замороженных» па- раметров остается работоспособным. На этом факте основывается простейший способ построения «поч- ти» оптимальных регуляторов с автоматической настройкой коэффи- циентов усиления. Принципиальная схема его показана на рис. 6.8. Рис. 6.8 В систему, кроме измерителя текущего состояния, вводится измери- тель текущих значений параметров объекта. Результаты измерения параметров обрабатываются вычислительным устройством, которое *) Вычисления проведены М, Цирульниковым,
§ 8. СИСТЕМЫ С ПЕРЕМЕННЫМИ ПАРАМЕТРАМИ 313 либо оперативно, с высоким быстродействием, решает уравнение (8.23), либо использует готовые формулы'преобразования значений параметров в значения коэффициентов усиления обратной связи K(t). В действительности все измерения являются не вполне точ- ными и неполными, дают лишь оценки измеряемых процессов ж((), .Л (£), B(t). Поэтому детальное изучение свойств систем с на- стройкой параметров является важной специальной проблемой тео- рии автоматического управления (см. гл. 11). Тем не менее рис. 6.8 отражает основную идею автоматической настройки (самона- стройки). . _ 8.4. Управление при случайных возмущениях. Кратко остановим- ся на проблеме управления системами с переменными параметрами при наличии возмущений (»(£)=#= 0). Если закон изменения возмущения в течение всего времени ра- боты системы [10, £/] известен, то решение проблемы выбора управ- ления, минимизирующего показатель (8.10), мало отличается от случая w(i) = 0. Теорема 8.6. Оптимальное по критерию (8.10) управление систе- мой (8.1) дается формулой и*(х, t)=—K*(t)x(t) — uw(t), (8.28)' еде первое слагаемое (управление с обратной связью) строится в соответствии с Т.8.2, а второе (компенсирующее управление) нахо- дится после вычисления решения n*(t) вспомогательного векторного уравнения n + (A — BK*Yn + P*Gw(t) = Q, n(tf) = 0 ' (8.29) по формуле u{l)(t)=B-tB'rn*(t). (8.30) Доказательство вполне аналогично доказательству Т.8.2 за тем ис- ключением, что функция V(t, х) берется в расширенном виде: V (i, х) = х^Р* (t) х + 2 [л* («)]та:. (8.31) Стоит отметить, что наличие полной информации о возмущениях па все будущее время, предполагаемое в Т.8.6, обычно сопровож- дается и наличием сведений о начальном состоянии. В этом случае допустимо (по крайней мере при устойчивом объекте) пользоваться чисто программным управлением, которое вычисляется по схеме: а) проинтегрировать уравнение (8.1) при заданных начальных условиях после подстановки в него и = и* (х, t), тем самым найдя оптимальную траекторию x*(t); б) вычислить программу как u*[x*(t), £]. Если же в действительности нет информации о будущих значе- ниях возмущения, а имеется лишь возможность измерения текущих значений, то вновь удобно использовать идею «замороженных» па- раметров. При этом вместо (8.29) используется алгебраическое
314 ГЛ. 8. МЕТОД ПРОСТРАНСТВА СОСТОЯНИЯ соотношение (A(t)-B(t)K(t)yn + P(t)G(t)w(t)~O, (8.32) откуда находится приближенное выражение для компенсирующего слагаемого й<‘> (£) = —R~lB* (i) {[4 (f) - В (0]т}-‘Р (О G (f) w\t) =» =-^„(f)»(/)'. (8.33) Принципиальная схема, ранее указанная на рис. 6.8, в этом случае дополняется каналом управления по возмущениям (рис. 6.9), опи- рающимся на данные измерителя', дающего оценку w(t). Рис. 6.9 8.5. Управление по оценкам. Перейдем теперь к краткому изло- жению задачи управления объектом с переменными параметрами при наличии случайных возмущений w(t) «белошумного» характера и такого же рода помех N (t), искажающих результаты измерения. Как и в § 6, предположим, что с измерителя непосредственно посту- пает сигнал y(t) = Cx(t) + N(t), (8.34) где С — заданная (возможно, зависящая от t матрица) . В этом слу- чае необходима предварительная обработка сигнала с помощью фильтра (системы оценки). Вновь без доказательства приведем утверждение, аналогичное Т.7.2. Теорема 8.7. Пусть для построения закона управления системой (8.1) доступны только измерения (8.34), причем известно, что М{1а(0^Ч«+т)}=Ж(/)6(т), MN (t) NT(t + т)} = У(«)6(т), еде V(£)—положительно определена при всех £,]. Пусть на- чальное состояние объекта случайно и известно, что MU(i0)) = пг°, M{[x(i0)— иг0] [я(М— m°]T} =D°, (8.36)
§ 8. СИСТЕМЫ С ПЕРЕМЕННЫМИ ПАРАМЕТРАМИ 315 Тогда закон управления u=*—K*(t)x(t), t (8.37) х = Ах + Ви + L* (£) [у — C#]t (8.38) x(t0) = M{x(f0)) (8.39) доставляет минимум показателю Ч J {“} ~ j" {x'Qx + urRu} dt + М {жт (£/) QjX (8.40) <о если K*(t) определяется так же, как в Т.8.2, а L*{t) —D*(t)C{t)V-l{t), (8.41) еде D* {^удовлетворяет матричному, дифференциальному уравнению ld = AD + DAT — DC!V~'CD + GWGT (8.42) с начальным условием D{t0) = D\ (8.43) Обобщения на случай коррелированных возмущений и задачу оптимального слежения могут быть проделаны путем расширения пространства состояний так же, как в § 7. Обратим внимание на то, что уравнение (8.42), определяющее коэффициенты L*{t) усиления в фильтре (8.38), вновь является уравнением типа Риккати, однако оно интегрируется от £0 «вперед», а не «вспять», от ts, как (8.13). Поэтому для получения текущего значения L*{t), а следовательно, и текущей оценки x{t) состояния объекта нет необходимости знать изменения параметров на будущее. Таким образом, при наличии косвенных и неточных измерений сохраняет силу идея построения системы управления, выражаемая рис. 6.9, однако сама оценка получается не непосредственно с изме- рителя, а после обработки его выхода y{t) в вычислительном устрой- стве. Теперь на него приходится возлагать и вычисление L* (£) по уравнениям (8.41), (8.42), и вычисление оценки x{t) по уравне- нию (8.38). Впрочем, при наличии полной информации о будущих значениях параметров коэффициенты L*{t) можно подсчитать предварительно и сохранять в памяти вычислителя.
ГЛАВА 7 ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ И ИМПУЛЬСНОЕ УПРАВЛЕНИЕ § 1. Свойства дискретных систем 1.1. Основная математическая модель. В течение почти всего кур- са использовалось главное предположение: управление строится на основе математической модели, позволяющей с той или иной точ- ностью предсказывать состояние объекта (или какую-либо интере- сующую нас выходную характеристику) в любой момент времени его работы. Однако во многих практических ситуациях, в особенности при управлении сложными объектами, это предположение не оправдано. Заменим его более слабым: при построении управления возмож- но использовать только предсказание состояния объекта или его выходы в некоторые моменты времени t = th, к = 0,1, 2, ..., образу- ющие дискретную последовательность. Состояние объекта в любые промежуточные моменты времени не определено. При этом любая текущая информация, поступающая в течение работы объекта, так- ,же может характеризовать его состояние только й те же моменты времени. Приведем два примера. Пример 1.1. Имеется склад, с которого удовлетворяется спрос на различные продукты. Для пополнения запаса на складе организуют- ся поставки, объем которых управляем. Особенность задачи заключается в том, что точное время поступ- ления заказанных поставок неизвестно, можно указать лишь опреде- ленный интервал времени (например, декаду, месяц), когда они придут. Равным образом непрогнозируемо распределение во време- ни спроса, т. е. момент времени, когда появится заявка на сохраняе- мый продукт, и объем заявки, однако суммарное количество за те же интервалы времени достаточно хорошо известно. Пусть х И — количество продуктов на складе в начале к-т о ин- тервала*), ip И —объем спроса на них в течение этого интервала, а и\к\ — объем заказа на тот же интервал. *) При отрицательных значениях х[А] значение |х[/с] | интерпретируется как дефицит, долг [4.7], .
§ 1. СВОЙСТВА ДИСКРЕТНЫХ СИСТЕМ 317 Тогда соотношение х [А + 1] = х [Л:] + и [к] — w [к] (1.1) определяет изменение состояния склада как объекта управления только на дискретном множестве моментов времени к = 1, 2, ..., если задано начальное количество продуктов ж[0] = х°. При этом со- стояние объекта в любые промежуточные моменты ие определено. D Пример 1.2. Рассмотрим задачу диспетчерского управления про- изводством, состоящим из нескольких участков (цехов). Диспетчеру неизвестен ход производства внутри каждого участка в любой мо- мент времени, и он не может управлять самим производством. Его цель заключается в том, чтобы выдавать задания на выпуск конеч- ной и промежуточной продукции в течение определенного интервала времени (смены) и контролировать их выполнение, зная количе- ство продукции, поступающей на склады после смены. При этом известно, что каждое задание должно быть обеспечено сырьем, ком- плектующими изделиями и промежуточными продуктами в опреде- ленных количествах, задаваемых нормативами затрат. Эти количе- ства изымаются со складов в течение смены, равно как со склада конечной продукции изымаются продукты, направляемые внешним потребителям. Ясно, что задача диспетчерского управления в такой формули- ровке представляет собой обобщение задачи, описанной в П.1. Ее особенность заключается в том, что необходимо учесть взаимосвязь задания на поставку (выпуск) со спросом на продукты (сырье), используемые при этом выпуске. Для прогноза результатов управления можно использовать следу- ющую матричную модель [4.7]: • х[к + 1] = х{к\ + и [к] — аи [А:] — w [А], (1.2) где х [Zc] = (Xi И) — вектор наличия продуктов и сырья разных ви- дов на складах в моменты th; и [к] — поступление за счет производ- ства и поставок извне; а —матрица с элементами а(/, равными нор- мативам затрат продукта (вида сырья, полуфабриката) с номером I па производство продукта с номером /; w [/с] — вектор поставок ко- нечной продукции вовне, удовлетворяющих внешний спрос (часть его компонент заведомо равна нулю). Управляемым выходом системы может быть как скалярная вели- чина, например, суммарная стоимость выпускаемой продукции или стоимость продукции на складах, так и векторная величина (сово- купность показателей). Важно лишь то, что любой из таких показа- телей определяется наличием продуктов и управляемых факто- ров *). □ *) Более детальное представление о различных моделях управления про- изводством можно получить по книге [4,7],
318 ГЛ. 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ Приведенные примеры позволяют сформулировать общую диск- ретную линейную модель в виде: х [к + 1] = Ах [А] + Bv [Аг]т х [0] = ха, y[&] = Сх[к] + C„v\k\, к = 0, 1, ..., (1-3)' где х Щ — вектор фазовых переменных (переменных состояния); V [Л] — вектор входных воздействий; у [&] — вектор выходных управ- ляемых процессов; А, В, С, С„ — матрицы параметров. Если матрицы постоянны, то будем говорить о стационарных мо- делях (однородных во времени) и пока ограничимся только ими. 1.2. Анализ дискретной модели. Уравнения (1.3) сходны с диф- ференциальными уравнениями, рассматривавшимися в гл. 6, но ана- лиз их значительно проще. Действительно, с помощью (1.3) можно последовательно (рекуррентно) подсчитать состояние и связанный •с ним выход в любой момент: х [1] = Ах° + Ви [0], х[2] = А3х° + АВи[0] + Bv[i}, к—1' 1 х [к} = Акх° + 2 Ah~l~1Bv [I], (1-5) y[k] = CAhx’> + 'Z САк~1~1Ви[1] +Cvv[k], 1=0 причем все операции сводятся к простому перемножению матриц. Какие-либо математические изыскания требуются только для ис- слсдования асимптотического поведения при больших к. Определение. Дискретная система называется устойчивой по начальным условиям, если х [А] -► 0 при к-+оо, (1.6) когда v [А:] = 0. Система, в которой из условия |о[А]|С с = const ’ (1.7)' •следует ограниченность 1ж[А:]1, называется устойчивой к внешним возмущениям. При наличии обоих указанных свойств система, опи- сываемая (1.3), называется устойчивой. Теорема 1.1. Дискретная система является устойчивой, если все ‘•собственные числа матрицы А лежат внутри единичного круга !AvI< 1. ' (1.8) Доказательство проведем для случая, когда все собственные числа различны. Введем замену х [A] = 8Ц&], где 8 —неособая матрица, столбцами которой являются собственные векторы А, причем S~]Л8 = diag {?.v}. Из (1.3) •следует 5Р + 11 = 8-148и*Ц-у1А:], Й{А]
§ 1. СВОЙСТВА ДИСКРЕТНЫХ СИСТЕМ 319 или в скалярной форме Ы* +1] = (1.9) При v[k] == 0 имеем vv[^l = 0 и m = (Av)*gv[O], (1.10) так что при условии (1.8) ||v[^]| -*0 при к-*-оо, а следовательно, |а:[&] | ->-0. С другой стороны, из ограниченности v[fc] следует ограниченность всех av[fe], | Cv — const, так что 1Ы* 4~ 1] | IM | gvW | 4* |pv[^] I4 14*1 | 4~Cv, откуда I4*]| |Xv|sIM0]| +cv[l+ 14 +...+IXVP"1]- Из сходимости геометрической прогрессии вытекает ограниченность |£„[Л]|, а следовательно, |ж[/с] |. 1.3. Структурные свойства. Все структурные свойства, выявлен- ные в § 2 гл. 6 для линейной системы, описываемой дифференци- альными уравнениями в нормальной форме, справедливы для. дискретных систем, описываемых рекуррентными соотношения- ми (1.3). Ведь все эти свойства (полнота входа, полнота выхода, невырож- денность или вырожденность системы, выделение «висячих» частей системы) определялись свойствами матриц А, В, С и устанавлива- лись с помощью перехода к подходящему базису (неособой замены переменных). Точно такие же процедуры можно проделать (остав- ляем это в качестве упражнения) и для уравнений (1.3) *). Свойства полной управляемости и наблюдаемости для дискретных; систем имеют место при тех же требованиях к матрицам А, В, С,. что и в непрерывном случае, причем доказательство их достаточно- сти проще. Теорема 1.2. Система, описываемая уравнениями х [fc + 1] == Ах [fc] + Ви [Аг], x[0]=x°, y[k] = Cx[k], k = 0, 1, ..., (1.11) где u[k], k = 0, 1, ..., — последовательность управляющих воздей- ствий, вполне управляема, если и только если невырожденна пара- А, В, и вполне наблюдаема, если и только если невырожденна пара Ат, С\ Доказательство. По определению, система вполне управляема, если существует такое ограниченное управление, что в некоторый момент к > 0 под. его действием достигается желаемое состояние х[к} =0 при произвольном ограниченном а:0. Примем к = п. Тогда в соответствии с (1.4) х[п] = Апх° + Ви[п — 1] +ВАи[п — 2] + ...+ВДп_1и[0]. (1-12) Это соотношение можно записать в виде линейного уравнения относительно неизвестных и[п— 1], и[п — 2], ..., и[0] Ви[п — 1] + АВи[п — 2] + .,. + Ап~*Ви[0] = х[п] —Апх°, *) Так же как и в гл. 6, эти свойства определены для случая С„ = 0,. т. е. для отсутствия мгновенного воздействия входа на выход.
320 ГЛ. 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ которое разрешимо при любой правой части, если выполнено условие невырож- денности пары А, В, т. е. rank {В АВ ... Ап~'В} — п. Тем самым устанавливается достаточность этого условия. Рассмотрим теперь систему линейных уравнений САх* = у[1] — СВи[0], (1.13) СДп-ix0 = у[п — 1] — САп~2Ви[0] — ... — СВи[п — 2]; находим, что невырожденность пары 4Т, Ст достаточна для решения ее относи- тельно неизвестного х° при произвольной правой части, т. е. известных значе- ниях входа и выхода. Вместе с тем знание начального состояния позволяет по рекуррентному соотношению (1.11) определить состояние х [7с] в любой по- следующий момент, что и решает задачу наблюдения. Необходимость условий невырожденности вытекает из структурной тео- ремы. Остановимся на некотором отличии решения задач управляемости и наблюдаемости для дискретных систем от непрерывных. Здесь не гарантируется возможность мгновенного (или почти мгновенно- го — для любого Т > 0) достижения цели: требуется некоторое фик- сированное число тактов*), чтобы привести систему в заданное со- стояние или оценить состояние по наблюдениям (измерениям) вхо- да и выхода. Формальные же процедуры решения основных задач теории управления для дискретных систем аналогичны соответствующим процедурам гл. 6. § 2. Управление с обратной связью 2.1. Стабилизация и влияние постоянных возмущений. Будем ис- ходить из основной модели х[к + 1] = Ах [к] + Ви [А] + Gw [Ц к = 0, 1, ..., х [0] == ха, (2.1) тде внешние воздействия являются управлениями и [к] и возмуще- ниями w [А]. При управлении, задаваемом по программу, система устойчива, если матрица А имеет с. ч. внутри единичного круга. В противном случае для стабилизации можно использовать обрат- ную связь u[fc] = —Кх[/с], (2.2) так что х[к +i] = Ах[к]+Gw[k], (2.3) АА.А-ВК. (2.4) Из результатов § 4 гл. 6 сразу следует вывод. *) Ойо может быть и меньше п, если ранг В (или Ст) больше 1,
§ 2. УПРАВЛЕНИЕ С ОБРАТНОЙ СВЯЗЬЮ 321 Теорема 2.1. Если пара матриц А, В является невырожденной, то может быть выбрана матрица К коэффициентов обратной связи (2.2), так, чтобы замкнутая система (2.3) была устойчивой. Действительно, при условии невырожденности по_известному ал- горитму можно выбрать К, так чтобы с. ч. матрицы А располагались произвольно, в частности, внутри единичного круга. Следствие 1. Пусть ip[Zc] = O. Возможен выбор К так, чтобы про- цесс перехода в состояние х = 0 заканчивался не более, чем за п тактов, если п — размерность вектора х {говорят, что при таком вы- боре в системе обеспечена бесконечная степень устойчивости) . Доказательство. Выберем К так, чтобы матрица Л имела все с. ч. пулевыми. При этом характеристическое .уравнение имеет вид Хп = 0. Тогда по теореме Гамильтона — Кэли Ап = 0, но в силу (2.3) при iv[k] =0 имеем х[п] = Дпх° => х[п] = 0. - ' Следствие 2. Пусть на систему действует постоянное возмущение w [к] — w = const. Тогда при выборе обратной связи, обеспечивающей бесконечную степень устойчивости, в системе x\k+i] —Ax[k] +Bu[k\+Gw, u[k]=* —Kx[k}, (2.5) не более чем за п тактов устанавливается постоянное значение век- тора состояния _ 7 ха ==[Z - 4]-‘Gw. (2.6) Доказательство. Имеем по рекурренции x[fe] = Ahx°+ [/ + А+ ... так что при к > п. х[к] = [I - A]~'Gu> = хм, поскольку Л” = 0и [/-A]-1 = Z + Д + ... + 4"-' + Д" + ... = 7 + 4 + ...+ Д»-1. Теми же способами, что и в гл. 6, исследуется ситуация, когда управление может базироваться только на неполных измерениях состояния, представимых в виде у[к] — Сх[к]. (2.7) Теорема 2.2. Пусть пары матриц А, В и Ат, Ст невырожденны. Тогда система х [й + 1] = Ах [к\ + Ви [fc] + Gw [fc] стабилизируется с помощью обратной связи, задаваемой соотноше- ниями и[к] = —Кх[к), л[к +1] = Ах[к] +Ви[к]+Gw[k]A-L{y[k] — Cx[k]}, /с = 0, 1, ...; 2[0] = ?, (2.8) в которой коэффициенты К и L выбираются так, чтобы матрицы 21 А. А. Первозвапский
322 ГЛ. 7- ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ А — В К и А — LC имели собственные числа внутри единичного круга. Пусть w [/с] = 0, к = О, 1, ... Если все с. ч. указанных матриц нулевые, то яг[/с] = О, е [Л] А ж[/с]—х[/с] = О при к~^2п. (2.9) Пусть w\k} — w = const; тогда для установившегося значения х[к] справедлива формула (2.6), причем при нулевых с.ч.ихе = О оно достигается не более, чем за п тактов. Доказательство производится аналогично § 4 гл. 6 путем перехода к переменным ер] = — х[к] и ер], после чего сразу следует, что характеристи- ческий многочлен системы в целом является произведением многочленов мат- риц А — ВК и А — LC. При выборе нулевых с. ч. он равен А2", откуда, как и в следствии Т.2.1, вытекает (2.9). Последнее утверждение также легко доказы- вается. Подчеркнем, что соотношения (2.8) представляют собой рекур- рентный алгоритм, который по произвольному х[0] и поступающей информации о значениях выхода и ранее принятых управлениях позволяет подсчитать новое управление. В отличие от простого пра- вила (2.2) соотношения (2.8) требуют для формирования управле- ния знания результатов измерений не в тот же самый момент, а только в предшествующие. Необходимо также понимать, что если возмущения w[k] недо- ступны для прямого измерения, то алгоритм управления (2.8) не- осуществим. Его можно упростить, изъяв из (2.8) слагаемое Gu?[7c]. Очевидно, что замкнутая система останется устойчивой, но ее реак- ция на воздействие изменится. В частности, при w[k\ — w = const установившееся значение вектора состояния будет также постоян- ным, но примет другое значение. Действительно, предполагая в уравнениях замкнутой системы х[к] = х^,- х[к] = х„, и\к} = и^„ получим х^ = Ах„ + Ви^ + Gw, uOQ = —KxQO, х„ = Ахх + Ви*, + L [Сх„ — Схх], исключая из которых и„, яв, найдем: xm = [I — A]-'Gw + [7 - Л]-1 ВК[1 - А + LCj-'Gw. (2.10) Второе слагаемое (ср. с (2.6)) появляется именно в силу того, что при оценке состояния мы не располагаем знанием возмущения. 2.2. Оптимизация обратной связи при полных измерениях и от- сутствии возмущения. Примем за показатель качества работы си- стемы величину J = s {хт [&] Qx [7с] + ит [Лг] Ru [Лт]}, (2.11) h=Q
§ 2. УПРАВЛЕНИЕ С ОБРАТНОЙ СВЯЗЬЮ 323 где Q и R-— заданные матрицы, которые, как и в интегральном по- казателе (5.10) в гл. 6, позволяют соизмерить отклонения различ- ных компонент состояния от желаемого значения х И = 0 и «затра- ты» на управление. Теорема 2.3. Пусть х{к+1] —Ах[к] +Ви[к], ж[0] = х’. (2.12) Пусть Я > 0 и существует единственное положительно определен- ное решение Р &Рopt уравнения . Р-£РА + A^PBR~1B'tPA — Q = Q, R^R + B^PB. (2.13) Тогда при любых Xs показатель (2.11) достигает минимального зна- чения, равного (я:0)тРор4^в, если u[k] = ua^[k] =—К0^х[к}, (2.14)’ еде ' Ко^В~1ВЧ>охЛА. (2.15) Доказательство*). Введем последовательность V[k] такую, что F[A] = жт[А]Рор1а:[А], А = 0, 1, ... (2.16) При произвольном стабилизирующем управлении и[к] имеем х[к] Г [А] ->0 при к-+оо. (2.17) Вычислим приращение V[k] за один такт при изменении х[к] в силу <2.12). Имеем У[Л + 1] -V[k} = {Ах[к] + Bu[k]pPopt{Ax[k] + 5и[А]}- — xT[fc]POptx[A], А = 0, 1, ... Суммируя по всем значениям к с учетом (2.17), получаем, что при любом ста- билизирующем управлении 2 [V [А + 1]-П*11= -V [0] = 2 {*т 1*1 hTPopt4-^opt] х 1*1 + л=о к=о + 2мт [к] В^Р^Ах [к] + ит [А) В^Р^Ви [А]). откуда, в силу определения F[0], РОрt, получим ' 2 {zT [AJ Qx [*] 4- uT [A) Ru [&]} = <:() = 2 {u [A] + p-xBTPopt42 [A])T R {« [A] + ТгЧПР^Ах [A]) + (г0)’?,/. ft=9 Поскольку левая часть совпадает с 1, а правая достигает минимума при «[А], вычисляемом в силу (2.14), то результат доказан. Теорема 2.3 сводит поиск оптимального управления к решению матричного уравнения (2.13) и вычислению по формуле (2.15). *) Сравните с § 5, гл. 6. Здесь вновь опущено доказательство того, что управление вида (2.14) является стабилизирующим, 42*
324 ГЛ. 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ Уравнение (2.13) отлично от уравнения типа Лурье, однако для нахождения его решения применимы аналогичные процедуры. Без доказательства приведем следующее утверждение. Теорема 2.4. Последовательности Pw, Kw, 2 = 1, 2, ..., строя- щиеся по рекурренции Р^‘> = А^Р‘‘-1>А - + Q, Р(0> = О, (2.18) К(‘> = (Л(!>)-’ВТРМ, Й(‘> = R + B*PWB, t = 1, 2, ..., сходятся к Popt,KoPt, если пара А, В невырожденна, В положитель- но определена, a Q либо положительно определена, либо Q = CTCt причем пара Ат, Ст невырожденна*). Отметим, что условия сходимости являются и условиями суще- ствования решения (2ЛЗ). 2.3. Случайные возмущения. Предельной альтернативой гипотезе о постоянстве возмущений является предположение о том, что воз- мущения на каждом такте изменяются, и притом непредвидимым образом. Формализуем это предположение более жестко, считая, что а) значения w[fc] для каждого к заранее неизвестны, но явля- ются реализациями случайной величины (скалярной или вектор- ной); б) для любого к М{гр[/с]} = 0 (в противном случае можно было бы выделить ненулевую постоян- ную составляющую); , в) для любых к и I, к^ I М {ш [it] uf [Z]} = О (в противном случае имеется корреляционная связь между значе- ниями в разные моменты, и знание предшествующих значений позволяло бы лучше прогнозировать будущие); г) известна и постоянна дисперсия w[k] или (в векторном случае) ковариационная матрица № {w{k\uA\k\} &DW. Определение. Последовательность w[&], обладающая свой- ствами а)—г), называется стационарной последовательностью не- коррелированных величин, или дискретным «.белым шумом». В отличие от белого шума, рассматривавшегося в теории непре- рывных систем, дискретный белый шум — простое и естественное понятие, не требующее для своего определения никаких предель- *) Указанные условия не являются необходимыми. В частности, не меша- ет вырожденность, но при устойчивости «висячих частей».
g 2. УПРАВЛЕНИЕ С ОБРАТНОЙ СВЯЗЬЮ 325 пых переходов. Поэтому и изучение поведения дискретных систем, возмущаемых таким белым шумом, является более простой про- блемой. Теорема 2.5. Пусть последовательность х[к] связана с последо- вательностью w [А] соотношением х\к+1] = Ах\к] +Gw[k], х[0] = х9, (2.19) причем ю [к] — дискретный «белый шум», некоррелированный с хв. Тогда х[к] является случайной последовательностью, ковариацион- ная матрица которой Д М {х [Zc] xr [/с]} может быть вычислена рекуррентно-. Dh+i—AI)hA't A-GDWG\ fc = 0, 1, ..., (2.20) при заданной матрице DQ, Если система (2.19) устойчива, то существует постоянный предел D<x, = YivoDhf (2.21) Й~>оо удовлетворяющий линейному уравнению D = ADA* + GDWG\ (2.22) Доказательство. В силу определения и (2.19) имеем: = fA{x[k + 1]жт[^+ 1]} = ЛМ{я [Аг] жт [А] }ЛТ + 4-ЛМ{х[А] wr[k]}G^ + GfA{iv[k]x'I[k]}AT + GfA{w[k] w^[k]]G'r = = ADhAT 4- GDaG* 4- ЛМ{я[А] wT[A])G’ 4- СМ{ш[А]х’[А])Л’. Для доказательства (2.20) остается лишь установить некоррелированность я [А] и и? [А]. Имеем: . й-1 х [А] = Ahx° + 2 Ab-^Gw (Z] =>М {x [AJ wT [A]} = 7=0 = Л*М {хйи* [A]} 4- {w p] u>T [&]} = 0 в силу предполагавшейся некоррелированности и?[Аг]. Доказательство сходимо- ста последовательности Р* к постоянному пределу проведем, предполагая, что собственные числа Л различны. В силу рекурренции Dh = Л*О0(Лт)» 4- Л*-1СРШС1(ЛТ)*-1 4-... 4- GD„G\ k = 1, 2, ... (2.23) По предположению имеется неособая матрица S такая, что А = SAS-1, (2.24) где Л = diag{%v) и |AV| < 1, v = 1, 2, ..., п. Подставляя (2.24) в (2.23), по- лучим Dh = SA^g^S1 4- «[ДА-’дЛ4-1 4- ... 4- g]ST, (2.25)
323 ГЛ. 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ где введем постоянные симметричные матрицы «о = « £ rWW = {9у}. (2-26) Все элементы первого слагаемого стремятся к нулю при к -> оо, а любой элемент (г, /) матрицы, стоящей в квадратных скобках, можно представить в виде 9у[(А-Л)Л-1 +•••+/Н 1 _2 что завершает доказательство и вместе с тем дает явную формулу для устано- вившегося решения {д.ч ) гфтт- <2-27> которой можно воспользоваться при вычисленнных собственных числах и соб- ственных векторах Я *). | Кратко остановимся на задано оптимальной стабилизации при случайных возмущениях. Как и в непрерывном случае, можно до- казать, что управление, минимизирующее показатель N J = lim 4г У м {ят [*] Q* [#] + WT [fc] Ru [&]}« (2.28) на решениях системы, описываемой уравнениями x[k + l}^Ax[k] + Bu[k] + Gw[k], fc = 0, 1, 2, ..., а:[0] = х», (2.29)’ не зависит ни от начальных условий, ни от интенсивностей шумов, т. е. матрицы Dw, а определяется теми же формулами (2.13)— (2.15), что и в соответствующей детерминированной проблеме. Приведем без доказательства и формулу для оптимального зна- чения показателя качества: /шт = tr (P0DtG£>wGT}, (2.30)' где Popt — решение (2.13). В качестве упражнения можно вывести элементарный вариант этой формулы для случая R — 0 и неособой матрицы В **): Jroln = tr{QGDwGT}. Этот результат достигается при uopt Ш = —В~'Ах [к], т. е. на каж- дом такте управление компенсирует влияние случайных возмуще- ний, пытаясь привести систему в состояние равновесия, от которо- го она вновь отходит под действием последующих возмущений (за- ранее непрогнозируемых, а потому и некомпенсируемых), так что в замкнутой системе х{к + 1] = Ga>[&], к = 0, 1, ... *) Из существования предела (2.21) следует, что он удовлетворяет урав- нению (2.22), которое может непосредственно использоваться для вычисле- ния ** ) См. также Приложение 2, и. 2ж.
§ 2. УПРАВЛЕНИЕ С ОБРАТНОЙ СВЯЗЬЮ 327 2.4. Управление при неполных и неточных наблюдениях. При- ведем без доказательства основной результат*). Теорема 2.6 {теорема разделения). Пусть управление и[1], 1 = «= О, 1, ..., может строиться только как преобразование результатов измерений, связанных с состоянием х\к} системы (2.19) формулой у[к]=Сх[к\ + N[k\, к = 0, 1, .... l-l, (2.31J где последовательность {N [&]} — нормальный белый шум с задан- ной матрицей ковариацией DN, некоррелированный с возмущением {грВД}, также являющимся нормальным белым шумом. Тогда ми- нимум показателя (2.28) достигается на управлении и [/с] = uopt И = — К^.х [Ц ' (2.32) x[k-V 1] *=-4я [Л]-Ь Bu [fc] + Z.opt(y[/c]— (2.33) где Kovi = (Я + B’PoptB) -‘ВТ0РгЛ, Lopt = 4DoptCT [Da + CDoptCT‘, (2.34) a P0!>T, Dopt являются положительно определенными решениями уравнений Р - АТРА + АЧ>ВТ {R + В'РВ) ~1В?РА - Q = 0, (2.35) D — ADAT + ADC {DN + CDCT)~'CrDAT — GD^G7 = О (2.36) существование и единственность которых предполагается. Подчеркнем, что оптимальный закон управления имеет струк- туру стабилизирующей обратной связи (2.8), где, конечно, отсут- ствует w [й], поскольку таковое не измеряется. Матрицы К и L имеют фиксированное значение, зависящее от параметров показателя качества, параметров системы и интенсив- ностей шумов (возмущений и помех в измерениях). Соотношение (2.33) дает оптимальную оценку состояния по неполным и неточ- ным измерениям. Оно обычно называется уравнением фильтра Бъюси — Калмана и аналогична уравнению фильтра Винера — Кай- мана в теории непрерывных систем (см. гл. 6, § 7). Уравнение (2.36) совпадает по структуре с (2.35) и может быть решено, например, с помощью итеративной процедуры, описанной выше. Таким образом, мы убедились, что для решения задач, рассмот- ренных в теории непрерывных систем, можно составить аналоги в теории дискретных систем и получить аналогичные схемы решения. Процедуры решения других проблем, в частности, проблемы опти- мального слежения, описанной в § 7 гл. 6, также можно построить по аналогии. *) В гл. 10 дано доказательство аналогичного -утверждения для конечного времени работы системы (см. также [4.5]) в предположении, что при вычисле- нии управления может использоваться и результат измерения, полученный в тот же момент времени.
328 ГЛ. 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ § 3. Импульсное управление непрерывными объектами 3.1. Описание импульсных систем. Основным достоинством зако- нов управления, построенных на основе дискретного описания объ- ектов, является простота их реализации с помощью средств вычис- лительной техники. Действительно, для выработки управления и[к + 1] на очередном такте к + 1 согласно, например, формулам (2.32), (2.33) требуется а) хранить в памяти вычислительного устройства значение оцен- ки состояния х [fc], найденное ранее, и значение управления и [к], принятого ранее, на предшествующем такте; б) ввести в память результат измерения у [к], отражающего со- стояние в момент tk; в) обработать эти данные по программе, включающей только операции умножения и сложения; г) выдать результат обработки как требуемое значение нового управления. Очевидно, что эта процедура прекрасно приспособлена к воз- можностям универсальной цифровой вычислительной техники. В то же время законы управления, построенные ранее на основе непрерывного описания (в виде дифференциальных уравнений) са- ми задавались дифференциальными уравнениями и требовали для своей точной реализации использования средств аналоговой вычис- лительной техники, в частности, посроения специализированных схем на основе операционных усилителей. Описание с помощью дифференциальных уравнений, как неод- нократно подчеркивалось, является естественным следствием ис- пользования известных законов природы при математическом моде- лировании объектов управления. С другой стороны, современная практика создания систем управления характеризуется тенденцией перехода к универсальным процедурам хранения и обработки ин- формации с помощью ЦВМ. Спрашивается, как найти выход из этой противоречивой ситуа- ции? Можно пойти двумя путями (и оба они практически исполь- зуются) : а) вести обработку с помощью дискретшш техники, используя вместо найденных непрерывных законов их дискретную аппрокси- мацию по той или иной схеме численного интегрирования; б) выработать дискретные законы управления, заменив исходное непрерывное описание дискретным. В обоих случаях возникает вопрос о выборе способа аппрокси- мации. Мы в основном займемся исследованием возможностей вто- рого пути по той причине, что он является единственным при на- личии еще двух осложняющих обстоятельств, также типичных для многих практических ситуаций: а) на объект можно оказывать воздействие только в течение не- которых интервалов времени его работы;
§ 3. ИМПУЛЬСНОЕ УПРАВЛЕНИЕ НЕПРЕРЫВНЫМИ ОБЪЕКТАМИ 329 б) измерения могут производиться только в фиксированные мо- менты времени. Очевидно, что при таких обстоятельствах описанные ранее не- прерывные законы управления вообще не применимы. ' Примем теперь ряд более четких ограничений на класс зако- нов управления, удовлетворяющих поставленным техническим тре- бованиям. 1) Управляющее воздействие полностью определяется заданием последовательности величин (скалярных или векторных) и [А], к = = 0, 1, ... 2) На объект (или промежуточный усилитель мощности) по- дается воздействие u(t), сформированное на основе этой последо- вательности так, что u(t)=u[k]pk(t), tk^t<tk^, (3.1) где pk(t) — заданные функции, характеризующие каждый А-й управ- ляющий импульс и удовлетворяющие условиям Рл(О = О , -Х3.2) при t < tk и t 5» tk + A*, > 0. Эти формальные условия требуют пояснений. Во-первых, реальный технический объект, работающий в реаль- ном непрерывном времени, изменяет свое состояние только под дей- ствием реального же фактора (силы, электрического напряжения и т.п.), изменение которого надо определить в любой момент вре- мени. Следовательно, величинам и [&] надо сопоставить какую-либо функцию непрерывного времени. Техническое устройство, осуще- ствляющее такое сопоставление, называют модулятором (или преоб- разователем «код — аналог», если величины и [/с] даны в виде чис- ловых кодов). Во-вторых, если на объект нельзя действовать вне заданных ин- тервалов, то эти интервалы можно совместить с отрезками [4, tk + Ак], вне которых согласно (3.1), (3.2) управление равно нулю. В дальнейшем ограничимся только системами, где управляющие импульсы одинаковы по форме, отличаясь только началом прило- жения Pdt) = p(t — tj (3.3) Функция p(f) называется формирующей. Будем считать, что мо- менты tft образуют периодическую последовательность 4+« = 4 +то, & = 0, 1, ..., 4=0, А* = А0<т0. Величина т0 называется шагом дискретности, или периодом кванто- вания по времени, или периодом чередования импульсов, Величйна ДотГ1 называется скважностью импульса.
330 ГЛ. 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ Наиболее прост случай, когда Z>(t)=l, О^Кто. (3.5) Построение функции u(t) по последовательности {и [/с]} сводится при этом (см. рис. 7.1, а) к фиксации значения u(t) при kx0^t< <(/с+1)т0 на уровне и[к]. Техническое устройство, вы- полняющее эту операцию, называется фиксатором. Дру- гой вариант задания формы импульса показан на рис. 7.1, б. Введем еще два условия. 3) Измерения (прямые или косвенные) состояния объекта производятся только в фиксированные моменты времени, причем для упро- щения примем, что они сов- падают с указанными выше моментами приложения им- пульсов У (th) = У(^а) А у [к]. (3.6) 4) Выполнено условие причинности: при выборе очередного значения управ- ляющей последовательности и[к] не могут быть использованы будущие измерения у|7], I > к. Иногда это условие следует ужесточить, учитывая, что обработка наблюдений требует времени, а следовательно, в u[fc] можно учесть лишь наблюдения, поступившие до момента tk — кха, т. е. значения U(t). , 4[0] «[2] И[П О Tq 2Cq- Зг0 I 1 1 П ° ; тИ i ' П-d id? Н- I Г*- J*-l I |Лй I I II & Рис. 7.1 Аг0 t /гг0 t а п 4о i Определение. Системы, где используются законы управле- ния, удовлетворяющие условиям 1)—4), называются линейными импульсными, если выработка управляющей последовательности и |7с] базируется только на линейных преобразованиях результатов изме- рений, а сам объект является линейным. 3.2. Дискретные модели непрерывного объекта. Исходным для исследования импульсных систем является следующее свойство. Теорема 3.1. Пусть на систему, описываемую уравнением = Ах (t) + Ви (i) + Gw (t)r х (0) = ж0, (3.7) ut оказывается управляющее воздействие вида (3.1). Тогда значения вектора состояния x(t) в моменты t=tk = kxa, k = l, 2, ..., могут быть вычислены рекуррентно по формуле х [k + 1] =» А*х [7г] + В*и [7с] + w* [А], (з.8):
§ 3. ИМПУЛЬСНОЕ УПРАВЛЕНИЕ НЕПРЕРЫВНЫМИ ОБЪЕКТАМИ 331 где = тв Л* = еА\} В* = J еА^Вр (х)йхя ° (3,9) w* [к] — j eA^»~x^Gw (т 4- кх0) dx. о При найденных х\к] состояние в промежуточные моменты времени кха + 9, 0 *5 9 < То вычисляется по формуле 0 0 х (кх0 + 9) = еАвх [к] 4- j eAie~x)p(x) dxBu[k] 4- J eA<e~T)Gu> (т 4- kx0)dx. о 0 (MO) Доказательство. Пусть задано x(Ц) — состояние Системы в момент 1ь. Тогда при любом управлении значение x(t) в моменты tJSsi* дается фор- мулой (см. гл. 6); t а (/) = /О-М х+ J еА»-т) [Ви (т) + Gw {т)j th В частности, имеем **+1 х ^h+i) = *й^л(1й)4- J /(**+! т) [Ви (т) 4~ Gw (t)] йт. ♦л Подставляя значение и(т) из (3.1), получим то 'о х {к + 1] = /Ч [*] + J /(То т) Вр (т) dxu [Л] + J А (To~T)Gu, (Т + АТ()) о о что эквивалентно (3.8), (3.9). Соотношение (3.8) обычно называется точной дискретной моделью непрерывного объекта (3.7) при управлении (3.1)1 Эпитет «точ- ная» вводится для того, чтобы отличить (3.8) от приближенных описаний, получаемых применением к дифференциальному уравне- нию объекта тех или иных формул численного интегрирования. Например, считая т0 малой величиной, а функции u(t), w(t) мало меняющимися на интервале длительностью тв, можно принять dt - T0 и 1+то u(l)~/- I u(x)dx,- I w(x)dx. (3,12i ° t ° t ,
332 ГЛ. 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ Тогда вместо (3.7) имеем приближенное соотношение ‘+хо ‘-тв x(t + to) — х(0 + T04a:(t) + В J u(x)dx + G J w(x)dxf t t откуда при t = /cx0 получим тр то х[к + 1]~ [I + хаА]х[к} + p{x)dxu[k] + G j w(x + A:x0)dx. о о (3.13) Соотношение “ х [к + 1] = 4ирЯ! [&] + Basu [&] -f" г#п1> [&]>; (3.14) где то т« 4*р = I + т0А, B*IV = В\ р (т) dx, ШпР [ к] = G J w (х + /сх0) drt о о естественно называть приближенной дискретной моделью. Оно также позволяет рекуррентно рассчитать, начиная с заданного х [0] = ха, значение вектора состояния в любой момент кха, однако лишь приближенно. На каждом шаге рекурренции погрешность имеет по- рядок о(т'о) и мала, если т0 мало, но за большее количество шагов эти малые погрешности накапливаются и могут существенно иска- зить представление о ходе процесса. Достоинством приближенной модели является то, что для вы- числения ее параметров нет необходимости вычислять матричную экспоненту еА1. С другой стороны, очевидно, что Апр получается из А* заменой . еАх° на I + х0А, а Впр, wnp — заменой еА’ на I, при 0<т<тв. Используя большее (но конечное!) число слагаемых в разложении матричной экспоненты (см. Приложение 2) еА‘^1 + At + ^- + (3.15) можно получать и другие приближенные модели, более точно отра- жающие ход непрерывного процесса. Пример 3.1. Рассмотрим поведение объекта, описываемого про- стейшим скалярным уравнением: - х — кх, ®(0)=ж’, без внешних воздействий. Имеем х (t)= eux’ и а: (кх0) А х {к} = еитох° = (eXto)ft х°. Те же самые значения получаем рекуррентно из соотношения +1] = A*x[fc], х[0]==х°, где по формуле (3.9) А* = еХто.
§ 3. ИМПУЛЬСНОЕ УПРАВЛЕНИЕ НЕПРЕРЫВНЫМИ ОБЪЕКТАМИ 333 Заменим теперь уравнение х = кх приближенным соотношением типа (3.13) х[к +!] = [! + тАИН откуда а:[Л:] = [1 + Пусть Х<0; тогда x(i)-*0 при £-*«>, Равным образом х[к]-*$ при к -* оо, если х [/с] вычислено по точной модели. С другой сторо- ны, считая по приближенной модели, мы получим тот же вывод, если То таково, что 2 11 + т0Х|< 1, т. е. т0 но при т0>2/(—X) приближенная модель дает качественно невер- ный результат! Таким образом, представление о «.малости» т0 зави- сит от свойств непрерывного объекта. Приближенная модель иска-, жает представление о быстрых процессах установления. О 3.3. Стабилизация импульсной обратной связью. Главный смысл Т.3.1, конечно, не в самой возможности рассчитывать состояние и выход системы в дискретные моменты времени по рекуррентным соотношениям — их можно рассчитать и непосредственным интегри- рованием исходной системы (3.7),— но в том, что возникает воз- можность использовать все дискретные алгоритмы управления, опи- санные в § 2! Изменения в формулах скажутся лишь в том, что вместо А, В, w\k} надо подставить соответствующие матрицы А*, В*, w* [к], найденные при построении точной дискретной модели. Прежде чем касаться некоторых теоретических проблем, кото- рые могут возникнуть при такой замене, рассмотрим простейший пример. Пример 3.2. Пусть требуется обеспечить стабилизацию объекта, описываемого скалярным уравнением x — kx + u(t), Л>0, х(0)— хв, используя импульсное управление. Пусть задан период та и для формирования импульсов может быть использован фиксатор. Точ- ная дискретная, модель согласно (3.8), (3.9) имеет вид х[к + 1] = еи»х[к] + Ь*и[к}% ж[0] = я:% где Ъ* =-^[^0—1]. Примем и [/с] — —Кх [А]. Тогда х[к+А] ^(еи*-Ъ*К}х[к\. Следовательно, для того чтобы х [&] -> 0, достаточно выбрать К из условия . |еЧ _ ъ*К\< 1.
334 ГЛ. 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ Если же принять к - е^° х то при любом хв имеем установление за один такт! Но х[к] = 0, А>0=> п[/с] = О, к > 0 => х{х<1} = 0, ы(£) = 0, t > т0; тогда в силу исходного уравнения ar(i)=O, t 3s т0. Таким образом, импульсное управление, состоящее из одного рабочего импульса, привело систему в желаемое состояние х = 0. Результат не зависит от т0. Так что на первый взгляд цели можно добиться сколь угодно быстро. Однако при малых тв имеем к = о(—\ \\) т. е. увеличение быстродействия требует и в импульсной системе роста коэффициента усиления. □ - Напомним теперь общие положения, касающиеся возможности стабилизации для непрерывных и дискретных систем, и сам смысл этих понятий. Непрерывная система-считается устойчивой, если x(l)-^(), t~+oo, когда w (t)=0, is. x{t) ограничено, когда w(t) ограничено. Стабилизация на базе использования непрерывных измерений x(t) заведомо возможна, если пара А, В невырожденна, а при ис- пользовании неполных измерений y(t) = Cx(t) требуется еще невы- рожденность пары А\ Ст*). С другой стороны, вводя импульсную обратную связь и обеспе- чивая стабильность дискретной системы, мы гарантируем, что х(кт0) = х [Аг] -* 0 при £-*<», когда ш*[А] = 0, и ограничено, когда w* [/с] ограничено. Таким образом, стабильность понимается в несколько разных смыслах. Бо- лее того, возможность введения стабилизирующей импульсной об- ратной связи следует из невырожденности нар А*,В* и (А*)т, Ст, где А*, В* связаны с А, В формулами (3.9). Неясно, следует ли из невырожденности пары А, В невырожденность А*, В*, иными сло- вами, не теряется ли возможность стабилизации при использовании вместо непрерывной обратной связи лишь импульсной? Все эти сомнения почти полностью рассеиваются в силу следу- ющих утверждений. *) Указанные условия лишь достаточные, поскольку и при вырожденно- сти возможна обшая стабилизация системы, если «висячие» ее части сами по> себе устойчивы (см. § 4, гл. 6).
§ 3. ИМПУЛЬСНОЕ УПРАВЛЕНИЕ НЕПРЕРЫВНЫМИ ОБЪЕКТАМИ 335 Теорема 3.2. Пусть объект, описываемый уравнениями х = Ах +Bu(t)+Gw(t}, ж(0) — х°, y{t) — Cx(t), t^O, (3.16)’ замкнут импульсной обратной связью, заданной соотношениями u(t) = u[k]p(t~ kxa), kx0^t<{k + 1)т0, k — 0, 1, ..., (3.17) u[k] = —Kx[k], (3.18) х[k + 1] = A*x[k] + B*uИ + L{y И - Cx[k]}, (3.19) где у [k] = у (кт:,,) и А*, В* вычислены no (3.9). а) Пусть К и L выбраны так, что матрицы А* — В*К и А? — LC имеют собственные числа внутри единичного круга. Тогда замкнутая система устойчива в том смысле, что w(t) — 0 => x(t) при t-^°o и \w(t) |< Са < оо =>)ж(/) Сх < оо при любых t. 6} Указанный выбор возможен, если возможно построение непре- рывной стабилизирующей обратной связи и выполнены дополнитель- ные условия на величину т». При различных с. ч. матрицы А, рав- ных X», v == 1, ..., п, эти условия имеют вид pv^Q, 2nki(kv — Хц)-1, к = 0, ±1, ±2, ..., *v #= ц, (3.20) где pv = eKv^o~^p(x) dxfi v = l,...,-n. (3.21) о . Доказательство. Указанный выбор К и L гарантирует, что последо- вательности x[fc], и [А] ограничены при ограниченности и>* [А] (вытекающей из ограниченности w(t)) и сходятся к нулю при ш*[к] = 0. Поскольку я[А] = = х(/сто), остается установить, как ведет себя функция x{t) в промежуточные моменты времени t Ф кхй. Имеем t - л (i) = еА^ (Ат0) ф- J еАП—г) _j_ qw . ftTo i = eA^~kX^x [A] + J eA<-t~^p (J - t) Bdxu [A] + feTo t + J eA(f~T)Gta (t) dx при Ат0 < t< (A + 1) To> (3.22) At0 Следовательно, значения x(t) в указанном интервале представляют собой ли- нейную комбинацию ограниченных величин с ограниченными коэффициентами, т. е. x(t) ограничена. При w(t) = 0 имеем |«(t)l + CaJwfAJJ, кх0 s; t < (к -ф 1)т0,
336 гл. 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ где сь с2 — положительные константы, откуда и следует, что «(«)-> О при г-*оо. На устойчивость «висячих» частей объекта наличие обратной связи (как непрерывной, так и импульсной) влияния не оказывает. Поэтому можно огра- ничиться рассмотрением вполне управляемых и наблюдаемых объектов, для которых условием стабилизируемости с помощью непрерывной обратной свя- зи является невырожденность пар А, В в Ат, С\ Стабилизируемость же с по- мощью импульсной связи требует невырожденности А*, В* и (А*)т, С\ Исследуем условия, при которых rank [В АВ ... An~sB] = га => rank [В* А*В* ... (А*)”-'В*] = га, где и — размерность х в А* = еА\ В*= § еА^»~^Вр (т) dr. О Пусть А == 5А5”1, Л — diag {Ц. Тогда вепосредственные вычисления дают: А* = A diag [еМ«} S-1, В* = 8 diag {pv} b, 1 = S^B. где р» определены формулой (3.21). Поскольку 8 неособа, то достаточно проверить, что rank {5 Л5 ... Лп-15} = га => rank {РЪ А*РЪ ... (Л*)П-1Р5) = га, где Л* A diag {Л*'0}, Р A diag.{pv}. При выполнении 1-го условия су- ществует столбец q такой, что столбец bq имеет все ненулевые элементы (см. § 4 гл. 6). Но тогда выполнено и 2-е, поскольку det {Ьд A*bq ... (A*)n~W = <^)VPV det {/ Л*. ... (Л*)”-1} =/> О, V—1 если все р,ч^=О и все элементы Л* различны, т. е. выполнено (3.20). Аналогично проверяется и то, что невырожденность пары Лт, Ст влечет не- вырожденность (Л*)т, СР при выполнении (3.20). Следствие. При выборе К и L такими, что матрицы А* — В*К, Л* — LC имеют только нулевые с. ч., объект, замкнутый импульс- ной обратной связью (3.16) —(3.18), останавливается через время, не большее 2пт0, в состоянии х — 0, если w(t)^ 0. При этом говорят, что импульсная система обладает бесконечной степенью устойчивости. (Для доказательства этого следствия доста- точно вспомнить следствие к Т.3.2.) Теорема утверждает, что импульсная обратная связь является эффективным средством стабилизации, не применимым только при неудачном выборе периода т0. Пример 3.3. Рассмотрим задачу о приведении в равновесие маят- ника с помощью импульсной обратной связи. Уравнения движения имеют вид Xi = я2, Х2 = — + ut
§ 3. ИМПУЛЬСНОЕ УПРАВЛЕНИЕ НЕПРЕРЫВНЫМИ ОБЪЕКТАМИ 337 так что ( О 11 Л = |-в$ ор cos <oot — <в0 sin <оо« 1 —- sin <о ° cos &Qt Пусть используются прямоугольные импульсы со скважностью Ао, = O<f<Ao. Тогда coscooT0 — % sin <о0т0 1 - sin <оо' cos©ото Ae J_f ел(то~т)5йт = M ТТз {cos <oe (т0 - До) - cos <ooto] uo 0 i г - A^ lSH> “о (To - До) - sin «Vol ] Предположим первоначально, что to = т. e. управляющие им- пульсы сдвинуты на период свободных колебаний; тогда А* — I, и пара А*, В* вырождена, поскольку det {В* А*В*} = det (В* В*} = 0. Таким образом, при таком периоде чередования импульсов невоз- можна стабилизация, причем этот вывод не зависит от формы им- пульса, что можно было бы выявить сразу по нарушению усло- вий (3.20). Примем теперь to “ Тогда W 0 Кроме того, будем для простоты считать импульсы очень узкими и высокими, т. е. Ав/т0 < 1. В этом случае В* « еАх»В = А*В = И det {В* Л*В*] = det Р/“° °.l = - -±- Ф 0. I 0 — 1) <оо ' Приведение в равновесие осуществляется из любых начальных ус- ловий за 2 такта, если принять (при очень малом До!) и (/) = у-u [А], Но <3 < &т0 + Ао, к = 0, 1, и И] = — (/ст0). 22 а. а. Первозванский
838 ГЛ. 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ Формальную проверку этого результата предоставляем читателю. Поясним лишь его физический смысл. Управление сводится к двум • тормозящим импульсам. Первый, начальный, импульс затормаживает маятник в началь- ном положении ж, (0)=/= 0. После этого и до окончания первого такта управление не прилагается, так что маятник в свободном движении доходит до положения равновесия, что займет 1/4 периода его коле- баний. В этот момент 2-й импульс снимает накопившуюся скорость. О •Zj(4o) Рис. 7.2 На рис. 7.2 показана траектория дви- жения на фазовой плоскости. Весь процесс занимает время т0 + До. D Таким образом, импульсное уп- равление обладает тем преимущест- вом, что теоретически позволяет вы- водить систему точно в равновесное -»- состояние за конечное время. Ко- нечно, это лишь теоретический вы- вод: ведь для вычисления коэффи- циентов импульсной обратной связи, •обеспечивающих бесконечную степень устойчивости, требуется точ- но знать параметры объекта, а это невозможно. В действительности собственные числа окажутся отличными от нуля, но при малых не- точностях модели этот сдвиг также должен быть Мал, а следователь- но, время вхождения в достаточно малую окрестность состояния х = 0 останется небольшим. - Поэтому требование выбирать обратную связь из условия обеспе- чения (с точностью расчета!) бесконечной степени устойчивости яв- ляется и на практике популярным. Однако, во-первых, в многосвяз- ной системе это требование неоднозначно определяет выбор коэф- фициентов обратной связи, а, во-вторых, неясно, насколько оно хо- рошо с точки зрения интегральных показателей качества. Здесь воз- никают и некоторые принципиальные трудности. 3.4. Оптимизация по квадратичному критерию. Рассмотрим пока- затель т lim — f М {жт (t) Qx (t) + uT (t) Ru (t)} dt, T-+°o 1 I (3.23) Напомним (см. гл. 6)’, что минимальное значение этого показателя достигалось на непрерывной обратной связи типа u0Pt(i) = — (3.24)' (при полных изменениях) или типа uopt(i)=* — XOptJ(0 (3.25)’ (при неполных и неточных измерениях). Поэтому лучшей с точки прения показателя (3.23) импульсной обратной связью окажется
§ 3, ИМПУЛЬСНОЕ УПРАВЛЕНИЕ НЕПРЕРЫВНЫМИ ОБЪЕКТАМИ 339 такая, которая лучшим образом аппроксимирует законы типа (3.24), (3.25), а это может быть достигнуто путем уменьшения шага дис- кретности т0. Если же шаг дискретности ограничен снизу (в силу невозможности чаще производить измерения или чаще подавать управляющие импульсы), то это ограничение заведомо может лишь ухудшить значение показателя, достижимое на непрерывном управлении. Для того чтобы найти оптимальную импульсную обратную связь при фиксированном тс, следует, во-первых, преобразовать выраже- ние показателя 7 так, чтобы оно содержало только величины u[Zc], а во-вторых, решить возникающую задачу оптимизации дис- кретной Системы. Эта процедура в принципе осуществима, по- скольку х(кха) —х\к\, и(кхй) = n[fc]p(0), а значения x(t), u(t) в промежуточные моменты времени даются формулами (3.20), (3.24). Тем не менее преобразования являются очень громоздкими, и мы проведем их только для простейшего примера, из которого, впрочем, будут ясны и общая формальная схема, и определенные качественные особенности. Пример 3.4. Пусть объект описывается скалярным уравнением Tox = u(t)+w(t), х(0) = х°, Т’о>О. Примем сначала w(t)=0, а показатель качества — в виде J = J [х2 + и2] dt. о Пусть требуется построить оптимальное управление «(/) по изме- рениям ;г[А:] = а:(Ато), к = 0, 1, ..., ограничиваясь условием . u(f) = u[fc],. кх0 < t <(к + 1)т0, к = 0, 1, ..., (3.26) т. е. используя импульсное управление с фиксатором. Таким обра- зом, выбирать можно только величины и[к]. Представим показатель в виде оо J = 2 j [x2(t) + u2(t)]dt. k—v ki0 Непосредственным интегрированием находим /гто+е х (/ст0 + 0) = х (кх0) + у- I u{t)dt = х[к] +-~и[к\, 0^9<т0г 1 ft J 1 ft 22*
340 ГЛ 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ что, конечно, следует и из общей формулы (3.10) . Отсюда №+1)т0 Г ( f h9\ \ ] [ж2(0 + w8(01 dt — т0|х2 [ft] + bx[&] u[k] + 11 + — ju2 [ft]j. ЙТО где Ь = т»/Тв — безразмерный параметр, и 1 о причем х\к + 1] = х[к] + Ьм[А], х[0] = ха. Тем самым задача сведена к чисто дискретной. В отличие от задачи оптимизаций обратной связи, решенной в общем виде (см. § 2), показатель J содержит слагаемые, вида zc[Zc]zz[/c]. Однако от них можно избавиться простым преобразованием. Введем новое уп- равление й[к] так, что »[ft] = w[ftj—рхрс] и подберем р из условия обращения в нуль коэффициентов при слагаемых x[A]u[fc]. Имеем а-2 [к] + Ьх [7с] {и [Л] - flx [Л]} + (1 + -у) (и [Л] — рг [ft]}2 = то то если R Ь _q___________________. ,о , Л ba\fia 1 + Ь8/12 г Р 2(1 + гЛ/з)* % з/Р 1 + б2/з’; s 3 Теперь получаем стандартную задачу: найти и[к], к = 0, 1, .../ми- нимизирующие показатель 7=2 {<1Х* [ft] + ru<i [ft]} А.=0 при условии х[к + 1] = a.r[ft] + &й[Л], к = 0, 1, ..., ж[0] = ж’, где а — 1 — Ьр. Применяя Т.2.3 и учитывая одномерность (скаляр- ность) изучаемой системы, получаем, что при импульсном управ- лении J орт = Р орт (а:°)2> WOpT [А) = Корт X [ к J, .Корт = . ,2 / » г + b Рорт (3.27) где Др» — положительное решение квадратного уравнения 2 j 2 г) 2 - (1-а2)Р + -^4--г = 0. 4 ' г + Ь2/> 4 С учетом зависимостей q, г, я от Ь можно показать, что Рорт=^ = 70>Л 1 + ^Ь2.
$ 3. ИМПУЛЬСНОЕ УПРАВЛЕНИЕ НЕПРЕРЫВНЫМИ ОБЪЕКТАМИ 341 В то же время нетрудно убедиться, что при непрерывном управ- лении морт = — х (0>; Jорт = То (а'°) • Тем самым оказывается, что с ростом шага дискретности т0 оп- тимальное значение показателя растет (т. е. ухудшается!), хотя и очень медленно: = |/1 + ^Ь2 = 1 + ^Ь2 + о(Ь2)е Рассмотрим теперь более сложную ситуацию, когда возмущение w(t) отлично от нуля и является случайным процессом типа белого шума с единичной интенсивностью. Показатель качества примем в виде т J = lim -i- f М {я2 (i) + u2 (t)} dt T->x * J 0 и вновь будем разыскивать оптимальное импульсное управление с фиксатором. Используем представление процесса x(t) в промежуточные мо- менты времени: х(кх0 + 0) = х [&] + —и [&] + wh (9), О^0<то 1 о где е w*t (0) Д I W (кх0 + т) dx. Тогда, действуя почти так же, как в детерминированной задаче, можно получить, что J = lim -у 2 M(qx*[k] + ruz[k]}+ (3.28) v0 N-kx> fe=0 *« 0 причем x[k + 1] = ax[/c] + bu[&] + ip*[/c], к = 0, 1, ..., zr[O] = хв, где w* [&] = w*k (т0), к = 0, 1, ..., дискретный «белый шум» с дис- персией Ь/То. При таком преобразовании учитываются со- отношения Mb4(0)z[A:]| =0,; M{[^(t0)]2}=^- = A 'о « т" . т-(м{[и;:(0)]2Не = ^ ° Jo
342 ГЛ. 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ для доказательства которых требуется аккуратное использование свойств белого шума w(t) как процесса с предельно малой корре- ляцией (см. § 3 гл, 4). Параметры a, b, г, q имеют тот же смысл, что и в детерминиро- ванной задаче. Поэтому оптимальные значения и[к] даются той же формулой (3.27). Соответствующее такой обратной связи значение показателя вычисляется по формуле /орт = орт (Ъ) = ~2— у- + РоРТ = iy- = То 1 + (3.29)’ вытекающей из общего соотношения (2.30) для оптимального зна- чения дискретного квадратичного показателя с учетом дополнитель- ного постоянного слагаемого в (3.28). При непрерывном управлении может достигаться значение того же показателя, равное 7oPt(0)= 1/То. Раскрывая выражение (3.29), обнаруживаем, что при наличии случайных возмущений импульс- ное управление при большом шаге дискретности оказывается суще- ственно менее эффективным, чем непрерывное: Выявленные особенности на самом деле справедливы и в общем случае: импульсное управление аффективно для обеспечения ста- бильности системы, но оно хуже справляется с быстро изменяю- щимися случайными возмущениями. Этому можно дать простое объяснение. Действительно, в интервале между измерениями обратная связь отключается, а управление ведется по програм- ме, определяемой формой импульса. Вместе с тем программное уп- равление неэффективно при наличии непрогнозируемых возмуще- ний и, в особенности, при собственной неустойчивости объекта. Если же шаг дискретности мал, то реакция системы на эти возму- щения не успевает развиться. § 4. Операторный метод 4.1. Операторное описание. В теории дискретных и импульсных систем широко используется и операторный подход, близкий по смыслу к операторному подходу в теории непрерывных систем*). Введем оператор £ сдвига на такт вперед, т. е. для любой после- довательности {/[/с]} имеем g/m + 1]« * = (4.1) *) Основные результаты здесь принадлежат Я. 3. Цыпкину и подробно изложены в [7.3, 7.4]. Принятая в данном параграфе схема несколько отличает- ся от методики Я. 3. Цыпкина и опирается на первичное описание в простран- стве состояний.
в 4. ОПЕРАТОРНЫЙ МЕТОД 343 Применение операторного многочлена А (?) = ап^п + ап-^п~1 + ... + щ, at — const, (4.2) и последовательности определено правилом: ^(S)/(/c)Aan/(7« + п} + ап-гЦк + n — 1] + ... +aof[k]. (4.3) Уравнение х[к + 1] = Лх[7с] + Bv[k], у\к\ = Сх[7с] + С„г[7с] (4.4) в операторной форме записывается следующим образом: ?а:[7с]= Ах[к] + Бгр], y[fc] = + C„v[fc], или К7-4кИ = ад, y\k\ = Cx[k'\ + Cvv\k\. (4.5) Операторная запись удобна для исключения промежуточных не- известных, при этом с оператором £ можно формально обращаться как с числом. Из (4.5), в частности, следует: 4*] = (V - A]-lBv[k], рИ = {С[?/-Д]-‘В + СДг[/с] (4.6) или х [7с] = #:»(?) г [й],; У [к] = Н*у (Z) v [k]fl (4.7) где введены дискретные операторные п. ф. преобразований «вход- состояние», «вход-выход» Uvx{^), Ясно, что введение операторных п. ф. позволяет распространить на дискретные системы все приемы построения и преобразования структурных схем, которые были даны в гл. 2 для непрерывных систем. Дискретные п. ф. являются дробно-рациональными функ- циями от оператора ?, смысл которых еще не был определен. Обозначим а(?) = det - А} = ?» + «„-.S’-1 + ... + а». Тогда из (4.6) следует, что а(?)ЯМ = {С[Ц - А]”В + Cva^)}v[k], (4.8) где введена присоединенная к — А матрица, компоненты кото- рой — многочлены ? степени ниже п, если А — (и X п)-матрйца. Обозначая р (£) = С[Ц - А}'В + С„а (?) = +... + Ро, (4.9) перепишем (4.8) в виде «М = Р(?Ж #(4.10) Поскольку в (4.10) последовательности умножаются только на мно- гочлены от оператора ?, то уравнение (4.10) уже имеет четкий смысл и эквивалентно соотношению у[к + n\ + an-iy[k + п — 1] + ... + аор[7с] = == $mv[k + т] +... + рор[7с], к = 0, 1, ..., т «S п. (4.11)
344 ГЛ. 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ Таким образом, формальная операторная запись - V [Л] (4.12> будет далее пониматься как эквивалент связи между последователь- ностями у[/с] и п[й], задаваемой соотношением (4.11). Это соотно- шение позволяет рекуррентно вычислять значение выхода по за- данным значениям входа и значениям самого выхода в предшест- вующие моменты времени: у[А + тг] = -ая_1р[й + и-1]-...-а0^[Л] + + + m] 4-... 4- fM>[H & = О, 1, . .. (4.13jfr Ясно, что для начала рекурренции надо задать не только y[Oj, по и значения выхода вплоть до у\п— 1]. Эти начальные условия должны быть заданы заранее или вычислены по начальному «внут- реннему» состоянию хй с помощью исходных уравнений (4.4). Операторная запись (4.10) или эквивалентные соотношения (4.11) — (4.13) наиболееудобны в случае, когда у[к]— скалярная' последовательность (система имеет один управляемый выход). Именно этот случай мы и рассмотрим подробнее*). Будем, кроме того, считать, что входное воздействие состоит из двух скалярных компонент — управляющего и\к] и возмущения ш[7с], так что в ска- лярной форме (4.10) принимает вид: = + Л = 0, 1, ..., (4.14> что по форме и по существу сходно с описанием непрерывного. a(D)y(O=0(D)u(0+MD)HO«- «>0, (4.15) использовавшимся в гл. 3—5. Из этого сходства вытекает и сход- ство приемов исследования, которые изложим в краткой форме, со- провождая иллюстративными примерами.' 4.2. ^-преобразование и весовые последовательности. Аналогом S’-преобразования является дискретное преобразование Лапласа,. или Z-преобразование (Приложение 1). При нулевых начальных условиях связь между ^-преобразова- ниями последовательностей, задаваемая (4.14), находится заменой оператора сдвига. £ на комплексную переменную z:; a(z)y(z)-₽(z)Z7(z)+pB(z)TF(z), (4.16) где «большими» буквами обозначены 5^-образы соответствующих последовательностей. Отсюда имеем y(z) = #V(z)t7(z)4-#*Hz)W(z),, (4.17) ♦) С матричными обобщениями можно познакомиться по книгам [4.2,4.11].
§ 4. ОПЕРАТОРНЫЙ МЕТОД 345 ГГ* I \ Р (Z) ГТ* — комплексные дискретные п. ф. соответствующих преобразований. По теореме о свертке получаем k ь У14 = 2 [И и [к.— Л + 2 к№у [Л w (к — I) = Z=0 - 1=0 k k = 2 huy [к—l] и (I) + 2 hwv [fc - (4.18) 1=0 1=0 где 7iuy[/c], к — 0, 1, ...— весовые последовательности такие, что &{huv[k]} ==H„v(z), ^{h^k}} =Hav(z}. (4.19) •Очевидно, что весовая последовательность huy[k] совпадает с реак- цией системы на вход вида п[0] = 1, 44 = 0, к>0. Пример 4.1. Пусть уравнение дано в виде у\к + 2] + 0,3p[/c + 1] + 0,0244 = w\k +1] + 0,Згг?[Лг]. Операторная запись такова: (5s+ 0,35 + 0,02) 44=45 + 0,3)44, так что тт , \__ г + 0,3 П wy \zl 2 . „ „ , „ п„ • z +0,3г0,02 Весовая последовательность находится путем обращения ЯюД2)- За- писывая разложение на простейшие дроби HwV (z) = г + 0;1 — г + 012 и используя таблицу из Приложения 1, получаем М0] = 0, М4 = 2(-0, 1)й-‘—(—0, 2)*-1, £ = 1,2, ... Убедитесь также, что исходное уравнение эквивалентно записи в нормальной форме Xt\k + 1] = —0,144+44, - хъ[к + 1] = — 0,244 + ^[4, У[к] — 244 — 4^1 и сравните явную связь «вход-выход», следующую из применения к этой системе формулы (1.5) (при ха — 0, v[k] 44) и следую- щую из формулы (4.18) при вычисленных выше весовых коэффи- циентах. □
346 ГЛ. 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ 4.3. Установившаяся реакция на типовые воздействия. Пусть дискретная система устойчива; тогда ее установившейся реакцией на входное воздействие {г[/г]} (управление или возмущение) назо- вем последовательность у«,[/с] такую, что 1у«И —уИ1 -*• 0 при к -* оо. Так же, как для непрерывных систем, доказывается справедли- вость следующих результатов: а) если к^О, (4.20) где 0 — вещественное число, иногда называемое дискретной часто- той, то у~[А:] = Ягв(е,8)е1в*; (4.21) б) если z?[fc] = о0 + «i/с, fc>0, (4.22) где а0, а,. — константы, то Ук[к]= (z)|z=1(o0+ atA:)+ I , йг» (4.23) из jz—1 Функцию Д,в(е’в), рассматриваемую как комплексноэначная функция вещественного параметра 6, называют дискретной частот- ной характеристикой преобразования «вход-выход». Очевидно, что она 2л-периодична по 0. Пример 4.2. Рассмотрим систему из П.4.1. Она устойчива, по- скольку корни характеристического многочлена равны —0,1; —0,2. Пусть w\k\ = io — const. Тогда по формуле (4.23) имеем ух [А] = Hwv (1) w = w ж 0,98w. В качестве упражнения получите тот же результат из представле- ния в нормальной форме, считая, что xti „[&], а?2, „[/с] — константы. Рассчитаем установившуюся реакцию на воздействие вида w[/c] =(_ 1)* = е™\ В соответствии с (4.21) получаем Роо I*] « (?”) einh = (- 1) (- 1)'! = - (- l)fc. □ 4.4. Установившаяся реакция на стационарные случайные воз- действия. Пусть {«[&]} — центрированная стационарная случайная последовательность с известной корреляционной последователь- ностью Rv[l] AM{t>[&]v[/c + /]}. (4.24) Введем в рассмотрение функцию S‘t(0)ASs(eie)A f (ei0)-!^(Z), (4.25) J=—-ОО
§ 4. ОПЕРАТОРНЫЙ МЕТОД 347 которую обычно называют дискретной спектральной плотностью. Она, очевидно, 2л-периодична по 0. Тот же термин употребляют и по отношению к функции ОО 0.253 . оо которая определена только при значениях z на единичном круге, т. е. при z = eie, и как функция 0 совпадает с 8„(0). Для устойчивой системы справедлива формула Sv(z)—\Hvy{z)\iSv(z) wpnLZ — eia, (4.26) Sy (eie) Д Sy (0)—спектральная плотность установившейся реак- ции. Доказательство аналогично приведенному в § 1 гл. 4 для не- прерывной системы. Поскольку 8*(0) и корреляционная последовательность Rv[l] установившейся реакции по определению связаны соотношением S* (0) = Sy (?9) = 2 Ry [И eiQ\ (4.27) l=s—0Q ТО J 8* (0) d9 = 2nRv [0],: о откуда находим выражение дисперсии установившейся реакции 2я Dy Д М {р* [й]} e Ry [О] ~ ~ J 8*, (0) d0. (4.28) о Пример 4.3. Пусть v{k} — дискретный «белый шум», т. е. Я„[0] ==£»„, 7?„[Z] = 0, Z^O. (4.29) Тогда по формуле (4.25) получаем 8* (0) = Dm (4.30) т. е. спектральная плотность дискретного «белого шума» постоянна. Дисперсия установившейся реакции на это воздействие дается формулой 2Л 2Л Dy = f | Л Jeie) |28: (0) d0 = М | Лгй (ei0) |2 dQ. (4.31) ° 0 Для вычисления таких интегралов используют либо численные ме- тоды, либо специальные приемы теории функций комплексной пере- менной. Если вернуться к переменной z = е,в, то (4.31) превратит- ся в контурный интеграл (обход против часовой стрелки единичной
348 ГЛ. 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ окружности в комплексной плоскости z) ' (4.32) j и, согласно теореме Коши, дело сводится к суммированию вычетов- j в полюсах подынтегрального выражения, лежащих внутри контура- j Для скалярного уравнения . у[к + 1] — О,5г/[7с] = фс] ! имеем ! и из (4.32) следует, что Dv “ 2й7 § 4.5. Решение задачи стабилизации. Пусть объект описан опера* торным уравнением а(?)г/М = Ш44 fc = 0, 1, ..., (4.33) возможно измерение выходной последовательности у\к\ и требуется построить стабилизирующую обратную связь, определяемую урав- нением Z(S)4M = (4-34) где Z(£), Л(£)—многочлены от £. Замкнутая система окажется устойчивой, если характеристический многочлен , A(z)=a(z)Z(z)+₽(z)fc(z) (4.35) будет иметь все корни внутри единичного круга. Как было показано в § 1 гл. 3, при взаимно простых a(z), p(z) всегда можно выбирать Z(z), k(z) так, чтобы корни размещались произвольным образом. Подчеркнем однако, что для дискретных систем особо существенно требование строгой реализуемости обратной связи nt A deg I (z) ^deg к (z) A (4.36) поскольку оно сорпадает с требованием неупреждающего характера обратной связи. Действительно, запишем (4.34) подробнее: и [к + Му] + ln^—iU \к 4- П/ — 1] 4* • • • d~ ZqU [к] = = — kmfy[k 4- m/J — ... — коу[к\, к = 0,1, ... Очевидно, что при невыполнении условия (4.36) для вычисле- ния значения управления в момент nt потребуется знание выхода в будущем, в момент mf > nh что невозможно. Вместе с тем из § 3 известно, что при невырожденности объек- та, эквивалентной несократимости a(z), ^(z), существует реализу-
S 4. ОПЕРАТОРНЫЙ МЕТОД 349; емая обратная связь, обеспечивающая произвольное расположение- корней характеристического многочлена, если его степень равна 2п. При этом из условия deg a(z)> deg fi(z) (только такой случай и рассматривался в § 31), следует, что воз- можен выбор обратной связи, при котором выполнено (4.36). По- втому использование простых алгоритмов из § 1 гл. 3 также возмож- но, если разумно задана степень A(z)*). Пример 4.4. Уравнение объекта дано в виде у[к + 2] + 2у[к 4-1] + Зу[к] = Зи[к + 1], так что a(z) = z2 + 2z + 3, (J(z)=3z, n — 2, m — i. Потребуем, что- бы A(z)=z2n = z4, непосредственно подбирая коэффициенты много- членов Z(z), k(z), определяющих вид обратной связи. Из тождества (z2 + 2z + 3) (z2 + liZ + Zo) + 3z(kiZ + &0) = z4 получаем l0 = 0, Ц = —2, k0 — 2, ki = 1/3, так что обратная связь, задается уравнением (£2 - 2g) и [Л] = - (± g + 2) у [Н; или и[к + 2} = 2и[к + 1]--1у[& + l]-2y[AJ. О Попробуем обеспечить A(z)=z3. Это удается при Z(z)=z, Zc(z) = 2 . " . — —3- z — 1, т. е. если и[к +1] + 1] +ММ- О 4.6. Отработка сигнала и особенности метода компенсации.. Пусть дискретный объект (4.14) уп- равляется обратной связью u[k] = H№(tW + NJk]), (4.37) основывающейся на измерениях ошибки e[fc] слежения за желаемым процессом Рис. 7.3 vm еВД = yd[k} — y\k\, (4.38) причем измерения искажены помехами 7Ve[&]- Структурная схема замкнутой системы дана на рис. 7.3. Тогда точно так же, как в гл. 3 (§ 3) можно получить формулу ' еИ = [1-Яз(?)ЬИ-^(?)ад, (4.39£ *) Нетрудно убедиться, что она может быть и меньше 2п (см. ниже, в при- мере), если допустить использование текущих измерений.
350 ГЛ. 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ где g3(g) A яр(С)дяиг/©Я/(а П. ф. замкнутого контура Я3(5)’ определяет обе компоненты ошиб- ки — ошибку отработки сигнала «[к] и ошибку, вызванную нали- чием помехи Nz[k], Если задана желаемая п. ф. Яз(^), то по методу компенсации формально может быть найдена п. ф. обратной связи, обеспечива- ющая тояедество Яз(й^^(9. Из него получаем полный аналог формулы (3.7) гл. 3 Н/(?)=Яи;©—(4.40) 1 — Яз (Й Повторяя анализ, проведенный в § 3 гл. 3, приходим к аналогич- ным заключениям о пределах применимости (4.40). Если потребовать, чтобы (4.41) где (7/(5)’—многочлен, имеющий корни внутри единичного круга, то выбор обратной связи согласно (4.40) еще не гарантирует устой- чивости замкнутой системы, поскольку характеристический много- член имеет вид (ср. с формулой (3.12) гл. 3) Д (z) = a(z)P(z)a<l(z), (4.42) Следовательно, метод компенсации непосредственно не приме- ним, если либо числитель P(z), либо знаменатель a(z) п. ф. объекта ммеют корни, не лежащие внутри единичного круга, т. е. имеют место те же неприятности, связанные с неминимально-фазовостью *) и неустойчивостью объекта, что и в непрерывном случае. Дополнительные осложнения связаны с требованием строгой ре- ализуемости обратной связи. Перепишем (4.40) в виде отношения двух многочленов гг a (Й (А ДЧ\ Hf ® “ Р (Й а? (?) - (Й • (3) Если обозначить г = dega(£)'—deg р(£)', г* = deg ad(g)’-deg р*Щ, *) Этот термин в дискретном случае применяется, если числитель п. ф. имеет не все корни внутри единичного круга (в непрерывных задачах — не все корни в левой полуплоскости!).
§ 4. ОПЕРАТОРНЫЙ МЕТОД 351 то для реализуемости необходимо иметь г4 — г > 0. (4.44) Условие (4.44) является дополнительным ограничением на выбор желаемой п. ф. замкнутого контура. Его выполнение можно обеспе- чить, приняв Rd (Й <4-4S> где а4(£), ₽d(S) имеют одинаковые степени, причем а4(£) имеет корни только внутри единичного круга. Выбор п. ф. в виде (4.45) означает, что выход замкнутой системы должен обязательно запаз- дывать относительно обрабатываемого сигнала на г тактов *). 4.7. Выбор оптимальной п. ф. замкнутого контура по условию минимума дисперсии ошибки. Введем предположение о том, что сигнал s[Zc] и помеха Nc[k] являются стационарными центрирован- ными случайными последовательностями, некоррелированными между собой. Тогда, используя формулы (4.26), (4.39), можно най- ти спектральную плотность установившейся ошибки. Имеем при z = eie, что Se(z)= ll-D3(z)l2Sa(z)+[//3(z)l25N(z), (4.46) где 5s(z), SN(z)— спектральные плотности s[/c] и 7Ve[A:j соответ- ственно. Ясно, что для уменьшения первого слагаемого желательно иметь Я3(е'“)«1, 0 < О 2л, а для уменьшения второго — иметь //,з(е'0)~О, 0 sS 0 С 2л. Чтобы разрешить это противоречие, мож- но попытаться выбрать Н3 такой, чтобы минимизировать дисперсию установившейся ошибки, порожденной обоими факторами. Поскольку А = J {| 1 - Я8 (z) |2Ss (Z) + | Н3 (z) |2Sn (z)) Ueie (4.47) 0 то приходим к проблеме, аналогичной той, которая рассматривалась, в гл. 4, § 2—5. Переходя к переменной интегрирования z = eie, пе- репишем (4.47) в виде Яе = l[1 ~ На (z)11 “ Ss + Яз & Н° (z)} (4-48) Аналитическое решение проблемы минимизации (4.48) можно по- лучить в предположении, что 5a(z), SN(z)— дробно-рациональные- *). Необходимость введения такого запаздывания можно обосновать, рас- смотрев, как в § 4 гл, 4; множество всех допустимых п. ф.
352 ГЛ. 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ функции, представимые в форме с ,_ч о / х „ ,m os (z) = — у-—fr j S,v (z) = -————. .ш (4.49) A (*)A («_ ) (*) an ) где Ba(z)', A,\zj, Вк(z), A№(zj— многочлены, причем A,(zj, An(z) имеют корни только внутри единичного круга. Приведем результат в виде следующего правила *) построения оптимальной п. ф., где учтена необходимость ограничить класс п. ф. такими, при которых удовлетворяется условие (4.45), а следователь- но, метод компенсации приведет к реализуемой обратной связи. Правило. 1. Произвести факторизацию числителя выражения S»(z)+Sw(z), получив представление A(z)A(z-i)^4.(z)4s(z-‘)5n(z)Bn(z-1) + + 4w(z)4x(z-*)5,(z)'k(z-‘), . (4.50) еде A(z) имеет только «хорошие» корни, т. е. лежащие внутри еди- личного круга. 2. Произвести сепарацию дробно-рациональной функции 1Х(.-‘)л.и т. е. выделить из нее дроби, отвечающие «хорошим» полюсам, и обо- значить их сумму V +(z). 3. Записать решение в виде я* %+(*) A (z) (4.51) (4.52) Если помехи отсутствуют (<SN(z)^0), то К (z) == В, (z),; V (z) = zr^, Hd (z) = z- ¥+ (Z). (4.53) Пример 4.5. Требуется найти управление и [/с], обеспечивающее минимальное значение дисперсии установившейся реакции у[к] одномерного объекта у\к + 1] = ау[&] + и\к — 0] + 0 > 0, lai < 1, на возмущение и>[к] типа дискретного белого шума, S„(z)— Dw= = const. При определении w[/cl считается возможным использовать точные измерения значений y[7j, I к,-или, что то же самое, строить *) Доказательство справедливости правила может быть произведено по схеме, аналогичной доказательству Т.2.1 гл. 4.
§ 4. ОПЕРАТОРНЫЙ МЕТОД 353 связь в виде м[й] = я.(;)е[Н где е[&] = —у[к], 77„(£)— строго реализуемый оператор. В данном случае я—9 4 н<М = -^-а, явд(р = ^, причем рВД-О, s[/c] = -H^)w[k], Ne[k]^0, так что > ' Ss (z) = Нwy (z) Hwy{z ) Su)(z) — ---T~—i---v (z — a) (z — a) Поскольку помеха отсутствует, можно воспользоваться простыми формулами (4.53). Имеем Bs(z)-yD~w, ¥(z) = zr^, ¥+(z) = «r^, UY. Найдем n. ф. обратной связи по методу компенсации, т. е. по фор- муле (4.'40): 77/ (z) = (z — a) ze -— zr—а Убеждаемся, что, приняв г = 0 + 1, обеспечим строгую реализуемость, причем и г \ (z —а) a0+1z® • az0 A(z) , f {Z) “ z»+i -a**1 “ ( z\&,( z ~ “ W \ a J \ a j Теперь можно окончательно записать уравнение обратной связи в операторной форме Z(£)M[fc] = -*(№] или а~йи[к + 0] + а~1в~1)и[к + 0 - 1] + ... + и\к} = -ау[к + 0]. Сдвинем нумерацию, заменяя к + 0 на к. Тогда и[к} + аи[к — 1] + ... + ави[к — 0] = —а0+1рИ, или о и [fc| = — ад+1у [к] — 2 а*и № ~ Л« i==i Эта форма записи особо удобна при реализации закона управления, поскольку текущее значение и[к} вычисляется на основе получен- ного измерения у\к\ и сохраняемых в памяти значений управления в прошлом (на 0 тактов назад). 23 А. А. Первозванский
354 - ГЛ. 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ Использование такого управления обеспечивает, что е[&] =» »[1-П)М4 Согласно принятым выше обозначениям, получаем = [1 _ ae+Vfe+1>](£ - <0'Ж откуда &[*]«(!+ аГ‘ + ... + («£-Т) 4*]** <=> у[к + 1] — w[k] + aw[k—i] +... +aew[k— 0]. При 0 — 0 имеем простейшие формулы и[к] = — ау[к\, у\к + 1] = w[k], которые можно сразу установить по исходному уравнению у[к + 1] = ay[fc] + u[A] + w[fc]. Поскольку w[Zc], w[k — 1], w[k — 0] взаимно некоррелированы и имеют одинаковую дисперсию Dw, то „„ 1 _ „2(0+1) Dy = Dw + a?Dw + ...+ a2*Dw = • - a Dwt 1 — a . где под Dv подразумевается дисперсия p[/c] в установившемся ре- жиме, причем этот режим заведомо устанавливается при к > 0. □ Приведенный пример показывает, что при отсутствии помех (точные измерения) и уа[к] 0 легко найти управление, обеспечи- вающее минимальную дисперсию в установившемся режиме. В некоторых случаях можно указать еще более простые рецепты построения закона управления. Пусть, например, описание объекта приведено к виду а(ШН = ?(?)«[*]+ МБМН (4.54) причем deg«(g) = degpui(g) = re, deg ₽(£) = n — 1, ап = pwn = 1, многочлены р, устойчивы, а {гс[/с]} — белый шум. Тогда, выбрав закон управления в реализуемом виде ₽(?)ф] = [«(£)-М) МН (4.55) приходим к системе, где выход у определяется уравнением МШ-ММ + «#])=о. (4.56) В силу устойчивости при к -> оо приходим к установившемуся режиму, где на любой реализации -p[fc]4-u>[fc]==0=>P, = IV (4.57)' Очевидно, что это значение D„ минимально, причем устойчивость гарантирует ограниченность дисперсии управления.
S 4. ОПЕРАТОРНЫЙ МЕТОД 355 4.8. Построение точной дискретной модели по заданному опера- торному описанию непрерывной системы. Рассмотрим следующую вспомогательную задачу. Пусть связь между управляемым входом u(i) и выходом y(t) объекта задана с помощью п. ф. #UIZ(D): y(t) = Huv(D)u(t). (4.58) Пусть u(f) организовано как импульсное управление, т. е. u(t)=u[k]p(t— /ст0), кх.} t <(к + 1)т0, (4.59) где То — заданный период чередования импульсов, p(t)—заданная форма импульса. Требуется найти оператор Ниу{%>) такой, что у [к] = Н*иу(£)и[к], У [к] &у (кхй), (4.60) т. е. найти п. ф. точной дискретной модели объекта. Принципиальная схема решения этой задачи известна: а) перейти от операторного описания (4.58) к нормальной фор- ме согласно правилам § 1 гл. 6; . б) построить точную дискретную модель в нормальной форме согласно правилам § 3 данной главы; в) найти п. ф. дискретной модели по формуле (4.6), подставив в нее вместо матриц А, В матрицы А*, В*, вычисленные в п. б). Однако эту громоздкую процедуру обычно можно заменить вы- числением по следующей простой формуле. Правило. Пусть Ниу(1)) — строго реализуемая п. ф., представи- мая в виде *) п Нщ, (D) = са + \ cv —*—, с0, Су — константы. (4.61) Тогда п. ф. точной дискретной модели дается формулой Я;(?) = Сор(О) + 2 'Су—(4.62) v=i. £ — е v 0 где т« pv = J е^(го-т)р (т) dx. о Доказательство справедливости (4.62) сводится к проведению опи- санной процедуры в общем виде. Согласно (4.61) можно ввести переменные сос- тояния xv, v = 1, ..., п, такие, что Dzv(«) = Мч,(0 + “(0. v = 1, п, (4.63) »(<)= 2 VvW + yW- (4.64) ,v=l *) Если полюсы Ниу— кратные, то (4.61) несправедливо. В этом случае не- обходимый результат можно получить предельным переходом в (4.62), вводя предварительно малое расхождение между полюсами. 23*
356 ГЛ. 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ Тем самым произведено преобразование к нормальной форме с матрицами А — diag {Xv, v = 1, ..п) и В — (1, 1, ..1). Согласно Т.3.1 имеем: то а\,|* + я = еХ<1<Ч> 1*1 + | р (т) dx и.[к] = е vT°a:v {к} + pxii [*], i> или, в операторном виде, xv 1*1 =-----------------------------“ 1*1- <4'65) £ — е 0 Поскольку 71 П У 1*1 Д у (*т0) = 2 cvxv (Ато) + V (*то) = 2 СА W + СОР (°) “ 1*1, V—1 V=1 то подстановка в это выражение (4.65) доказывает (4.62). Пример 4.6. Если связь «управление — выход» дана уравнением D(T1D+l)(T2D + l)y(Z)=u(() и используется импульсное управляющее воздействие с фиксато- ром, т. е. р (/)'== 1, 0 t < То, то формула (4.62) позволяет найти уравнение, определяющее связь значений и[к] со значениями выхо- да г/[А] = ja(Ato). Пусть т0 = 1. Тогда: а) Ниу = 0(7,0+ 1)(Г21)|-1) “ D-Х, + D — X 2 + 1) — л3« 1 7 1 7 где А* = 0, = 1, Х2 = с2 — m у , к3 = уГ", с3 — ; 1 1 2 1 2 1 1 1 2 1,р2 = Л(1-е g_e 1/Г2 б) рг = в) Ниу (?) = g-77-J + о -1/Т Ь—« ₽2?2 + Pi? + ₽0 ?3 + а2ь2 + «j? + “0 где коэффициенты а{, легко подсчиты- ваются; г) у[к + 3] + агу\к + 2] + afy[A: + 1] + оад[/с] = = [}2и[А: + 2] + Piu[7c + 1] + [Jou[A:]. □ 4.9. Решение задачи слежения с помощью импульсной обрат- ной связи. Пусть требуется, чтобы выход объекта y(t) с малой ошибкой е(7) отслеживал желаемый процесс yd(t). * Допускается построение импульсной обратной связи, основанной на измерениях ошибки e(t) в моменты времени th = кх<>, искажен- ных помехами ^(^). Обозначим е (/с] А е (/ст0), N[k] = N(kxa) и попытаемся разыскивать дискретную п. ф. ///(?), определяющую
s 4. ОПЕРАТОРНЫЙ МЕТОД 357 импульсное управление с обратной связью по ошибке по формуле 4М -HAD (еМ + ВД), (4.66) причем само управляющее воздействие u{t) формируется по и [к] согласно (4.59). Структурная схема такой гибридной системы, включающей не- прерывную и дискретную части, представлена на рис. 7.4, где вве- ден символ «ключа», периодически замыкающегося для ввода ре- зультата измерения в дискретный преобразователь, а также блок Л/, описывающий операцию модуля- ции, т. е. сопоставления последова- тельности {w[fc]} процесса u(t) по формуле (4.59). По определению е(0 = yd{t) — y(t) = = yd (О- Н^ (D) ш(0 - НиУ (D) X v>(t) U(t) WO lkvCD) М®) Рис. 7.4 хЦ0Д8((НМг), 64.67) где s(t)—отрабатываемый сигнал, а уи = Hnv(D)u(t)—реакция объекта на управляющее воздействие. Имеем также, что е (к] А е (А:т0) — s (/ст0) — уи (/ст0) A s [/с] — уи [к} = = s\k}-Hly{Du{k}t (4.68) причем п. ф. точной дискретной модели Я*?;(£) может быть най- дена по Я„Й(П) с помощью формулы (4.62). Объединяя (4.66), (4.68), приходим к стандартной формуле типа (4.39) 4М = [1 - Н3 (£) ]з[М - И, (?) N[k], где ЯЭ(£) = ЯР(£)[1+ЯР(£)]_‘, но п. ф. разомкнутого контура HP(D определяется через п. ф. точной дискретной модели объекта: яр(5) = я;и?)я/(?). Тем самым задача импульсного управления непрерывным объ- ектом формально сведена к задаче управления дискретной системой и далее можно обратиться к алгоритмам, описанным выше в пп. 4—6. Однако следует иметь в виду обстоятельство, уже отмечавшееся в § 3: формальное сведение является неполным, ввиду различия целей управления непрерывными и дискретными объектами. Дей- ствительно, во втором случае достаточно обеспечить малость ошиб- ки только в дискретные моменты th = кгв, а в первом — требуется обеспечить малость ошибки в любой момент Z! В дополнение к уже высказанным в конце § 3 качественным со- ображениям отметим лишь следующий простой факт: если s(t) = — as sin at, то s'[/c] = a, sin co т0/с, так что в периодической' (с перио-
358 ГЛ. 7. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ дом То) выборке не проявляются гармоники с частотой, _ кратной ш0/2, где <в0 = 2л/т0. Следовательно, импульсная обратная связь не реагирует на их наличие, и ошибка может оказаться сколь угодно большой, если сколь угодно велики их амплитуды. Вывод: если сигнал представляет собой гармонический про- цесс, частота которого неизвестна^ может принимать любое зна- чение (в„ из диапазона 0 < м < ®8, то период чередования им- пульсов должен быть меньше, чем л/®а *). Отметим в заключение, что на основе гипотезы_ о гармоническом характере сигналов и помех может быть развит систематический подход к синтезу импульсной обратной связи, аналогичный методу ЛАХ в теории непрерывных систем (см., например, [3.1]). •) При более сложной гипотезе о характере процесса s(t) (гипотезе огра- ниченности фурье-спектра) аналогичный вывод следует из классической тео- ремы Котельникова — Шеннона в теории связи [7.4].
ГЛАВА 8 - АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ § 1. Описание системы. Равновесные состояния 1.1. Описание в пространстве состояний. Основная цель данной главы — анализ особенностей поведения системы управления, вы- зываемых нелинейным характером связей между переменными, определяющими состояние как самого объекта, так и управляющих устройств. Будем предполагать, что выбраны координаты x-—(xh жп), значения которых в каждый момент времени, t полностью опреде- ляют скорости их изменения х в тот же момент времени x = f(x,’t).' (1.1) Это позволяет так же, как в гл. 6, назвать вектор x(t) вектором со- стояния системы в момент t. Однако в Отличие от гл. 6 допускаем, что вектор-функция f(x, t) может нелинейно зависеть от состоя- ния х, и будем интересоваться именно качественными особенностя- ми процессов изменения состояния, связанными с нелинейностью. Соотношение (1.1) в скалярной записи Xj = fs(xit ,.хп, t), j = имеет форму системы п дифференциальных уравнений 1-го поряд- ка. Если фиксированы начальные условия x(t°) — (xi(t°), ..., Xn{t°)) = x0, (1.2) то можно пытаться прогнозировать дальнейшее (при t > f0)’ изме- нение состояния, интегрируя эту систему. Однако каких-либо об- щих методов точного интегрирования нелинейных систем не суще- ствует. Численное интегрирование на ЭВМ осуществимо только для каждого конкретного задания начальных условий. Более того, не исключено накопление ошибок, связанных с переходом от (1.1) к конечноразностной схеме, используемрй в любом методе числен- ного интегрирова'ния. Поэтому для задач анализа систем управле- ния с обратной связью, когда задано лишь множество (обычно бес- конечное) возможных начальных условий, особую роль играют ме- тоды теории дифференциальных уравнений, с помощью которых
3G0 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ характеризуются качественные особенности решений, соответствую- щих всем возможным начальным условиям, а иногда и целым клас- сам функций /(ж, i), если не полностью определен и характер этих функций?. 1.2. Равновесные состояния и их устойчивость. Так же, как в гл. 5, начнем с выявления равновесных состояний *). Определение. Любое частное решение x(t) = ж = const на- зывается равновесным состоянием системы (1.1). Разыскание равновесного состояния сводится к нахождению по- стоянного вектора х, удовлетворяющего при всех t уравнению /(ж, 0 = 0. - (1.3)’ В системе может не существовать ни одного равновесного состоя- ния, существовать только одно или множество таковых. Это ясно на примере линейной системы: х = A(t)x + r{t). (1.4) Уравнение (1.3) является в этом случае линейным алгебраическим уравнением - • -Д(0ж=г(0. (1.5): Оно, как правило, не имеет ни одного постоянного решения. Одна- ко, если г(()=0, то имеется решение х — 0. Если А, г постоянны и А — неособая матрица, то имеется единственное решение х = = —А~'г. Если А особая матрица, а г = 0, то имеется множество решений, соответствующих множеству равновесных состояний. В общем случае задача вычисления всех равновесных состояний или даже проверки того, существует ли хоть одно таковое, нетри- виальна, и для ее решения нет общих конструктивных приемов. Численные методы позволяют с высокой точностью выявить одно или некоторые равновесные состояния, если они, конечно, су- ществуют. Предположим, однако, что эта задача решена и найдено какое- либо равновесное состояние. Возникает вопрос об его устойчивости. Для линейных систем (гл. 2, 6) вводились специальные определе- ния этого понятия, для простейших нелинейных систем (гл. 5) мы ограничивались полуинтуитивными представлениями. Теперь можно дать строгие определения понятия устойчивости, , следуя схеме, впервые введенной А. М. Ляпуновым в 1892 г.**). *) Связь между задачами, рассматриваемыми в данной главе и гл. 5, подробно описывается в § 2. **) В настоящее время имеется огромная литература, посвященная мате- матической теории устойчивости. Далее излагаются лишь отдельные фрагменты этой теории, особо важные для решения задач управления. Углубленное изу- чение требует знакомства со специальными курсами (см., например, [8.3, 8.7]). Наиболее «физичное» описание проблем устойчивости и вообще анализа нели- нейных систем дано в классической книге [8.1],
g 1. ОПИСАНИЕ СИСТЕМЫ. РАВНОВЕСНЫЕ СОСТОЯНИЯ 361 ) При этом удобно принять исследуемое равновесное состояние за начало отсчета, положив х — 0. Решение уравнения (1-1) при условии (1.2) обозначим x(t, t°, X6)*)'. Определение 1. Решение х = 0 называется устойчивым (по начальным условиям), если для любого е > 0 можно указать б(е, 1°)> 0 такое, что \x(t, f, а;0) | < е, t > t\ (1.6) при всех х°, удовлетворяющих условию, k°l<S(e, Н- (1-7) В противном случае х неустойчиво. Определение 2. Решение х = 0 называется асимптотически устойчивым, если оно устойчиво, а кроме того, для любого t° суще- ствует такое 6(1°), что lim | х (t, t°,, х°) | = 0 при | х° |<6(1°). (1.8) t-*oo Определение 3. Решение х = 0 асимптотически устойчиво по отношению к множеству Xй начальных условий, называемому областью притяжения этого решения, если при любых конечных f и х° е Х° решение х(1, 1°, х“) ограничено и выполнено (1.8). Если область притяжения совпадает со всем пространством состояний, то решение х — 0 называется асимптотически устойчивым в целом (глобально устойчивым). Проиллюстрируем эти определения применительно к решению ж — 0 линейной системы х = Ах, (1.9) где А = const. Тогда x(t, 1°г х°) = еА^~*°^х°. (1.10) Из спектрального представления матричной экспоненты следует, что решение х — 0 а) асимптотически устойчиво в целом, если все с. ч. матрицы А лежат в левой полуплоскости; б) неустойчиво, если хотя бы одно с. ч. лежит справа от мни- мой оси. В случаях, когда все с. ч. слева, кроме некоторых, лежащих на мнимой оси (критические случаи), возможна как устойчивость, так и неустойчивость, но при отсутствии кратных с. ч. устойчивость (не асимптотическая!) гарантирована. *) Здесь и далее предполагается единствеллость решения,
362 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ Пример 1.1. Пусть имеется одно (скалярное) уравнение х, — 0. При этом матрица А имеет нулевое с. ч. Тогда x,(t, f, х<,) = х°. Очевидно, что решение х — 0 устойчиво, но не асимптотически (в определении (1.6), (1.7) можно принять 6 = е). Пусть теперь имеется система Xt = 0, Хг = 0. При этом матрица А имеет двукратное нулевое с. ч. Вновь ясно, что устойчивость имеет место. Однако если система имеет вид х, = Хг, Хг = 0, то, хотя матрица А имеет те же с. ч., равновесие неустойчиво: Xj (t, t°, х°) = (t — t°) Хг 4- Xi, x2 (t, t°, x°) = x®,; и при любом x®#=0 найдется такое t, что x(t, t°, x°) «уйдет» .от решения х = 0 больше, чем на любое заданное постоянное е, ука- занное в определении. □ . Таким образом, введенное ранее в гл. 6 определение устойчиво- сти линейной системы (1.9) по начальным условиям соответствует понятию асимптотической устойчивости в целом ее единственного равновесного состояния х — Q. Обобщая, можно записать: Определение 4. Система (1.1) называется устойчивой (по начальным условиям), если она имеет единственное равновесное состояние, и это состояние асимптотически устойчиво в целом. Предположим далее, что описание системы дано в виде X = f(x, t)+ r(t), (1.11) причем r(t) интерпретируется как внешнее воздействие (возмуще- ние), приложенное к исходной системе, описываемой уравнени- ем (1.1). ’ Определение 5. Система (1.1) называется устойчивой по отношению к внешним воздействиям,"если она имеет единственное равновесное состояние х = 0 и при любых ограниченных r(t) и ну- левом начальном условии решение возмущенной системы (1.11) остается ограниченным при t > t°. Очевидно, что, для линейных систем это определение совпадает с приведенным ранее. Как уже указывалось, устойчивость по отношению к начальным условиям и устойчивость по отношению к внешним воздействиям обычно являются желательными свойствами систем управления. Однако, если первое из них не удается гарантировать, можно выдвигать и более слабые требования.
§ 1. ОПИСАНИЕ СИСТЕМЫ. РАВНОВЕСНЫЕ СОСТОЯНИЯ 363 Определение 6. Система (1.1£ называется сходящейся *) в окрестность X равновесия, х = 0 е= X, если при любых конечных i°, х° выполняется условие x(t, Г, хв)е^Х, t> t*>t\ (1.12) причем, если х° X, то t* = t°. Иначе говоря, любая траектория изменения состояния не позже чем к моменту t* попадет в X, а единожды попав, не выйдет из нее (рис. 8.1). Конечно, тот фарт, что система является сходящейся, полезен практически, только если его можно устано- вить по отношению к множеству X доста- точно малого «объема». Неединственность состояния равновесия типична для многих нелинейных систем, причем в ряде ситуаций практически без- различно, к какому равновесному состоянию придут процессы в системе. (Это,, в частно- сти, имеет место при достаточно малой зоне „нечувствительности датчиков — см. § 2 гл. 5.) Поэтому полезное развитие понятия ус- Рис. 8.1 тойчивости дает и следующее определение. Определение 7. Пусть X — множество равновесных состоя-, ний системы (1.1). Тогда X называется поточечно асимптотически устойчивым в целом, если при любых конечных х" решение x(t, t°, х°) является ограниченным и lim «(i, i°, ж0) = х,/ . (1.13) где х — какая-либо точка из X (вообще говоря, различная для раз- личных начальных условий (рис. 8.2)). - Еще раз подчеркнем, что все данные определения устойчивости содержат слова «при любых», а поэтому провер- X ка выполнения их условий невозможна путем А численного интегрирования. 1.3. Метод функций Ляпунова. Принципиаль- Ху цый путь проверки выполнения условий устойчи- л вости был указан А. М. Ляпуновым и известен 8 g как второй метод Ляпунова или метод функций Ляпунова. Приведем основной результат в наиболее простой форме**), *) Во многих работах здесь используется термин «диссипативная система» [8.6, 8.7]. - **) Теорема 1.1 обычно называется второй теоремой Ляпунова с дополнени- ем Барбашина — Красовского, касающимся устойчивости в целом. Под djVfdx здесь и далее понимается вектор (матрица-столбец) с элементами dVfdxj, / = п.
364 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ Теорема 1.1. Пусть.. существует дифференцируемая скалярная функция V(x) переменных состояния системы вида (1.1) с f(x, t)==f(x), обладающая при |х| /s = const следующими свой- ствами: 7(0) = 0, 7(х)>0 при х=#0, (1.14) dV (х) (dVYdx (dV\T., . ,n ,. .c. ..Y = hr -77 = hr /(x)<0 при x^=Q. (1.15) dt \dx ) dt \J)x ) ' ' ' r ’ Тогда состояние равновесия x = 0 является устойчивом (по началь- ным условиям). , Если условие (1.15) заменить на более жесткое: ^-<0, х=^0, (1.16) то имеет место асимптотическая устойчивость. Если условия (1.14), (1.16) выполнены при любых х, а кроме того, V (х) оо при 1x1оо, (1.17) то x — Q асимптотически устойчиво в целом. Доказательство. Рассмотрим сферу |х| — в h (см. двумерную ил- люстрацию на рис. 8.3). По теореме Вейерштрасса непрерывная функция V(x) в некоторой точке х* на сфере, причем в силу (1.14) а > 0. С учетом непрерывности V(x) и (1.14) устанавливаем, что существует б < <е такое, что 0 V(x) < а при |х| < б. Рассмотрим произвольное решение систе- мы (1.1), начинающееся из точки х(Р), |х(«°)| < 6, и докажем, что |x(t)| <в при t > t°. Предположим, что это не так, и (' — пер- вый момент выхода решения на сферу: |х(Р) | = в. Изучим поведение функции V[x] на этом ре- шении, т. е. функцию v(t) А V [х (t)l. В силу (1.15) эта функция невозрастающая, а следо- вательно, а > F[x(«0)] > F[x(t>)] ><х. Противоречие доказывает, что решение не может выйти из сферы |х| в, т. е. имеет место устойчивость. При условии (1.16) функция v(t) монотонно убывает и, будучи ограничен- ной снизу, стремится к пределу vx > 0. Почти очевидно, что v„ = 0. Действи- тельно, предположим противное: > 0 => | х (t) | А $ Q, t > t => у, у > 0. Интегрируя последнее соотношение, получаем F[x(t)J F[x(«°)] — yt, t > достигает минимума г (х'-) — а,
§ 1. ОПИСАНИЕ СИСТЕМЫ. РАВНОВЕСНЫЕ СОСТОЯНИЯ 365 что противоречит положительности функции V. Таким образом, lim V [х (/)] — О, f-*oo откуда сразу следует асимптотическая устойчивость lim.r(f) = 0. (1.18) t—»oo В силу (1.16) Дополнительное условие (1.17) позволяет установить, что, каково бы пи было x(i°) — найдется такое R, что V (х) > V (х°) = и0 при | х | 5? R. V[x(t)] < V[x<>] = е0=> к(<)| т. е. все решения ограничены. После этого установление (1.18) производится так ясе, как и выше. Аналогично можно указать, какими свойствами должна обладать функция Ляпунова, для того чтобы выполнились условия других определений. Приведем, например, следующий результат. Теорема 1.2. Пусть равновесное множество X системы (1.1)- ограничено. Пусть на X и в его h-окрестности определена диффе- ренцируемая функция V(x), обладающая свойствами-. V(x)>Q при х из h-окрестности X, V (х) = 0 при х из X, dV (х) п —<^0 на любом решении x(t, г, х ’), пока его значения лежат в окрестности X. Тогда множество X устойчиво (по начальным условиям). При замене последнего условия на строгое неравенство имеет место асимптотическая устойчивость. При распространении условий на все пространство гарантируется устойчивость в целом*). Вообще любому осмысленному определению устойчивости мож- но сопоставить соответствующую теорему ляпуновского типа, при- чем доказательство таких теорем настолько стандартизовано, что осуществимо даже с помощью логических программ ЭВМ. На са- мом деле ясно, что само значение функции Ляпунова является не- которым обобщенным расстоянием до множества, устойчивость ко- торого изучается, и обеспечение ее убывания служит гарантией приближения к этому множеству, и напротив, возможность возрас- тания хотя бы по некоторой «щели», примыкающей к этому мно- жеству, свидетельствует о неустойчивости**). Действительно сложные проблемы возникают, когда приходится переходить к построению функций Ляпунова с требуемыми свойствами. *) В [8.6,- с. 193] Т.1.2 дана в более гибкой, но и более сложной формули- ровке. **) Строгая формулировка соответствующего факта называется теоремой Четаева [8.7, с. 246].
366 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ § 2. Построение функций Ляпунова и критерии устойчивости 2.1. Квадратичная функция Ляпунова. Наиболее простым обоб- щением величины отклонения от нулевого состояния является поло- жительно определенная квадратичная форма от переменных со- стояния. Такая мера отклонения от нуля неоднократно использовалась в гл. 5. * Поэтому естественно попытаться использовать при иссле- довании устойчивости состояния равновесия функцию Ляпунова вида < У(а:) = жтРа:, (2.1) где Р — положительно определенная матрица. Вычислим ее произ- водную в силу уравнений = (2.2): Имеем ^1 = 2жтР/(а;). . dt ' В силу теоремы 1.1 и определения 4 в § 1, система (2.2) является устойчивой (по начальным условиям), если,_х = О— единственное решение уравнения /00 = 0 и для всех х =И= 0 выполнено условие 2аЛР/(х)<0. (2.3) Отнюдь не при любых f(x) удается выбрать параметры функции Ляпунова, т. е. элементы положительно определенной матрицы Р так, чтобы (2.3) выполнилось при любых х. Выясним первоначально, возможно ли это по крайней мере для линейных систем, где /1)(х) = Л.г (2.4) и А — постоянная 'неособая матрица, так что х = 0 — единственное равновесное состояние. Условие (2.3) записывается так: 2хтРАя = хт{А*Р + РЛ]х < 0, х ¥= 0. Оно выполняется, если A'P + PA~-G, (2.5) где G — любая положительно определенная матрица. Таким обра- зом, задавшись какой-либо матрицей G, например G = al, а > 0, найдя из линейного уравнения (2.5) матрицу Р и установив ее по- ложительную определенность (Р>0), мы докажем устойчивость
§ 2. ПОСТРОЕНИЕ ФУНКЦИЙ ЛЯПУНОВА 367 состояния равновесия х = 0 системы х — Ах. Этот путь доказательства устойчивости известен под названием матричного критерия Ляпунова. Но ведь нам известен другой кри- терий: для устойчивости необходимо и достаточно, чтобы все с. ч. матрицы А лежали в левой полуплоскости. Оказывается, что эти два критерия формально эквивалентны. Лемма 2.1 (лемма Ляпунова). Уравнение (2.5) имеет (при G > 0) положительно определенное решение тогда и только тогда, когда все с. ч. матрицы А лежат в левой полуплоскости. Доказательство. Если А имеет «хорошие» с. ч., то существует мат- рица СО / = ^e^Ge^dt о (все элементы подынтегрального выражения экспоненциально убывают). Имеем ДТУ = j 4TeATiGe'A( dt = eATtGeAt |8 — J eATtGeAtA dt, о о или = — G — J A, t. e. J является решением (2.5). Имеем также G > 0 => J > 0, поскольку (х°)т Jx° = J (х°)т eATiGeAix° dt = J [у (t)]T Gy (t) dt > 0, о о y(t) ^eAtx\ так как #= 0 => НО ¥= 0 => y'(t)Gy(t)>0 при любых t 0. ' С другой стороны, существование положительно определенного решения уравнения (2.5), как уже было показано, достаточно для обеспечения устойчи- вости в целом, но таковая имеет место, только если все с. ч. матрицы А «хо- рошие». Непосредственно матричный критерий используется редко, но его связь с возможностью построения функции Ляпунова важна, поскольку он может быть использован как промежуточный резуль- тат при установлении условий устойчивости нелинейных систем. Теорема 2.1 (теорема Ляпунова — Пуанкаре об устойчивости по линейному приближению). Пусть х — 0 — равновесное состояние
368 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ системы (2.2) и правая часть представима в виде f(x) = Ах + (2.6) причем lim = 0 (2.7) IxRo 1*1 и А — имеет только «хорошие» с. ч. Тогда х = О — асимптотически устойчивое состояние равновесия. Доказательство. Построим Р(г) — х^Рх, причем в силу леммы можпо взять такое Р > 0, что G = —[4т/>4-РЛ] > 0. Вычислим производную V на решениях системы х = Ах + /1(^)- Имеем V = 2x~P[Az + faW\ = хЦА-Р + РА]х + 2х'гРр(х) = — x'Gx+ 2x*Pfa (я). В силу (2.7) найдется такое h > 0, что —xrGx < 0 => — x‘Gx + 2x'*Pfa(x) < 0 при \х\ h, т. е. выполнены условия Т.1.1, обеспечивающие асимптотическую устойчи- вость. Теорема 2.1 зачастую трактуется как фундаментальное обосно- вание приема линеаризации (по Тейлору) «гладких» нелинейно- стей и тем самым — в качестве «оправдания» использования ли- нейных моделей для приближенного описания реальных систем. Очевидно вместе с тем, что это далеко не достаточное обоснование: «грубым» по отношению к гладким нелинейным возмущениям ока- зывается лишь «локальное» свойство асимптотической устойчиво- сти. Более сильные результаты можно получить только для нели- нейных систем специального типа. 2.2. Системы с безынерционными нелинейностями. В рамках тео- рии управления, как уже указывалось в гл. 5, значительный инте- рес представляет описание систем в виде структур, включающих линейные динамические звенья и нелинейные статические (безынер- ционные) звенья. На языке пространства состояний такие структу- ры могут быть описаны с помощью уравнений, введенных А. И. Лу- рье в книге [8.10], сыгравшей основополагающею роль в развитии теории устойчивости систем управления. ' Уравнения в форме Лурье имеют вид: х = Ах + Ви, (2.8) о = Сх, (2.9) п = /(о), (2.10).
§ 2. ПОСТРОЕНИЕ ФУНКЦИЙ ЛЯПУНОВА 369 где А, В, С — постоянные матрицы, а /(о) — вектор-функция с ком- понентами /,(о,), 7 = 1, ..т, причем Oj — j-я — компонента век- тора о. Предполагается, что /(0)=0, (2.11) а следовательно, х = О, v = 0, а = 0 — состояние равновесия систе- мы (2.8) —(2.9). Первые два уравнения (2.8), (2.9) описывают линейную часть системы, а (2.10) описывают характеристики т нелинейных эле- ментов (НЭ), входом каждого из которых является скалярная пе- ременная О/(£), а выходом — скалярная же переменная Рис. 8.4 Уравнениям (2.8) — (2.10) можно сопоставить структурную схему, представленную на рис. 8.4. Эту схему можно «свернуть» (рис. 8.5), вводя в рассмотрение операторную матричную п. ф. линейной ча- сти системы Рис. 8.5 Д -C[D/ — А]~1В (2.12) (от входа v к выходу — о). Введение п. ф. эквивалентно исключе- нию «внутренних» переменных линейной части из уравнений (2.8), (2.9) и записи результата в операторной форме o + #b(D)v = 0. (2.13) Уравнения (2.13), (2.10) являются матричным обобщением операторных уравнений (2.4) из гл, 5, где рассматривалась система с одним (т — 1) нелинейным элементом,- Операторная запись компактна и удобна. Однако в виду, что из-за возможного сокращения элементов знаменателя п. ф. в ней может быть потеряно описание «висячих» звеньев линейной части системы. Отметим, что уравнения (2.8), (2.9) с точностью до обозначе- ния переменных совпадают с уравнениями многосвязной линейной 24 а. А, Первозванский надо иметь числителя и
370 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ управляемой системы (и — вход, —о —выход). Это формальное сходство позволяет сразу указать, используя результаты гл. 6, что несократимость ЯЬ(В) гарантирована, если пары матриц А, В и А\ Ст являются невырожденными. Можно было бы ограничиться исследованием только таких ситуаций. Вместе с тем очевидно, что наличие линейных «висячих» звеньев, выделяемых с помощью структурной теоремы (§ 2, гл. 6), почти не усложняет исследования устойчивости системы как целого. Действительно, если хотя бы одно такое звено неустойчиво, то неустойчива и система, если же все они устойчивы, то результат определяется поведением вполне свя- занной части, задаваемой операторным уравнением (2.13) и нели- нейным уравнением (2.10). Поэтому в дальнейшем не будет особо оговариваться, что все приводимые результаты об устойчивости си- стемы в форме Лурье справедливы, только если устойчивы все «ви- сячие» звенья или их вовсе нет. 2.3. .Условия устойчивости и оценки процесса установления. Пе- рейдем к выяснению условий устойчивости системы (2.8) — (2.10). Теорема 2.2 (о разрешающих уравнениях Лурье). Пусть функ- ции Д(щ) удовлетворяют условиям принадлежности к секторам [0, Rj], kj> 0, т. е. _ . /Д0) = 0,; о}#=0,. / = 1, ...,тп. (2.14) Пусть при каких-либо Q > 0, T = diag{rj, 1 = 1, ..., m}>0 и q = = diag{^, j 1, ..., m) > (Унайдугся симметричная (пХ ^-матри- ца Р>0 и (тХ п)-матрица h, удовлетворяющие системе урав- нений А*Р + РА +hTh +Q = 0, (2.15) yTh = ВТР + 4 [qCA + тС],: (2.16) где ^ = xK-l — qCB>Q, Z = diag{zy, С = {СД. (2.17) Тогда система (2.8) — (2.10) устойчива (по начальным условиям). Доказательство. Покажем, что функция Ляпунова вида m V (х) = х'Рх + 2 q}\f} (оД dajf = Cf, (2.18) i=i о удовлетворяет условиям Т.1.1, обеспечивающим устойчивость -в целом равно- весного состояния х = 0. Поскольку Р > 0, q > 0, fj(<Jj) 0 при oj 0, то V(x) >0 при х ф 0. Очевидно также, что V(х) -> оо при |ж| -+ оо. Остается до- d казать отрицательность jjV(x(t)). Имеем ~ -ж 2хтР (Ах + Bv) + Я jfj (Hj) = 2*Т/> А* + Bv) + 9jVjCj(.Ax + Bv). i=i 3=1
§ 2. ПОСТРОЕНИЕ ФУНКЦИЙ ЛЯПУНОВА 371 Прибавляя и вычитая слагаемые приведем это выражение к виду т/>0, (2.19) т = 2хтР (Ах +Bv)+G (х, v) — У TjVj dt j=l где обозначено G +’ v} = М(Лг + + ^vi ( °j~ vi / j e 3=1 L \ i /J — vTgC (Ax + Bv) + Л (Cx— K~rv). (2.20) В силу свойств (2.14) нелинейных функций, слагаемые (2.19) неотрица- тельны для всех и(, удовлетворяющих (2.10). Таким образом, если W (х, v) A 2хтР (Ах -j- Bv) + G (х, v) < 0, (2.21) то и — < 0 при любых х, v Ф 0. (2.22) dt С другой стороны, в силу (2.15) и (2.20) имеем Ж (a, v) — —xPQx — x'Whx + от [2BTP + qCA xC] x + vT [qCB — tK-1] v, откуда с использованием (2.16), (2.17), убеждаемся в справедливости представ- ления „ г И'(г, v) =—x^Qx—]hx — 7а |2, (2.23) что и доказывает (2.22). Дополнение, к Т.2.2. Пусть матрица А является гурвицевой; тог- да утверждение Т.2.2 сохраняет силу, даже если найдется вектор q с компонентами произвольного знака. Доказательство. Требование q > 0 использовалось при доказатель- стве Т.2.2 только в связи с обоснованием условия V (х) >0 при г =/= 0. Пока- жем, что оно сохраняет силу и при отказе от этого требования. Неравенство V < 0 было установлено для любых функций /, (а<), удовлет- воряющих условиям (2.14)..В частности, оно верно для линейных функций h = kjOj, (2.24) Докажем, что _ Л (Д) А Л 4-ВКС, ^ = diag{^, у = 1, ...,пг} гурвйцева, если Л гурвицева. Для линейных fj(Cj) имеем m v = ^Рх + 12 Cix’ ’=1 (2.25) V = (2xrP + 2 Зх < 0. \ j } 24*
372 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ Если A (fc) имеет с. и. на мнимой оси, то линейная система х === Ах + ВК<з = А(К)х имеет периодические решения, но тогда невозможно, чтобы V < 0 па таком ре- шении, а следовательно, А (К) при любых К, 0 К К, не может иметь таких о. ч. Вместе с тем А(0) = А имеет с. ч. только в левой полуплоскости. Ввиду не- прерывной зависимости с. ч. А (К) от К они не могут перейти направо, не пере- ходя через мнимую ось, что и доказывает гурвицевость А (К}. Обозначим 3 В силу (2.25) имеем Р(К)АЦК) + А\К)Р(К) < 0. Согласно лемме Ляпунова Р(К) >0, поскольку А (К) гурвицева. В частности, имеем Р<->ДР+|2Н$(%>0, (226> з где суммирование распространено только на те индексы, где д, < 0. Теперь легко убедиться, что V (х) = жтРх + 2 /> (^) = ’ о / °з \ аз = xW>x + 2l~> (- $ 4 (о7.) dOj + 2(+) Ч}J/> (^) > 0, з \ i> J i о (2.27) где в последнем слагаемом суммируются только члены, где gj > 0. Подчеркнем, что из гурвицевости А вытекает, что любая симметричная матрица Р, удовлетворяющая (2.15) —(2.17), окажется положительно определен- ной. Если А имеет некоторое число с. ч. справа, то это же число имеет матри- ца А (К) при любых К, удовлетворяющих (2.24). Теорема 2.2 сводит проблему абсолютной устойчивости к чисто алгебраической задаче о разрешимости матричного квадратичного уравнения Лурье. Знание самого решения матрицы Р позволяет по- лучить и оценки скорости приближения к равновесному состоянию. Приведем один полезный результат. Теорема 2.3. Пусть найдена матрица Р, удовлетворяющая систе- ме (2.15) — (2.17) при Q — yJ, ц > 0. Пусть V-— наименьшее с. ч. матрицы Р^~* = Р + 2<-> а v+ — наибольшее с. ч. мат- з рицы Р(+) = Р + S<+> Тогда для решений системы (2.8) — з
§ 2. ПОСТРОЕНИЕ ФУНКЦИЙ ЛЯПУНОВА 373 (2.10) справедлива оценка |я(£)12^с0е_<", Доказательство. Имеем °з °з V (х) хгРх +2(+) f h (CTj) dai + S(-) f fj (ffj) doj. i о i о Очевидно, что справедливо неравенство +2(+Ч 3 3 откуда х'Р^х 7(я) < хтР<+)ж, или v_|x[2 7(х) v+|a:|2. (2.28) (2.29) (2.30) (2.31) С другой стороны, в ходе доказательства Т.2.2 было установлено, что на реше- ниях х = x(t) системы (2.8)—(2.10) dV < W (х, р)< - х^х, так что при Q = р./ имеем: С учетом неравенства (2.31) получаем dF ti dV u, . о. ^<-7- v=>V — ^=>V[x(t)]<vh ] *r + С учетом левого неравенства (2.31) приходим к окончательному результату I * «) |а < V- V [X (t)] ё V+‘V[x°] = V-«. Дадим простейший пример [8.4, с. 58] использования получен- ной оценки. Пример 2.1. Рассмотрим систему 2-го порядка ^1 = ^2, ^!(0)=1, Х2 = —Х1 — 2х2 — V, хг (0) = О, о = Xi, О :С v/a И = 1, о ¥= 0; она записывается в матричном виде при (01) ( 0 ) А — —2)’ = (— 1 j’ = {1 0}». п = 2г т — 1.
374 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ Уравнение (2.15), (2.16) запишем, считая q = 0, т — 1, 72 = 1/^ = 1, О — 11 |Рц •P.12I 1 -W12 J (Pit, 1 {ht M = {0 -1}L ' +y{l O}. И12 F22J Выпишем положительно определенное решение при у, — 1: Ри = 1,586, р12 = 0,5, р22 = 0,586. В данном случае (д = 0) имеем Р = Р(+) = Р(_), так что достаточ- но вычислить меньшее Vi и большее v2 с. ч. матрицы Р: V_ = V1 = 0,377, v+=v2 = 1,79. Оценка (2.28) принимает вид 4(0 + 4(0<М«-</1’79*’ . Для сравнения заметим, что для линейных систем v = ко, 0 к =£ 1, j имеет место оценка того же типа, но в показателе экспоненты сто- | ит 1 вместо 1/1,79. □ | 2.4. Частотный критерий. Несмотря на желательность непосред- ственного вычисления матрицы Р для построения оценок, наиболее важной проблемой остается установление самого факта устойчиво- сти, а для этого, как утверждается в Т.2.2, достаточно показать лишь разрешимость уравнения Лурье, а не находить само решение. Оказывается, что это можно проделать существенно более про- стым способом, с помощью частотного условия В. М. Попова, вари- ант которого (для случая одного нелинейного элемента, т = 1) уже приводился без доказательства в гл. 5. Теорема 2.4 (частотный критерий В. М. Попова). Пусть матри- .< ца А гурвицева, пара А, В невырожденна, а функции /До,), j= j = !,..., m, удовлетворяют условиям (2.14) принадлежности к сек- торам [0, йД. Тогда-. <| 1) состояние равновесия х = 0, о = 0 системы (2.8) — (2.10) j асимптотически устойчиво в целом, если существуют такие матри- I цы т = diag {тД > 0 и q = diag iq,}, что при всех to, —°° со «5 <», 1 выполнено неравенство *) Й л(ы)Лт£-1+Ве[(г 4М#Х®)]>0« (2.32) | где ’ HL(p) = —C\pl - A]-lB, К~* = diag {ОД. . *) Если Z — матрица, то Re 2 = у (2 + 2(*5), где (») обозначен результат операции транспонирования и замены всех элементов на комплексно сопряжен- ные. При m = 1, можно положить т = 1, и (2.32) переходит в неравенство (2.10) гл. 5.
§ 2. ПОСТРОЕНИЕ ФУНКЦИЙ ЛЯПУНОВА 375 2) При некотором Q > 0 и упомянутых х, q существует положи- тельно определенное решение уравнений Лурье (2.15), (2.16). Доказательство. Попытаемся найти такие Р, h, 7, что при заданных 5, т > О Q > 0 для всех х, v Ф 0 выполнено тождество W(х, i>) + xTQx + |hx — 7а)2 = О, (2.33) где W(x, у) определено соотношениями (2.20), (2.21), т. е. IV(ж, v) == 2хтР(Ах-}-Bv) vT[qC(AxBv) А-х(Сх— Всюду ранее предполагалось, что х, v являются вещественными. Усилим (2.33), потребовав, чтобы для всех комплексных а: и и выполнялось тождество 2Re х^Р(Ах + Bv)+3(х, v) + |Ъ —Tp|« = 0, (2.34) где _ # (*. р)ДВе Р*’ [qC (Ax + Bv)+ x(Cx—K~1v)] +xmQx}. (2.35) Лемма Якубовича — Калмана (Приложение 2) указывает, что для выполнения тождества (2.34) необходимо и достаточно выполнение частотного условия: — А)-'Ви, р] <0, —оо^со^оо. (2.36) € учетом определения &(х, v) и матричного тождества А(р1— А)-1 + I = р(р! — А}~'1 условие (2.36) преобразуется к виду Re vW{xK~l + [(т + г(од)Яг(г<о)]}р— — Re {₽<»>[(ад/ — A)~lB] — A)^B}v} 0. Очевидно, что оно заведомо выполняется *), если выполнено частотное неравен- ство Попова (2.32). Тем самым гарантировано существование Р, h, q таких, что имеет место. (2.33). Однако нетрудно убедиться, что оно эквивалентно уравне- ниям Лурье (2.15) —(2.17) (при доказательстве Т.2.2 устанавливалось обратное: в предположении существования решения уравнений Лурье строилось тождест- во (2.33)). Таким образом, доказано, что неравенство Попова гарантирует раз- решимость уравнений Лурье, т. е. п. 2 теоремы, а тогда п. 1 является прямым следствием Т.2.2. Доказательство всех остальных утверждений, приведенных в § 2 гл. 5, и их обобщений на случаи пг > 1 может быть построено по близким схемам (см. [8.6]). _ При этом ключевыми являются два момента: а) использование условия типа или °? j VjdcSj О 0 . (локальных или интегральных связей), вытекающих из предполага- емых свойств нелинейностей; *) Взяв Q — pl, при достаточно малом р. получим, что второе слагаемое меньше первого, которое по условию Попова положительно и отделено от нуля;
376 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ б) преобразование требований к квадратичным формам в частот- ные условия с помощью леммы Якубовича — Калмана. К сожалению, доказательство самой леммы крайне громоздко, и в Приложении 2 оно приведено только для случая т = 1. § 3. Элементы теории возмущений и зависимость от малого параметра 3.1. Ограниченные возмущения. Проблема «грубости» результа- тов исследования по отношению к точности модельного описания, естественно, важна и для нелинейных систем. Результаты теорем § 2 гл. 5, дающих условие устойчивости для класса систем (усло- вия абсолютной устойчивости) могут трактоваться и как гарантии грубости факта установления устойчивости по отношению к нели- нейным возмущениям определенного вида, т. е. к изменениям пра- вых частей уравнений системы. Вместе с тем возмущения не обязательно укладываются в узкие рамки условий типа «принадлежности к сектору», а следовательно, не обязательно гарантируется, что возмущения не приведут к по- явлению отклонений от равновесного состояния в установившемся режиме или даже к неограниченному уходу от равновесия. Приведем лишь следующий простой результат*). Теорема 3.1. Пусть для системы x = Ax + Bf(o), о — Сх, (3.1) выполнен критерий В. М. Попова. Тогда система х = Ах + Bv + r(x, t), v = j(o), о = Сх, (3.2) где r(x, t) ограничено по модулю при всех x,_t, является сходящей- ся в некоторое ограниченное множество X (является диссипа- тивной). Доказательство. Согласно доказательству, приведенному в § 2, при выполнении критерия Попова существует функция . ' о V (х) = х^Рх Ц- q J / (о) da (3.3) о такая, что ее производная в силу невозмущенной системы (3.1) У(1) удовлетво- ряет условию / У(1) < W(x, v), где W(x, и) — отрицательно определенная квадратичная форма переменных х, v. Следовательно, W (х, v) —eix2 — e2t>2, ei, 62 > 0. *) Более тонкие утверждения об устойчивости по возмущениям имеются в книге [5.7],
§ 3. ЭЛЕМЕНТЫ ТЕОРИИ ВОЗМУЩЕНИЙ 377 Найдем теперь производную V(х) в силу уравнений (3.2). Имеем V [Ах + Ви] + (JZY г (х, t) = Й(1) + [2Рх + Чи(УУ г (х, t) < \dx I \их / ' ' < — е^г2 — е2и2 + [2Рх quC^ г (х, t). Вторая группа слагаемых, в силу ограниченности г и того, что | г|\К<з| = = | КСх |, растет не быстрее, чем линейно по х. Поэтому найдется такое R, что при |г| У(2) < —а < 0. (3.4) Поскольку V (х) -> оо при [ж[ -> оо, то существует ограниченное со > 0 та- кое, что из условия У(х) Со (3.5) следует | х | R. В силу (3.4) любая траектория системы входит в множество X, все точки которого удовлетворяют условию V(x) < с0. (3.6) Это множество ограничено. Подчеркнем, что в силу данных в § 1 определений диссипатив- иость системы (3.2) влечет за собой устойчивость системы (3.1) по внешним воздействиям*). 3.2. Асимптотический метод. Установление только факта устой- чивости и тем более сходимости в множество с трудно оцениваемы- ми «размерами» обычно не полностью удовлетворяют исследователя. Важно полнее изучить возможное влияние конкретных возму- щений описания системы, конечно, предполагая их в том или ином смысле малыми. Для этой цели эффективным оказывается асимпто- тический метод (метод малого параметра). Пусть исходная (порождающая) система описывается урав- нением x = fa(x,t), , (3.7) а влияние возмущений характеризуется малым параметром у, (у > >0), так чТо возмущенная система задается уравнением * = /»(£, t, р,), (3.8) где k(x, t, 0) = /0(х, t). (3.9) Возникает вопрос, насколько близки решения х„(1) и x(t, р,) урав- нений (3.7), (3.8) при одних и тех же начальных условиях х0(^°)=я:0, x(t\ ц)=а:0. В учебниках по теории дифференциальных уравнений, как прави- ло, приводится следующее утверждение. Теорема 3.2 (теорема Пуанкаре). Если функции f№(x, t, у) не- прерывно дифференцируемы по всем своим аргументам, то при до- *) Класс возмущений здесь расширен по сравнению с определением 5 в § 1, где г(х, t) =.r(i) и рассматривалось как внешнее воздействие.
378 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ статочно малом р x(t, p)=x0(f)+ р,Ж1(£)-ЬR(t, р)', (3.10) где R(t, р) -> 0 при р-> 0 как величина меньшего порядка, чем р, равномерно по t, решение (3.10). определено по крайней мере на конечном отрезке [t0, t0 + То]. Если функция f»(x, t, р) аналитична по всем аргументам, то при достаточно малом р решение системы (3.8) можно представить в виде ряда х (t, р) = 2 Vkxh (t), — (3.11) й=0 равномерно сходящегося на конечном отрезке [t0, t0 + Та]. Подстановка представления (3.10) в уравнение (3.8) показыва- ет, что функция xt(t), называемая функцией чувствительности ре- шений по параметру р, удовлетворяет линейному уравнению x^A^x. + hit), ^(0)=0, (3.12) где ~ дх L(n=5C0(t),|x=0* ~~ ёр |х(О=х0(О,ц=0* а гго(О—решение уравнения (3.7), удовлетворяющее заданному начальному условию. Следует четко представлять, что, вообще говоря, близость выра- жения a?0(i)+ p,xl(t) к решению возмущенной системы даже при малых р гарантирована лишь на конечном интервале времени. Для исследования влияния параметров на бесконечном интерва- ле приходится применять метод Ляпунова. Справедлив, в частности, следующий результат [3.6, с. 85]*). Теорема 3.3 (условие параметрической устойчивости «в малом»). Пусть функция fn(x, t, р) непрерывно дифференцируема по х, р при всех Пусть функции A(t), ft(t) в (3.12) ограничены, матрица Ф(£, т) фундаментальных решений уравнения (3.12) удов- летворяет условию |Ф(£, т) I С ce-v<l-x), v > 0, с > 0, ia < т t, а 17и(х, t, р) — и(х0 (t), t, 0) — [A (t) I + р/х (t)] c2H1+V1* где 5 (i) Д x — x0 (t), v, > 0, ct, c2 > 0. Тогда для любого б > 0 можно найти такое р, что \x(t) — x0(t) — pari (t) I С 6р, f>t0. Отметим, в частности, что если исходное уравнение линейно: х (Ло "1" рЛ,) х, *) В книге [3.6] имеется много других полезных результатов о чувстви- тельности при регулярном вхождении параметров (см. также [8.14]).
§ 3, ЭЛЕМЕНТЫ ТЕОРИИ ВОЗМУЩЕНИЙ 379 где Ao, At = const, то для обеспечения параметрической устойчиво- сти в малом достаточно устойчивости матрицы /!<>*). То же верно для слабо нелинейной системы х =(40+ цА1)х + nfi(x), где Л (ж) — гладкая нелинейная функция, удовлетворяющая усло- вию Липшица.. 3.3. Сингулярные возмущения. Существенным условием приме- нимости Т.3.2, Т.3.3 является также дифференцируемость правых частей по параметру, по крайней мере, в окрестности р = 0. Однако это условие нарушается в ситуации, представляющей фундаментальный интерес для теории управления. Определение. Назовем, следуя [8.5], систему (3.8) сингу- лярно возмущенной, если при р -+• 0 хотя бы одна из компонент вектора Д не ограничена. Наиболее изучены сингулярно возмущенные системы, предста- вимые в виде % = fy(y,z,x)f (3.13) . y(0)=y’, z(0)=z*, где вектор состояния разбит на два подвектора у, z, причем при р-*>0 скорость изменения переменных z(x) не ограничена (пере- менные z(t) называются быстрыми) .Функции /в, Д при этом пред- полагаются регулярно (в частности, аналитически) зависящими от р. Конечно, в уравнениях (3.13) при р > 0 можно сделать замену независимой переменной, положив t — У, и прийти к регулярно Г возмущенной системе § = Н/у {У, z, У-t),. 1г(У, z, pt)( к которой применима Т.3.2. Однако приближенное решение, полу- чаемое в виде разложения по степеням р, окажется пригодным лишь на конечном отрезке изменения переменной t, а следователь- но, на малом (порядка р) отрезке изменения переменной т, что неудовлетворительно. Поэтому следует использовать другие приемы. Вернемся к исходной записи (3.13). Уравнение для быстрых пере- менных можно переписать и в виде pg = /2(y,z,T). (3.14) Тогда, полагая р = 0, получим Д(у,г,т) = 0. (3.15) ♦) Это свойство как свойство грубости устойчивых линейных систем уже описывалось в гл. 4, § 4'.
380 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ Построенная таким путем порождающая система имеет меньший порядок, чем возмущенная при р ¥= 0. Это явление называется вы- рождением *), а система g = /г(у,з,т) = 0,; y(O) = y” (3.16) называется вырожденной. Напомним, что с явлением вырождения мы уже сталкивались в линейной теории: пренебрежение малыми постоянными времени приводило к понижению порядка дифференциального уравнения. Дальнейшее изложение посвящено обобщению представлений, данных в § 3 гл. 4. Основные качественные представления просты: при определен- ных условиях малость ц обеспечивает быстрое затухание переход- ных процессов по переменным z, «быстрая» подсистема приходит в «квазиравновесное состояние», которое медленно меняется при изменений переменных у и явно входящего в (3.15) времени т. Если выразить с помощью (3.15) z через у и т, z = q>(y, т), и под- ставить в первое уравнение (3.16), то получим систему пониженно- го порядка ^ = /Лг/,Ф(у,т),т]. (3.17) Спрашивается, когда такая процедура дает разумное приближение к поведению исходной Системы? Общий анализ этой проблемы дан в книге [8.5]. Здесь мы приведем лишь основной результат в не- сколько огрубленной форме. Теорема 3.4 (теорема Тихонова — Васильевой). Пусть при т е ®[0, Т} а) функции fv, fz дважды непрерывно дифференцируемы по всем переменным; б) уравнение (3.15), рассматриваемое как уравнение относи- тельно быстрых переменных z при у и т, входящих как параметры, имеет изолированный корень z — <p(y, т) при всех х е [0, Т\ и у из некоторой замкнутой ограниченной области, причем <р(у, т) не- прерывна; в) все собственные числа матрицы он Л2(т) = -^, (3.18) где производная вычислена на решении ^(х), z°(t) = ф(у°(т), т) вырожденной системы (3.16), лежат в левой полуплоскости при всех х; *) Здесь термин «вырождение» имеет, очевидно, другой смысл, чем в теории линейных систем (гл. 6, 7), хотя эти понятия взаимосвязаны ([6.6]),
g 3. ЭЛЕМЕНТЫ ТЕОРИИ ВОЗМУЩЕНИЙ 38t г) решение z(t), t = -^ уравнения g = /2(y»,z,O), t>0, z(0) = z® Ulr ограничено и стремится при t -> <» к <р(г/°, 0). _ Тогда существует такое ц, что , при 0 < jx < ц оценки ' |г/(т, р) — Уо(т:) I < СуЦ, Z (т, р) — z0 (т) — Ло (-М < c2ji,. (3.19) справедливы. (3.20) (3.21) где cz, cv — константы, не зависящие от ц, а функция ло(0'— рсше- • ние уравнения краевого эффекта (пограничного слоя): ~ = л ly\ ? (0) + л, 0],. л (0) = z° - z° (0). (3.22) Поясним смысл условий и результаты теоремы. Условие в) га- рантирует асимптотическую устойчивость «в малом» положения равновесия z = <p(z/, т) уравнения для быстрых переменных, если в нем у, т рассматриваются как «замороженные» параметры. Усло- вие г) требует устойчивости «в большом» по z, но при параметрах, зафиксированных на их начальных значениях. Тем самым обеспе- чивается приближение решений возмущенной системы к поверхно- сти, задаваемой уравнением z = y(y, t)<^fz(z, у, т) = 0. (3.23) Это приближение не' является «мгновенным», а происходит лишь после затухания краевого эффекта. Доказано [8.5, с. 57], что [л(<)| С С1е-", (3.24) где Ci, х — константы, причем х сколь угодно близко к степени устойчивости матрицы Л2(0). Поэтому (\ I * ИТ т \ . —- — -Сс,е я Н/1 и затухание практически происходит через время порядка щ что и оправдывает название «краевой эффект». Отметим также, что при повышении требований к гладкости функций /и, /2 могут быть построены асимптотические представле- ния, дающие сколь угодно большую точность (при достаточно ма- лых р) оо «М)“ 2 Iх+ Мтг) • (3.25) h=0 L /J
382 ГЛ. 8. ДИАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ Наличие затухающих функций ли ---) отличает разложение (3.25)'' от регулярного разложения (3.11). — 3.4. Системы с медленно меняющимися параметрами. Простей- шей сферой приложения теории сингулярных возмущений являют- ся задачи, возникающие при исследовании систем с медленно ме- няющимися параметрами. Рассмотрим систему, описываемую урав- нениями t | (У), £ = А (У, У (0) = У\ Z (0) = z% (3.26) где у, > 0 — малый параметр. Нас интересует поведение системы на большом, но конечном 17* 1 о, — . Iх J Параметр р входит регулярно,, и, как уже говорилось, можно было бы применить классическую процедуру поиска решения в ви- де разложения по степеням ц. При этом в нулевом приближении получим У = У° = const, = /г(у°, г). Однако это приближение непригодно на большом интервале, по- скольку переменные у, изменяющиеся с малой скоростью ~ р, за время Т/у. могут отойти от своих начальных значении на конечную, не малую величину. Поэтому целесообразно ввести новую переменную: «медленное время», т = pi, и тогда уравнения (3.26) приобретут вид g = A(^). У(0) = »% z(0) = z°, (3.27) являющийся частным случаем (3.13). Упрощающей дело особенностью является то, что «медленные» переменные у могут быть вычислены независимо. Обозначим это решение р(т). Тогда для z имеем уравнение с медленно изменяю- щимися параметрами р = А (т), А ** g = А [У (р0, 2], z (0) = z\ (3.28) В соответствии с Т.3.4 можно вычислить приближение к точному решению z(t, р) в виде z(t, р) Д z0 (т) + л0 ( (3.29) и, если выполнены условия теоремы, это приближение окажется отличающимся от точного решения не более, чем на малую величи- Г у 1 ну порядка р на всем отрезке времени т е= [0, Т\, т. е. telO,— . L I* J
§ 3. ЭЛЕМЕНТЫ ТЕОРИИ ВОЗМУЩЕНИЙ, 383. Предположим, что функции /„, /, достаточно гладкие и, более того, h(y,z)AAt(y)z + fzy(y). (3.30> Нетрудно убедиться, что в этом случае все условия теоремы выпол- нены, если матрица Л»(р) имеет все с. ч. в левой полуплоскости при значениях у на траектории у(т), т. е. линейная система g=A(T)z + /2(T)( (3.31) где Аг (х) ДЛ2[у (т)], /2 (т) A/z!Jy (т)], устойчива при любых «за- мороженных» коэффициентах Аг (т). «Вырожденная» часть прибли- женного решения (3.29) дается формулой z0(t) = — ЛГ^тШт), а часть типа «краевого эффекта» получается как решение уравне- ния (3.22), которое в данном случае имеет простейший вид: f = А (*/°) R (0) + л] + fzv (у°) = А (0) лх л (0) = z® — (0), t = р т. е. является линейным уравнением с постоянными коэффициен- тами. Можно выписать теперь явную формулу для приближенного решения (3.29) 2(Ь Н) = — А-1 (т)/2 (т) + еА*(0) ъ [z° + А-1 (0) /2(О)], те [0, Т}. (3.32) Поскольку Л2(0) имеет только «хорошие» с. ч., то краевой эффект быстро затухает и на большей части рассматриваемого интервала приемлемо вырожденное, квазистатическое приближение, при котором z(t)« Л2[у(т)]-‘/4у(т)]. Обратимся теперь к проблеме синтеза управления с обратной связью для системы с медленно изменяющимися параметрами, ко- торая рассматривалась в гл. 6, § 8 и записывалась в виде = Л (pl) ж + 5 (р/) и, х(«0) = ж°. (3.33) Сравнивались два вида управления с’обратной связью. Минимальное значение показателя J {и} = J + ifRu] dt + Xе (tf) Qfx (tf) (3.34) *o обеспечивало управление с обратной связью и = = —к*х, (3.35)
384 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ где k* = R~lB^P*, (3.36)’ а Р* являлось решением уравнения Риккати - = А^Р + РА - PBR-'ETP + (?,. P(tf} = Qi. (3.37) Как эффективное приближение рассматривалось управление и = ц = —кх, (3.38) где к = r-'Btp, (3.39) а Р удовлетворяло в каждый момент t уравнению АТР + РА- PBR~lB*P + <2 = 0. (3.40) Обозначим через x*(t, ц) решение уравнения = А*х, x(t0) — x°, А* А А — Вк*$ (3.41) а через x(t, ц)— решение аналогичного уравнения ~=Ах, x(t0) = x\ А&А-Вк. - (3.42) Эти уравнения описывают соответственно систему, замкнутую опти- мальной (3.35) или «замороженной» (3.38) обратными связями. Сравнение требует оценки проигрыша в значении показателя (3.34), вызванного использованием неоптимального управления, т. е.- различием между#* и х, и* и й. Эта оценка была сформули- рована в виде Т.6.5 (гл. 6). Теперь возможно дать ее доказатель- ство, опираясь на теорию сингулярных возмущений. Доказательство теоремы 8.5 (гл. 6). Введем в уравнение Риккати (3.37) переменную т = ц(tj — t). Тогда получаем сингулярно возмущенное уравнение И = № + РА “ PBR-'IPP + Q, Р |t=0 = Qf, (3.43) где параметры являются функциями медленной переменной т. Замечательно, что уравнение (3.40) оказываетсявырожденным по отношению к (3.43) и его решение Р зависит только от т, Р = Р(т). Поэтому сравнение Р* и Р может базироваться на оценке, даваемой Т.3.4*). Необходимо первоначально прове- рить выполнение ее условий. Условие а) о дифференцируемости, очевидно, выполняется. Условие б) о наличии изолированного корня выполняется, если пара матриц А, В невырожденна при любых т и Q > 0, поскольку в этом слу- чае уравнение (3.40) имеет единственное положительно определенное решение. Условие в) эквивалентно требованию устойчивости матрицы Л(т), что следует *) Далее используется Т.3.4 применительно непосредственно к матрично- му уравнению, хотя результаты сформулированы в векторном случае. Но, оче- видно, они сохраняют силу, поскольку любое матричное уравнение можно рас- писать по столбцам. Выражение ||Р|| следует понимать как норму вектора, со- ставленного из столбцов Р.
S 3. ЭЛЕМЕНТ ТЕОРИИ ВОЗМУЩЕНИЙ 335 из стабилизирующего характера обратной связи (3.38). Наконец, условие г) выполняется в силу теоремы Калмаиа (Т.8.3, гл. 6) о сходимости решений урав- нения Риккати из произвольной положительно определенной начальной точки. Согласно Т.3.4 решение Р* уравнения (3.43) представимо в виде = Р (Т) _|_ По т 7 + А (т, И). рТд — tf — tQ, (3.44) 0, TJ, где По(г|),С — — , дается уравнением краевого эффекта типа (3.22), а Д(т, р) — 1 в погрешность приближения. В данной задаче уравнение краевого эффекта принимает вид — = 4Т(? (0) + П) + I? (0) + П] А - - [Р (0) + П] BR-'B' {Р (0) + П] 4- Q, .(0), где матрицы А, В представлены своими значениями при ti — 0, т, е. при t = tf. С учетом (3.40) это уравнение принимает вид rfTI — гг=Л1'П+ПЛ-ПВД-1ДтП, П|<1=0 = (?г-Р(0), (3.45) где А определено в силу (3.42) при t = tf. В Т.3.4 дана оценка 11Д(т, р) II sC С1Ц, (3.46) где с, — константа, не зависящая от р. Кроме того, было указано на справедливость экспоненциальной оценки ви- да (3.24) для скорости затухания краевого эффекта, так что (3.47) где 71 может быть взято сколь угодно близким к степенй устойчивости линеа- ризованного уравнения краевого эффекта (3.45). В данном случае линеаризованное уравнение получается путем отбрасы- вания в (3.45) квадратичных слагаемых. Можно доказать, что степень устойчи- вости такого матричного уравнения равна удвоенной степени устойчивости век- торного уравнения £ = Ах, где матрица А зафиксирована при t = tf. Таким образом, мы доказали, что при достаточно малых р > 0 ||p*(t, р)-Р(т)||<с0Г1’1'1+с1р, 0<т<Т0. (3.48) Поскольку (3.42) также можно записать в сингулярной форме, введя ц — р(г — г0) = Та — т, dx — „ р^ = Ах, х (0) = х°, т1 > 0, (3.49) где А зависит только от медленной переменной Т|, то и для его решения х (ть р) можно записать аналогичную оценку P(Tr p)|<rfoe ’“^-Ь^р, 0<Т1<Го, (3.50) 25 А, А. Первозванский
886 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ где do, <4, То — константы, причем можно взять сколь угодно близко к степе- ни устойчивости матрицы А, но при значении ti — 0, т. е. t = te. Теперь для оценки проигрыша в значении показателя используем его пред- . ставленив (8.17) гл. 6, из которого следует, что Ч 7{u) = 7(u*}+ (3.51) ‘о каково бы ни было управлепие u(t) и определяемое им изменение состояния «(<). В частности, для управления (3.38) получаем , Ч А/A/ {S} —/{»♦} = J «T[K* —4r]’fllff* -K]«dt=« *о « j (3.52) ‘о Теперь остается произвести оценку правой части (3.52) с учетом неравенств , (3.48), (3.50): го А/ < р"1 J | 5 (т, р) |21| Р* (т, р) - Р (т) р | В (%) R-'B'1 (т) I di < О Т0 / <sp-1 J (d0«“V«(T"“T),‘'’1 + d1p)!!(cee~Vi4‘ (3.53> о где s A max §В (т) В~1ВУ (т) ||. Непосредственное интегрирование в правой ге[0,тв1 части (3.53) приводит теперь к оценке, указанной в Т.8.5. Доказательство Т.8.4 окажется упрощенным вариантом доказательства, описанного выше, если принять Т = Го/р. - Проведенный в ходе доказательства анализ поведения решений уравнения Риккати интересен и сам по себе как пример приложе- ния теории сингулярно возмущенных уравнений к нелинейным задачам (см. также [6.6] й [8.13]). § 4. Периодические решения. Автоколебания и вынужденные колебания Рассмотрим первоначально системы, описываемые уравнения- ми вида ______ 0.1) где в правую часть время t не входит. Как уже указывалось в гл. 5, уравнения (4.1) могут иметь как постоянные частные реше- ния, так и частные решения колебательного характера, в частности
g 4. ПЕРИОДИЧЕСКИЕ РЕШЕНИЯ. АВТОКОЛЕБАНИЯ 387 периодические решения, удовлетворяющие условию x(t + T) = x(t) (4.2) при некотором Т> 0. • Если периодическое решение не исчезает при малых измене- ниях характеристик системы (является «грубым») и, более того, устойчиво по отношению к малым изменениям начальных условий, то в реальной системе, описываемой математической моделью (4.1), возможно возникновение автоколебаний. Для разыскания периодических решений используются два принципиально различных подхода. 4.1. Методы типа Пуанкаре. В методах этого типа осуществля- ется поиск начальных условий аДО) = £ таких, чтобы соответствую- щее этим начальным условиям решение x(t, Ё,) уравнения (4.1) удовлетворяло требованию периодичности (4.2). Иначе говоря, разыскивается п+1 параметр (%, Т), удовлетво- ряющий уравнению = Ь (4.3) Как правило, найти в явной форме зависимость x(t, g) невозможно. Численное интегрирование позволяет это сделать с достаточно вы- сокой точностью, но лишь при конкретном задании начальных ус- ловий В таких ситуациях говорят, что функция задана алгорит- мически. . Процедуры поиска решений уравнений при алгоритмическом за- дании входящих в него функций изучаются в вычислительной мате- матике *). Здесь же мы ограничимся анализом лишь частных клас- сов систем, где уравнение (4.3) может быть представлено в более явной форме. а. Линейные системы. Пусть . . t(x) = Ax, (4.4) где А — постоянная матрица. Тогда *(М) = еА'В, '(4.5) и уравнение (4.3) приобретает вид еАте = В- (4,6) Это уравнение однородно по Для того чтобы оно имело нетри- виальное решение £ ¥= 0, необходимо выполнение условий det {I - еАт} »= 0 (4.7) при некотором Т > 0. *) Некоторое представление об этих методах дано ниже, в гл. 9, § 7, где приведены и ссылки на соответствующую литературу. 25*
388 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ Предположим для простоты, что матрица А приводима к диа- гональной форме. Тогда (4.7) эквивалентно П(1-^Г) = 0,; (4.8) V где А, —с. ч. матрицы А. Очевидно, что (4.8) выполняется, если одно из А, лежит на мнимой оси, Av — При этом период равен *) = и^0. (4.9) В качестве искомого начального условия может фигурировать любой вектор £, удовлетворяющий однородному уравнению {/_еАТ*}£ = 0. (4.10) Вывод: линейные системы допускают периодические решения, . отличные от постоянных, если матрица имеет чисто мнимые с. ч. Эти решения не являются изолированными по начальным усло- виям (если & 0 удовлетворяет (4.6), то и при любом а. удовлетворяет (4.6)). Свойство периодичности «негрубо» по отношению .к изменению параметров, поскольку малые изменения могут привести к смеще- нию с. ч. с мнимой оси. Автоколебания отсутствуют. б. Непрерывные кусочно-линейные системы. В кусочно-линей- ных системах построение зависимостей х(Т, %) может быть осужде- но примем, что ствлено путем непрерывного «сшивания» реше- ний, описывающих изменение ее состояния в .пре- делах каждой зоны линейности. Для демонстрации этой процедуры рассмот- рим уравнение системы с одним нелинейным эле- ментом g = Иа; 4- Ви* и = /(стД ст = Сх* (4.11) где А, В, С — постоянные матрицы (В — столбец, С —строка). Функцию /(о) предполагаем ку- сочно линейной, причем /(0)==0. Первоначаль- имеется только один «излом» (рис. 8.6) /(о) = | А+ст( о^О, о<; о. (4.12) Пространство состояний разбивается на два подпространства (см. двумерную иллюстрацию на рис. 8.7), в пределах каждого из *) В случае нулевого корня (4.8) удовлетворяется при любом Т, т. е. пе- риодическое решение является постоянным. Эта ситуация уже рассматрива- лась в § 1.
g 4. ПЕРИОДИЧЕСКИЕ РЕШЕНИЯ. АВТОКОЛЕБАНИЯ 389 которых изменение состояния описывается линейным уравнением = А+х, А+ Д А + к+ВС при СхС^ О, (4-13) — = Л_аг, Л_ Д А 4- к^ВС при Сх «С 0. dt ’• = Попытаемся искать Т-периодическое частное решение x(t, £), для которого ж(ОД) = ё, о(0Д) = ^ = 0,: o(U)>0, о(^Д)“^(^Л)==0>. а(«,В)<0, t^KT. Иначе говоря (см. рис. 8.7), движение начинается с точки, лежа- щей на разделяющей гиперплоскости*), Сх — О, и внутри периода (в момент ii) происходит нее из (+)-подпространства в (—)- подпространство. Состояние системы в момент пере- хода дается формулой х (f*) = eA+‘4f а условие периодичности требует, чтобы один переход через Рис. 8.7 ж(Т) = еА-' Таким образом, периодическое решение описанного типа может су- ществовать, если найдутся такие константы %, tiTt что еА_(г-^д+ц _ С£ = 0( СеА+Ц = О. (4.15) Мы вновь пришли к однородной по § системе. Поэтому либо най- дется неединственный вектор начальных условий, которому соот- ветствует периодическое решение**), либо решения нет (см. При- ложение 2, п. 46). Ясно, что общие свойства периодических решений системы (4.13) те же, что и общие свойства периодических решений линейных систем: они не «грубы» и не изолированы. Иначе говоря, им не могут соответствовать реально наблюдаемые автоколебательные режимы. Рассмотрим, наконец; случай, когда нелинейность имеет два из- лома (рис. 8.8), причем для простоты выкладок ограничимся *) При п = 2 это просто прямая. **) Требуется после нахождения решения (4.15) дополнительно проверить выполнение гипотезы об одном переходе о (4) через нуль за период.
390 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ симметричным случаем: /(о) = а—А,. о^А„ 0, |о|^А, о + А, — А (4.16) (нелинейность типа «зоны нечувствительности»). В фазовом прост ранстве имеются три области ли- нейности (рис. 8.9), разделяемые гиперплоскостями Сх = А, Сх = В силу симметрии системы можно попытаться искать симмет- ричные периодические решения такие, что ®(г + ^) = -ж(0, ж(2+Г) = х(2). (4.17) Выберем начальный момент так, чтобы (рис. 8.9) ' *(0Л)=Ч, o(0,g) = Q = A, причем предположим, что o(2,B)>A, О<2<2*, а о(«*Д) = Д, т. е. 2* —момент выхода в «зону нечувствительности», и |о(2, В)| < т I т \ < А, 2* < t <Z -у4 а о l.-y, £ I — — А. В силу принятых предположе- ний можно явно выписать зависимость решения от начальных ус- ловий В и параметров 2*, Т. При 0 С 2 < 2* имеем х = Ах + ВСх — В А; х (0) = £ => х (2, В) = eAi‘B + АГ1 (J - eAi') ВЬ, At А А + ВС,
S 4. ПЕРИОДИЧЕСКИЕ РЕШЕНИЯ. АВТОКОЛЕБАНИЯ 391 ' Т в при используем другое линейное описание} i-Лх, x(/*) = x(t*,£)=>x(f)== = еА«~^ [Л‘*и A? (I - eV) в\]. Для нахождения £, t*, Т получаем систему уравнений: а = Д, СеАА = -(?ЛГ1(1-еА1<*)вд + (т \ (т \ "Чл A + S = - е^-^АТ1 (I - еА^) ВЬ. Из последнего уравнения можно найти вектор |. Подстановка результата в первые два скалярных уравнения дает два трансцен- дентных уравнения, из которых можно найти неизвестные пара- метры t*, Т. Хотя доведение выкладок до конца в явном виде не- возможно, ясно основное: при фиксированных £*, Т вектор | опре- деляется единственным образом, корни трансцендентных уравне- ний, как правило, изолированы и непрерывно зависят от парамет- ров системы. Следовательно, здесь возможны автоколебания. в. Системы с разрывными кусочно-линейными нелинейностями. Вновь рассмотрим систему вида (4.11), однако допустим, что функ- ция /(о) не является непрерывной, но каждому участку непре- рывности /(о) вновь соответствует линейное описание системы в целом, и можно вновь пытаться строить зависимость x(t, £) пу- тем «сшивания» решений из условия непрерывности. Опишем соответствующую процедуру для идеальной релейной характеристики ( 1, о>0, /(»)-(_!, о<0. (4-«) При о = 0 значение /(о) не определено. Однако, если о(£)’ обращается в нуль лишь конечное число раз за период, то эта не- определенность несущественна. Опять-таки пространство состояний разбито на два подпростран- ства (рис. 8.7), в каждом из которых справедливо линейное опи- сание: «. х = Л х + В, если о = Сх > О, • Л D ' Г (4.19) х — Ах — В, если о = Сх<0« Попытаемся искать симметричное периодическое решение. При- мем начальное состояние § таким, что o(0) = Q = 0 и о = Сх = С(Л^ + 5)>0. (4.20) Тогда имеется отрезок времени, в течение которого о(#)>0 и справедливо первое из уравнений (4.19) . Потребуем, чтобы в конце
392 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ этого отрезка, при i = 272, выполнялось условие (4.21) Интегрируя первое уравнение (4.19), приводим (4.21)’ к виду ' ^(4) = еАТ/25-Л-1(/-еА7’/2)5^-|1. (4.22) откуда *) • ^Г*[2+ М]~г[1 - М}В, МЛеАТ/г. (4.23) Условие (4.20) дает уравнение для определения Т (уравнение пе- риодов) СА~'[1 +— М}В ~0. (4.24) Если матрица А приводима к диагональной, то это уравнение не- трудно преобразовать к виду [8.10]: где А = diag O.J = 5_‘А5, у = {уА = CS, р == {pj = S~lB. Опять-таки существенно, что уравнение периодов, как правило, может иметь только конечное число основных**) корней 2\, не- прерывно зависящих от параметров. Каждому такому корню в си- лу (4.23) однозначно сопоставляются начальные условия а по находится соответствующее периодическое решение х (i) = eA<V - А-1 (I - еЛ() В, (4.25) причем в силу симметрии x’^ + -fj = -xs(0. (4.20) Вывод: для ряда нелинейных систем основное уравнение может иметь единственное реиТение или конечный набор реше- ний (|*, Т,), каждому из которых соответствует периодическое решение исходной системы (4.1) с начальными условиями x(0) = V и периодом Т„ причем эти решения сохраняются при малых изменениях параметров системы. *) Здесь в дальнейших выкладках используется перестановочность функ- ций от одной и той же матрицы А. Предполагается также неособешюсть обра- щаемых матриц. **) Корень типа NT,, где N — целое число, N > 1, определяет то же реше- ние, что и корень Т„
6 4. ПЕРИОДИЧЕСКИЕ РЕШЕНИЯ. АВТОКОЛЕБАНИЯ 393 4.2. Устойчивость. Наличие периодических решений - свидетель- ствует о возможности возникновения автоколебаний, если эти ре- шения устойчивы. В общем случае вопрос об устойчивости сводит- ся к изучению поведения решений, для которых начальные условия отличаются от вычисленного Обозначим и*) = *(0-И0'. (4.27) Тогда для £ (0 получаем уравнение I =/к + ^ («)]-/Р(0]. (4.28) Устойчивость решения #*(£) исходной системы (4.1) эквива- лентна устойчивости состояния равновесия 5 = 0 системы (4.28). Однако применение общих методов теории устойчивости затрудни- тельно, в особенности при наличии разрывных правых частей. Поэтому, следуя [8.10, с. 170]*), опишем только сравнительно простую процедуру исследования устойчивости «в малом» периоди- ческих режимов в системах (4.11) с релейной нелинейностью (4.18). Рассмотрим некоторое периодическое решение я*(0, задаваемое формулами (4.25), (4.26), где Т,— корень уравнения (4.24), а V вычисляется по формуле (4.23) (для простоты в дальнейшем ин- декс решения опустим). • Наряду с ним рассмотрим другое, не обязательно периодическое решение x(t) системы (4.11), (4.18) и изучим последовательность x(th) = х[к], к = 0, 1, ..., его значений в моменты переключения ift, к — 0, 1, ..., т. е. в моменты, когда о(гА) = Са:(^) = 0. (4.29) Пусть нумерация выбрана так, что о(0>0 при te(t2h, o(f)<0 при fe(i2A+1, ^+2)’, к = 0, 1, ... В пределах каждого из интервалов состояние системы изменяется в соответствии с линейными уравнениями, и можно записать х (t) « еАУ~^х [к] — (— 1)л А-1 (7 — еАР~*ъУ) Bt (4.30) так что х [к+1] — еА'шх [/с] - (-1)кА~'\1 - eA'w)B, (4.31) к = 0, 1, ..., *) Более подробные сведения об особенностях построения периодических режимов в кусочно-линейных системах и исследовании их устойчивости даны в [8.11].
394 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ где — th- С другой стороны, из условий (4.29) имеем Сг[/с] = 0, fc = 0, 1, .... (4.32) что дает дополнительные соотношения для определения моментов h,, а, следовательно, длительностей х[к] интервалов между переклю- чениями. Уравнения (4.31), (4.32) являются нелинейными рекуррентны- ми соотношениями, позволяющими по заданным начальным усло- виям вычислить последовательность {х [/с], т [7с]}. По предположе- нию при ta = 0, х [0] = £ эти уравнения имеют решение *[&] = -£« X [&] =₽ (- l)ft t (4.33) Введем в рассмотрение последовательность отклонений от этого решения 9[*]Д(-1)а(тл-4)г СМ - х [7с] - (-1)4 (4.34) и запишем для нее рекуррентные соотношения, линеаризуя (4.31), (4.32) в окрестности периодического решения (4,33). В результате линеаризации (4.31) получаем Ufc+l] = eAT/2Ufc] + eAr/’-[Ag + BJO[/c], fc = 0, 1, ..., (4.35) причем из (4.32) следует, что C£[fc] = 0, & = 0, 1, .... а следовательно, CeAT/2U7c] + CeAT/2[Ag + B]0[fc] = O, fc = 0, 1, ..., (4.36) и можно исключить 0[fc] из (4.35), (4.36), получая линейное ре- куррентное соотношение с постоянными коэффициентами для по- следовательности {£[&]} в виде С [к + 1] = at, [fc], fc = 0, 1 (4.37) где С учетом (4.23) _ дт = МАеТ. [ сМ (As 4- В) J* = это выражение можно, переписать в виде (I + М)~1 мвсм а (4.38) По аналогии а — М I-----------------:—- . CM (I + Му~1 МВ] с теоремой Ляпунова — Пуанкаре для непрерыв- ных систем (§ 2) можно доказать, что асимптотическая устойчи- вость линеаризованной системы (4.37), т. е. расположение всех с. ч. матрицы а внутри единичного Круга, влечет за собой асимптотиче- скую устойчивость («в малом»!) нелинейных рекуррентных соот- ношений, так что £ [7с] 0 при к -*
g 4. ПЕРИОДИЧЕСКИЕ РЕШЕНИЯ. АВТОКОЛЕБАНИЯ 895 ' В свою очередь почти очевидно, что это свойство влечет за со- бой асимптотическое приближение траектории, описываемой в про- странстве состояний процессом x(t), к замкнутой траектории (цик- лу), описываемому исследуемым периодическим решением. В этом случае говорят об асимптотической орбитальной устойчивости цик- ла, а сам цикл называют устойчивым предельным циклом [8.7, с. 295]*). Только решение, соответствующее асимптотически орби- тально устойчивому предельному циклу, и может реализоваться как наблюдаемый автоколебательный режим. 4.3. Методы типа Галеркина. Перейдем теперь к рассмотрению второго подхода к разысканию периодических решений. В методах типа Галеркина частное периодическое решение разыскивается в виде линейной комбинации заданных функций времени. Коэффи- циенты в этой комбинации подбираются так, чтобы наиболее точно удовлетворялось исходное уравнение (4.1). Рассмотрим подробнее особенности метода применительно к си- стемам с одним нелинейным элементом, описываемым уравнениями (4.11). Зададим o(i) приближенно в виде ЦУ1 o(i) ~ a(W) (/) = 2 (4.39) k=-N где о*—пока неизвестные (вообще говоря, комплексные) коэффи- циенты. Неизвестным является и параметр со. Представление (4.39) задает a(t) как периодическую с периодом Т = — функцию, и ко- эффициенты о* можно (хотя и не обязательно!) рассматривать как приближенные коэффициенты отрезка ряда Фурье искомой функ- ции o(i). Функцию v(t) также будем разыскивать в виде линейной ком- бинации р(/)~^(1) = 3 (4.40) Выберем коэффициенты к*, ок так, чтобы минимизировать сред- неквадратичную (за период Т) погрешность в удовлетворении уравнения „ п(П = /(о(С), если в него подставлены представления (4.39), (4.40). *) Асимптотическая орбитальная устойчивость не означает асимптотиче- ской устойчивости самого периодического решения: траектории могут сбли- жаться, но между решениями может наблюдаться сдвиг но времени («набег фазы»). Известно, однако [8.1, 8.7], что асимптотическая орбитальная устой- чивость обеспечивает устойчивость по Ляпунову самого решения. («набег фа- аш ограничен).
396 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ Нетрудно убедиться, что минимум О . достигается, если т Zh = ^f[5N(t)]e-ihe>tdt, k = 0,±l):...,±Nx (4.41) о т. е. vk являются коэффициентами ряда Фурье 7-периодической функции /[ow(t)]_ При заданной в виде (4.40) периодической функции v(i) ли- нейная часть системы также будет иметь периодическое решение, если, конечно, величины ika, k = Q, N, не являются с. ч. мат- рицы А (отсутствует резонанс). Каждая гармоника проходит че- рез линейную часть независимо, и можно сразу записать, что оА = —/ЛДг/сы)^, к = 0, ±1, ..., ±N, (4.42) где Яь(щ))== — с [icoZ — А] ~'В — частотная характеристика линейной части. При заданной нелинейной характеристике /(о) можно вычис- лить по формулам (4.41) зависимости f* = v»(Oo, О±1, ..., о±к), (4.43) подстановка которых в (4.42) дает систему уравнений для опреде- ления неизвестных ch. Кроме того, в силу независимости от време- ни характеристик системы (4.11) начало отсчета может быть вы- брано произвольно. Если взять оА = аА + фА, к>0, 0!, = ^-^/,, к<0, где аА, вещественны, то одна из величин сх* или (5* может быть принята равной нулю за счет указанного произвола. Таким обра- зом, имеется 2Я вещественных неизвестных вида аА, £*, а также неизвестная св, для определения которых есть 2N + 1 уравнение (4.42), (4.43). Доказать, что решение этой нелинейной системы существует, затруднительно. Вычислительная процедура также не может быть простой. Найти в явном виде зависимости (4.43) уда- ется лишь в редких случаях (например, для полиноминальных нелинейностей), так что обычно их приходится считать алгоритми- чески заданными (при каждом конкретном численном значении набора а*, определенные интегралы (4.41), конечно, могут быть вычислены).
§ 4. ПЕРИОДИЧЕСКИЕ РЕШЕНИЯ. АВТОКОЛЕБАНИЯ 397 Таким образом, в вычислительном отношении задача поиска ре- шения с помощью описанного метода типа Галеркина относится к тому же «классу сложности», что и задачи, возникающие при применении методов типа Пуанкаре. Разница заключается лишь в том, что в первом случае число не- известных определяется принятым числом слагаемых в представ- лении (4.39), а во втором — жестко задается размерностью систе- мы. Если аппроксимация (4.39) при небольшом N (существенно меньшем размерности) является удачной, то методы типа Галерки- на могут иметь практическое преимущество. Очевидно, что метод гармонического баланса является частным вариантом (при N = 1) описанной процедуры, и ее естественно назвать обобщенным мето- дом гармонического баланса. Напомним (гл. 5), что обычный (2V = 1) метод гармонического баланса был применим не только для разыскания автоколебаний, но и для приближенной оценки установившейся реакции на внеш- ние периодические воздействия, т. е. оценки вынужденных колеба- ний. Не приводя соответствующих выкладок, укажем, что оба опи- санных выше подхода полностью применимы и к решению этой проблемы. Все различие заключается лишь в том, что период Т окажется заданным, что существенно облегчает задачу, по возни- кает новая неизвестная — сдвиг по фазе между воздействием и решением. Иначе говоря, в методах «сшивания», применяемых к кусочно-линейным задачам, нельзя произвольно выбирать момент перехода из одной области линейности в другую — это добавочная неизвестная, а в обобщенном методе гармонического баланса нельзя произвольно выбирать одну из констант а*, В остальном же процедуры остаются сходными. 4.4. Метод интегральных уравнений [8.11]. В заключение кратко остановимся на важном как в, теоретическом, так и в прикладном отношении подходе к разысканию периодических решений, как бы синтезирующем оба ранее описанных. Рассмотрим вновь систему в форме Лурье: х — Ах + Bv + Gw, v = f(o), а — Сх. (4.44) Если рассматривается задача о вынужденных колебаниях, то w =» = w(t)— заданная Г-периодическая функция. Если рассматривает- ся задача об,, автоколебаниях, то можно положить w 0 и считать период Т дополнительной неизвестной. Размерность тп векторов v и а будем пока считать произвольной (система имеет тп нелиней- ных элементов). Разыскивается Т-периодическое решение x(t + T) — x(t), o(t + T) = o(t), v(t + T) = v(t). (4.45); Построим интегральное уравнение, которому должна удовлетворять функция о (4).
OJO ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ В силу уравнений линейной части системы имеем t x(t)-eAtx(0) + §eA<t~V[Bv(x) +Gw(x)]dx. (4.46) о По условию периодичности х (Т) — еАТх (0) + J еЛ(Т-х) [Bv (т) 4- Gw (г)] dxs о откуда < z(0)= [/-е4Г]-1 J еА(Т’т)[Яр(ч) + Gw[x)]dxt (4.47) , , о а следовательно, т х (0 - еА< [Z - еАТ]-1 J eA(T~r) [Bv (т) + Gw (т)] dx + , о t * + JeA(‘_x)[^(T) + Gw(t)HTs te[0,n (4.48) о Поскольку р(т) = /(о(т))== f(Cx(x)), то (4.48)' представляет собой нелинейное интегральное уравнение относительно неизвестной Г-пе- риодической вектор-функции х(1). Его можно записать и в более компактной форме: т - х (0 =• J 2/ёцх (t — x)f [Сх (т)] dx + wx (/),, t <= [0t Г], (4.49) о где Ж, (9)—матричная Т-периодическая весовая, функция, имею- щая вид 3^(Q)~eAe[I-eAT]-lB, 0<0<Г, (4.50) а смысл обозначения wx(t) очевиден. Действительно, из (4.48) сле- дует, что ядро преобразования примет вид "е^[1 — еАТГ1 еА^т-^В + еА^Вх 0<ч<г, ^[I — e^r1 eA<T-^Bs . t<x^l\ или eA(t-T) _ eATj-i вл 0 < ч < t, . eA(t-t+T) _ еАЦ-iBf t<x^Tx откуда и вытекает возможность представления' (4.49), (4.50). Из (4.49) сразу следует и уравнение, содержащее только про- цесс o(t)i ____ т о(г) =» J 2fe{t — ч)/[о(т)]Л + wo{t\' (4.51) S&vx — ч) = Ж их (t — ч) —
s 4. ПЕРИОДИЧЕСКИЕ РЕШЕНИЯ. АВТОКОЛЕБАНИЯ 399 где (4.52) весовая о свой- Ж (0) = СеАв [Z - еАТ] -‘5, 0 < 0 < Т, we{t) = Cwx{t), Q^t^T. В задачах об автоколебаниях (Cw(t)^ 0 0)' функция 3^(0) содержит всю необходимую информацию ствах линейной части системы*). Она является периодической по 0, причем может иметь разрывы непрерывности на концах периода. Интегральное уравнение (4.51) в некоторых случаях дает воз- можность сразу решить задачу. Пример 4.1. Пусть система включает только один нелинейный элемент, характеристика которого /(о) имеет вид (4.18). Пусть разыскивается симметричный автоколебательный режим с одним переключением на периоде. Тогда 1» До(т)]~ Т 2 wa (0 ss О -1„ 4<т<Т, я т/s т о(0 = j 3S(t-T)dT- J ^(t^-r)dT. 0 T/2 [T 1 0, y I используем (4.52), причем учтем периодичность <Э0(0): t т/з. т о (0 = J Ж (Z — т) dt + j Ж(Г + t-x)dx- J Зё(Т + I — T)dT = о t т/г г С t Т/г J еА^~Щх + J еА<г+«~г>йт —. J eA(T+i-r)jT ц _ елт} -* в о t Т/2 С A’1 \еЛТ — I +2eAt— 2e* [1 — еАТ]~^В. Поскольку о(0) = 0, имеем , СА~* [I - 2еАГ/г + еАТ] [Z - еАТ] ~'В = О, или CA-^I+МГ1 M£eATf\ что совпадает с уравнением периодов (4.24), полученным выше. Если же wo(i)¥=0 и является заданной Г-периодической функ- ( т\ цией wa 11 + у I = — wa(t), TO решение находится столь же просто. *) В [8Д1] эта функция названа импульсно-частотной характеристикой <ИЧХ), поскольку она может быть найдена как установившаяся реакция ли- нейной части на Т-периодическую последовательность 6-импульсов.
400 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ Возьмем за начало отсчета неизвестных момент ф, когда а(1) = 0г Тогда, разыскивая симметричный режим с одним пере- ключением внутри периода в момент Т/2, получим Т/2 Т о (tj == J Ж (t — т) dt — J (t — т) dx + wa (t + ф), О Т/2 или o{t) = СА~'[1 - М] [7 + М\-'В + «?,(« + ф), причем ф определится из условия О = СА~* [7 - М\ [7 + Л/] ~'В + 1Ра(ф)\ □ 4.5. Оценки точности. В общем случае интегральное уравнение (4.51) может служить как исходный объект для применения спе- циальных итеративных вычислительных процедур [8.9], а также для получения оценок точности приближений, получаемых по методам галеркинского типа, и прежде всего, для качественного понимания их возможностей. При этом .особую роль играет следующее замечательное свой- ство периодической весовой функции: возможность ее выражения через частотную характеристику линейной части системы в виде? W) = “у 2 O<0<7’J со =^.(4.53) k=—oo Для доказательства справедливости разложения (4.53) достаточно, представить Ж(&) в виде ряда Фурье ^(6)= s о<е<л. ft=—оо Тогда т т hk = X j Ж (9) = у С J eAee-^de [7 - еАТ] В = 0 0 = у [А - гАсо7]“1 [eiA-ik^T _ /ц/ _ eAT]-i в = = ~ С [iW - АГ1 В = - A HL (ika). Из (4.51)', (4.53) очевидно, что высшие гармоники в р(£) = •= J(o(t)),-преобразуясь в о(1), ослабляются пропорционально зна- чениям частотной характеристики на частотах fcco, к > 1, а это дает качественное обоснование метода гармонического баланса.
9 4. ПЕРИОДИЧЕСКИЕ РЕШЕНИЯ, АВТОКОЛЕБАНИЯ 401 Интегральное уравнение (4.51)', (4.53)' позволяет получить и строгие оценки эффективности приближений. Кратко опишем основную идею применительно К задаче о вынужденных колебаниях. Т-периодическое решение системы (4.44), если оно существует, предста- вимо в виде 0(0» 3 ^he>t. h=—оо Обозначим N <^(п- 2 к^Я И До(0 = о(г) — oN(t). Нетрудно убедиться, что уравнение (4.51), (4.53) эквивалентно системе двух уравнений Т aJV(t) = j3gN(«-T)/[o2V(T) + Aa(T)UT+^(0> (4.52') о где т До (0 = J Д5® (i — т) / [aN (т) + Да (т) J dr + Ды>а (0, (4.53') о ^N(6)=y 2 ffL^eihae> 1 h=-N ДЖ(0) = 3g(0) -2^(0), и>д (t) также содержит лишь первые 2.V + 1 слагаемых ряда Фурье функции а Ди>о(/) — высшие гармоники. Действительно, структура функции 5^х(0) такова, что в результате вычисления интеграла в правой части (4.52') все выс- шие гармоники (с номерами больше N) в функции /(ок(т) +До(т)] исчезают. Из тех же соображений очевидно, что приближенное решение а"(/), находимое по описанной выше схеме метода типа Галеркина, точно удовлетворяет урав- нению 1 1 г oN (0 = J<?gN (t — r)f[aN (r)]dr + u$ (0. (4.54) о Отличие этого решения от точного решения a(f) исходной задачи можно запи- сать в виде Д (0 A a (0 — aN (0 = Ano (0 + До (0, где первое Слагаемое возникает в силу неточности вычисления амплитуд пер- вых N гармоник и смещения, а второе — в силу наличия высших гармоник, вообще не принимавшихся во внимание при построении решения по методу типа Галеркина. * ' 26 А, А, Первозванский
402 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ Из предшествующего следует, что т ф ~ § %N (t-x){f[oN (х) + Ь(х)]~-/ [nw (т)1) </т, (4.55) О г Да (I) = J Ajg (t — т) {/ [ст7* * (г) + Д (т)] — f (aw (т)]} dx -f- О г + |дз»(« — т)/(a'v (т)] йт+Ди>а (г). (4.56) о Если функция /(а) скалярна и удовлетворяет условию Липшица . |/(а<*>)-/(а<2’)| <Ь|а“>-а<2>|, i = const, (4.57) то можно получить следующую оценку погрешности max Д (г) :----у, К=(о.Г] 1 1 - Lc (Т) (4.58) где у == max teto.T] а*) Т f Д3£ (t — т) f [aw (т)] йт+Ди> (t) , j 't. u о [ Ж* (?) dx = 1/2 | HL <ik<v I2, о Г k “=к (4.59) т о К сожалению, оценка (4.58) пригодна, только если 1 > Lc(T), т. е., грубо гово- ря, в том случае, когда коэффициент усиления разомкнутого контура на часто- те воздействия мал. Более сильные (но и более трудоемкие) оценки для кон- кретных нелинейностей и N — 1 (метод гармонического баланса) даны в £8.11, гл. 5]. Исследование интегральных уравнений позволяет получить и условия существования периодических решений. Как правило, они являются следствием анализа сходимости итеративных процедур решения, представляющих самостоятельный интерес. Приведем в несколько упрощенной форме следующий резуль- тат [8.11]. Теорема 4.1. Пусть выполнено условие Lc < 1, где константы L, с определены в (4.57), (4.59). Тогда существует решение урав- нения (4.51), являющееся пределом последовательности о<0((), по- лучаемой, начиная с произвольного начального приближения о<0) (1) по схеме т ~ . а(!+1)(0 == J 5g (t _ т) / [СТ(О (Т)) dx + wa (t), (4.60) О I 0, 4, ..., 0Cl<Т. - *) Далее используется неравенство Коши — Буняковского и равенство Парсеваля для коэффициентов ряда Фурье. <
в 4. ПЕРИОДИЧЕСКИЕ РЕШЕНИЯ. АВТОКОЛЕБАНИЯ 403 - т) {/ [а(1) (т)] — / [a(I 15 (т)]} dx, (4.61) = 1. 2, .... | п(1> м I й-j £сД(1_1\ (4.62) Доказательство. Имеем т a<i+1> (t) — 0<г> (t) = J 36 (t • о / = или д<0 А шах | о(г+1) (г) — а(г) (<) | = t т < f шах 136 (t — т) | L о ‘ Используя признак равномерной сходимости Вейерштрасса, убеждаемся, что при Lc < 1 равномерно сходится ряд ОО а°« + 2 [н<1+1)(0-а(О(0], . г=о или, что то же самое, равномерно сходится последовательность {<J(l)(i)L Пре- дел о*(г), очевидно, удовлетворяет интегральному уравнению (4.51) и являет- ся искомым периодическим решением. Результат Т.4.1 без особых затруднений переносится на случай системы с многими нелинейностями вида (2.8)-—(2.10). Предполагая, что функции /До,), / = 1, ..., т, удовлетворяют условию Липшица 1Л(^‘))-ЛШ1<^|оР)-а?)к (4.63) и производя в (4.61) покомпонентную оценку, получим ‘ т Д^ЧЗ^ДТМРЛ (4.64) 3=1 где т ________ Cgj(n = f|^(T)|dT</'21^(^)|% ю=-^ (4.65) о и через обозначены элементы матричной частотной характери- стики Яь, а Aj°A max |ojI+1>(0-ajl) (01. = <e[o,T] Вводя в рассмотрение матрицу Я(Т) A {LjCgj(T)} и вектор Д<° = (ДР/)» можно записать (4.64) в виде Д(,) =^ Я(Т)Д(,-1). Если все с. ч. матрицы Я(Т) лежат внутри единичного круга, то гарантируется равномерная сходимость последовательных при- ближений к пределу, являющемуся решением интеграль- ного уравнения. Этот результат с помощью более тонких методов теории операторных уравнений был усилен в [8.8]. 26*
404 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ Теорема 4.2. Пусть 1Л(а,)| CLJoJ, (4.66)’ сгД7) = max а> = т=г. (4.67) fc=o,±i,... 1 Тогда решение уравнения (4.31) существует, если все с.ч. матрицы П(Т)^{Ь^(Т)} (4.68) лежат внутри единичного круга. Интересно, что условия Т.4.2 гарантируют как существование решения уравнений (4.42), (4.43) обобщенного метода гармониче- ского баланса при любом N, так и сходимость (по равномерной норме) приближенных решений, получаемых по этому методу, к точному решению по мере увеличения числа N слагаемых в пред- ставлении (4.39). 4.6. Обобщенные автоколебания. С практической точки зрения зачастую безразлично, существует ли в системе периодический ав- токолебательный режим или же имеются колебания, не являющие- ся периодическими. В работе [8.12] было введено обобщенное представление об авто- колебательных режимах. Определение. Решение х(t), a(t), i>(£) системы (4.11) при ш(/)^0, m = 1 называется обобщенно автоколебательным ((—а, Р)- автоколебательным по а), если выполнены следующие условия: а) |я(£) I *£ const; б) число изменений знака функции o(t) бесконечно на ta е[0, оо); в) число выходов о(£) за пределы заданного интервала [—а,ф], а>0, ф>0, бесконечно на t е [0, °°). Интуитивно ясно, что если система неустойчива в малом, но диссипативна, в ней должны возникать обобщенно автоколебатель- ные режимы. На самом деле справедлив следующий строгий результат [8.12], вновь даваемый в упрощенной форме. Теорема 4.3. Пусть А не имеет с. ч. на мнимой оси, функция /(о) удовлетворяет условию Липшица и дифференцируема в нуле. Пусть существует единственное равновесное состояние х = 0, о = 0, р = 0. Тогда решение системы (4.11) при почти любых начальных условиях*) является (—oi., ^-автоколебательным, если выполнены следующие условия: 1) при |о[ >о график f(o) лежит в секторе абсолютной устой- чивости-, 2) при —график /(а) лежит в секторе абсолютной не- устойчивости. ♦) За исключением множества нулевой меры.
g 4. ПЕРИОДИЧЕСКИЕ РЕШЕНИЯ. АВТОКОЛЕБАНИЯ 405 Поясним используемые в теореме термины. Пусть на некотором отрезке [о0 о2] /q &2i! о ¥= 0,; / (0) = 0,. 0 kt <Z ка < оо. (4.69) Тогда говорят, что функция /(ст) лежит в секторе [7ci, k^. Пусть при некотором k^[k^ k2] линейная система (4.11) с /(о) = /ш является устойчивой, а кроме того, выполнено частотное неравенство Попова, которое для сектора, не обязательно примы- кающего к оси абсцисс, имеет вид + Re [{1 + 1 + MlU)'} >°* °°« °°)- <4-70> Тогда говорят, что на отрезке [щ, о2] функция Цв') лежит в сек- торе абсолютной устойчивости. Если же условие Попова выпол- нено, но при некотором /се [А:,, к,] система с /(o) = fco неустойчива, то говорят о том, что на этом отрезке /(о) лежит в секторе абсо- лютной неустойчивости. Заметим также, что условие (1) теоремы гарантирует диссипа- тивность системы и может быть заменено любым другим условием диссипативности. В качестве приложения рассмотрим следующую проблему. Пусть линейный неустойчивый объект с дробно-рациональной строго реализуемой п.ф. Нь(р') замкнут безынерционной нелиней- ной отрицательной обратной связью, имеющей характеристику типа зоны нечувствительности /(ст) ст —Д, 0, ст -f- Д, ст > Д,, ] СТ | Д, о<; — Д. (4.71) Пусть замкнутая система была рассчитана как устойчивая по линейной теории (без учета зоны нечувствительности). Покажем, что тем не менее в такой системе обязательно возникают автоко- лебания (по крайней мере в указанном выше обобщенном смысле). Запишем уравнение системы в операторной форме o + Z7x.(D)/(o) = 0. (4.72) Его можно переписать и в виде где о + Яь(О)о-ЯДП)/1(О) = 0, /1(о) = — /(ст) + ст = д, ст, -А. Ст> Д, | О | «С Д / ст< —Дл (4.73) (4.74)
406 ГЛ. 8. АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ или в виде а + ЯЬ1(В)/1(а) = 0., 7/£1(D) = -r-^^_t (4.75) Поскольку ft (о)« 0 при А «= 0, то ЯЬ1 (D) соответствует и. ф. замк- нутой системы, рассчитанной при А = 0, и по предположению устойчива. Поскольку /4(о) ограничена, то нелинейная система (4.73) (и эквивалентная ей (4.72)) диссипативна: ограниченное воздействие не может вывести устойчивую линейную систему из ограниченной области. * f G другой стороны, при lol С А функция /(о) заведомо лежит в секторе абсолютной неустойчивости. При использовании Т.4.3 можно дать простую оценку размаха колебаний o(i), В силу (4.74), (4.75) при достаточно больших t СО |o(t)KAf Ргы(т)Мт8 о где Лы(т)’—весовая функция, соответствующая Я£1(р)'. Согласно теореме размах колебаний превышает А. Последнюю оценку можно уточнить, давая лучшую оценку границы отрезка, в пределах ко- торого /(о) лежит в секторе абсолютной неустойчивости. Напри- мер, положив в (4.70) ki = 0, q — 0, можно записать условия По- пова в виде min Re Hl ( йо) > —г-« О 2 Тогда в качестве границы сектора (см. рис. 8.9)', а следовательно, оценки снизу величины размаха можно принять а = А/(1 — к2). Напомним лишь, что Т.4.3 применима только в том случае, когда в системе нет равновесных состояний, отличных от о = 0, т. е. урав- нение о + Яь(0)/(о) = 0 имеет единственное решение, иначе говоря, г _____1_> ।
ГЛАВА 9 ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ § 1. Формулировка задачи 1.1. Общая задача. В этой главе будет систематически рассмат- риваться проблема оптимизации управления, т. е. задача выбора такого закона управления, который, удовлетворяя четко заданной системе ограничений, обеспечивает при своей реализации наилуч- шее (оптимальное) значение того или иного показателя качества работы управляемой системы. При исследовании линейных систем уже рассматривалась одна из возможных постановок проблемы оптимизации. Были изучены возможности построения законов управления системой, описываемой уравнениями х = Ах + Ви, t0 «2 t '-С tt, x(ta)==3^, (1.1) обеспечивающих достижение минимального значения показателя качества J {«.} = J [xTQx -f- dt + хт (tt) QfX (tf), (1.2) (0 который интерпретировался как мера отклонения от заданного со- стояния ard(t)^ 0,* t0 С t < tf, с учетом «энергетических затрат» на управление. Предложенная процедура позволила (при определенных пред- положениях о параметрах задачи) построить как программу управ- ления nopt(i), дающую решение при каких-либо заданных началь- ных условиях х(М = х°, (1.3) так и закон управления с обратной связью по измерениям вектора состояния nOpt(x, t)= —K(t)x(t), (1.4) обеспечивающий тот же результат при любых начальных условиях. Более того, в рамках линейной теории были даны обобщения за- дачи для ситуации неполных и неточных наблюдений и наличия случайных возмущений.
408 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ В данной главе будут изучаться только детерминированные за- дачи построения оптимальных программ управления. Однако мы попытаемся описать подходы к решению проблемы оптимизации для значительно более широкого (по сравнению с гл. 6, 7) класса моделей систем, различных показателей качества и существенных ограничений. Итак, пусть 1) система описывается уравнением х = /(х, и, t), (1.5) где х — n-вектор переменных состояний, и — m-вектор управляю- щих воздействий, / — n-вектор-функция, предполагаемая непрерыв- ной и непрерывно дифференцируемой по всем переменным; 2) требуется обеспечить экстремум (максимум или минимум) показателя качества, называемого также критериальным функцио- налом ' J{u} = J g0(*x и> + GoM^o)t (1-6) 'о значение которого определяется как непосредственно видом выби- раемого управления u(t), так и изменением состояния x(t) в си- лу уравнений (1.5) при начальном значении #(Z0); 3) при выборе управления требуется также соблюсти выполне- ние условий j Si «1 0dt + Gi [x (Z0)t x(f/)l { o* i = ri + 1’., r; (1’7> скалярные функции g{, Gf, i = 0, ..., г, фигурирующие в (1.6)', (1.7), предполагаются непрерывными и непрерывно дифференци- руемыми; 4) управление может быть произвольной кусочно-непрерывной функцией t, однако его значения в любой момент t е [i0) tf\ не должны выходить за пределы области U, множества в йг-мерном пространстве, которое, как правило, также задается набором урав- нений или неравенств; 5) моменты начала t0 и корца t> оптимизируемого процесса могут быть заранее фиксированными либо также подлежать выбо- ру с целью улучшения значения функционала (1.6). Сформулированную проблему принято называть общей задачей математической теории оптимального управления. Фактически же ее решение, если его удается построить, определяет только програм- му управления в условиях полной информации. Лишь в некоторых ситуациях оказывается возможным и осуществление оптимального синтеза управления с обратной связью по переменным состояния (точный смысл этого понятия будет указан ниже).
§ 1. формулировка Задачи 409 Очевидно, что описанная проблема включает в себя, как част- ный случай, линейно-квадратичную задачу оптимизации (1.1) — (1.3). Желательность обобщения с прикладной точки зрения оче- видна., Нами уже обсуждалась важность учета нелинейных эффек- тов в описании объекта управления и в особенности ограничений на выбор управления — ограничений как по «полной энергии», так и по «уровню» в любой момент времени работы. 1.2. Приведение частных задач к общему виду. Остановимся на одном классе задач оптимального управления, который принято называть задачами об оптимальном быстродействии. Пусть зафиксированы начальный момент t0 и состояние в этот момент, т. е. условие x(t9) = xa, (1.8) где ха — заданный числовой вектор. Требуется выбрать управление так, чтобы преобразовать состояние в заданное, т. е. выполнить < условие x(tf) = xf. (1.9) Эта проблема изучалась в линейной теории (§ 3 гл. 6), причем было показано, что при невырожденности пары матриц А, В такое управление может быть найдено и, более того, цель может дости- гаться за сколь угодно короткий отрезок времени. Однако с умень- шением tt —t0 или с увеличением |х° — х'\ уровень требуемого уп- равляющего воздействия возрастал. Осталось неясным, как выбрать какое-либо управление, приводящее к цели и удовлетворяющее за- данным ограничениям по уровню, и как добиться цели при ограни- ченном управлении за минимально короткий отрезок времени. В этом и заключается задача оптимального быстродействия. Запи- шем ее формально: найти u(t) такое, что для системы (1.5) в за- данный момент t.} и произвольный tf выполнены условия (1.8), (1.9), причем u(t)^U, t0^t^th (1.10) a tt —1<> достигает минимального значения. Покажем что задача оптимального быстродействия является частным случаем общей проблемы. Действительно, примем в (1.6) go si, Go 0. Тогда tf J {и} = dt = tf —t0. (1.11) fe Условия (1.8), (1.9) дают 2га уравнений Xj(t0)~ ж-=0е 7 = 1,. ..,п, (1.12) Xj (tf) —- х) = 0, 7 = 1,/.. , га, (1-13) являющихся частными случаями условий типа (1.7) (г = 2га), при отсутствии интегральных слагаемых.
410 ГЛ. 8. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ Задача оптимального быстродействия допускает различные, так- же имеющие прикладное значение модификации. Например, доста- точно достичь желаемого состояния хл с некоторой точностью, за- даваемой условием (1.14) где Qd—неотрицательно определенная матрица коэффициентов со- измерения отклонений по различным координатам, а 6 — заданное число, или же независимыми условиями по каким-либо (не обяза- тельно всем) координатам типа — (1.15) Очевидно, что это тоже частные случаи условий типа (1.7), но в виде неравенств. Зачастую наряду с ограничениями на «текущий уровень» уп- равления типа (1.10) или вместо них целесообразно ограничить «энергию» управления условием б _ (1.16) *0 где R — «соизмеряющая» матрица, или, покомпонентно, условиями типа V (1.17) *0 Вновь имеем дело с частными вариантами условий (1.7)’, но с ин- тегральными слагаемыми. Как мы убедимся в дальнейшем, задачи о преобразовании из исходного состояния в желаемое (даже с заданной погрешностью) могут не иметь решения. Поэтому их зачастую заменяют близкими по содержательному смыслу, но формально существенно другими постановками типа достижения цели с минимальной погрешностью ва фиксированное время, являющееся практически приемлемым. При этом i0, tf заданы, равно как x(tB), минимизируемый функ- ционал берется, например, в виде (1-18) а явных ограничений на значения x(tf) не налагается. Такие за- дачи называются задачами оптимизации со свободным правым кон- цом траектории и в определенном смысле являются наиболее про- стыми. Во всех предшествующих классах задач начальцые условия при выборе программы считались фиксированными. Однако это не обя- вательно. В ряде ситуаций начальные условия по некоторым коор- динатам могут быть предварительно, к моменту начала работы, вы-
g 2. УСЛОВИЯ ОПТИМАЛЬНОСТИ. ПРИНЦИП МАКСИМУМА 4Ц браны, «выставлены» желаемым образом. Иногда возможность вы- бора определяется тем, что на самом деле некоторые координаты вводятся искусственно, при уже знакомых нам процедурах фор- мального расширения пространства состояний. Для понимания существа дела важна следующая ситуация. На- помним, что в рамках сформулированной проблемы управления вы- бираются среди кусочно-непрерывных функций, поэтому в опти- мальном управлении допустимы разрывы непрерывности, скачки. Вместе с тем в приложениях могут возникать ситуации, когда ско- рость изменения управляющего воздействия должна быть ограни- чена и управления со скачками окажутся недопустимыми. Для того чтобы «вложить» требования ограниченности скорости в описанную общую схему, и используется идея расширения про- странства. Пусть для определенности ограничена по модулю ско- рость изменения компоненты u,(t) управляющего воздействия (1.19)' Тогда само управление объявляется новой переменной состояния xn+1(i)=>u,(f)> а вместо щ (£) выбирается программа изменения скорости - t’(i)=w1(i), связанная с переменной x„+1(i) очевидным уравнением xn+i(t) = v(t), (1.20) Это уравнение может быть добавлено к исходным, образуя вместе с ними систему тина (1.5), но относительно расширенного вектора. Существенно, что начальное условие по переменной xB+1(t), т. е. начальное значение исходного управления может быть выбрано произвольно. Таким образом, мы убедились, что общая постановка проблемы оптимального управления включает в себя, как частные случаи, многие практически интересные классы задач, конкретные приме- ры которых будут приведены ниже. К сожалению, не существует каких-либо работоспособных алгоритмов получения точного реше- ния общей проблемы оптимального управления. Однако описанная постановка полезна тем, что в ее рамках можно установить опре- деленные свойства, которыми должно обладать решение,— условия оптимальности. § 2. Условия оптимальности. Принцип максимума 2.1. Задачи с конечным числом неизвестных. Для того чтобы выяснить свойства решений общей проблемы, описываемой в § 1, предварительно напомним ряд простых фактов, относящихся к ана- лизу функций конечного числа переменных, которые в определен- ной мере уже использовались в предшествующем изложении.
412 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ Определение. Функция Fe(y) достигает максимума в до- пустимой области Уо изменения переменной у, если существует такое значение этой переменной у* е Уо, что F,(y)^Fe(y*) , (2.1)’ для всех !/еУ0. Соответственно, функция Ев(у) достигает миниму- ма в Уо, если существует такое у*, что Е0(у)>Е.(у*) (2.2) для всех у е= Ув. Теорема 2.1. Пусть у* — внутренняя точка области Уо и функ- ция F0(y) векторной переменной y = (yi, ..., уп) дифференцируе- ма в точке у* *= {у*, ..., у„). Тогда для того, чтобы у* доставляла, акстремум (максимум или минимум) функции F0(y) в области Уо, необходимо выполнение условия . OF „ -^ == 0 при у = y*s (2.3) или, в скалярной форме, При У^ = yif • • Уп — Уп- Напомним, что доказательство теоремы основывается на том факте, что при малом изменении какого-либо аргумента, например, придании yt значения Ур+с, не выводящем за пределы Уо, пове- дение функции Fo(y) описывается соотношением dF„ F0(y) = F0(y*) + e-^ + о(е). (2.4) Выбирая 8 достаточно малым и придавая ему произвольный знак, всегда можно добиться того, чтобы условия (2.1) или (2.2) были нарушены, если не выполнено (2.3). Указанное в теореме свойство «у* — внутренняя точка Уо», т. е. «существует малая окрестность у*, целиком лежащая в Уо», весьма важно. Если у* лежит на границе У», то (2.3) не является необхо- димым условием. Например, пусть допустимыми являются только значения у > 0, а точка у* такова, что какая-либо компонента, на- пример, 1/1 = 0, Тогда в ней может достигаться максимум, даже если ^°<0t (2.5) что также прямо следует из (2.4), поскольку в этой формуле мож- но выбирать только е > 0 (значение Ух = Ух + е = е недопустимо
g 2, УСЛОВИЯ ОПТИМАЛЬНОСТИ. ПРИНЦИП МАКСИМУМА 413 при 8 < 0). Как правило, допустимая область Уо явно задается с помощью системы условий, уравнений или неравенств, которым должны удовлетворять значения у. Кратко записывают так*): Уо-W<(y)=0, i = l, .... r„ Л(р)<0, i-n + 1, ..., r). (2.6) Для установления условий оптимальности при этом обычно ис- пользуют метод множителей Лагранжа. Напомним соответствую- щий результат для случая, когда в числе условий имеются только уравнения. Теорема 2.2. Составим лагранжиан S’Ду, м\(у) + • • • + V(yJ, (2.7) где %0, ..., — некоторые скалярные величины. Для того чтобы в допустимой точке у* достигался экстремум (максимум или мини- мум) функции ЕДу) в области y.=-W(j/) = 0, i-1, .., А (2.8) необходимо, чтобы существовали А*, г = 0, ..., г, Ао 0, не равные одновременно нулю и такие, чтобы они совместно с у* удовлетво- ряли системе уравнений дЗ? —2 = 0,; 7 = 1, ,.nt . 8«j Pi (у*) = о» г = it..., г. (2.9) При этом предполагается, что функции ЕДу), i ~ 0, ..., г, диффе- ренцируемы в точке у*. Если, кроме того, выполнено условие регу- лярности (8F, ' 1 rankfe i = ) = 1л • = r (2.Ю) при у — у*, то заведомо существуют такие Ъ.*, причем А* =#0. Мы не будем приводить доказательство. Отметим лишь, что обычно предполагается выполнение условия регулярности (2.10), поэтому сразу принимают Ао = 1 (условия (2.9) однородны по А и фактически определяют лишь отношение компонент вектора X = = (Х<) к какой-либо одной, не равной нулю). Лагранжиан при атом принимает вид W) = WWi(!/). (2.11) i=i Первая группа уравнений (2.9) обычно трактуется как требование безусловного экстремума лагранжиана по переменным у при зна- *) Символ «/» здесь и далее читается так: «удовлетворяющих условиям» или «при выполнении условий».
414 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ нениях X как свободных параметрах, а вторая — как добавочные уравнения, с помощью которых разыскиваются подходящие значе- ния этих параметров. . Приведенная теорема дает строгое описание необходимых усло- вий оптимальности, получаемых при использовании вспомогатель- ной функции — лагранжиана. Однако зачастую метод Лагранжа применяют в более «воль- ной» форме, восходящей к гипотезе, выдвинутой еще самим Лаг- ранжей в 1797 г.: «Можно высказать следующий общий принцип. Если ищется максимум или минимум некоторой функции многих переменных при условии, что между этими переменными имеется связь, задаваемая одним или несколькими уравнениями, нужно прибавить к исходной функции те, которые должны обращаться в нуль, умноженные на неопределенные множители, а затем искать максимум или минимум построенной суммы, как если бы перемен- ные были независимыми; полученные уравнения будут служить совместно с уравнениями связи для определения всех неизвест- ных»*). Гипотеза Лагранжа верна не всегда, в чем убеждает следующий простой пример. Контрпример. Дана задача min !у* + yl Единственной допустимой точкой является у*=*(0, 0), следователь- но, в ней и достигается минимум. Вместе с тем, составляя лагран- жиан согласно гипотезе, имеем Z = У1 + Хх (И + у|). Условия минимума дают — = 1 + 2Х1у1 = 0t = 2Хху2 = 0, однако первое условие несовместно с уравнением связи. Очевидно, что в точке (0, 0) нарушено условие регулярности (2.10) и справедлива лишь более общая схема построения необхо- димых условий, указанная в Т.2.2. Составим S’ о = Mi + (У1 + У»)» Тогда условия Хо 4- 2Х*У1 .== Ojj 2X^2 У1 4* У г “ 0 совместны при = 0, уг = О, Хо = 0 и произвольном Xt. О *) Цит, по книге [9.1],
в 2. УСЛОВИЯ ОПТИМАЛЬНОСТИ. ПРИНЦИП МАКСИМУМА 415 Гипотеза Лагранжа, дополненная введением неотрицательного множителя А» при минимизируемой функции, обычно приводит к правильным результатам или по крайней мере позволяет «угадать» правильный подход к задачам на условный экстремум, хотя, конеч- но, не заменяет строгих формулировок и доказательств. Покажем сначала, как использовать эту гипотезу для составле- ния необходимых условий при наличии ограничений в форме не- равенств, для определенности в задаче min {Fe (у) /F((y)=O, i=l, ..., rt, F((y)< 0, i = r, + l, ..., r). (2.12) Превратим первоначально неравенства в уравнения введением но- вых неизвестных vt, i = rt + 1, ..., г. Очевидно, что условия Fi (у) + Vi = 0, i «= гх + 1,. ,.rt (2.13) эквивалентны исходным неравенствам. Составим расширенный лаг- ранжиан ~2Vi(i/) + 2 М д2’0 + 2 М, i=0 i=r1+l 4=г^+1 где 1=0 Минимум S’. по у достигается при условиях gv 83 83 -gJL = —® = о <=«- = 0, / = 1ж...мп4 (2.14) а минимизация по требует, чтобы = 0 =>= 0,. г = ^ + 1, ,.г; (2.15) при этом минимум достигается только, если i = r, + l, ...» г. (2.16) Условия (2.15) означают, что в точке минимума либо = 0, либо v< = 0, т. е. в силу (2.13) ХЛ(р)=0. (2.17)' Эти условия обычно называют условиями дополняющей нежестко- сти (если какое-либо неравенство выполняется в точке минимума у* нежестко, т. е. точка у* не лежит на поверхности, определен-
416 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ ной условием (2.13)', то соответствующий множитель должен быть жестко равен нулю и наоборот). Строгий результат может быть сформулирован в следующем виде*). Теорема 2.3. Для того чтобы в допустимой точке у* достигался минимум функции* FДу) в области Уо, задаваемой соотношением (2.6), необходимо, чтобы существовали величины А{ = Х*, I — 0, ... ..., г, Хо 0t не равные одновременно нулю и такие, чтобы они совместно с у^у* удовлетворяли системе условий д£ —= О, 1,: .j, nfi У) гп Л оу №Ду) = О, г = г, + 1, ,j(, г, где i—0 а функции РДу), 1 = 0, ..., г, предполагаются непрерывно диффе- ренцируемыми в у*. Если, кроме того, в точке у* выполнено усло- вие регулярности типа (2.10), где учитываются индексы i=* 1, г, кроме таких, для которых РДу*)<0, то указанный набор множителей 10, ..., %, существует, причем Ао#= так что лагранжиан может записываться с = 1. Отметим, что для одного, довольно широкого класса задач усло- вия теоремы 2.3 оказываются не только необходимыми, но и доста- точными. Напомним известные из анализа понятия. Определение. Функция F(y) называется выпуклой, если для любых двух значений ее аргумента yw, yw выполнено условие Г[(1 - 0)^“’ + 0у(2)] < (1 - 0) W’)+6W!))'. где 0 — скалярный параметр, принимающий произвольные значе- ния на отрезке [0, 1]. Если выпуклая функция дифференцируема в точке р<о, то Если опа дважды дифференцируема, то матрица вторых производ- d2F ных -y-j- является неотрицательно определенной. Свойство выпуклости в случае скалярного у хорошо иллюстри- руется (рис. 9.1): график выпуклой функции лежит не выше хор- ______________ i, *) Этот результат обычно именуется условиями Куна -= Танкера.
§ 2. УСЛОВИЯ ОПТИМАЛЬНОСТИ. ПРИНЦИП МАКСИМУМА 417 ды, стягивающей любые две точки, и не ниже касательной, прове- денной через любую точку. Очевидно, что линейная и неотрица- тельно определенная квадратичная формы являются выпуклыми функциями. Определение. Множество У является выпуклым, если оно содержит отрезок, соединяющий любые две свои точки, или фор- мально: если yw е= У, ут е У, то (1— F - ©)+ §ут е у, е е [о, 1]. . k ; / С помощью этих определений нетрудно 1 показать, что выпукло множество, точки // которого удовлетворяют условию F(y)^O, если F(y} — выпуклая функция, или же набору условий F((jr)<0, i = 1, ..., если все А (у) —выпуклые функции. Выпукло и множество (гиперплос- : кость), определяемое уравнениями Ft(,y) = рис. 9.1 — О, если Ft (у)— линейные функции. Теперь можно сформулировать интересующий пас факт. Дополнение к теореме 2.3. Если в задаче (2.12) функция F0(y) является выпуклой, равно как и функции Ft(y), i = n + 1, ..., г, а функции Ff(y), i = l, ..., гъ являются линейными*), то условия теоремы 2.3 оказываются достаточными для того, чтобы в точке у* достигался минимум. Достоинство лагранжева подхода к решению задач па условный экстремум особенно ярко проявляются в случае, когда функции, входящие в формулировку задачи, оказываются сепарабельными, т. е. Fi (у) = 2 /ц(г/;), i = Q, 1, ..., г 1=1 (каждое слагаемое зависит только от «своего» аргумента). В этом случае лагранжиан также оказывается сепарабельной функцией ’ S. = 2 KFt {у) = 2 К S1М = S ^i, i=0 г=0 1=1 1=1 где “F 3 ~ 2 (Уз)' 1=0 При фиксированных множителях минимизация 3\ по векторному аргументу у распадается (декомпозируется) на п независимых за- дач минимизации функций по скалярному аргументу у,-. Такая особенность окажется чрезвычайно эффективной и при исследова- нии общей задачи оптимального управления, сформулирован- ной в § 1. *) При указанных свойствах задача (2.12) называется задачей выпуклого программирования. 27 А. А. Псрвозваиский
418 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ 2.2. Принцип максимума как необходимое условие оптимально- сти. Для определенности мы будем иметь в виду поиск управления, обеспечивающего минимум критериального функционала (1.6). Значение минимизируемого выражения зависит от вида функ- ций u(t), x(t) на всем отрезке t0 t^. tf, т. е. в отличие от ранее рассмотренных ситуаций определяется не конечным набором чисел (вектором), а бесконечным числом значений функций в различных точках отрезка. Эти значения связаны рядом условий. Первую группу условий образуют уравнения объекта (1.5), ко- торые должны быть выполнены в любой момент времени, t<^[l:i, £.], т. е. фактически здесь имеется бесконечное число ограничений. Вто- рую группу образует конечное число соотношений (1.7) и, нако- нец, третью группу — ограничения (1.10) на выбор значений п(4) в каждый момент времени и условие, что u(i) должна быть ку- сочно-непрерывной функцией. Таким образом, здесь вновь возникает задача на условный экс- тремум, но относительно бесконечного числа переменных с беско- нечным числом ограничений. Тем не менее попытаемся применить для получения необходимых условий оптимальности тот же общий принцип Лагранжа, что и в конечномерном случае. Построим лагранжиан tf + j Хт (i) [ х — f(x,u, t)]dt. (2.19) *e Здесь г условий (1.7) учтены с постоянными скалярными множи- телями X;, i — 1, ..., г, а уравнения объекта, задающие условия для всех t <= [i0, tf], учтены с помощью функциональных множите- лей— непрерывной вектор-функции X(i). При этом конечная сум- ма добавляемых слагаемых превратилась в интегральную. Ограни- чения на значения u(t) типа (1.10) в лагранжиан не введены, и поэтому его минимизация должна вестись- в пределах, допускав-, мых этими ограничениями. Минимум разыскивается по переменным x(t), u{t), а также па t0 и th если, таковые моменты не фиксированы. При этом па зна- чения x(t), t0, tf ограничений нет. Преобразуем предварительно последнее слагаемое в (2.19). Что- бы избавиться от йвно входящего х, проинтегрируем по частями 0 ^)Jxdt — Хт (tf)x{tf) — Хт (f0) z(i0) — J '^xdt, *0 ‘о
§ 2. УСЛОВИЯ ОПТИМАЛЬНОСТИ. ПРИНЦИП МАКСИМУМА 41Э С учетом этого лагранжиан переписывается в виде О S£ = J [— Я (а;, и, X, i) — Vz] dt + 'о ' . + 2 ^Ак(«0), x(tt)\ + — XT(f0) a:(f0), (2.20) l=e - - где введено обозначение функции Н(х,и,к,,t) A XT(i)/[x(l), u(t), t] — 2 hSi 1^(0, i],: (2.21) i=0 » обычно называемой гамильтонианом. Используем далее следующее почти очевидное, хотя и не строго формулируемое утверждение: если функция y*(t) доставляет ми- нимум функционалу 0 J {у} = ndt + ^ly^y^ (2.22) *0 чо ее значения почти в каждый момент t <= [£0, /.,] доставляют мини- мум подынтегральному выражению, 'а краевые значения y*(t0), y*(tf) доставляют минимум внеинтегральному слагаемому. Выражение (2.20) имеет такую же структуру, что и (2.22), если под y(t) понимать совокупность x(t), u(t). Пусть u*(t), x*(t), tf доставляют минимум Z. Поскольку на'значения x(t) огра- ничений нет, то ^[Я+Л]=0 при X = X* (t), и = и* (£), или Х = --^|х=х*(р (2.23) дх |u=u*(i) . ' ' почти в каждый момент ?e[i0, t*\- Условие (2.23) можно рас- сматривать как дифференциальное уравнение для определения "функциональных множителей Х(£). Из условия минимума внеинтегральных слагаемых имеем Г = dx(t \ 2 (2.24) ' 0' г—О Z (tf) =* — дх %iGit (2.25) если x(t0) = х* (to),, x(tf) = х* (t*). Соотношения (2.24), (2.25) 27*
420 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ (2.27) (2.27) мож- (2.28) можно рассматривать как граничные (краевые) условия к уравне- нию (2.23). От значений u(t) явно зависит только подынтегральное выра- жение, а в нем — только гамильтониан. Поэтому должно выпол- няться условие • — II [ж* (t), и* (t), X* (t)] = min {— II [х* (t), и, A(t), t]}, U&U или, что то же самое, II [х* (t), и* (t), K(t), t] = max II [х* (t), и, A,(t), t] (2.26) uSU ч. почти в каждый момент t е [io, t^]. Наконец, если t0, tt — свободные (выбираемые) величины, то для оптимальности их значений t0, tf необходимо ^ = 0, ^ = 0 oio dtf при значении и* (tg), х* (to), и* (t*), х* (t*). Условия но преобразовать к более удобной форме 77 [ж* (t*), u* (to), А*(*о). <о]=О# 7i[^(t;),u*(t;),r(t;),t;] = o. Действительно, из представления (2.20) следует, что =Н [х (t0), и (t0), (t0), t0] + A (t0) ж (t0) + x (i0) — (Zo)x (#o) — (*o) x (to) = = H [x (t0), и (t0), A(io), i0J, причем использовано условие (2.24), справедливое на оптимальной траектории. Аналогично доказывается, что на оптимуме g = -//[a;(t/)1U(t;),A(ty)It;]. Проведенные рассуждения и аналогия с Т.2.3 делают правдо- подобным следующий результат. Теорема 2.4 (принцип максимума Понтрягина)*). Для того чтобы допустимые u*(t), x*(t), -t0,tf составляли решение общей задачи оптимального управления, необходимо, чтобы существовали множители Лагранжа а*, 1 = 0,...^ (%;>о), а*ю, t€= [to\t/*L *) Принцип максимума был предложен в 1956 г. Л. С. Понтрягиным и его сотрудниками В. Г. Болтянским и Р. В. Гамкрелидзе (первоначально только для задачи об оптимальном быстродействии) [9.3]. dGi _вх (М 4=0
§ 2. УСЛОВИЯ ОПТИМАЛЬНОСТИ. ПРИНЦИП МАКСИМУМА 421 не равные одновременно нулю и такие, что. при х = хГ, i = 0, ..., г,, X(t) = К* (t)t х (t) = x*(t)t u(t) = U*(O> ^0 == ln>. G ~ h выполнены условия: 1) an (2.29) : эн (2.30) при почти всех £ ^/1, (—- о i ‘— 1 т* • 2) ygi(x1u,t)dt + Gi[x(t0), x(tl)]\<Q i==r' '+i ‘о 1 г r; (2.31) 3) т дх И 2 Iх (fo), х (А)1« ил Vo) i=0 (2.32) ~ дх (tj) 2 (l0), x(t/)]' (2.33) 4)' Я[а:(1), u(t), Х(1), П = о (2.34) при t = t0 и 9 5) J gi (х, и, t) dt + Gi [х (t0) X («;)] .*» = 0х 7 = 1,... r, (2.35) причем ^>0, 1 = г, + 1, • •> r; (2.36)’ 6) Н \х (t), y(t), K(t), t] — max Я u<=U [Ж (0г U,.^(t), 0 (2.37) для почти всех Ъ1» причем, если u(f)=u*(l) на некотором отрезке времени принимает значения во внутренних точках U, то на этом отрезке ^ = 0. (2.38) Если t0 и (или) tt фиксированы, то соответствующее условие (2.34) отпадает. Если x(ta) фиксировано, то отпадает условие (2.32), а если фиксировано x(tj), то отпадает (2.33). Все формулировки в теореме являются прямым следствием ги- потезы Лагранжа. Возможно, нуждается в пояснении запись урав- нения (2.29).
422 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ В действительности оно совпадает с исходным уравнением объекта • х — ](х, и, t), но записано с учетом тождества ёО) = t <2-39) что позволило придать системе уравнений (2.29) симметричную, так называемую гамильтонову форму, аналогичную уравнениям аналитической механики.- В качестве дополнительного комментария укажем, что если Ga~0, то условия (2.32), (2.33) называются условиями трансвер- сальности и геометрически выражают тот факт, что краевые зна- чения вектор-функции Х(t) являются линейными комбинациями векторов нормалей к поверхностям Gt = 0, i = 1, ,.., г, в начальной и конечной течках траектории. Строгое доказательство общего принципа максимума основыва- ется на использовании понятий функционального анализа и топо- логии (см., например, [9.1]) и приводиться не будет. Вместе с тем для понимания самого «механизма» построения необходимых усло- вий оптимальности существенно знакомство с доказательством, при- водимым в следующем параграфе для задач, где отсутствуют огра- ничения типа (2.31). 2.3. Достаточность принципа максимума в выпуклых задачах. Здесь же мы покажем, что использование свойства выпуклости так же, как в конечномерном случае, позволяет доказать достаточность гипотезы Лагранжа и вытекающего из нее принципа максимума как условия оптимальности*). Теорема 2.5 [6.3]. Если u*(t) является управлением, удовлетво- ряющим условиям принципа максимума (с = 1) в задаче мини- мизации функционала Ч ' J{u} = §[gxa(x) + guo(u)]dt+ G0[x(t,)] (2.40) го при условии х = A(t)x +fu(u,t), x(t0) = x'1, u(t)^U, (2.41) где функции gz0, Ga являются выпуклыми, ta, tt фиксированы, то u*(t) оптимально. Доказательство. Введем вспомогательную переменную го(О такую, что ' • «о = g*o(z) + £ио(«), хо(«о)=0. (2.42) Тогда , J(u} = xa(tf) + Go[x(t/)]< *) Свойство выпуклости играет важную роль и при строгом доказательстве общего принципа максимума,
§ 2. УСЛОВИЯ ОПТИМАЛЬНОСТИ. ПРИНЦИП МАКСИМУМА 423 Пусть "х* (<) = (хо> х*) ~~ решение уравнений (2.41), (2.42), соответствующее, управлению н*(1), а 1(!) = («о, х) —решение, соответствующее произвольному допустимому управлению. Докажем первоначально неравенство + + <2-43) где X*(i/) — множители, фигурирующие в условиях принципа максимума. При этом используем тот же прием, что и при непосредственном решении линейно- квадратичной задачи (§ 8 гл. 6). Введем функцию W(t) = -Хо(Г) + V’-(t) x(t) и вычислим ее производную в силу уравнений (2.41), (2.42). Имеем W = -xt + Ъ*гх + М = -gxo - g«o + К'ЦАх + fu) 4- VTz, откуда- Ч <2-44) (о ~ J Используем далее условия принципа максимума. В данной задаче опреде- ление гамильтониана (2.21) принимает вид II ——[gxo(i) + guo(«)] + Хт(1) [A (t)x + fn (и, /)], и из условия (2.37) максимума Н по и следует, что Т -gao(H*(0) + А.*т(1)/и(и*(0, «) > -g«o(u) + VT(0/a(“, t) . (2.45) для любого ие U и почти всех te [<0. О]. Множители Х*(0 удовлетворяют уравнению dli dg | -^(/)х. • ' их х=х* - ох |х=х* С использованием этого уравнения получаем из (2.44) тождество - х0 (ty) +-VT (f/) х (tf) - VT (Q x° = 4 = J {(^г)Т |ж=ж, x ~ ~ 8W Ы + VT/U (u, t) | dt. (2.46) <o X Записывая это тождество для и — и*, х == х* и вычитая из результата само (2.46), находим, что хо (Ч) + ^*Т(г/)ж*(г/)] ~~ [~ж0 (Ч) + ^-*т (г/) х (z/)] = Ч = J I[-8ио («*) + VT/U (и*, 1)] - [- guo («)4- VT4 (и, t)] + . (о Г Ids VI 1} + Sra(I)-«TO(i*)+ — (i*-x)Ul>0, L \ С’Л 1 |jc=x* , J) поскольку под интегралом первая группа слагаемых неотрицательна в силу (2.45) для почти всех а вторая неотрицательна в силу выпуклости ^х0(х)
424 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ (см. определение в п. 2.1). Тем самым неравенство (2.43) доказано. Теперь ос- тается использовать граничное условие для множителей <?С„ I — -(2Л7) Из (2.43), (2.47) получаем • Х0 (М + Go [*• О < *о W) + Go [* ('/)] + • Z9G„VI + Go Г* О - Go Iх О - J Lx<//) К (М - * (Ml- Однако последняя группа слагаемых неотрицательна в силу выпуклости G0(x), так что окончательно получаем J {и*} Д х^ (Z,) + Go [X* (t,)j < х, (tz) + Go [X (Z,)} Д / (u), что и доказывает оптимальность и*. Точно так же доказывается достаточность принципа максимума для задач, в которых отсутствует слагаемое G0[x(t/)] в функцио- нале, однако требуется, чтобы в конечный момент выполнялись условия ( = 0, i = 1, ..., rlf (-r1+i,...,r, <2'48> где Gi, i — 1, ..., rt)— линейные функции, a Gt, i = rl+i1 ..., r,-~ выпуклые, т. e. множество, в которое должна в конечной момент войти траектория, является выпуклым (см. п. 2.1) . Неравенство (2.43) остается в силе, а при установлении окон- чательного результата придется вместо (2.47) использовать гранич- ные условия (2.33) и условия дополняющей нежесткости (2.35), (2.36). § 3. Задачи оптимизации со свободным правым концом траектории Рассмотрим класс задач оптимального управления, формулируе- мых в виде: найти кусочно-непрерывную функцию u(t), миними- зирующую функционал J{»} = G0[x(f,)] (3.1) при условиях, что Я = /(х, U, £), x(ts) = x° (3.2) и и (£)<={/, .(3.3) Здесь начальный и конечный моменты t0, tf заданы, фиксированы начальные условия, а значения x(t/) на правом конце могут сво- бодно выбираться.
§ 3. ЗАДАЧИ ОПТИМИЗАЦИИ СО СВОБОДНЫМ ПРАВЫМ КОНЦОМ 425 3.1. Линейные задачи. Начнем рассмотрение с простейшего примера. Пример 3.1. Пусть объект описывается скалярным уравнением £ = а:+и, .а;(О) = ;г0, и требуется выбрать управляющее воздействие и(1) так, чтобы достигалось минимальное значение координаты x(tt} в заданный момент tj > 0, причем Решим задачу «в лоб», выразив явно минимизируемую координату через управление V = etfx° + J elf~xu(x)dx. 0 Управление в каждый момент должно доставлять минимум подын- тегральному выражению, но > 0, 0 х sC tft следовательно, оптимальным является постоянное управление п(£) = —1, что, впрочем, очевидно и по здравому смыслу. О . Тот же «лобовой» подход позволяет получать решение и в более общем случае. Теорема 3.1. Значения управления u*{t}, минимизирующего функционал J — Clx(tt) (3.4) при условиях*} х(/) = A(t)x(t) + B(t}u(t}+W(t}, ta^t^t}, (3.5)’ x(ta) = x°, u(t)e=U, t0<t^th (3.6) почти в любой момент t обеспечивают максимум линейной функции nT(t)u*(t) = mnx{nT(t)u/u^U}, (3.7) где вектор-функция л (/) определяется формулой = (3.8) через решение уравнения Х=-Л’Х (3.9) с граничным условием X(tt) = -C0. (3.10) *) Обозначения соответствуют § 8 гл. 6.
426 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ Доказательство. Используем формулу для общего решения вектор- ного уравнения (3.5), полученную в § 8 гл. 6: - t x(t) =T(<)x°+ ( Ч'(t) Ч'-1 (т) [5(T)M(T) + IF(T)]dT, (3.11) «о где V (г) — фундаментальная матрица системы (3.5), а Т-1(1) — обратная к ней, определимые уравнениями = Т(<0) = /, 7 (3.12) = 'F-1(z0) = Z. (3.13) В силу (3.11) имеем Ч Сох (tf) = [ (tf) V-1 (т) В (т) и (т) Лт + Ч + (слагаемые, не зависящие от управления). (3.14) Докажем эквивалентность формул rf(t)~-(^(tf)4~\t)B(t) и лт(г) = XT(t)B(O, т. е. докажем тождество Х(«) =-[^-‘(t)]1^1^)^. ~ (3.15) Умножая (3.13) справа па постоянный вектор —'FT(i/)C0, получаем А [Чг-1 = _ лт [т-1 ррт (3 л6) а следовательно, 1(t), определяемое формулой (3.15), удовлетворяет дифферен- циальному уравнению (3.9). Очевидно, удовлетворяется и граничное условие K(t/) =_[ip-*(t/)]tVT(t/)C0 = -C0. Минимизируемое выражение в (3.14) принимает вид §(— лт (<)) и (t) dt, *о откуда следует требование минимизации подынтегрального выражения почти в каждый момент времени, эквивалентное желаемому результату. Подчеркнем теперь, что Т.3.1 эквивалентна утверждению в фор- ме принципа максимума. Теорема 3.2. Для того чтобы u*(t) являлось решением задачи (3.4) — (3.5), необходимо и достаточно, чтобы его значения почти в каждый момент t е [i0, удовлетворяли принципу максимума Н [х* (t), и* (I), X* (t), i] == max H [x* (t), и, %* (t), (J, (3.17) ueu
§ 3. ЗАДАЧИ ОПТИМИЗАЦИИ СО СВОБОДНЫМ ПРАВЫМ КОНЦОМ 427 Ze fr=X*T(0M(i)z(/) + 5(0»(0+W)], (3.18)’ aX(i) = ^*W удовлетворяет условиям к = k(tt)--C0. ' (3.19) Действительно, условия (3.19) эквивалентны (3.9)-, (3.10), а сла- гаемое в гамильтониане (3.18), явно зависящее от и, совпадает с выражением, максимизируемым в (3.7). 3.2. Свойства оптимальной программы. Теорема 3.1 указывает четкое правило построения оптимальной программы управления. Для этого следует: 1) проинтегрировать систему (3.9) с условием (3.10); 2) вычислить функцию" л (i). по формуле (3.8); 3) решить для каждого момента t задачу ’конечномерной макси- мизации (3.7). Первая фаза может быть проделана либо аналитически (при А = const), либо с помощью программ численного интегрирования (интегрирование должно вестись в обращенном времени T = i/ —/!). Третья фаза, к сожалению, не проста. К проблеме вычисления решения конечномерных задач на условный экстремум мы еще обратимся ниже (§ 7). Здесь же интересно проанализировать про- стейший случай, когда множество U допустимых значений управ- ления задается покомпонентными ограничениями "" ик<ик<йк, k = i, ..., m, (3.20)’ где ик, ик — заданные числа — нижние и верхние границы. Перепишем (3.7) с учетом этого явного задания m Й=1 где л*(0 — компоненты вектора n(t). Задача (3.21) распадается на m независимых шах (0пй/мй<мй<пй, /с = 1, ,.. , тпк. (3.21) шах {як(1)ик/ик «£ ак ик}, к = 1, m, (3.22)’ решение которых очевидно: «а (0 = uh при тех t, где лй(/)>0# ик при тех t, где яА (0 < 0,, ' (3.23) произвольно в пределах допуска, если лй (t) *= 0. Следствие к Т.3.2. Управление линейной системой (3.5), опте- мальное по линейному критерию (3.4) при ограничениях (3.20}, может быть построено как кусочно-постоянная функция. Каждая компонента такого управления принимает только одно из двух граничных значений.
428 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ Если функции лк(1), называемые функциями переключения, обращаются в нуль только в конечном числе точек, то эти точки и являются моментами переключения. Подобное управление часто называют управлением релейного типа. Для запоминания програм- мы управления релейного типа достаточно хранить только гранич- ные значения и моменты переключения. Пример такой программы приводился еще в § 1 гл. 3. В дополнение остановимся на частном случае, когда матрицы А, В в (3.5) постоянны. В этом случае можно записать явное вы- ражение для функции переключения л(f) = (/) = - 5теАТ^~%, (3.24) Вводя обращенное время т = tf — t, получаем лт(т) =— (ЛеАхВ, — t0. Продолжив функцию лт(т) на всю полуось г>0 и применив к ней преобразование Лапласа, найдем, что &{-~^(т)} = Ст0[р1-АГ'В, (3.25) т. е. получаем передаточную функцию (векторную) от управления u(t) к выходу y(t)ACox(t). Очевидно, что любая компонента nk(t) обращается в нуль на конечном отрезке только в конечном числе точек, за исключением тривиальной ситуации, когда она тождественно равна нулю при тождественном обращении в нуль соответствующей компоненты п.ф. (3.25). Интересную оценку числа переключений в оптимальной програм- ме управления стационарным объектом дает следующая Теорема 3.3 (теорема Фелъдбаума). Пусть (п X п)-матрица А имеет только вещественные собственные числа. Тогда число пере- ключений любой компоненты оптимальной программы не превосхо- дит п — 1. Доказательство проведем для случая некратных корней. Функция переключения, соответствующая любой компоненте управления, представима в виде . „(’» (/) = у dve-^, v=l где dv — вещественные компоненты. При п = 1 она, очевидно, не меняет знака ври любом t. Далее можно действовать по индукции. Пусть утверждение спра- ведливо при п = I, т, е. функция n(i) (/) = У, dve v=l обращается в пуль не более (I — 1) раз, каковы бы пи были вещественные кон- станты dv и Xv.
§ 3. ЗАДАЧИ ОПТИМИЗАЦИИ СО СВОБОДНЫМ ПРАВЫМ КОНЦОМ 429 Составим функцию при п = I + 1: 1+1 . . я(Н-1) (<) = 2 dv-^v\ V=1 Умножим л(!+1’(«) на Лг+1<>0, что пе меняет чередование ее знаков, и про- дифференцируем произведение ± (/) ] = 2 dv (Хг+1 - Xv) v—1 Это выражение вновь является линейной комбинацией I экспонент с вещест- венными показателями и по индуктивному предположению обращается в нуль не более чем (Z —1) раз. Однако из анализа известно, что пули функции и ее производной чередуются, а поэтому функция л<г+1>еХ'2+1* имеет не более I пулей. То же справедливо и для jtu+1)(t), что и доказывает результат. 3.3. Оценка приращения функционала. Задача оптимизации ли- нейной системы по линейному критерию типа (ЗА) + (3.6) весьма редко возникают в приложениях непосредственно. Однако они игра- ют важную роль как вспомогательные при решении более сложных задач. Вернемся, к исследованию нелинейной проблемы (3.1)-+(3.3) и докажем сначала полезное вспомогательное утверждение, основан- ное па хорошо известном нам приеме линеаризации. Лемма 3.1 (лемма Розоноэра о приращении функционала) [9.19]. Пусть u(t)— какое-либо допустимое управление, a Ut,(t) — любое другое допустимое управление, мало отличающееся от него в том смысле, что \u(t) = uA(t)—u(t) подчинено ограничению И (ti-to) (3.26) ‘о где е — заданная малая величина. Пусть x(t)—решение уравнения (3.2) при u(t) — u(t), a x&(t) — при u(t) — uh(t). Тогда AJ AJ {нд} — J [и] Д Go [жд (tf)] — Go [я (£/)] = У = — J {Н [х (t), (t), X (t), t] — Н [х (t), и (t), К (t), £ J} dt + О (e2), (3.27) где K(t) вычисляется путем решения уравнения Х = -ЛТ(«)Х, X(t/) = -C„ (3.28) = ^fe)L(V)=x(«/)» (3.29)
430 гл. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ а Н(х, и, X, t) Д XT(f) f(x,и, t). При этом предполагается, что f(x, и, t), Ge(x) дважды дифференцируемы по своим аргументам. Доказательство. Обозначим Ax(z) — xA(Z) — х(Z). Тогда Дх — f(x Ц- &х, й + Ди, Z) — f(x, й, t), Ax(Z0) = 0, (3.30) пли, в ийтегральной форме, t Лх (t) = j [/ (х 4- Дх, и 4- Ди, х) — / (х, и, х)] dx. (0 Запишем условие Липшица |/(х 4~ Ax, u 4~ Au, т) —/(х, u, т) | sg Z, |Дх| 4~ МАи |, где Zi, 1г — некоторые константы. Далее имеем t t ] Дх (t) К J | Дх (х) | dx 4~ Z2 J I Au (x) I dx. *o *o Используя лемму Гронуолла — Веллмана*), получаем z *1 | Ax (Z) | к I | Им (x) I dx^ к I | Au (x) | dx, к — const. Учтем неравенство /г( V Ч I ( | Ди | dt I (Zy — го) j I Д“ |2<ZZ еа (3.31) 'го ' *о (при ограничении (3.26)). Имеем теперь . |Дх(г) | sgAe, fe [г0, t/]- (3.32) Введем далее процесс 6x(Z), подчиняющийся линейному уравнению в ва- риациях 6x = A(Z) 6x4-B(Z) Ди, 6x(Z0)=O, (3.33) где A(t) дано формулой (3.29), а _ St I B(Z) = ^- _ _ (3.34) OU |X=X,U=U ' Оценим разность <(Z) =Ax(Z)-fix(Z). (3.35) Разлагай правую часть (3.30) по формуле Тейлора с остаточным членом, получим Дх = J(Z)Ax-f-S(Z) Ди4-г[Дх(г),Ди(1), Z], (3.36) *) Если u(Z), v{t) 0, с > 0, то [8.3] z / t \ “ (*)< с 4- J uv dx, Z> 0 =ф- и (Z) < сехр I J v'dx j, Z>0. о > \о )
§ 3. ЗАДАЧИ ОПТИМИЗАЦИИ СО СВОБОДНЫМ ПРАВЫМ КОНЦОМ 431 где функция г зависит только от компонент векторов А®, А и во 2-й степени и их произведений. Вычитая из (3.36) уравнение в вариациях, находим t £V) = Jv (т)Т~1 (т) г [А® (т), Ди (т), т] Л, 4 где Y (г) — фундаментальная матрица, вычисляемая согласно (3.12) при Л = Д(г). Теперь с использованием оценок (3.31), (3.32) нетрудно убедиться, что • |g(t)|^ce2, гДе с = const. Таким образом, линейное уравнение (3.33) с точностью до О(е2)' дает правиль- ное описание изменения состояния, вызванное изменением управления иа Au(t): Д®(0 = 3®(t)+О(82). (3.37) Разложим теперь в ряд Тейлора и критериальную функцию г- т 9G |т «о рд (Mi=Go h (*/)]+oi H(tZ)д* (M + + ° (I F <zr)l+(*f)+° № Тем самым доказано, что A J = С'бх (tf) 4- О (е2),... (3.38) где вариация траектории на правом конце определяется линейным уравнени- ем (3.33). Далее, повторяя начальную часть доказательства Т.3.1, устанавливаем, что Ч _ ’ CJ6® (t,) = J [-V (t) В (t) Ди (<)] dt. *о С другой стороны, имеем Ч tf J" {Я (х, ил, К, t) — Н (х, и, %, 0} dt = _ Au Гц (АЯ) j dt = го *о Ч _ t _ = f {V (t) В (t) Au (t) 4- ra (Au)] dt = f £T(t)~B (t) Au (t) dt 4- 0 (в2), поскольку остаточный член ra (Ли) содержит только слагаемые 2-го порядка относительно Ди. Подстановка полученных соотношений в (3.38) завершает, до- казательство леммы. 3.4. Доказательство принципа максимума. Формула (3.27), даю- щая оценку изменения функционал при малых по норме измене- ниях управления, широко используется при построении методов приближенной оптимизации, о чем — ниже. Вместе с тем с ее помощью легко получить прямое доказатель- ство принципа максимума для задач типа (3.1) —(3.3), не исполь- зующее гипотезу Лагранжа.
432 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ Теорема 3.4. При условиях леммы (3.1) для оптимальности уп- равления u*(t) и определяемого им в силу (3.2) процесса x*(t) необходимо, чтобы существовала функция удовлетворяющая уравнению (3.39> U—U* при краевом условии * 8G (х) X(tj)^-C0 =---------, (3.40) причем Н[х* (t), и* ((), X* (/), t] = mas.H[x* ((), w, X* (t), t] (3.41) veil при почти всех t e= [Zo, ij. Доказательство. Согласно лемме 3.1 имеем: Ч У {нд} — J {и*) = — J ДЯ dt+ О (г2), (3.42) ‘о . где ДЯдЯр* (0» (/), X* (z), q-~ II [я* (/), и* 0), X* (0, Ф причем предполагается, что Ди{1) = ид(/) — и*(1) подчиняется условию (3.26) или вытекающему из него условию (3.31): Ч J | Д« | dt < г. (3.43) «о ’ Управление u*(t) оптимально, если 7{ид} (3.44) каково бы ни было допустимое ид(1). В частности, необходимо, чтобы (3.42) выполнялось для любых малых в смысле (3.43) отклонений «д(1) от н*(1). Но тогда из (3.42) ясна необходимость условия Ч - J ДЯ dt < 0, (3.45) *о • ибо в противном случае при достаточно малых е /{ид}-У{и*}<0, что противоречит определению оптимальности (3.44). Рассмотрим теперь специальный класс отклонений, называемых игольчаты- ми или импульсными вариациями. Пусть ( и, “д (0 = 1 » ... Iй* (0> «е=[т, т + е0), h, т 4- e0J, (3.46)
§ 3. ЗАДАЧИ ОПТИМИЗАЦИИ СО СВОБОДНЫМ ПРАВЫМ КОНЦОМ 433' где и — произвольная (векторная) константа с ограниченными компонентам» такая, что и е U, т — произвольный момент т е [<о, tf — е0), а е0 — малая поло- жительная величина. Вид игольчатой вариации ясен из рис. 9.2, где представ- лена одна из компонент управления а^(«), подозреваемого на оптимальность.. Обозначим Ди (г) Л иЛ (t) — и* (I). . Тогда в силу ограниченности и получаем где со — некоторая константа. Приняв е0 = ?о г r+s-0 tf t — е/со убеждаемся в выполнении условия рис. д.2 (3.43) для игольчатой вариации. Для такой вариации необходимое условие (3.45) записывается в виде- т+е0 (3.47) j {Н (х*, и, А*, 0 — Н (х*, и*, А*, 0} О- т Отсюда следует, что /7[х*, и, A*, t] Н[х*, и*, A*, t] при почти любом te [<о, t/b Действительно, если это не так, т. е. Н[х*, и, A*, t] — Н(х*, и*, A*, Z) > О (3.48)' (3.49) в некоторый момент f, являющийся точкой непрерывности то эта точка может быть помещена в интервал [т, т + во], па котором всюду будет выпол- нено (3.49), а следовательно, (3.47) невозможно. Вместе с тем условие (3.48) эквивалентно доказываемому принципу макси- мума (3.41) ввиду произвольности выбора и из I). Приведенное доказательство по существу охватывает и несколь- ко более общий класс задач, когда вместо критериальной функции (3.1) требуется минимизировать J{и} = J и, t)dt + (3.50) *0 Используем прием расширения пространства состояний, введя новую переменную x0(t) такую, что = и, t), Хо(<о) = О (3.51) (переменную x0{t) можно интерпретировать как значение накоп- ленных вплоть до момента t текущих затрат, полное значение ко- торых (3.50) требуется минимизировать). Обозначим x(i) = (x0(Z), х(()). Тогда ч J{u} = x0(i/) + G0[^(t/)]AG0[x(i/)]i (3.52) 28 а. а. Первозванский
434 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ а уравнение (3.51) вместе с исходным описанием (3.2)' дает * = и,. t)t (3-53) где f = (go, /), ж’ = (0, хй). С точностью до обозначений задача те- перь соответствует условиям Т.3.4. Для нее справедливо условие типа (3.41) - ' Н[х*, и*, к*} t] = max Н [х*, и, к*, f], (3.54) йен " где Н = kTf = k0(t)g0(x, и, t) + kT(t)f(x, и, t), (3.55)’ а %* А (Хо, X*) — решение уравнения типа (3.39) U-CI_______________t X(tz) = -S-I . (3.56) |x=5C*,U = U* 0Х \x—X\tf) Записанные условия, однако, можно упростить, вернувшись к исходному описанию. Действительно, из (3.56) следует Хо = _.JL = о => Хо (t) = const, о но X0(f/)== — ~ = — 1=>Х0(£) =— 1, С учетом найденно- ОХ0 x=x(tf) ' го значения X0(t) можно записать Н==— g0(x, и, t)+kT(t)f(x, и, t), (3.57) Х = -^| , X(t/) = -52- м. (3.58) дх \х~х& ' 7 7 дх x—x(tfp ' > причем знак над Н можно теперь опустить. Очевидно, что формулировка принципа максимума для задач с функционалом (3.50) совпадает с формулировкой, даваемой Т.3.4 в исходных обозначениях, за исключением замены выражения га- мильтониана на (3.57)*). Попытаемся теперь осознать, что дает необходимое условие в форме принципа максимума для непосредственной практической цели — построения оптимальной программы. Обычно рекомендуется следующая процедура: 1. Записать уравнения системы, ограничения и критериальной функции в стандартной форме (3.2), (3.3), (3.50), 2. Составить выражение гамильтониана . H = —g0(x, и, t) + kTf(x, и, 0. (3.59) *) Можно получить тот же результат и из -общего принципа максимума, изложенного в § 2, как частный случай, дополнительно высказав гипотезу, что константа Х^, фигурирующая в общей формулировке, не равна нулю.
§ 4. ЛИНЕЙНО-КВАДРАТИЧНЫЕ ЗАДАЧИ 435 3. Найти для каждого t, х и X, рассматриваемых как векторные параметры, величину и(х, X, t), при которой достигается максимум Н по явно входящему и в пре* делах допустимой области U. 4. Составить уравнение «• дН ~дх* положив <в его правой части u = u(x, X, i). 5. Решить краевую задачу относительно переменных x(i), X(i) для системы X = f (х, U, t)|u=u<®> л I 4 г f f. 1 X “ — j— , i GE [i0, id, дх |и=и(х,Х,4) 0 с условиями x(i0) = x°, X(i/) = — у 6. Если x*(i), X*(i) —решение краевой задачи, то программа u*(i) = u(x*(i), X*(i), i), очевидно, удовлетворяет необходимом условиям оптимальности. Описанная процедура не является законченным алгоритмом по- строения оптимальной программы управления. Во-первых, решение на этапе 5 может быть не единственным, а следовательно, возможно множество управлений, удовлетворяющих необходимым условиям, но не обязательно оптимальных. Во-вторых, что практически наибо- лее существенно, решение задач, возникающих на этапах. 3 и Заяв- ляется с вычислительной точки зрения крайне сложным. Тем не менее для некоторых видов задач процедура осуществима. § 4. Линейно-квадратичные задачи 4.1. Условия оптимальности. Вернемся вновь к задаче оптимиза- ции линейной системы х = Ах + Ви, аг(О) = ж° (4.1J по критерию минимума квадратичного функционала Ч * •X {u} = [xTQx 4- иЧ Ru} dt 4—g- xT (t/) Qjx (tj)» (4.2) <0 24*
436 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ Эта задача была ранее детально изучена с помощью специальных приемов. Вместе с тем она является частным случаем задач опти- мального управления со свободным правым концом траектории и, более того, частным случаем линейно-выпуклых задач, для которых принцип максимума является необходимым и достаточным условием оптимальности. Выясним, что здесь дает процедура, основанная на использовании принципа максимума. Критерий имеет стандартную форму (3.50), где ёо и, t) = + utRu], Go \x(tf)} = (4.3) Запишем гамильтониан согласно (3.59) H =-----|~[жт<2.г + li'Ru] + №[Ax -\-Ви]. (4.4) Если R — положительно определенная матрица, то II достигает мак- симума по явно входящему и в единственной экстремальной точке, удовлетворяющей условию g = о => — RU + ВЧ = 0. (4.5) (Напомним, что явных ограничений на значения iz(i) не поставлено, н задача максимизации гамильтониана здесь является задачей на безусловный экстремум.) Из (4.5) получаем и(х, X, t) = R-lBTK. (4.6)' ^Составим теперь уравнение Для множителей Х((): = (4.7) Траничпое условие дает 9G (4.8) Таким образом, в отличие от задач оптимизации по линейному кри- терию, уравнение для множителей не может быть проинтегрировано, независимо. Требуется решать краевую задачу х = Ах + Ви |u=u = Ах + BR~lB','K, \ = Qx — ЛТХ (4.9) с условиями х(0) = ж<’, — QtX^tf). (4.10) Хотя эта -задача линейна, стандартные процедуры численного инте- грирования, ориентированные на решение дифференциальных урав- нений с заданными начальными условиями, здесь не проходят. Одна .из принципиальных возможностей заключается в следующем.
§ 4. ЛИПЕЙНО-КВАДРАТИЧНЫЕ ЗАДАЧИ 437 Введем 2п-вектор z = (x, к) и (2n X 2п)-матрицу , „ (а вп^в} U — 4Т г (4.11) Тогда система (4.9) сокращенно запишется в виде z = st-z. (4.12) Предположим, что построена фундаментальная матрица 0(i, io), т. е. решение матричного уравнения 0 = 3^0, 0(i0,io) = Z. (4.13) Тогда z(t) = Q(t, i0)z(i0), или ®(i) = 0n(i, t„)x(i0) 4- 0i2 (t, i„)?.(io), (4.14) X(i) = 021(i, h)x(t0) + d22(t, to)K(t.o), (4.15) где 0ih, i, к = 1,2,— (n X n) -блоки матрицы 0 (t, ta): KU21 22> Из краевых условий следует, что £ь)ж° 4" 02г({/, io)X(io) '@/[0ц (^/» to) 4- 9/2 @/> ^о)^(^о)], откуда 7.(i0) = [9z2(£/t to) 4" @/912(t;, i»)] 1[9г1(^/» tB)4*@/0ц(tf, io)]r°. (4.16) Тем самым находятся неизвестные начальные значения множителей, а следовательно, и определяются в силу (4.14), (4.15) искомые функции x*(t), X*(i), являющиеся решениями краевой задачи. Основная трудность на этом пути связана с вычислением (2пХ2га)- матрицы 8(t, i0), что требует 2п-кратпого решения системы уравне- ний перядка 2п с заданными (в виде единичных векторов) началь- ными значениями. Хотя известны и другие способы непосредствен- ного вычисления решений краевой задачи (4.9), (4.10), остановим- ся на косвенном подходе. 4.2. Уравнение Риккати. Попытаемся удовлетворить (4.9), (4.10) с помощью подстановки K(t) = -P(t)$(t), (4.17) где P(t) — некоторая симметричная (п X п) -матрица. Подстановка дает £ = А х — BR~ ЧРРх, —Рх — Рх — Qx — АтРх, P(tf)x(tf) — QfX(tf). Исключая х, получаем —РАх 4- PBR~'B‘Px — Рх — Qx + АтРх.
438 гл. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ Это уравнение удовлетворяется тождественно, если выполнено’ соотношение ~Р = А*Р + РА - PBR-^P + Q, (4.18) причем из граничного условия следует, что Р(*,) = &. (4.19) Если найдена матрица Р, удовлетворяющая (4.18)', (4.19), то и(х, К, t)^-R-'B^Px, (4.20) т. е. найдена зависимость оптимального управления от переменных состояния, удовлетворяющая принципу максимума. Это прекрасный результат, но:.. он уже был получен ранее в § 8 гл. 6 прямым пу- тем: уравнение (4.18) является известным уравнением Риккати, а формула (4.20) дает известное представление оптимального управ- ления в виде обратной связи по перемейным состояния. Таким образом, мы вышли на знакомый путь, хотя теперь нам предоставляется возможность выбирать между двумя подходами: либо решать линейную задачу относительно 2п неизвестных, либо решать задачи с начальными условиями для нелинейной системы с п(п+, Э. неизвестными элементами матрицы P(t). Хотя вычисли- тельный опыт здесь недостаточен, представляется, что во многих случаях «линейный» путь проще, особенно если параметры по- стоянны, и можно использовать аналитические представления для фундаментальной матрицы. Подчеркнем также, что формула (4.16) пригодна для произволь- ного начального момента i0, а следовательно, она определяет ту же связь между переменными состояния x(t) и множителями Х(£), что и формула (4.17). Отсюда устанавливается представление решения уравнения Риккати через фундаментальную матрицу P(i) = M/. + ОГ‘[021(^ t)], (4.21) а следовательно, и возможность вычисления оптимальных коэффи- циентов усиления Х(/) = Я-‘ВТ(0Р(О (4.22) путем интегрирования линейной системы. Дискуссия о сравнительных достоинствах различных способов вычисления матрицы P(t), конечно, может относиться только к за- дачам большой размерности. Однако для иллюстрации стоит рас- смотреть простейший скалярный (и — 1) пример. Пример 4.1. Пусть объект описывается скалярным уравнением T6x + x = kS)u, х(10) = х\ к0>0, Т0>0,
S 4. ЛПНЕЙПО-КВАДРАТИЧНЫЕ ЗАДАЧИ 439 а критерий оптимальности задан в виде Ч 4- I (я2 + ru2) dt + qx2 (tf) -* min,; г > 0, q > 0. At Ai «о Задачу можно интерпретировать как задачу выбора закона измене- ния движущего момента с целью изменения угловой скорости от на- чальной хй к конечной, принятой за начало отсчета, с минимиза- цией «штрафа» за отклонение вдоль всей траектории и особенно в конце ее, а также «энергетических затрат» на управление. Уравнения (4.9) здесь имеют вид • 1 • 4 % — — f— х + —- X, X — х + у— X, о ‘ог 'о а граничные условия x(to) = xt, X(tf) = —qx(tf). Фундаментальная матрица удовлетворяет уравнению"', 1 где в данном случае 0Й — скалярные функции, удовлетворяющие начальным условиям ' 611 ( М - 022 (to)- 1, 612 (to) - 021 (to) - 0. Интегрируя уравнения для элементов 1-го столбца 0П = — у- 0ц + -у- 021, 021 = 0и+ 4- 9аи О j 0Г < а получаем ? —у- Y+y- 011 a, t0) = + -2Г~ е-т(‘~ч 021 (t, t0) = '») — e г») ], где
440 . ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ Аналогично находим*) о™ у-+т т — у- 8!а(«,м - Л^-е’(,'м + Выражение оптимального коэффициента усиления находится теперь, по формулам (4.21), (4.22), которые в данном случае приобрета- ют вид Jf it\_ _L k 0 + А1(гп 0 г то М‘о‘) + А2(‘р‘)’ Выпишем это выражение подробнее для случая q — 0: I. lf\ _ _о_______1 g__________ l + ^ + lg Очевидно, что с точностью до «краевого эффекта» коэффициент близок к постоянному /г = к° r(i + yT0)’ Существенные различия имеют место только вблизи конца траекто- рии при временах порядка tf — 4.3. Учет дополнительных ограничений. Применение принципа максимума особо эффективно, когда в задаче (4.1), (4.2) требуется учесть дополнительные ограничения. Пусть, в частности, требуется, чтобы в конечный момент состоя- ние совпадало с заданным, х1. Тогда уравнения (4.9) сохранят свою силу, но условия на конечные значения множителей отсутствуют, и вместо (4.10) имеем x(t0) = x0, x(t/) = xt. (4.23) Вновь требуется решать краевую задачу. Не приводя общей форму- лы, остановимся на содержательном примере. Пример 4.2. Управление полетом космического аппарата с реак- тивным двигателем [9.7]. Содержательный смысл задачи таков: тре- буется доставить с помощью космического аппарата в заданную точку пространства наибольший полезный груз. Масса аппарата *) Наличие в элементах фундаментальной матрицы растущих (неустойчи- вых) слагаемых является главным осложнением при их построении путем чис- ленного интегрирования. '
§ 4. ЛИНЕЙНО-КВАДРАТИЧНЫЕ ЗАДАЧИ 441 переменна: т — — q, m(t0) = т° (4.24) и определяется интенсивностью расхода q через двигатель, создаю- щий реактивную тягу (забором вещества из внешней среды пре- небрегаем). Величина F реактивной тяги связана с интенсивностью расхода и мощностью реактивной струи N соотношением Р = ш (4.25) Пусть r(i) — радиус-вектор центра масс аппарата в инерциаль- ной системе координат, F — вектор тяги, Fe — вектор внешних сил*). Запишем уравнение движения центра масс mr = F + Fe, или г = а + ае, (4.26) где а — реактивное ускорение, а ае — ускорение, создаваемое внеш- ними силами. Если таковые определяются только гравитационным шолем, то ае не зависит от массы т, что мы и предположим в даль- нейшем. Преобразуем уравнение (4.24). В силу соотношения (4.25) I-'1 _ т21 а |2 q 2N 2N ’ так что __ m2 | а |2 d / 1 т 2N dt \ т Интегрируя, получаем t ~ -7ГТ = f -Ухг dt- ’ (4.28) т т (<0) J 2N ' . ' . ‘о Масса аппарата есть сумма масс носителя, топлива и полезного гру- за. Если в конечный момент tf допускается использовать все топливо (или вплоть до некоторого заданного запаса), то масса полезного груза, который можно доставить к моменту i,, определяется конеч- ной массой аппарата m(t}) за вычетом фиксированной величины. Поэтому максимизация массы доставляемого полезного груза экви- валентна максимизации т(1/), а последняя в силу (4.28)'эквива- лентна минимизации функционала tf 2 J{a,Ar}= (4.29) !0 *) Здесь используются векторы в смысле теоретической механики; они обозначены жирным шрифтом.
4'12 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ , Будем считать, что заданы положение г' конечной точки и скорость v' аппарата в конечный момент. Кроме того, заданы начальные значения r(£0), v(f0). Текущие значения радиуса-вектора центра масс и его скорости подчиняются уравнениям r = v, v = a + a„, £e[f0, t}], (4.30) Предполагается возможность управления путем изменения реактив- ного ускорения а(0 и мощности реактивной струи N(t), причем на значения a (t) явных ограничений не налагается, a N(t} ограниче- но сверху: (4.31} Из вида функционала (4.29) ясно, что независимо от программы изменения ускорения оптимальным является поддержание мощности N(t) на предельном уровне N. Поэтому далее можно интересоваться только программой изменения ускорения а, минимизирующей J{a} = -1 J|a|Mt. (4.32) В целях упрощения предположим, что ае постоянно (по величине и направлению). Введем в рассмотрение произвольно направленные ортогональные координатные оси «г у, z и снабдим соответствующи- ми индексами проекции всех векторов на эти оси. Тогда функционал примет вид J ~ ~ J + aV *0 а уравнения движения запишутся в координатной форме fx = Vx, rv = Vw fz^Vx, Vx == Их "Г ffexi Vy Пу ~1” Vz Qz 4“ Qezi причем фиксированы начальные и конечные значения всех перемен- ных состояния г», vx, rv, vy, гг, v,. Поскольку функционал сепарабе.- лен, т. е. является суммой функционалов от каждой компоненты ускорения по отдельности, а условия также покомпонентно незави- симы, то оптимизацию можно вести для каждого координатного • направления независимо. Опуская индекс координаты, запишем J {«} = -у- J ar dt го
§ 4. ЛИНЕЙНО-КВАДРАТИЧНЫЕ ЗАДАЧИ 443 при условиях г = р, v = a + ae, r(t0) = r®, v(tg)=v°, r(tj)=*rf, v(t/)=v,> где заданы константы г®, rf, vtt, vf. Мы пришли к двумерной линейно-квадратичной задаче с фикси- рованными краевыми значениями. Применим принцип максимума. Гамильтониан имеет вид Н =—s-a2(0 + Xr(f)v(f) + lu(f)(a(O + ае). Требование безусловного максимума по управлению дает для ,опти- мального управления выражение a*(?) = a = X1J(i). Множители Хг(0, %„(<) удовлетворяют системе уравнений i______________________ п i______________т л,- — — 77 ~ ли — dv--------Arji так что hr —“ Crj hv ' СЛ I Св, где cn с„ — константы, и а* (/) — —сЛ + с„. Константы определяются по заданным краевым условиям по переменным состояния. Действительно, при а = а* имеем г = v, v = — cTt + с» + аа, откуда \ С v (t) = р° + (cu + ае) (i — £0) — -у (i — *0)ах С -4— (L С r(f)=r0+v°(t~U + ^^(t~t^--^{t-t0)\ и константы cr, с» находятся из системы двух линейных уравнений у 2 сьТ — ст = Av — аеТ^ «г»2 у»з тз Cu ~2 + Cr -g- = Аг — v°T — ае где Аг = ^ — r°, Av = v’ — v°, Т = tf — ta — заданные величины. Приведем конечный результат для случая ае = 0, Av — 0, v° = 0, t0 = 0. Здесь Таким образом, устанавливаем, что оптимальный закон измене- ния управления является линейным* по времени, причем коэффи- циенты линейно зависят от требуемых изменений положения и ско-
444 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ рости. Решение поставленной задачи завершено, однако стоит вер- нуться к ее содержательному смыслу и уточнить постановку. Значение конечной массы при оптимальном управлении равно и не может быть сделано больше этой величины пи при каком дру- гом управлении. Однако по смыслу задачи т (4.33) где т — суммарная масса носителя и резерва топлива. Масса достав- ляемого полезного груза равна — m и не м:ожет быть отрица- тельной. Поскольку J{a*} в конечном счете зависит только от исход- ных параметров требуемого маневра Дг, Av, Т, то получаем неявное ограничение (4.34) \ т mJ на параметры возможного маневра. В случае ае = 0, t0 == 0, v" = 0, Ду = 0 это ограничение определя- ет шар, радиус которого увеличивается со временем как Т3/г. Если конечное значение скорости не фиксировано, то достижи- мая область пространства расширяется. Это можно показать, пере- смотрев решение краевой задачи. В силу условий трансверсальности должно быть Хк(^) = 0. Используя это условие вместо у(£/) = у\ можно найти другие значения констант cr, cv и подсчитать новое значение /{а*}. □ • Интересно рассмотреть, как влияет на характер решения задачи явное ограничение на возможные значения управления. Примем их в простейшей форме ограничений снизу и сверху на каждую компо- ненту управления. Кроме того, предположим, что в функциона- ле (4.2) R — diag {rft, к = 1, ..., т}, rh > 0. Задача максимизации гамильтониана (4.4) шах x'Qx 4- 7П 2 rkui й=1 (4.35) + + VBu при условиях к = 1, ..., 7/г, распадается на т одномерных задач шах{—ГдЫ* + где л* — компоненты вектора л = В'к. (4.36).
§ 5. ОПТИМИЗАЦИЯ ПО БЫСТРОДЕЙСТВИЮ 445 Решение любой из таких задач имеет вид ик (X) = ф/г (лй) = — — uh, если -5— > uh, Л/, — 2^“, если 2r ' Г1а __ uh, если s— < ик. ^rh — (4.37) Таким образом, решение является кусочно-линейной функцией от пА(0, а следовательн'б, множителей Лагранжа k(i). Для вычисления A.(i) в соответствии с основной процедурой сле- дует теперь решить нелинейную краевую задачу х = Ах + 2 -S/tTfe (лД (4.38) А=1 \ = Qx — Лт7, л = (лй) = с соответствующими граничными условиями. Явного выражения для решения дать невозможно*). Отметим, что при г„ -> 0 нелинейно- сти типа «насыщения» стремятся к релейным, причем при гк = О, nft¥=0 компоненты оптимального управления принимают только- граничные значения, как и в задачах (§ 2) оптимизации по линей- ному критерию. § 5. Оптимизация по быстродействию 5.1. Формулировка принципа максимума. Задача об оптимально» быстродействии была сформулирована в § 1 как вариант общей проблемы оптимального управления: требуется выбрать кусочно- непрерывное управление u(Z) со значениями в заданном. U так,, чтобы система x — f(x, и, t), t0^t^t}, (5.1) за минимальное время перешла из заданного состояния x(t0) = x<>‘ в заданное же состояние x(tf) = xf. Момент ta фиксирован, мо- мент t<, естественно, свободен. Сформулируем принцип максимума в задаче о быстродействии, как частный случай теоремы 2.4. Теорема 5.1. Для того чтобы допустимые u*(t), x*(t),t* -достав- ляли решение задачи о быстродействии, необходимо существование множителей Лагранжа Х*(0, не равных одновременно нулю и та- ких, что при K(t) = X*(Z), u(t) = и* (I), x(t) = x*(t), tf = t* выпол- няются условия: *) О возможностях приближенного решения см, гл. 10, § 2.
446 гл. Э. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ 1. При почти всех t & [£0, £/] ж = = Л х(Ч) = х^ (5.2) i = — (5.3)' 2. 3@[x(t), u(t), X(t), t] = р1ахЖ[х(1), u,X(t),t]. (5.4) 3. u(tf), %(tz), t/]>0, (5.5) яде Ж л№(1) f[x(t), u(t), t\. (5.6) Доказательство. По сравнению с общей задачей здесь следует по- ложить '| Go = 0, go = 1, gt — 0, i = 1, .... г, (5.7) поскольку функционал представим в виде Ч J (U} = J dt, (5.8) а интегральные ограничения отсутствуют. Записывая гамильтониан по форму- ле (2.21), имеем . н = V(0/k(0, “(0. <] (5.9) или, с учетом обозначения (5.6), Н = Ж - U Поскольку Хо = const, то условие (5.4) эквивалентно условию (2.37) максимиза- ции Н, а в силу Хо > 0 граничное условие (2.34) //|(=(/ = 0 переходит в неравенство (5.5). Условия трансверсальности (2.32), (2.33) опущены ввиду фиксированно- сти обоих концов траекторий. Для функции <Ж, определяемой (5.6), сохраним наименование «гамильтониан». И Если пытаться применять принцип максимума как базу для кой- -струирования оптимальных или по крайней мере подозрительных на оптимальность управлений, то вновь основные трудности воз- никают на двух этапах: 1). найти функции и(х, X, (), доставляющие максимум •Ж(х, и, X, () по явно входящему и при х, X, t, рассматриваемых как параметры; 2) решить краевую задачу для системы x = f[x, и(х, X, (), t], x(tv)=x°, (5.10) X = -^l ~ X, x(tf)~x4 (5.11) dx |u= u(x,M) Преодолеть эти трудности в общем случае невозможно, однако удается построить ряд содержательных примеров непосредственного
§ 5, ОПТИМИЗАЦИЯ ПО БЫСТРОДЕЙСТВИЮ 447 использования описанной процедуры. Кроме того, принцип макси- мума может быть использован и по своему «исходному назначению» как необходимое условие оптимальности, с помощью которого можно проверить решения, находимые каким-либо другим путем. Опишем сначала решение задачи о быстродействии для одно- мерной (скалярной) системы, поясняющее смысл конструкции прин- ципа максимума. Это решение тривиально. Действительно, для того чтобы пре- дельно уменьшить время перехода в новое состояние, требуется пре- дельно увеличить (по модулю) в каждый момент времени скорость перехода (f(x, и)) в желаемое состояние x(tf) — Q. Если начальное значение х° < 0, то требуется обеспечить- max {f(x, u)/u^U); если же «°>0, то max{—f(x, u)/us=U}. Принцип максимума рекомен- дует находить •управление путем решения задачи • max {Xf(x, и)/и е= U}. (5.12) Очевидно, что обе рекомендации эквивалентны, если принять f 1, а-’<0, ' Л-1-1, ж" >0, Ясен и смысл принципа максимума в многомерном случае. Опять-таки требуется максимизировать скорость перехода. Однако скорости по разным компонентам вектора состояния зависят от управления по-разному, поэтому требуется в качестве общего крите- рия соизмерить различные компоненты вектора скорости fi(x, и). Гамильтониан (5.6) представляет собой такую «средневзвешенную» скорость, причем «весами» служат множители Лагранжа. Основная рекомендация принципа максимума и сводится к мак- симизации «средневзвешенной» скорости движения к цели, причем,, что весьма существенно, указывается связь между «весами», зада- ваемая уравнениями для множителей. К сожалению, связь задана неявно, поскольку эти уравнения не могут быть проинтегрированы независимо. 5.2. Линейные системы. Опишем более подробно особенности многомерных задач для стационарных линейных систем, задаваемых уравнением х — Ах + Ви, (5.13) где приняты стандартные обозначения. Гамильтониан принимает форму = V (Ах + Ви), (5.14) а система (5.3) . Х==_^ = _ЛТХ. (5.15Х Задача (5.4) эквивалентна ' max {nT(£)u/u e= [/}, (5.16) где л(£). = BTX(t).
-448 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ Таким образом, управления выражаются через множители X,(t)’ "точно так же, как в задаче оптимизации по линейному критерию (ср. (5.16) и (3.7)). Более того, совпадают и уравнения для множи- телей, которые не содержат ни x(t), ни «(/). Поэтому верны общие утверждения о свойствах оптимального управления, высказанные в § 3 (релейный характер управления, теорема о числе переключе- ний). Однако имеется и фундаментальное различие: моменты пере- жлючения нельзя найти столь- простым образом. Действительно, в задаче о быстродействии отсутствует информация о граничных значениях Х(£)- Можно выписать решение (5.15) в виде Х(/) = е-Атщго), (5Л7)' но значение Х(£о) неизвестно, а тем самым неизвестны и X(i), и функция переключения л(£), и сами моменты переключения. Ре- шение задачи (5.16) определяет управление, претендующее на опти- мальность, с точностью до п параметров, компонент вектора Х(Л>) = ~С. Обозначим его u(C, t). Чтобы найти С, требуется подставить это решение в (5.13): x = Ax + Bu(C,t) (5.18) и проинтегрировать (5.18) при заданных начальных условиях -£(0) =*ж°. Решение опять-таки определено с точностью до С: x(t)~ = х*(С, t). Условие x*(C,t1)^x> (5.19) „дает требуемую систему п уравнений для нахождения п неизвест- ных С и неизвестного времени tf (напомним, что фактически суще- ственна п — 1 неизвестная компонента С). К сожалению, выписать уравнения (5.19) в явной форме, как правило, затруднительно. Более того, как уже указывалось, нет гарантии разрешимости этих .уравнений, поскольку, вообще говоря, нет гарантии существования какого-либо управления, удовлетворяющего ограничениям и обес- печивающего требуемый переход. Нетрудно доказать лишь следующий простой факт. Теорема 5.2. Пусть матрицы А, В постоянны, А устойчива, пара .Л, В невырождена. Тогда существует управление, переводящее си- стему (5.13) из произвольного начального состояния в нулевое и удовлетворяющее ограничению u(t)e Urto^t ^tf, если нулевое зна- чение управления допустимо и принадлежит внутренности U. Доказательство элементарно и основывается па двух известных -фактах: а) если положить u(t)=O, то по любому б > 0 найдется такой момент Ц, что к(й)|Сб. . поскольку объект устойчив;
§ 5. ОПТИМИЗАЦИЯ ПО БЫСТРОДЕЙСТВИЮ 419 б) из любого состояния х(Ц) вполне управляемая система может 'быть пе- реведена в нуль с помощью управления u(t), h С * гь не обязательно до- пустимого, по такого, что |a(t) | c|x(ti) | ей, с = const. Это следует из установленной в § 3 гл. 6 линейной зависимости програм- мы управления от начальных условий. Теперь очевидно, что можно задать такое 6, что и(«) при любых te [tb tf] не будет выходить из U. Таким образом, если начальное состояние далеко от положения равнове- сия, х = 0, то достаточно на некоторое время предоставить устойчивую систе- му «самой себе», и отклонение уменьшится настолько, что из него можно перей- ти точно в равновесие за заданное конечное время tj — tt с помощью ограни- ченного управления. Конечно, такая последовательность действий не является оптимальной (напомним, что оптимальное управление сразу выходит на грани- цу допустимой области!), однако важна сама гарантия возможности построить допустимое, а следовательно, и оптимальное управление *). Подчеркнем также, что доказанное утверждение верно только применительно к переходу устойчивой системы в состояние равно- весия, но не в любое другое состояние xd (замена g = x — xd пере- водит желаемое состояние в начало координат, но одновременно возникает постоянное слагаемое Лж4 в уравнении объекта). 5.3. Управление движением. Перейдем к рассмотрению примеров, связанных с управлением движением механических объектов. Пример 5.1. Достижение заданной скорости.' Рассмотрим матери- альную точку, движущуюся по прямой под действием управляемой силы /(t). Скорость u(.t) изменяемся в силу уравнения mv = f(t), i>0, n(0) = tA (5.20) Требуется обеспечить достижение заданной скорости vf > i>° за ми- нимальное время при условии, что сила ограничена: 1/(0 1^7, *>0. (5.21) Решение очевидно: сила должна все время принимать наибольшее значение /, причем развивается ускорение тп-1/. Усложним задачу, считая, что масса является переменной, и бу- дем интерпретировать дальнейшее как поиск оптимальной програм- мы управления реактивным ускорением для летательного аппарата, движимого реактивной тягой (см. пример 4.2). Пусть мощность двигателя N поддерживается постоянной, движение осуществляется по прямой; тогда уравнение изменения массы m = —q может быть преобразовано к виду dt\mj а (5.22) (5.23) *) Доказательство того, что из существования допустимого управления следует существование оптимального, несложно (см., например, [6.3]), 29 а. а, Первозванский
450 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ Введем теперь обозначения (5.34У тогда уравнения изменения состояния приобретут особо простую форму [9.13] - Xi«=a, х2 = а2 (5.25 ) с краевыми условиями *1(0) = п°, х2(0)=^, т (5.26) ... f 2N Л f (^/) —v t — t‘ т’ Используя принцип, максимума, составим гамильтониан X = Xitt + Л2И2. Из уравнений для множителей i,-----«О, 1 Ох^ * i дх2 следует, что %t(i) = с, = const, A,2(t) = c2 = const. Выразим управление через константы Ci, с2. Требуется выбрать d(t\ так, чтобы в любой момент достигался max {с^Ч- с2аг/|д! < а.}. (5.27) Результат зависит от знака коэффициента с2, определяющего знак второй производной максимизируемой функции. Из необходимого условия безусловного экстремума имеем a* (f) = — —1. = const. zca но это значение доставляет максимум только при с2 < 0. Более того, оно может лежать вне допустимой области, так что при с2 < 0 ре- шение задачи имеет вид ci а*(0 = 1 “2Га* — ах
§ 5. ОПТИМИЗАЦИЯ ПО БЫСТРОДЕЙСТВИЮ 451 В случае с2 = 0 минимизируемая функция линейна и )а, с, > 0, В случае сг > 0 вновь нет точки безусловного максимума и решение достигается только на границах: а* (0 = а. С1 О, — а, и. а* = const и |а*1 а. a*Xi (t) + с*,; Во всех описанных ситуациях В силу уравнений (5.25) dx —3 = а* =>; ахг Tjsfi с* — константа интегрирования. Эту константу, а также кон- станту а* надлежит определить из краевых условий. Имеем Лг =* а*х[ + с*м = а*х[ + с* => •=> а* = 4~7 = (-Ц— 2# А а. (5.28) X" — х^ и' — V задача решена: так же, как при управлении точкой массой, следует все время двигаться с постоянным Казалось бы, с постоянной , ускорением. Правда, здесь оно, вообще говоря, не является предель- но возможным, а* ¥= а, а зависит от заданных начальных и конеч- ных значений скорости и массы: требование сохранить достаточно большую массу не позволяет увеличивать ускорение до предела. Од- Рис. 9.3 нако решение является неполным: если а>а, то значение а* является недопустимым. Но ведь только с помощью этого значения удалось удов- летворить граничным условиям! Мы пришли н противоречию: при некоторых соотношениях гра- ничных условий нет управлений, удовлетворяю- щих принципу максимума и вместе с тем позво- ляющих достичь заданного состояния. На самом деле это противоречие только кажущееся: при разборе вариантов различных возможных значений лагранжевых множителей был пропущен существенный случай с2 >0, ct = 0. Максимизируемая функция является симметричной параболой (рис. 9.3), и принцип максимума выделяет какое-либо из решений a*(t) = a или a*(t) = —а. Оба варианта удовлетворяют необходймым условиям. Ясно лишь, что в этом случае оптимальное управление удовлетворяет условию [a* (J) I — а = const, (5,29^ 29*
452 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ но возможны переключения знака управления. С помощью таких переключений И удается удовлетворить граничным условиям, когда это невозможно при использовании постоянного ускорения. Остается выяснить, каким должен быть закон переключения, но оказывается, что он в определенной степени безразличен. Действительно, при |a*(f) I —а имеем . _ _ xf__х» а: = а2 => xf2 — х°2 = a2tf=> tf = а так что время перехода определяется лишь квадратом управления и не зависит от его знака. Минимальное значение времени достига- ется при любых законах переключения, обеспечивающих переход в заданное состояние. Теперь можно подвести итог: если что а^а, то aa^(t) = а — const; если заданное состояние таково, же а>а, то оптимальное управление не единствен- но и ограничивается усло- вием kopt(f) I = а и требо- ванием перехода в задан- ное состояние. Все ситуа- ции хорошо, иллюстриру- ются на фазовой плоско- сти (рис. 9.4). Поскольку масса может только убы- вать, а связанная с ней переменная хг — только возрастать, то представ- ляют интерес только на- чальные точки, располо- женные ниже конечных. Из точек, лежащих вне сектора, ограниченного прямыми' ?2-^ xi~xi — rfc л, (5.30} оптимальный переход осуществляется с постоянным ускорением, а из точек внутри сектора — с ускорением, меняющимся по знаку, но сохраняющим предельное по модулю значение. Все траектория этого типа эквивалентны. Время перехода из точек, имеющих одну и туже ординату (одинаковую начальную массу), одинаково, если они лежат внутри сектора. В противном случае оно тем больше, чем больше заданное различие в исходной и конечной скоростях. □ Пример 5.2. Управление скоростью («навигационная задача Цер~ мело»). Пусть точка движется в среде, имеющей заданную перенос- ную скорость v0. Имеется возможность управления собственной (от- носительной) скоростью и, модуль которой ограничен. Требуется найти программу управления и, обеспечивающую минимальное вре-
g 5. ОПТИМИЗАЦИЯ ПО БЫСТРОДЕЙСТВИЮ 453 мя перехода из одной точки в другую. Для простоты рассмотрим движение в плоскости, где введена неподвижная система координат (х„ хг) (рис- 9-5)- Будем считать также, что вектор скорости v0 имеет постоянное направление, совпадающее с направлением оси xt, и, более того, по- стоянен по величине, которую можно принять за единицу. Тогда изменение во времени координат движущейся точки («пловца, переплывающего ре- ку») определяется уравнениями /, = 1 + ^008 Ф, Хг — u sin ф, (5.31) •Zza Рис. 9.5 должна быть предельно bos- где через и обозначена величина ско- рости, а через ф — угол, составляе- мый ею с осью xt. Поскольку зара- нее очевидно, что величина скорости можной, и = й, то остается единственное управление — угол Действуем по стандартной схеме: Ж = Xj (1 + й cos ф) + %2й sin ф, Xi = 0, 12 = 0 => X, = const, Л2 = const. Учитывая, что на управление не наложено явных ограничений, запишем необходимое условие максимума Ж по ф: = 0 => — Xj sin ф* + Х2 cos ф* = О, т, е. ' X, tg ф* ==—? == const. Таким образом, скорость должна быть постоянной по направлению, а движение — происходить по прямой, соединяющей начальную и конечную точки. Однако следует учесть одно обстоятельство: в си- лу уравнений изменения состояния наклон прямой ограничен, если и < 1: _ и sin ф* < и ^Х1 1 + и cos ф* 1 — U2* т. е. если собственная скорость «пловца» меньше по величине ско- рости «течения», то он может переплыть только в точку на «другом берегу», лежащую в пределах (см. рис. 9.5) заштрихованной зоны достижимости 5» / . - .......... (река «сносит пловца»).
454 гл. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ Предположим теперь, что координата х{ не задана (требуется только «переплыть реку», попав в любую точку «противоположного берега»). Тогда в силу принципа максимума A1(f/) = O=*M(0 = O и tg<p* = оо => ф* =-у, (5.32) т. е. «пловец» должен направляться прямо в цель, поперек течения. Конечно, полученные результаты почти очевидны. Более заслу- живает названия «навигационная задача» следующая постановка: пусть направление переносной скорости по-прежнему постоянно, но ее величина зависит от координаты х2, и задан профиль скорости Vo(^2)>O. Уравнения движения приобретают вид Xi = V» (х2) + й cos ф, х2 — и sin ф, (5.33) а из принципа максимума следует, как и ранее, что tg ф* = == const, (5.34) но множитель Х2 уже не постоянен, а подчиняется уравнению (хХ ^-*1-^’ . (5.35) Если значение х( не фиксировано, то вновь получаем тривиальное решение Х1 = О=>ф* = |, при котором точка придет к цели с несложно вычисляемым значе- нием х*. Если fete Xi заранее задано и х{ =/= х*, то А,( =/= О, и можно сразу положить kt = 1, = к, поскольку управление определяется только отношением множителей. Исключим время t из уравнений, записав ___£ ЙХ ' ро (жг) + “ со® *₽ и sin <р ’ dxg и sin <р Первое из этих уравнений эквивалентно — й sin ф dk = dvb а из условия экстремума (5.34) следует
§ 5. ОПТИМИЗАЦИЯ ПО БЫСТРОДЕЙСТВИЮ 455 так что sin ф* соза <р* dq>* = 4- dvQ. и Интегрируя это соотношение, получаем явную зависимость опти- мального управления от координаты х2: — cos-1 ф* = -1 v0 (х2) + с* => cos ф* = [4- v0 (х2) + с*1 \ (5.36) и L “ J где константа с* определится по граничным условиям. О Пример 5.3. Управление силой для скорейшего торможения в за- данном положении. Вернемся к' задаче, рассмотренной в начале примера 5.1, о движении точки постоянной массы под действием ограниченной управляющей силы, однако введем дополнительное условие: торможение должно быть осуществлено в заданной точке я/ = 0. Задача при Этом существенно усложняется. Для ее исследо- вания используем принцип максимума. Запишем уравнения в стан» дартной форме. Обозначим xt = х, х2 — и. Тогда xt — хг, mxt = и. (5.37 J Гамильтониан имеет вид 3% — ^1^2 4“ ^2^< а изменение множителей X((i), X2(f) задается уравнениями i _ SH _ n i _ dff i ------л2--------------- Из условия максимума гамильтониана получаем (5.38) и и* принимает произвольное допустимое значение при Х2 = 0. Для нахождения программы управления требуется ’найти закон изменения А2(£). Система для множителей дает ct, Х2 Cit 4* с2, где с,, с2 — неопределенные константы. - Поскольку X2(t) —линейная функция, то она может изменять знак не более одного раза (частный случай теоремы Фельдбаума из § 3, при п = 2). Таким образом, с помощью принципа максимума установлены два факта: во-первых, оптимальное управление может принимать только значения ±м, а во-вторых, переключение с одного значения на другое возможно только один раз, каковы бы ни были начальное
456 ГЛ: 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ и начальная- скорость Остается выяснить, каким начальный знак управляющей силы и момент пере- ноложение должен быть ключения. Для того чтобы получить решение при произвольных начальных условиях, используем анализ траекторий на фазовой плоскости xt, хг (рис. 9.6). Траектории подчиняют- ся уравнению , и , 1 „2 . * , и Зх" = т7-=>"2 С ~~ ~т 1 2 (5.39) Рис. 9.6 вий.' Однако имеются только точнее, поскольку заранее знак не- известен, можно сказать только, что любая траектория должна быть «сшита» не более чем из двух ча- стей, каждая из которых является , участком параболы вида (5.39) с тем или иным знаком. Константа с* зависит от начальных усло- две траектории, две полупараболы (5.40) по которым точка может подойти к желаемому состоянию началу координат. В силу правила о числе переключений любая оптималь- ная траектория либо представляет собой одну из этих полупарабол, т. е. движение осуществляется без переключений, либо включает одну из них в качестве второго участка траекторий, который дол- жен быть непрерывно сшит с какой-либо другой траекторией вида (5.40), соответствующей управлению другого знака и проходящей через заданную начальную точку с координатами я®, ж®. Естествен- но, что оптимальное движение без переключений возможно только, если величины Xi, ж® удовлетворяют одному из условий (5.40). Оптимальные траектории, типичные для любого другого начального состояния, состоят из двух участков парабол (см. рис. 9.6). Проведенный анализ фактически позволил установить, каким должно быть управление при любом состоянии, любых значениях положения и скорости: для всех состояний, изображаемых на фазо- вой плоскости точками, лежащими левее финальных траекторий, управление равно й, а для состояний, изображаемых точками спра- ва, равно —й. Переключение происходит только при выходе на фи- нальные траектории (5.40).
§ 6. ДИСКРЕТНЫЕ СИСТЕМЫ 457 Можно дать и аналитическое выражение оптимального закона управления как функции состояния и = — usignpj + a:.® sign #2(5.41) справедливое всюду, кроме финальных траекторий. В исходных обозначениях имеем й = — и sign х + v2 sign v L (5.42) 2u J т. е. оптимальное по быстродействию управление является нелиней- ной функцией от положения и скорости и может быть реализовано в виде обратной связи при наличии таких измерений. □ * § 6. Дискретные системы 6.1. Формулировка задачи оптимизации. Управляемый объект на- зывается дискретным (по времени), если его описание дано рекур- рентным соотношением x[k +l] = F(x[k], и[к], к), ж[0] = х°, к —0, 1, ..., (6.1)' где х [А] — вектор состояния в момент к, и [й] —вектор управлений, а /'’() — вообще говоря, нелинейная вектор-функция своих аргумен- тов. Уравнение (6.1) можно ассоциировать с дифференциальным уравнением х = /(г, и, t), 1>0, (6.2). если ввести последовательность моментов времени th, к~0, 1, .. определить х [*]= x(th), u[k] = u(th) и считать моменты tk настолько близкими, что допустима прибли- женная замена а*~ ,R ~ *А+1-Л • ' Тогда из (6.2)' следует «(^+1)^а:(/*) + (^+1-^)/[а:(4), ц(1»), tj, что приводит к (6.1) при ^(^14:], *) Д + (tA+i —fA)/(a;[*h u[A;]t ift). (6.4) Впрочем, как уже указывалось в гл. 7, дискретное описание мо- жет быть и исходным, содержательно естественным.
458 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ Соотношение (6.1) позволяет по заданному начальному условию а?[0] и последовательности управляющих воздействий {&[&]} опреде- лить состояние в любой последующий момент. Поставим задачу нахождения такой последовательности {и* [/с]» Л = 0, ..., kt — 1 которая доставляет минимум функции hf-l J&}- 2 g0^Wt «1Н *) + G0№D (6.5) fe=O при условии, что /с = 0, ..., kt-i, .(6.6)' где Uk — заданные множества допустимых значений управления в каждый момент к, а также при условиях связи между перемен- ными, задаваемых соотношениями (6.1). Критерий (6.5) также является очевидным дискретным аналогом интегрального критерия (1.6). Вместе с тем подчеркнем, что постав- ленная задача оптимизации является задачей минимизации функции (6.5) конечного числа переменных при ограничениях (6.1), (6.6), т. е. относится к классу задач, рассмотренных в п. 2.1. Введем в рассмотрение вектор у, включающий все неизвестные: y=(u[fc], й = 0, 1,kf — i, х[к}, к—1, ..., kf). Можно обозначить Л/-1 A W) Д 2 g0 (X [к],_ и [к\ к) + Go (xU/1), (6.7) fc=0 Fh(y) Д x[k + 1] — F (x\k],u\x], k)t к = 1, 2,; , kf — 1. (6.8). Зададим также в явной форме ограничения (6.6) с помощью систе- мы неравенств (вообще говоря, векторных) <Pfe(g) Дф(«[*], *)<0х * = 1, ...Д/—1, (6.9) Тогда исходная задача перепишется в виде min{Fe(y)/F*(y) = 0,4==l, ...,4,-1, ф*(у)<0, 4 = 0, 1,.... к,-1), (6.10) что по существу совпадает с (2.12). Составим лагранжиан задачи kf—1 fey—1 S’, = k0F0 (у) + 2 Г [4] Fh (у) + 2 № Фь(У)> k=l fe=0 где для удобства через д,[4] обозначены лагранжевы множители, соответствующие ограничениям (6.9). Далее используем необходи- мые условия оптимальности, фигурирующие в Т.2.3. С учетом различия в обозначениях эти условия формулируются так: необхо- димо, чтобы существовали множители 10, Х[Л], не равные
8 6. ДИСКРЕТНЫЕ системы 45g одновременно нулю и такие, что ЭЗ? МГ1 = 0- * = (6.11) 7Й==0« * = °.......kf-^ : (б-12) ~ -%0>Q, ич*]ф*(у)=о, (6.13) если у =(«[*], х[к\) удовлетворяет ограничениям задачй (6.10). Специфика задачи проявляется в структуре связей. Перепишем лагранжиан в виде А/-1 . S’o *=*oGo (* [*/])+ 2 {^0 (* 1*Ъ и\к}, к) + /1=0 4- к'г[к] х[к + 1) — kT[k]F(x[k]r и [к], к) 4- рт [к] <р(и,[к], А)) == *=X0G0 (х [&/]) + 2 !** 1*1 х\к + 1] — h=o -Hoh{x[k],u\k],klk], к, \) + рт[к] Ф(и[к],, к)}, где HQh А Г [*] F (х [к\, и[к],к) — kogo (х 1*1» «1*1» к). (6.14) Тогда (6.11) принимает вид М^-П.-Ч-^С.. (6.45) Очевидна аналогия этих условий с системой, определяющей лагран- жевы множители в принципе максимума. Условия (6.12), (6.13) дают . . _2_(яой-рт[Мф («(*],*)}= 0, (6.16) p,[fc]>0, у,1 [*]<₽(»[*], *) = 0. (6.17) Таким образом, можно сформулировать следующий результат. Теорема 6.1. Пусть функции F(x, и, к), ф(х, и, к), g0(x, и, к) непрерывно дифференцируемы по х, и, a G0(x) непрерывно диффе- ренцируема по х. Для того чтобы на допустимой условиями (6.9) последовательности управлений {и* [к], k — Q, , к, — 1) и соответ- ствующей ей в силу (6.1) траектории {х* [/с], к = 1, к,} достигал- ся минимум функции (6.5), необходимо, чтобы существовали вели- чины к [А;] = к* [*], к = 1, ..., к} — 1, Хо 0, не равные одновременно нулю и такие, чтобы они удовлетворяли уравнениям (6.15). Кроме того, необходимо, чтобы существовали величины Н [*J = р* [*], к = 0, 1, ..., kf — 1, такие, чтобы они совместно с и [к} = и* [к] удов- 'летворяли при каждом к условиям (6.16), (6.17),
460 гл. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ 6.2. Дискретный принцип максимума. Приведенная Т.6.1 являет- ся аналогом принципа максимума в теории непрерывных систем, однако аналогия не полна. Действительно, выражение Нм- цтИф(а[Н к) можно рассматривать как «классический» лагранжиан в задаче тах{Яо*/и[&НС4}, (6.18) если множество Uk задано условиями (6.9). Однако возможность ис- пользования такого лагранжиана (без множителя перед функциона- лом) не обоснована, поскольку требуется дополнительная проверка условий регулярности типа (2.10). Поэтому и эквивалентность усло- вий (6.16), (6.17) выбору и* [к] из решения задач на максимум гамильтониана Яо*, вообще говоря, не имеет места. Утверждение, вполне аналогичное «непрерывному» принципу максимума, удается сформулировать только для более частных клас- сов задач. Теорема 6.2 (дискретный принцип максимума). Пусть go(x, и, /с) = 0, б?0(х) непрерывно дифференцируема по х, F(x, и, к) непрерывно дифференцируема по х при любом u^U и линейна по и. Тогда для того, чтобы последовательности (и* [/с]}, {х* [Л:]}, до- пустимые в силу (6.1), (6.6), доставляли минимум G0(ze[Zc/]), не- обходимо, чтобы существовали такие X [k] = X* [Ас], к = 0, ..., kf — 1, что при и [7с] = и* [к], х [Zc] = х* [&] удовлетворяются уравнения дН. 8G. .....(«да где Hht.tf[k]F(x[k],u\k],E). (6.20) При этом Hh (х* [Ас], и* [Л], 1* [Ас], к) = max Я* (а:* [Л:], и, X* [к], к). (6.21) иеик Если же F(x, и) нелинейна по и, но дифференцируема, a Uk—вы- пуклые множества, то вместо (6.21) можно записать, что на и* [А] достигается . max 1-^ (х* [к], и, X* [Ас]Й и. (6.22) Доказательство Т.6.2 и некоторых ее обобщений можно найти в [9.2], [9.5]. Возможные приложения аналогичны приложениям обычного, принципа максимума, хотя указанные условия несколько сужают их круг. Подчеркнем в заключение, что из дополнения к Т.2.3 следует: для задач, где целевая функция (6.6) -выпукла по ar[fc], и{к), урав- нения (6.2) линейны, а множества Uk выпуклы, дискретный прин- цип максимума является и необходимым, и достаточным условием оптимальности.
g 7. ПОНЯТИЕ О ЧИСЛЕННЫХ МЕТОДАХ ОПТИМИЗАЦИИ 461 § 7. Понятие о численных методах оптимизации 7.1. Конечномерная параметризация. Построение точных реше- ний в задачах управления возможно лишь в немногих ситуациях. Основным подходом к решению реальных задач является прибли- женная численная оптимизация. Проблеме организации вычислительных методов посвящена огромная литература, и достаточно полное знакомство с ними тре- бует изучения самостоятельных курсов *). Здесь мы ограничимся лишь некоторыми общими понятиями и основными конкретными рекомендациями. Прежде всего подчерк- нем, что любая проблема оптимизации есть проблема выбора из до- пустимого множества вариантов того, для которого оптимизируемый показатель достигает наилучшего значения. Если допустимое множе- ство конечно, то в принципе возможна оптимизация путем полного перебора по схеме: а) перенумеровать все варианты {и’}, з = 1, ..., 5; б) последовательно для каждого з, начиная с з=1, вычис- лить /{»*); в) сравнить это значение с лучшим из предшествующих («ре- кордом»); г) отбросить вариант, если он дает значение хуже «рекорда», а в противном случае запомнить его как новый «рекордный», после чего перейти к следующему. Полный перебор требует времени, равного произведению числа вариантов на время вычисления показателя. Напомним, что в задаче оптимизации программы управления вычисление одного значения показателя Ли,) требует интегрирования системы дифференциаль- ных уравнений, что само по себе связано с большими затратами. Более того, лишь в. немногих задачах мы сталкиваемся с конечным множеством вариантов. Как правило, в исходной постановке выбор осуществляется на бесконечном множестве функции. Основной выход заключается в использовании тех или иных представлений о непрерывности, т. е. того свойства, что мало от- личающимся между собой вариантам управлений соответствуют мало отличающиеся»значения показателя. Возможен простейший подход: отрезок работы [£0, tf] (если таковой фиксирован и конечен!) разделяется на конечное число к, отрезков (шагов сетки), на каж- дом шаге допускается конечное число I вариантов значений. Далее предполагается, что значение на любой из допустимых функций мало отличается от значения на какой-либо из описанного конечно- го набора кусочно-постоянных функций. Общее число S таковых _hf в наборе, очевидно, равно I . Показательный рост числа вариантов ♦) В качестве пособий можно рекомендовать, например, книги [9.18], [9.21], Начальные сведения можно почерпнуть из [9.17.].
462 гл. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ с ростом числа шагов делает простейшую процедуру полного пере- бора, как правило, неприемлемой. Второй, практически более используемый подход заключается в конечномерной параметризации множества допустимых управле- ний. В основной форме он сводится к замене поиска на множестве всех допустимых функций поиском на множестве кусочно-постоян- ных функций, различающихся их значениями и [А], к = 0, ..., к, — 1, на каждом шаге сетки. Показатель качества при этом становится функцией конечного числа kf переменных (если u(t) скалярно). Существенно, однако, что она задана не в явной аналитической фор- ме, а лишь алгоритмически (можно рассчитать значение показателя при любом конкретном значении набора {u[fc]}). Наряду с указан- ной основной формой используется также параметризация путем сужения до множества функций вида N u(t) = 2 ОДМО, (7-1) fe=i где <p/(f) ~ заранее заданные функции, например, многочлены, а вы- бору подлежат значения коэффициентов ск в представлении (7.1), т. е. опять-таки показатель оказывается функцией конечного числа неизвестных с*. Исходные ограничения типа /еф0, tf] (7.2) переходят в ограничения на введенные неизвестные. При этом ос- новной способ параметризации имеет то преимущество, что ограни- чения типа (7.2) естественно переходят в. ограничения u[k]^U, к = 0, kf — i, (7.3) на каждую переменную в отдельности. 7.2. Локальные методы поиска безусловного экстремума. Пусть параметризация каким-то образом проведена. Спрашивается теперь, как решать возникшую задачу поиска экстремума функции многих переменных? Обозначим их для унификации как вектор у размер- ности N, а зависимость от них показателя — через F0(y). Ясно, что «школьный» способ: найти экстремум, решая систему N уравнений ^ = 0,. /=1,...,JV„ (7.4) явно не проходит, поскольку а)/ неизвестна аналитическая зависи- мо мость для производных б) решать численно систему большого числа нелинейных уравнений почти так же сложно, как решать за- дачу оптимизации; в) даже если решение найдено, остается неиз- вестным, обеспечивает ли оно именно минимум, а не другую экстре- мальную точку, и если минимум, то обязательно ли глобальный, на воем множестве возможных значений у. Наконец, остаются трудно-
§ 7. ПОНЯТИЕ О ЧИСЛЕННЫХ МЕТОДАХ ОПТИМИЗАЦИИ 463 сти, связанные с наличием ограничений: искать переменные у, X, удовлетворяющие системе необходимых условий, указанных в Т.2.2, еще сдожнее, чем решать уравнения (7.4), соответствующие задаче на безусловный экстремум. Поэтому основными способами решения задач минимизации (или максимизации) функций многих переменных являются итеративные (последовательные) процедуры локальной оптимизации. Эти про- цедуры основываются на следующей схеме: а) задать начальное приближение yw; б) вычислить Fly0)-, в) оценить поведение F(y) в малой окрестности у0; г) выбрать г/(1) как лучшее из значений в этой окрестности и перейти к б), если F(у1) лучше F(yr>), или остановить поиск в про- тивном случае. Схема локального поиска напоминает схему перебора, однако в ней, во-первых, заранее не фиксировано множество вариантов, а во-вторых, остановка происходит при достижении локального экстремума. Естественно, что эффективность локального поиска рез- ко зависит от выбора удачного начального приближения как в смысле требуемого числа шагов, так и в том, что различный вы- бор может привести к различным локальный экстремумам, не каж- дый из которых, вообще говоря, является глобальным. Существует множество способов реализации пп. в) и г) общей схемы. В наиболее распространенных способах оценка локального по- ведения осуществляется путем построения линейной аппроксима- ции: считается, что F(y^F(y4 + (c°r(y-y°}, (7.5) где с° —вектор коэффициентов, который можно принять равным градиенту ^-\ о,; если таковой вычислим непосредственно. В про- у ’у=У тивном случае обычно используется оценка типа разностной 0 Sf\ F(y°1, + ------------A ’ (7’b) при достаточно малых А. После этого лучшей считается точка у'1’, в которой достигается максимум (минимум) линейной аппроксимации в пределах окрест- ности р°. Если эта окрестность — шар радиуса в°/1с°|, то, очевидно, _ yw = ±ev, ' где «+» соответствует максимуму, а «—» — минимуму. Если с° совпадает с градиентом (или его оценкой) , то = о. (7.7)
464 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ Формулой (7.7), повторяемой на каждом, шаге, характеризуются методы градиентного типа. Очевидно, что последовательная про- цедура останавливается только в той точке, где точно или прибли- женно удовлетворяются требования безусловного экстремума. Число потребных для этого итераций, вообще говоря, не ограничено*). Поэтому, как правило, вместо условия остановки, указанного в ос- новной схеме, используется условие (при минимизации!) F(y<‘*‘>)-f(y<‘’)<eF, (7.8> где еF — заданная точность по критериальному показателю. Более эффективными могут быть методы, основанные на квад- ратичной локальной аппроксимации (ньютоновского типа). Не оста- навливаясь на них детально, укажем, что вместо (7.7) они приводят к формуле P(1) = y<o)-e°3egl п,: (7.9) где В° дает ту или иную оценку матрицы, обратной к матрице вто- рых производных в точке у0. 7.3. Задачи математического программирования. При наличии ограничений процедуры (7.7) или (7.9) непосредственно не годятся. Остановимся на Основных их модификациях, учитывающих ограни- чения. Пусть задача представлена в виде общей задачи нелинейного программирования (НП) min {F0(y)/Fi(y) = Q, i = l, ..., r„ F((y)<0, i = rs + 1, ..., r). (7.10) Логически наиболее простой процедурой решения является схема проектирования градиента. Пусть ут е У, где У — допустимое мно- жество. Тогда (7.7) модифицируется следующим образом: {дР I 1 ?”±90^-0 (7.11) И 1У=!/ > где оператор Пу определяет проектирование на У, т. е. (У, если у е Y, Пу М = ' (7.12>- 1 . ( х*, если y^Yt где х* — решение вспомогательной задачи mindly — хУхе= У), (7.13) т. е. х* — ближайшая к заданному у точка в множестве У. Ввиду сложности вспомогательной задачи процедура проектиро- вания градиента имеет преимущественно теоретическое значение, ва исключением простейшего случая, когда ограничения в (7.10) ») Условия сходимости приведены в гл. 11, § 2.
§ 7. ПОНЯТИЕ О ЧИСЛЕННЫХ МЕТОДАХ ОПТИМИЗАЦИИ 465 являются покомпонентными У = / = 1, ..., М. . (7.14> Проектирование на такой параллелепипед производится элементар- но: значение компоненты, вышедшей за пределы допуска, заменя- ется на ближайшее допустимое, так что (7.11) имеет вид уТ = У^ y°i <Уп у?<у°<уи (7.15) где В других случаях часто используют различные варианты метода штрафных коэффициентов: например, задача (7.10) заменяется на задачу безусловной минимизации функции Fo (У) + 2 (у) + 2 (Fi (у) + 1=1 i=r +1 (7.16) где — «штрафные» коэффициенты, a vt — вспомогательные пере- менные, служащие для преобразования неравенств в равенства. Очевидно, что при достаточно больших kt решения (7.10) и (7.16) должны быть близки. Второй общий подход связан с линеаризацией зависимостей, вхо- дящих в (7.10). Дело в том, что в случае, когда функции Ft(y)r 1 = 0, ..., г, являются линейными (7.17> >1 с явно заданными числовыми коэффициентами ai}, bt, задача (7.10) является задачей линейного программирования (ЛП), для которой разработаны специальные алгоритмы и программы, входящие в ма- тематическое обеспечение всех ВЦ. Здесь нет необходимости описы- вать какие-либо из этих алгоритмов, которым посвящены многие учебные пособия (см., например, [9.7], [9.9], [9.14], [9.18]) . Подчеркнем лишь, что высокая эффективность стандартных про- грамм делает возможным использовать решение задач ЛП в качестве промежуточных процедур в итеративных схемах решения нелиней- ных задач. Пусть ут—начальное приближение. Пусть в окрестности yw произведена линеаризация всех функций Ft(y): dF. 1т (у) ((/°) + —i (y-y°)t i = 0,...,rf у *у=у 30 а, а. Первозванский
. 466 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ так что можно приближенно записать j Л(У)-24аО -b°it (7.18) j j=i i где 6F, 1т -W) + ^ \у=у аГ <•’ Oi *3 iv=v — величины, подсчитываемые при заданном у0. С точностью до при- ближения (7.18) задача (7.10) становится задачей ЛП. В нее, одна- ко, следует ввести дополнительные ограничения, обеспечивающие невыход за пределы окрестности у0, в пределах которой приемлемо линейное приближение (7.18). Окрестность можно задать линейными же ограничениями -ДКу,-у?<Дк / = (7.19) (размер окрестности может меняться от шага к шагу)’. Таким образом, следующее приближение у(1) может быть найде- но как решение задачи ЛП вида !n / N N 2 аозУif 2 а1зУз = bit * = 11 • • •! г1>; 5 аиУз bit 3=1 I i=i з=1 t == Г1 + I* * •.* г; — Д? у, У] Д;,: / — ls • .»ж (7.20) Отметим, что типовые пакеты программ ЛП имеют модификации, специально ориентированные на наличие двусторонних ограничений типа (7.19). 7.4. Оптимизация дискретных систем. Вернемся теперь к основ- ной проблематике — оптимизации программ управления. Начнем с рассмотрения дискретных по времени систем. Пусть, как и в § 6, требуется найти последовательность {«[А:], к — 0, ... ..., kt — 1), доставляющую минимум функции *) J{n} = G0(a:[A:/]) (7.21)’ при условиях, что х[й+1] = ^(х[Ц u[fc], к), к = 0, kf —1, a>[0] = z° (7.22) и u[k]^Uh. (7.23) Здесь х [А] — n-вектор, и [/с] — ттг-вектор. Ясно, что задача (7.21) — (7.23) является задачей на условный экстремум типа (7.10), но имеющей специальную структуру ограничений. Общее число вы- бираемых переменных равно kf(n+m) и для любой реальной зада- ♦) Сумму, фигурирующую в функционале (6.5), можно учесть и в записи (7.21), (7.22), если расширить пространство состояний.
§ 7. ПОНЯТИЕ О ЧИСЛЕННЫХ МЕТОДАХ ОПТИМИЗАЦИИ 467 чи очень велико. Поэтому непосредственно применять к такой задач© общие процедуры НП малоэффективно. Остановимся на возможно- стях использования особенностей структуры ограничений в рамках схемы последовательной линеаризации, где на каждом этапе при- ходится решать задачу ЛП, данные для которой находятся путем линеаризации в окрестности очередного приближения. Для простоты будем считать, что множества UK заданы линейными соотношениями. Пусть принято некоторое начальное приближение для управле- ния W [А:]}. Соответствующее начальное приближение {ж® [А:]} для изменения состояния находится путем рекурренции по формуле (7.22). Тем самым определяется и начальное значение критериаль- ной функции /{»’} = G [ж’(MJ. (7.24) Далее произведем линеаризацию уравнений (7.22)’ в окрестности {и® [А:], ж® И). Тогда бж[А:] Д ж [А:] — ж® [ж], би [А:] Д и[к} — и® [А:] будут связаны уравнением в вариациях бж [к + 1] = А° [&] бж [А:] + В° [А:] би [Аг], бж [0] = 0,. (7.25) о 5°[*)Д^ Линеаризуя также критериальную функцию, имеем J{u} « G [ж® [&,] ] + (с® [А:]) тбж [А:,], (7.26) Тем самым задача поиска лучшего следующего приближения в ма- лой окрестности типа (7.20) приобретает здесь следующий вид: найти u(1)[A:] = u0[A:] + 6u[/c], доставляющее минимум линейной функции 6J°&(c0Y6x[kf] (7.27) при условиях (7.25), а также требованиях, что и® [А:] + би [A:] s Uk, к = 0, ..., kf — 1, (7.28) и покомпонентно ограничены вариации управления Д°^би[А:]< Д°, Аг — 0, ..., к}-1, (7.29) где Д’, Д® — векторы, задающие размер отклонений, допустимых для обеспечения точности линеаризации. По общей логике следовало' бы добавить и ограничения на размах бж [А:], но нетрудно убедиться, что диапазон изменений переменных состояния остается ограничен- ным (при конечном &/)., если ограничены би [А], и выбором Д’, Д* 30*
468 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ |Я можно добиться достаточной точности аппроксимации, даваемой й уравнением в вариациях. Задача (7.27), (7.25), (7.28), (7.29) является задачей ЛП, число || переменных в которой совпадает с числом переменных в исходной s нелинейной задаче. Однако ее можно упростить, исключив перемен- 1 ные бх[А] и явно выразив (7.27) только через вариации управлений. ; Несложно показать, что . . Ц fy-i 67 = - 2 (X*[/f])T5°[*]&[^]t (7.30) тде X* [Zc] определяются рекурренцией «вспять»: Х*[й-1] = (Л°Ш)Т%*[4 Х*[/с/-1] = -с4. (7.31) ’Я Действительно, итерируя уравнения в вариациях, получаем &х [£,] = В0 {к, - 1] би [к, - 1] + Л° [kf -1] В4 [к, - 2J би [к, - 2] +.. . ... + Л4[*/-1]...Л°[0]В4[0]би[0]. (7.32) С другой стороны, из (7.31) следует X*[fc,-1] = -C°, Х*^-^--^4^-!])^4, ..и Х*[0] = —(Л4 [&> — !]... Л4 [0])’с4. Очевидно, что подстановка (7.32) в (7.27) и (7.33) в (7.30) дает одинаковые выражения. Поскольку (7.30) дает представление функции (7.27) в виде ли- нейной комбинации вариаций управления в каждый момент к, то мы приходим к замечательно простому результату: исходная задача ЛП большой размерностй распадается на ряд независимых задач оценки наилучшего изменения управления для каждого к: max[(n°[A:])T6u[A:]/u4[A:] + 6u[A:]e U, Д°<6иИ<Д4], (7.34) где я°№Д(В°[й1)тХ*[й]. (7.35) Если множество Uk также определяется покомпонентными огра- ничениями или и[к]— скаляр, то (7.34) решается в явном виде. Конечно, очевидна связь между проведенным построением и резуль- татами § 3, касающимися оптимизации линейных непрерывных си- стем по линейному показателю, а также очевидно, что (7.34) ло- кально выражает дискретный принцип максимума. Подводя итоги, сформулируем алгоритм последовательной линеа- ризации применительно к рассмотренной задаче оптимального управления дискретной системой: а) выбрать начальное допустимое приближение для управления <и4[Ц к = 0, ..., kf — i}; б) вычислить начальную траекторию с помощью (7.22) при и [/с] = и4 [&];
§ 7. ПОНЯТИЕ О ЧИСЛЕННЫХ МЕТОДАХ ОПТИМИЗАЦИИ 469 в) вычислить матрицы п » х=х°[Л] u=u°[ft] х=х*[А] u=u°[A] С° = дх |x=x*[fy] г) найти последовательности X* [А], л* [А] согласно (7.31), (7.35) ; д) решить для каждого к задачи ЛП (7.34), найдя би0 И; е) если 2(л0[/с])т6и°[&]<8, (7.36) А где е — заданная точность, то принять u° [й] в качестве приближенно оптимального управления; в противном случае повторить процедуру, приняв и* И = И + бп° [Ц Правило остановки может быть изменено: при выполнении (7.36) можно повторить процедуру, приняв уменьшенные значения разме- ров зоны Д®, Д® и уменьшив е. 7.5. Задачи с ограничениями на траекторию. Рассмотрим теперь более широкий класс задач, где на траекторию наложены огра- ничения 1=0, t = 1, ,.., г,. Gi(xlM) <0 t_r ,4 г (7.37) Вновь примем схему последовательной линеаризации, однако теперь придется провести оценку приращений всех функций Gf. В точности .повторяя выкладки, проведенные применительно к G0(x), получим Gt(хIM)— S (л?[Х])тби[&],; (7.38) к—о где (7.39) а векторы X* [fc] определяются рекуррентно: X- [fe - 1] = (A» [A])T Xt [Л], X* [kf -1] = - 4 (7.40) т. e. согласно уравнению (7.31), но при других граничных условиях »Л^| Cj A ~s~ I - °s” дх |x=x°[AyJ (7.41) Задача ЛП для вычисления лучшего допустимого приращения с учетом дополнительных ограничений принимает вид: найти би® [Ц доставляющее максимум kf— 1 2 (л°[Л])т би [Л] (7.42) ь=о
470 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ • при ограничениях h'~l . п . . ( =^(£*>(^1), 7-1,. ...,гн 2 («’[*])тби[А] . „ . ; н (7.43) fc=0 I («»[*/])> 1, ...» г, ив[к] + би[к]еи, Л°^6и[к]^Д°, А —О, .... к,-1. (7.44) Видим, что наличие ограничений на правом конце траектории суще- ственно усложняет задачу: здесь уже невозможна декомпозиция на независимые задачи определения каждого из 6и° [As]. Поскольку сложность решения задачи ЛП определяется главным образом числом связывающих ограничений (7.43), то можно ис- пользовать различные приемы, позволяющие уменьшить это число- или вовсе избавиться от них. Наиболее известной является процеду- ра Данцига — Вулфа (см., например, [9.8], [9.14]), основанная на введении (7.43) в критерий с помощью множителей Лагранжа и специальной методике последовательного вычисления этих множите- лей. Широко используется также введение ограничений непосред- ственно в исходную критериальную функцию со штрафными коэф- фициентами. Наряду с общими методами понижения размерности, рекомендуе- мыми теорией ЛП, можно учитывать следующее обстоятельство: если для какого-либо i, i = г, +1, ..., г, имеет место G<(** [А,])< 0, то почти наверняка ограничение с этим индексом в (7.43) можно отбросить, поскольку малые изменения его не нарушат. Проверку этого можно провести после решения (7.42)(7.44) или по пред- варительной оценке: если просто подсчитать для каждого к [А] = min {(щ [А]) т8и [к} /и° [А] + би [А] е U, А° би [А] С А°), (7.45) то ограничение можно отбросить при условии, что Gil^°[A]]-SVi[^]<0. (7.46) h Современные пакеты программ ЛП позволяют решать в разум- ное время задачи с десятками тысяч переменных и тысячами огра- ничений, так что реальные проблемы связаны в основном с органи- зацией ввода и вывода данных, поскольку процедура требует много- кратного решения сходных по структуре задач ЛП. Необходимо, однако, иметь в виду одно существенное обстоя- тельство: метод последовательной линеаризации в описанной форме начинает работу только с такого приближения и0 [А], при котором правый конец соответствующей траектории ха [А,] удовлетворяет ограничениям (7.37). По крайней мере, требуется такая точйость их выполнения, чтобы погрешность не превышала возможностей
§ 8. ЧИСЛЕННАЯ ОПТИМИЗАЦИЯ НЕПРЕРЫВНЫХ СИСТЕМ 471 достижения границ на допустимом множестве вариаций, определяе- мом условиями (7.44). В противном случае в качестве предвари- тельной фазы следует решить задачу минимизации суммы штрафов .за нарушение ограничений (7.37) и, только добившись точного или приближенного их выполнения, переходить к основной фазе. § 8. Численная оптимизация непрерывных систем 8.1. Особенности процедуры последовательной линеаризации. Если поставлена задача поиска оптимальной программы управления непрерывной (по времени) системой, то естественным представля- ется простейший путь: перейти к дискретной задаче, как это дела- лось в начале § 6, а затем использовать метод оптимизации дискрет- ных систем, описанный в § 7. Однако существенные преимущества имеет использование процедуры последовательной линеаризации в процессе поиска непосредственно в исходном множестве кусочно- непрерывных функций. Запишем решаемую задачу в общей форме § 1, но без интеграль- ных слагаемых в функционале и ограничениях, которые всегда мож- но учесть предварительным расширением пространства состояний, я фиксируя для простоты начальные условия. Итак, требуется найти n(f), доставляющее минимум ири условиях Ли)« G0[x(t/)] (8.1) х = /(х, и, t), x(t0) = x0, (8.2) tf\, (8-3) ( — 0, i = 1, ..., r,,. Gi[x(tf)]l ' . ' l<0.: i = rr + l, ...tre (8.4) Моменты t0, tf считаем пока фиксированными. Предположим, что известны управление »°(1) и соответствую- щий ему процесс изменения состояний x°(t), при которых выполне- ны все условия. Построим схему локального улучшения начального приближения. Запишем уравнение в вариациях бх = А (1) 8х + В (t) би, 6x(to)==O, (8.5) л(о = х=х°(О* u=u®(0 В (t) == ~ ' ' ди П * x=x°(t) U=U°G) а определим приращения функций 6^ = (С»)тбх(^ >о__dGi * дх (8.6)
472 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ Как и при доказательстве Т.3.1, можно получить представления: Ч- *0 i = О, ..., г,; л® (i) = (В0 (f))T Xf (1),. (8.7> где X® (f) удовлетворяют одному и тому же уравнению Х--[4«(0]’Х, (8.81 но при различных граничных условиях л («/) = -с?. (8,9> Для оценки улучшающей поправки 6u°(f) получаем задачу max J (л® (t))T 8и (t) dt (8.10> /о _ при условиях Jм«))&,(Оdt!“b." ‘“г'+Г" г <8Л1> / I ° i t ‘ = 'l + и°(О + бгг(Ое^, A°^6u(Z)sSA°, (8.12) где b<-GW (tt)]. Если ограничений (8.11) нет, то задача сводится к простейшей: задаче управления линейной системой по линейному критерию (§ 3): она распадается на решение независимых задач максимиза- ции (лд(^)т 6u (t) при ограничениях (8.12) для каждого момента t, причем часто можно найти решение в явной форме. В противном случае мы имеем дело с бесконечномерной задачей ЛП, для которой нет прямой схемы решения. Поэтому приходится использовать ее конечномерную параметризацию, считая 6u(t) ку- сочно постоянной функцией, принимающей значения и[&] на каж- дом /с-м участке постоянства: 6и(/) —щ,, А —О, ... (8.13)* После этого мы получаем задачу ЛП типа (7.42) 4-(7.44). Каза- лось бы, мы пришли к первоначальной идее замены непрерывной задачи на дискретную. Однако это не совсем так. Во-первых, изменился способ вычисления коэффициентов л® [А]. Теперь они должны находиться по формулам *й+1 ' л® [А] = J л® (t) dt. h<. ' . ' •
§ 8. ЧИСЛЕННАЯ ОПТИМИЗАЦИЯ НЕПРЕРЫВНЫХ СИСТЕМ 473 Во-вторых, что значительно более существенно, новое приближение для траектории xw{t) вычисляется не с помощью рекуррентного, соотношения (6.1), (6.4), а с помощью исходного дифференциаль- ного уравнения (8.2). Подставляя в него построенную функцию и(0 = и(1)(0Аи<0)(*) + 6и(о>(«), tf],; (8.14) получаем точное значение критериальной функции, достигаемое .при управлении u(1,(t). Может, конечно, возникнуть естественное возражение: ведь ни уравнение (8.2), ни уравнение (8.8) для мно- жителей в общем случае нельзя проинтегрировать точно, приме- нимы только схемы численного интегрирования, в которых вновь .используется дискретизация по времени! Такое возражение разум- но, однако оно в основном снимается тем, что численное интегри- рование уравнений (8.2) и в особенности (8.8) можно вести с дру- гим, существенно более малым шагом, чем тот, который был при- нят при параметризации управлений. Действительно, выбор шага при оценке £>u{t) лимитировался возможностями решения задачи ЛП (уменьшение его увеличивает число переменных). В то же время численное интегрирование таких жестких условий не ста- вит, а кроме того, можно использовать и ряд специальных схем численного интегрирования, отличных от простейшей процедуры перехода к рекуррентным соотношениям (6.1), (6.4). Если же численное интегрирование вести с тем же шагом ik+i — tk, что и в (8.13), то, конечно, новая процедура совпадает с простейшей. Вычислительный опыт (см., например, [9.21]) позволя- ет решительно высказаться против простейшей схемы. Наконец, стоит отметить, что «происхождение» конечномерной задачи.ЛП (7.42)н-(7.44) от непрерывной (8.10)-?-(8.11) вносит в нее существенную особенность: чем меньше шаг сетки th+i — tk, тем ближе становятся векторы л" [к] для соседних значений ин- декса к. Поскольку наиболее распространенный алгоритм решения задач ЛП {симплекс-метод) включает в себя операцию обращения мат- риц, составленных из векторов л" [&]> то эти матрицы могут ока- заться близки к особым, что приводит к накоплению ошибок. По- этому может' оказаться необходимым использовать либо специали- зированные алгоритмы типа двойственного симплекс-метода [9.22, с. 437], либо вносить изменения в сам стандартный симплекс- метод [6.6, с. 65]. 8.2. Другие постановки задач оптимального управления. Кратко остановимся на модификациях метода последовательной линеа- ризации при некоторых отличиях постановки от основной (8.1), (8.4). А. Наличие управляемых параметров. Пусть наряду с управле- ниями w(Q, для которых возможно изменение за время работы системы (в пределах допусков), имеется еще возможность выбора
ML ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ некоторых параметров, постоянных величин, а — const (также в пределах некоторого допуска Схема последовательной ли- неаризации в принципе работоспособна и здесь, но при вычислении вариаций функционалов Gf[x(tf)], вызванных вариациями парамет- ров ба, в них добавляются слагаемые («®)тба, где коэффициенты а®, называемые коэффициентами чувствительности функционалов по параметрам, могут быть вычислены различным образом. Например, можно считать, что ба — частный случай вариации: fhi(t) при би (£)—const, и воспользоваться правилом, аналогичным (8.7) -г (8.9). Тогда a?=’f(₽°(t))Tii(O^.; (8.15) ‘о где %?(*) вычисляются, как и ранее, в силу (8.8), (8.9), а P°(t) дтг x=x°(t) _____,о а—а u=u°(t) (8.16) Б. Нефиксированное время окончания. Поскольку tt здесь явля- ется управляемым параметром, то задача в принципе относится к: тому же классу, что и предшествующие. Это особенно ясно, если t ~ (п ™ предварительно произвести замену времени, введя т = ------Тог- tf % да (8.2) перейдет в уравнение (tf— t0)f[x, и, t0 + (tf — t0)r], 0<т<1, (8.17) а условия окажутся заданными на концах фиксированного отрезка [О, 1]: a'k=o==a'°,: Gi(х |r=i) 0, г==1,;,, ., г. (8.18) В. Ограничения на переменные состояния. В основной постанов- ке ограничения вводились только на конце траектории. Одако во. многих практических задачах требуется ограничить возможные из- менения состояния в промежуточные моменты времени. Если этих моментов конечное число, то в основную процедуру вводятся лишь незначительные изменения. Действительно, пусть, вместо (8.4) фигурируют ограничения Gila(ti)] = О, г = 1,...,г,; .19) где моменты /, не обязательно совпадают с tt. В задачу оценки улучшающей поправки 6u°(t) войдут ограничения на возможный вариации функций £.[#(£()]> которые запишутся в том же виде
g 8. ЧИСЛЕННАЯ ОПТИМИЗАЦИЯ НЕПРЕРЫВНЫХ СИСТЕМ 475 . I ‘ (8.11) с заменой t, на tt и с учетом того, что при вычислении мно- жителей граничные условия (8.9) устанавливаются при f = Сложнее ситуация, когда ограничения на переменные состояния требуется выполнять на отрезке t}] или на некотором его интер- вале. При этом, как правило, приходится идти простейшим путем: расставить на интервале конечное число точек и перейти к зада- нию ограничений в виде (8.19). Можно учесть, что при наличии ограничений в форме неравенств вместо фиксированной на все ите- рации сетки точек t( стоит расставлять эти точки только на тех интервалах, где текущее приближение выходит на ограничение, я в небольшой их окрестности, где возможен такой выход при ма- лом варьировании управления. Г. Минимаксный критерий. В предшествующем рассмотрении неявно предполагалось, что все фигурирующие в формулах произ- водные действительно существуют. Это предположение существен- но для того, чтобы можно было построить линейные зависимости вариаций показателей бфг(Ь)] от малых изменений управлений. •Однако для ряда популярных способов оценки качества такое по- строение невозможно. Начнем с простейшего случая. Пусть требу- ется минимизировать показатель вида Go I® («/)] == max 1ft I W) |, j = 1„ ,,. n],. (8.20) 3 т. e. обеспечить минимум наибольшего из покоординатных откло- нений (с учетом весов gj > 0) от нуля. Функция Go (х) недиффе- ренцируема. Ее приращение в силу малых изменений управления .нельзя записать в виде (8.7). Вместе с тем почти очевидна эквивалентность задач min (max [gj ж, (fy) |, / = 1, « I i ' ) и min {z/ qjXj (tf) — z 0, / = 1, ..., n, u (t/) z 0, 7 = 1,),,.} (8.21) где z — новая скалярная переменная. Теперь показатель линеен по z, но появились новые ограничения стандартного типа. Попытаемся применить тот же прием при решении задач, где критерий не имеет стандартной формы, а представим в виде J{u} = max фо (я, t)f (8.22) или J {и} = max ф [x(tf, a)]t (8.23) где параметр а входит и в описание объекта. К задачам типа (8.22) относятся задачи выбора управления с щелью обеспечить наименьшее отклонение некоторого скалярного
476 гл. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ выхода системы y(f)== Фк(О] от заданной функции ^(i) в течение- всего времени работы системы. Тогда . . фо(ж, t)= l#r(/)]-p<i(f)|. (8.24) Это так называемые задачи о наименьшем уклонении, весьма важ- ные для приложений. Используем эквивалентность тштахф0(ж, t) о min {z/ ф0(ж, t) — z^O, t^[t0, fy]} (8.25) u t и • или в случае (8.24), когда сама функция ф0 (х, t) недифференцируе- ма, перейдем к задаче min {г/ ф[х(£)] — yd(t) — z^O, — ф [#(£)] + yd(t) — z^O} (8.26) u с «гладкими» ограничениями (если ф дифференцируема) на пере- менные состояния. Далее можно применить приемы, описанные в н. В. . Пример 8.1. Рассмотрим простейшую линейную систему, описы- ваемую скалярным уравнением g = -/(f)+ii(f), 0<t<th у(0) = 0, у(0) = 0. (8.27) Требуется выбрать управляющее воздействие u(t) так, чтобы ми- нимизировать J {u} = max | у (t) [,. (8.28) t причем u(t) ограничено: \u(t) I sS 1, a /(f) —заданная функция времени. Подобная задача впервые возникла в связи с проблемой оптимизации защиты механического агрегата от ударных воздей- ствий [9.10]. В такой интерпретации f(t) имеет смысл заданного ускорения основания, у(t)—перемещение агрегата относительно ос- нования, a u(t) пропорционально усилию, передаваемому на аг- регат защитным устройством, помещенным между ним и основани- ем. Оптимизация обеспечивает минимальные габариты («свободный ход») защитного устройства. Если |/(£)|®С1, OsUCT, то существует тривиальное решение и*(*) = /(г), y(t)^O, J{iz*)=O, т. е. управление полностью компенсирует возмущение. Нетрудно показать, что при /(0“{ о’ t > tlz
g 8, ЧИСЛЕННАЯ ОПТИМИЗАЦИЯ НЕПРЕРЫВНЫХ СИСТЕМ 477 оптимальным является управление простого вида *) (рис. 9.7) ; г । u*(t)==| 0’ О /о^и f — j /{и*}=МГ-2^- При более сложных знакопеременных воздействиях дать точное решение затруднительно. Вместе с тем применима общая методика, описанная выше, и к тому же в простейшей форме, в силу линей- ности объекта [9.16]. Запишем задачу в виде* ( t min z/ y(t)<z^ —y(t)<zA y(Z) = f (i —т)гг(т)йт —yz(«), u (. о |m(£)|<1, *6=[0,;T]|, (8.29) где уравнение движения явно проинтегрировано и обозначено t У/(0 = J(f —т)/(т) йт. о Эта задача сама по себе является задачей ЛП, и нет необходимости в последовательной линеаризации, а также введении дополнитель- ных ограничений на изменение уп- равления, обеспечивающих эффектив- ность линейного приближения. Во- лее того, интегрирование уравнений произведено^ точно. Далее можно пе- рейти к сеточной аппроксимации. Управление разыскивается как ку- сочно-постоянная функция, определя- емая значениями ил /— 1, ..., 2V. Выполнение первой группы нера- венств для всех t е [О, Г] заменяет- ся требованием их выполнения на узлов LN, L> 1. Тем самым прихо ЛП вида более частой сетке с числом дим к конечномерной задаче С N N min \z/ z — 2 aUui z -)- У, а^и, — bit 1 = 1, ..., LNX U I j—1 3=1 |uj<l, 7 = 1, (8.30) где коэффициенты atj, b( очевидным образом вычисляются. Задачи вида (8.29) успешно решались таким путем с помощью стандарт- ной программы ППП ЛП АСУ при весьма сложных воздействиях *) На самом деле здесь оптимальное управление не единственно при t > /0Ц.
478 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ j(t), представляющих собой суперпозицию слабо затухающих гар- моник с резко различными частотами. Основные вычислительные проблемы связаны с выбором шага дискретизации. Практически ре- комендуется постепенное увеличение шага с контролем изменения соответствующего значения размаха отклонений maxlp(f) I*). Если 4 эти значения перестают существенно меняться, то дробление шага прекращается. Другая возможность формирования правила остановки, указан- ная в [9.16], заключается в использовании теории двойственно- сти задач ЛП, позволяющей дать оценку снизу для оптималь- ного значения функционала. Достаточное сближение этой оцен- ки с величиной найденного размаха отклонений и является сигна- лом остановки счета. □ Задачи с критерием типа (8.23) также формально могут быть сведены к задачам вида min{z/ <р[х(//, а)] — 2^0 для всех u(t) Здесь вновь имеется континуум ограничений. Если а — скаляр, а множество является отрезком, то ситуация не отличается от только что рассмотренной: можно использовать фиксированную или меняющуюся сетку значений а на отрезке, требуя выполнения ог- раничений только в точках сетки. Для векторного параметра этот прием также реализуем, но необходимое число точек на сетке мо- жет оказаться слишком обременительным. К классу минимаксных относятся и задачи [9.12], в которых требуется выбрать управление, минимизирующее наибольшее зна- чение G0[x(fz)], достигаемое на множестве всех допустимых функ- ций w(t), входящих в описание объекта: х — fix, и, ip(f)]. Здесь щ(£) обычно интерпретируется как возмущение, действующее на объект, о котором известно только то, что оно является кусоч- но-непрерывным и принимает значения из некоторой ограниченной области W. Задачи такого рода являются наиболее сложными в вы- числительном отношении. Конечно, и здесь возможно сужение до- пустимого множества до конечного множества вариантов Wo, а тем самым переход к задаче min{z/ w(f)]) —z<0, u(t) т. e. задаче с конечным числом ограничений, но требования к до- ♦) Расчет этой величины ведется параллельно по вычисленному на каждом приближении виду закона управления с помощью точной формулы.
в 8. ЧИСЛЕННАЯ ОПТИМИЗАЦИЯ НЕПРЕРЫВНЫХ СИСТЕМ 479 статочно «плотной» аппроксимации исходного множества приводят к большому разрастанию их числа *). 8.3. Выводы. Подведем итоги проведенного краткого и далеко не полного обзора численных методов. А. Имеются достаточно эффективные методы, в частности, метод последовательной линеаризации (дополняемый иногда методом штрафных функций для получения почти допустимого решения), которые позволяют последовательно улучшать «угаданные» началь- ные приближения в очень широком классе задач. Б. Основные методы носят локальный характер, используют ло- кальную аппроксимацию критериальных функций и уравнений из- менения состояния, поэтому в лучшем случае с их помощью можно получать локально оптимальные решения, которые лучше «сосед- них» в пределах допустимых малых вариаций. Вопрос о сходимо- сти последовательных итераций недостаточно хорошо изучен, хотя практические вычисления, как правило, дают разумные результаты. В. До применения локального метода рекомендуется провести предварительную оптимизацию путем полного перебора хотя бы на очень грубой сетке вариантов управлений (описанная в начале па- раграфа схема). Локальные улучшения стоит начинать только с ото- бранного варианта. После остановки последовательных приближе- ний (отсутствует или мало изменение функционала на множестве малых допустимых вариаций) целесообразно провести «зондирова- ние» с помошью почти «игольчатых» вариаций, распространяемых на всю область U допустимых значений, но имеющих достаточно малую ширину для сохранения линейной зависимости приращений функционала от их уровня. Эффективным является и повторение процедуры последователь- ного улучшения, если имеется вариант управления, сильно отли- чающийся от принятого за начальный в первом «запуске» процеду- ры, но дающий не слишком плохое значение функционала. Самое главное заключается в том, что реальное применение чис- ленных методов требует четкого понимания существа задачи и осо- бенностей вычислительных процедур. Успех определяется: а) пра- вильным выбором набора исходных вариантов: б) разумным выбо- ром сеток для удовлетворения ограничений и в особенности про- цедур численного интегрирования; в) правильным назначением па- 7 раметров А, А, задающих зону линейности. Эта «разумность и пра- вильность» достигается не автоматически, а путем накопления опы- та решения реальных задач. Все описанные методы относились к так называемым прямым методам численной оптимизации, не использующим непосредствен- но аналитического аппарата принципа максимума. Однако суще- ствует и большое число численных схем, где за основу берется не *) Математические аспекты см. в [9.9],
480 ГЛ. 9. ОПТИМИЗАЦИЯ ПРОГРАММ УПРАВЛЕНИЯ решение исходной задачи, а поиск набора u*(f), , X*(i)’, удов- летворяющего совокупности необходимых условий оптимальности. Вычислительная практика показывает, что эти схемы приемле- мы только тогда, когда удается аналитически найти выражение u[x(t), Х(/)], доставляющее максимум гамильтониана при произ- вольных x(t), Z(t)- После этого требуется «лишь» рещить краевую задачу для системы дН\ : дн\ “А» “ I -у А ... I Z4 |и= и - Ох |и== и с соответствующими граничными условиями. Фактически здесь вновь возникают тонкие вычислительные проблемы. Удовлетвори- тельное их решение имеется для случаев, когда правые части урав- нений являются достаточно «гладкими» функциями х, X. Возможно, наиболее эффективная схема изложена в работе [9.20]. _ В заключение следует подчеркнуть, что весь проведенный обзор касался только методов оптимизации программы управления. Про- блема синтеза оптимального управления с обратной связью на поря- док сложнее, и ей посвящена следующая глава.
ГЛАВА 10 СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ § 1. Динамическое программирование 1.1. Формулировка задачи. Хотя ряд задач построения оптималь- ных обратных связей уже был рассмотрен выше (оптимизация ли- нейной системы по квадратичному критерию в гл. 6, оптимизация по быстродействию в п. 5.3 гл. 9), но общая формулировка пробле- мы дана не была. Попытаемся дать ее, начиная с наиболее про- стой постановки. Пусть управляемый объект описывается рекуррентным соотно- шением * x\k + l] = F(x[k], и[к], к), к = 0, 1, ..., kt— 1, 40] = хв, (1.1) где, как и ранее, 44 — вектор состояния в момент к, 44 — век- тор управлений, а /Д-)—известная вектор-функция своих аргу- ментов. Требуется, как и в § 6 гл. 9, выбрать последовательность {п*[4, к = 0, 1, ..., kj — i), которая доставляет минимум целевой функции S/—1 J{u}= ^g0^W,u[k],k) + G0{x[kf]^ (1.2) ft=o причем минимизация производится на множестве значений и[к], подчиненных ограничениям и{к} *=Uk, и значений х[к], связанных с и[к} соотношением (1.1). Последовательность {u*[W была названа оптимальной по кри- терию (1.2) программой управления объектом (1.1). Очевидно, что оптимальная программа может быть построена только, если дано полное описание объекта. В частности, требуется знание начально- го состояния, вектора ха. Гипотеза 1. Пусть в момент проектирования системы управле- ния неизвестно состояние, начиная с которого будет работать уп- равляемый объект, однако в любой момент работы возможно полу- чение текущей информации о состоянии в виде наблюдений: у{к} = Ф(ж[А:], к), & = 0, 1, /.. (1.3) 31 А. А. Первозванский
482 ГЛ. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ Соотношения (1.3) формально описывают работу датчиков инфор- мации (ДИ). Обозначим у<т) всю совокупность данных, получен- ных от ДИ к моменту т > 0: У(Т,=(г/[О], у[1], УН). ; < (1.4) Определение. Если существуют функции п*(у<т), т), т = 0, 1, ..., kt — 1, (1-5) такие, что значение функционала (1.2), вычисленное на траекто- риях, системы (1.1) после подстановки и[к] = и* (yw, к), к = 0, ..., kf — 1, совпадает с его значением /{и*} при оптимальной программе уп- равления для любых ха, то функции (1.5) определяют оптимальный закон управления с обратной связью. Построение таких функций называется синтезом оптимальной обратной связи. Вектор у‘х> часто называют вектором полной текущей информации, так что в резуль- тате синтеза управление строится как функция от полной текущей информации. . ' Существование оптимальной обратной связи в смысле приведен- ного определения отнюдь не гарантировано. Первоначально мы ука- жем принципиальную процедуру построения оптимальной обратной связи при дополнительном упрощающем предположении. Гипотеза 2. По сигналу у[к] однозначно определяется состоя- ние объекта х[к] в тот же момент к. Очевидно, что в рамках гипотезы 2 наличие наблюдений у(т) эк- вивалентно знанию состояния объекта во все моменты времени А "Ст. Однако вектор состояния х[т] потому так и называется (см. гл. 6), что его значение полностью определяет все будущее (при 7с>т) поведение объекта при любых заданных воздействиях, т. е. для знания будущего поведения достаточно задать х[х], а инфор- мация о всех предшествующих значениях вектора состояния х[к], к < т, оказывается излишней*). Поэтому при выполнении гипоте- зы 2 без ограничения общности можно разыскивать оптимальную обратную связь как функцию текущего состояния иИ = и*(х[к}, к). (1.6) 1.2. Уравнения динамического программирования. Для поиска оптимальной обратной связи вместо исходной задачи (1.1), (1.2) рассмотрим последовательность задач min S go(^L &) + GoCM&y]) A^(X, t),; (1-7) *) Это свойство иногда называют марковским, по имени великого матема- тика А. А. Маркова (1856 — 1922). Обобщенная вероятностная формулировка марковости дается ниже.
§ 1. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ 483 (1.8) где минимизация производится при условиях, что х[к + 1] = F (х[/т], и[/с], к), = х, При этом х — произвольный, фиксированный как параметр вектор, и при т>0 выбору подлежит лишь часть управляющей последо- вательности u[k]^Uk, x<k^kt -1. (1.9) Функции $(х, х) можно интерпретировать как минимальные затраты на работу системы, если она начинается в произвольный момент т из произвольного состояния х. По определению &(х, kj) = Ga(x), (1.10) а по смыслу исходной задачи ]{и*}=^(х°, 0), (1.11) если и* — оптимальное управление. Таким образом, в последова- тельности £%(х, т), т = 0, ..., kf, известна последняя функция ^(х, kf), а требуется найти значение начальной функции $(х, 0) при х = хе. Нетрудно установить рекуррентное соотношение, связывающее между собой функции $1(х, х). Запишем согласно определению (1.7), (1.8). & (ж, т) = min \g0 (х, и [т], т) + Й=Г..kf-1 I */-* • + 3 goGMH; и[к\, к) + G0(x[kf]) Будем осуществлять минимизацию в два приема: сначала мини- мизируем по всем значениям управления в «будущем», при к > х + + 1, зафиксировав значение п[т] = и, а затем результат минимизи- руем по и. Учтем при этом, что первое слагаемое зависит только от и: ^(х, т) = min ig0 (ж, и, х) + v£~Uу [ г ч + min X £о(ж1М, “ &) + и[й]епЛ |_a=t+i й=т+1,...Л/-1 (1.12) Обратим теперь внимание, что 2-е слагаемое в фигурной скобке со- ответствует определению (1.7), но с индексом т+1 и, что особен- но важно, с измененным значением 1-го аргумента, поскольку х[х + 1] не произвольно, а в силу (1.8) х[х + 1] = F(x, и, т), (1.13)' т. е. зависит от значения управления и[х] — и. 31*
484 ГЛ. 10. СИНТЕЗ ОПТИМАЛЬНЫХ овратпьтх связей В результате получаем искомое рекуррентное соотношение $ {х, т) = min {g0 (х, и, т) + {F (х, и, т), т + 1]}, (1.14) - u~Ux Соотношение (1.14) принято называть уравнением динамиче- ского программирования*). В принципе оно позволяет, начиная с заданной в силу (1.10) функции <${х, kf), рассчитать всю после- довательность функций $3(х, х) вплоть до $(х, 0), дающей опти- мальное значение критерия (1.2) при произвольном начальном ус- ловии х[0] = х. Более того, очевидно, что если функция и*(х, т) до- ставляет минимум выражению ’ go(x, и, x)-r$[F(x, и, х), т + 1], (1.15) где х рассматривается как параметр, то она может интерпретиро- ваться как оптимальный закон управления с обратной связью по измерениям текущего (в момент к = х) состояния объекта, по- скольку характеризует оптимальный выбор управления при произ- вольном текущем состоянии. Таким образом, динамическое программирование кажется иде- альным математическим аппаратом для прямого решения проблемы синтеза законов управления с обратной связью. Однако при реальном применении динамического программиро- вания возникают существенные трудности. Это, во-первых, вычис- лительные проблемы [10.2] — для реализации схемы необходимо вы- числять и хранить в памяти функции $(х, т), где размерность век- тора х совпадает с порядком дифференциального уравнения объек- та, а во-вторых, имеются и принципиальные проблемы, связанные с тем, что не при любых значениях х может существовать минимум (1.15). Отметим, что логика, приводящая к рекуррентному соотно- шению (1.14), сохраняет силу и в том случае, когда наложены лю- бые ограничения как на конечные, так и на промежуточные значе- ния переменных состояния x(t) или совместные ограничения на значения управления и состояния типа ' ( =0, Gi(x[k\, и [7с]) j 0 *) В ряде случаев исходный функционал можно представить в сколько отличающемся от (1.2): kf—1 /{«)=. У. g(a=jA+l], и\к\, к). h=0 Тогда уравнение динамического программирования можно построить такой же логической схеме, но оно будет иметь форму SS (х, т) = min {g [F (г, и, т), и, т] + Я! [F (г, и; т), х 1]}. u&J - (1.16) виде, не- по почти (1.14')
§ 1. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ 485 При этом кажется необходимым лишь ввести добавочные огра- ничения на область возможных значений параметра х в (1.14) и об- ласть поиска оптимизирующих значений и[А]. На самом деле требуется дополнительно вводить ограничения, гарантирующие существование решений во всех задачах минимизации выражений (1.15). Не касаясь детально этих тонких проблем, рассмотрим эле- ментарный Пример 1.1. Рассмотрим в весьма идеализированном виде сле- дующую практическую задачу. Имеется стадо, на содержание ко- торого приходится нести определенные затраты. Эти затраты ком*- пепсируются за счет продажи части поголовья. Требуется найти правило управления поголовьем, при котором суммарные затраты (за вычетом получаемого дохода). были бы минимальными. Пусть х[к] — количество голов скота на начало года к, к = 0, 1, ... ..., kh и[к] — количество продаваемых голов скота в году к, к** = 0, 1, ..., kf — 1. На эти величины наложено естественное ограни- чение*) 0 < и\к\ «5 ж[&], к = 0, ..., kt — 1. Поголовье меняется от. года к году в соответствии с соотноше- нием х[к + !] = [} {х[к} — и[/с]), к = 0, ..., kf, где > 1 интерпрети- руется как коэффициент естественного прироста за год поголовья, оставшегося после очередной продажи, совершаемой, по условию, сразу после очередного учета. Требуется минимизировать kf-i J= У {h{x[k]— и [/с]) — си [7с]}, где h — затраты на содержание одного животного в течение года, ас — цена его при продаже в начале года, с > h > 0. Рекуррентное соотношение (1.14) принимает здесь вид & (х, т) = min {hx—(с + h) й + [ф (х — и), т + 1]}, т = 0, — 1, причем Шх, kt)=0. Попытаемся строить последовательно функции &{х, т). Имеем . & (x, kf — 1) = min {hx — {с + h)u} = —cxf 0-^u^x причем u*{x, к, — i) = x, иначе говоря, на последний год сохранять поголовье нецелосообразно, поскольку от него уже нельзя получить доход (последняя продажа возможна только в самом начале года!). Далее, при т = к{ — 2 имеем & {х, kf — 2) = min {hx — (с + h) и — с|3 (х — и)},. *) Целочисленностью величин и(к) здесь и далее пренебрегаем.
486 гл. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ причем учтен вид &(х, — Теперь результат минимизации за- висит от знака при и: и = 0, если Р > 1 + -у,; и = х, если В<1 + —. ’ • С Ч Иначе говоря, целесообразно сохранить все поголовье, если коэффи- циент прироста достаточно велик, а в противном случае избавить- ся от него заранее. Предположим, что параметры соответствуют первому варианту (например, р = 1,2, h — 0, 1 с). Тогда &(х, kf — 1)= — (<ф — h)x, т. е. мы имеем линейную функцию с отрицательным коэффициен- том (затраты не превышают дохода). Очевидно, что рассмотрение дальнейших этапов дает тот же ре- зультат: ч и*(х, т) = 0, TsSfe, —2, т. е. при заданном соотношении между параметрами оптимально сохранение поголовья вплоть до последнего года. При этом оно на- растает по показательному закону х[к] — р*х[0], к — 0, ..., kf — 1, растут и совокупные затраты на содержание fe,-i h 2 ₽^[0], fe=O но они с избытком покрываются за счет дохода, получаемого от продажи перед последним годом: с^~гх [0]. Всюду ранее неявно предполагалось, что все функции $(х, т) оп- ределены только при ж > 0. Чтобы подчеркнуть важность этого об- стоятельства, немного изменим формулировку задачи, добавив ус- ловие, что в конечный момент k = kt необходимо сохранить пого- ловье на уровне не ниже заданного х. В этом случае условие &(х, kf) = 0 задано только при ж>х, а при х<х функция &(х, к/) не опреде- лена. Далее ясно, что допустимы не произвольные начальные ус- ловия на каждом этапе, а лишь такие, при которых возможно вы- полнение конечного ограничения: в момент kt— 1 x[kt — 1] должно быть не менее чем при произвольном т ж[т] —не менее чем
§ 1. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ 487 P'l-h/z, ибо в противном случае даже при отсутствии продаж пого- ловье не вырастает до заданного уровня. Эти ограничения необхо- димо учитывать при минимизации. В частности, в момент kt — 1 должно быть и* (х, кf — 1) = х — -р-,< х - j-. Вид функций @(х, т) показан на рис. 10.1. О 1.3. Непрерывные системы. Основная идея динамического про- граммирования переносится и на непрерывные по времени систе- мы. Рассмотрим задачу минимизации функционала V J{u} = J£о [•*(*)> м(0, t\dt + GokO (1.17) на траекториях системы ®==/[ж» и, & х{1й)==х°, u(t)*=U, которая уже изучалась в § 3 гл. 9 с прмощью принципа.максимума. Введем функцию $ (х, т) = min IJ g0 [х (i), и (0, И dt + Go [x (£,)] , u (1.18) tf > T > /о, где минимизация производится при условиях х ~ f[x(t), u(t), t], t> х, х(х) = х, u(t)e= U. (1.19)1 По определению имеем @(х, tl) = G<>(x), ' (1.20)’ т. е. значения функции S3(x, т) при x = tf заданы. Попытаемся построить уравнение, которое определяло бы зна- чения Я(х, т) в предшествующие моменты времени, имея в виду,
488 гл. 10. СИНТЕЗ ОПТИМАЛЬНЫХ обратных связей что оптимальное значение критерия равно Ли*} = @(х°, i0). (1.21) Рассмотрим два момента времени, т и т + А, А > 0. Тогда, в точ- ности повторяя выкладки, проведенные в дискретном случае, полу- чаем & (х, т) = min щ|)еР 1е[т,т+Д] ’т+Д j gok(i)> “(О, t]dt + , т min u{t)=U 1=[т+Д,(у] Ч J gok(t), u(t),t]dt + G0[x(fz)] .т+Д т+Д j go к (0, «(О, t]dt + г т+Д min v(t)eU <е[т,т+Д] + х+ j u(t), t]dt, т + A [. (1.22) Здесь вновь используется возможность сначала провести выбор уп- равления, начиная с момента т + А, до конца, а затем осуществить минимизацию по значениям управления в пределах отрезка [т, х + А]. Предполагая, как обычно, что a) f[x, и, i] и g0[x, a, i] непрерыв- ны по всем своим аргументам, б) допустимые траектории x(t) не- прерывны по i, в) допустимые управления u(i) кусочно-непрерыв- ны по ^ причем отрезок [т, т + А] не включает точек разрыва, мож- но записать, что т+Д Ах(т)Д J /(x(i), u(t), t]dt = f (х(т), и(т), т] А + о (А) (1.23) т ' Й т+Д . f go^Gh t]dt-golx(x), и(т), x] A + o(A)t (1.24) причем х(т) = x. Предположим дополнительно, что функция т) дифференцируема, и используем формальное разложение [ж + Ах (т), т + А] = (х, т) + А + + + °(д): (!-25)
§ 1. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ 489 Подставив (1.23), (1.24), (1.25) в (1.22), получим _ад mjn (g0 [х~, u(t), т] + (х’V. У/[ж, и (т), т] + u(oeu ( \ i)x ) Д J <е[т,г+Д] Теперь перейдем к пределу при Д -*• 0 и установим справедли- вость при почти любых т уравнения — — = min [g0 [х, и(т), т] + / [х, и (т), т]1, (1.26) от и(т)еп I \дх J J определяющего с учетом граничного условия (1.20) функцию ^(х, т), ta т I/. Уравнение (1.26) принято называть уравнением Веллмана или уравнением Веллмана—Гамильтона — Якоби (в силу аналогии со сходным уравнением Гамильтона — Якоби в аналитической меха- нике [6.1]). Так же, как и в дискретном случае, важно понимать, что функ- ция и* (х, t), минимизирующая выражение g0(a:, и, t) + (|^)/(я, и, t) (1.27) по явно входящему ив пределах допустимой области U при фик- сированных х и t, определяет оптимальный закон управления с об- ратной связью по измерениям текущего состояния x — x(t). Однако для нахождения и* (х, t) требуется знать функцию $(х, t) или по крайней мере ее градиент Введем обозначение Н (*’ ~ 5?’ г) = ~ <*> 0 ~ (fr) *>• С1-2^ гр ад 1 огда, рассматривая компоненты — как дополнительные пара- „ , * ( ддц \ метры, можно наити функцию и* I х, 11, доставляющую мини- мум выражению (1.27) или1, что то же самое, тахЯ^ж, — u, (В29) По существу, это же условие фигурировало в принципе макси- мума, с той разницей, что вместо — в гамильтониан Я входил вектор лагранжевых множителей X. Динамическое программирова- ние не дает непосредственно условий для нахождения значений этого вектора на оптимальной траектории. Для его нахождеция, а следовательно, вычисления оптимального управления приходится решать нелинейное дифференциальное уравнение в частных про-
490 гл. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ изводных, получаемое после подстановки в (1.26) функции и*: дЯ гг Г дЯ * ( dSS \ 1 %— = Н х, — -т—, и* х, — ,т , т L (1.30) дх [ ’ дх ’ \ ’ дх ’ /’ J ' ' Лишь в исключительных случаях удается найти решение (1.30) в аналитической форме. В частности, можно угадать, что в линей- но-квадратичной задаче функция ^(х, t) совпадает с функцией V(x, t), использованной при доказательстве Т.8.2 из гл. 6 (провер- ку этого факта предоставляем читателю), однако мы уже и так располагаем двумя подходами к решению этой проблемы. Численное интегрирование уравнения (1.30) также сталкивается с трудно преодолеваемыми препятствиями даже при п = 2, где п — размерность х. Име- ются и теоретические осложнения [10.2]: дело в том, что почти во всех зада- чах оптимизации, где оптимальное управление принимает значение па границе области U, функция ^(ж, Z) не является всюду дифференцируемой по ж, а это предположение было сделано при выводе уравнения (1.26). К счастью, более тонкие исследования [9.4] позволяют частично преодолеть указанную непри- ятность: на самом деле оказывается достаточным, чтобы уравнение (1.26) или (1.30) было определено при почти всех значениях х, где Я(х, t) дифференци- руема, за исключением кусочно-гладких многообразий размерности, меньшей, чем п, например, многообразий, задаваемых одним или несколькими уравнени- ями ф;(ж) — 0, где ф,- (ж) — непрерывно дифференцируемые функции. Выполнение уравнения (1.26) почти всюду может служить необходимым и достаточным условием оптимальности, если, конечно, удается угадать функ- цию ^(ж, Z). § 2. Субоптимальные обратные связи 2.1. Субоптимальность и теория возмущений. Метод динамиче- ского программирования указывает лишь принципиальный путь ре- шения проблемы синтеза, как правило, алгоритмически нереали- зуемый. В данном параграфе будут кратко описаны некоторые идеи практического построения законов управления с обратной связью, использование которых, вообще говоря, не гарантирует точного до- стижения оптимального значения целевой функции, но обеспечива- ет близкое значение. Такие законы обычно именуют приближенно оптимальными или субоптималъными. Прежде чем переходить к их построению, укажем на еще один, теоретически возможный способ осуществления оптимальной обратной связи. Определение. Назовем обратную рвязь заданной алгоритми- чески, если указано правило, алгоритм, с помощью которого по лю- бой заданной текущей информации ух можно вычислить значение управления и, задаваемое в любой момент т. Если выполнена гипотеза 2 из § 1, т. е. прямо или косвенно можно получить полную и точную информацию о состоянии объек- та в момент т, то алгоритмическое задание оптимальной обратной
§ 2. СУБОПТИМАЛЫ1ЫЕ ОБРАТНЫЕ СВЯЗИ 491 связи состоит в указании правила решения задачи (1.7)ч-(1.9) (для дискретной системы) или (1.18), (1.19) (для непрерывной систе- мы). Решение должно производиться при именно том значении х, которое к этому моменту получено от датчиков. В этом состоит главное отличие от динамического програмирования, где х задава- лось произвольным (осуществлялся поиск оптимального управле- ния для любых возможных состояний!). «Плата» за такой подход очевидна: если в методе динамического программирования все вы-- числения можно было произвести заранее, при проектировании си- стемы, и «заложить» в нее уже готовые функции и*(х, т), то здесь требуется решать задачи оптимизации в ходе работы системы, по мере поступления текущей информации*). Причем необходимо осуществлять решение быстро, поскольку иначе требумое оптималь- ное решение станет известным позже того момента, когда его следует использовать. Поэтому идея алгоритмического задания прак- тически неприменима для осуществления оптимальной обратной связи. Однако она может быть с успехом использована для суб- оптимизации. Основной прием заключается в том, чтобы упростить задачи, которые требуется решать в ходе работы системы, до такой степени, чтобы вычислительное устройство могло успеть вовремя рассчитать значение сигнала управления. Конечно, разумное упрощение не всегда возможно. Как прави- ло, оно оказывается успешным, если исходная задача обладает та- кими специфическими особенностями, что упрощенная задача имеет близко к ней описание. Как мы уже убеждались (гл. 6, 8), математической базой для оценки возможности упрощения задач является теория возмущений. В рамках этой теории близость меж- ду исходной (возмущенной) задачей и упрощенной (порождающей) формально отражается введением малого числового параметра р таким образом, что при р. = 0 описание возмущенной задачи совпа- дает с описанием порождающей. С помощью теории возмущений в ряде случаев удается постро- ить оценки эффективности субоптимальных управлений, т. е. опре- делить потерю в значении целевого функционала, если вместо оп- тимального управления используется субоптимальное**). 2.2. Слабодинамичные дискретные объекты и оптимизация на ко- ротком интервале. Предположим, что управляемый объект облада- ет следующим свойством: его состояние в момент к + 1 слабо зави- сит от состояния в предшествующий момент к, а в основном опре- деляется значением управляющего воздействия и[к). При этом влияние управления и[к) быстро «забывается» системой. Гипотеза слабой динамичности достаточно хорошо отражает особенности импульсных систем управления устойчивыми непрерывными объ- *) Зачастую применяют английский термин «on-line» — оптимизация. **) Систематическое изложение метода возмущений в задачах оптимиза- ции дано в [6.6]. Там же можно найти асимптотические оценки эффективности ряда субоптимальных управлений, описанных далее в этом параграфе,
492 ГЛ. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ ектами, если интервалы между импульсами настолько велики, что за время от th до tk+i переходные процессы, почти затухают. Если ги- потеза выполняется, то можно сделать естественный вывод: при выборе управления и[т] в каждый текущий момент т допустимо учи- тывать его влияние только на' короткий отрезок времени в будущем, примыкающий к этому моменту. В самом простом варианте допу- стимо учитывать влияние только на один такт вперед. Следовательно, при алгоритмическом задании обратной связи на каждом такте вместо задач (1.7) — (1.9) придется решать лишь «укороченные» задачи вида (т+1-1 min I У g0(x[k], и[к], к)/х[кА- — F{х[к],и[к], к), I А=Т х(х) = х, и[к\ <= Uh j, (2.1) где /—«глубина» учитываемой памяти. Существенно, что хотя в (2.1) минимизация ведется по всем переменным и[т], и[т + 1], ... ..., н[т + I — 1], использовать в текущий момент т требуется только первую компоненту решения и*[т]. После приложения соответству- ющего управляющего воздействия к объекту от датчиков информа- ции поступит значение состояния в следующий момент т+1, и ре- шение новой «укороченной» задачи можно будет повторить на сдвинутом интервале *). Приведем пример использования этой идеи в задаче, где име- ются и ограничения на переменные состояния. Пример 2.1 [6.6]. Рассмотрим линейный дискретный объект с одним (скалярным) управляющим воздействием, описываемый уравнением x[k + l} — Ax[k} + bu[k} + Gw[k\, k = Q, 1, ..., (2.2) скалярные же возмущения w[k] заданы. Матрица А размерности пХп мала по норме, что соответствует гипотезе слабой динамично- сти. Требуется построить закон управления с обратной связью по измерениям состояния, минимизирующий целевую функцию S (crx{k + \} +du[k}), с = const, d>= const, (2.3) А—О причем необходимо обеспечить выполнение ограничений х\к + 1J х, к — О, 1, ..., к/ — 1. (2.4) Такая постановка приемлема для приближенного описания задач оптимального управления некоторыми технологическими процесса-. ; *) Очевидно, что если т + kf, то в (2.1) надо учитывать и «концевое» слагаемое G0(x[М) целевой функции.
§ 2. СУВОПТИМАЛЫПэТЕ ОБРАТНЫЕ СВЯЗИ 493 ми [6.6]; при этом условие (2.4) интерпретируется как необходи- мость невыхода состояния объекта за «опасную» границу х. Для алгоритмического задания оптимальной обратной связи тре- буется в каждый момент т решить задачу вида hf-i min У, {стх[к 4- 1] + du{k}) (2.5) k=x при условиях (2.2), (2.4) с учетом того, что известна величина х[х], полученная от ДИ. Все эти задачи являются задачами линейного программирования и в принципе разрешимы с помощью стандартных программ. Одна- ко время вычислений существенно зависит от числа переменных и ограничений, а при больших к, оно заведомо велико. Для упрощения учтем предположение о слабой динамичности и будем принимать во внимание влияние управления н[т] только на состояние х[т+ 1] в ближайший момент. Тогда вместо (2.5),. (2.2), (2.4) можно иметь дело с задачами малой размерности: min{cT (А лс[т] + 6и[т] + Gw[t]) + dufr]} (2.6) с ограничением Лт[т] + bv.{x] + Gw[x]^x. (2.7) Более того, решение можно выписать в явном виде. Примем для определенности, что Ь = (&,)> О, cTfe + d<0. (2.8) Тогда оптимальное значение управления и*[т] должно быть наи- большим из таких и[х], при которых выполняются все ограничения М[т] х, — а,х[т] — giiclr], (2.9) где at— i-я строка матрицы A, g,—i-a элемент столбца G. Таким образом, — (a?i — а4х[т] —giW[T])L (2.10) J где учитываются только индексы г, для которых > 0. Формула (2.10) в явном виде выражает нелинейный закон уп- равления с обратной связью. Дополнительно заметим, что при построении закона нетрудно формально учесть явные ограничения на управление, однако при наличии ограничений снизу, например, вида и[т]>-1 (2.11) может оказаться, что решения не существуют: ограничения (2.7) и (2.11) окажутся несогласуемыми. Иначе говоря, управление не сможет справиться с большими возмущениями, и возможен выход за «опасную» границу,, однако это естественное свойство задачи,
494 ГЛ. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ Теоретический анализ эффективности закона (2.10) проведен в [6.6, § 2.9], причем установлено, что при достаточно слабой дина- мичности (2.10) в действительности позволяет достичь строго оп- тимального значения функции цели. Этот результат является след- ствием особенностей задач ЛП. В общем случае применение гипоте- зы слабой динамичности, конечно, приводит лишь к субоптималь- ным обратным связям, причем оценка эффективности обычно за- труднительна. Тем не менее практически значимость вытекающего' из гипотезы приема «укорачивания» задач очевидна. Действие закона управления у «опасной» границы иллюстриру- ется графиками на рис. 10.2, где использована следующая числовая модель: х& + 1] = 0,1 (Xl[k] + 2х2[к}) + и[к\, х< [0] = 0, х2[к +1] = — 0, 05х2[ к] + и[к} +(—!)*, т2[0] = 0, Xi = l, х2 — 1. При атом п[к] = min{l — ОДхД] — 0,2дг2[/с], 1 + 0,05х2[/с] — (— I)’1}. (2.12) Видно, что управление заставляет переменные «прижиматься» то к одной, то к другой «опасной», но выгодной по критерию гра- нице, с которой они «сбиваются» периодическим возмущением. В системе быстро устанавливается периодический режим. О 2.3. Гипотеза слабой управляе- мости. Эту гипотезу можно форма- малиэовать и непосредственно на языке непрерывных систем. Она соответствует описанию в виде X = f0(x, t)+]lfl(x, и, t), x(t0) = x°, tf], (2.13) где p — вновь малый параметр,, так что возможно лишь малое влияние управления на скорость изменения состояния системы [6.6], [10.8]. Такая постановка разумна в задачах управления движением механических объектов, когда уп- равляющие силы существенно слабее естественных, например, при . управлении спуском космического аппарата в верхних слоях атмос- феры. Порождающая система неуправляема, ее движение x(i) опре- делено соотношениями x = f(l(x, t), x(to) = x,>. (2.14) А 1 <г2 1 1 •Г, [К] о----6----1----2-----1----2----1___£ 0 1 2 3 4 5 6 хг(/<] /< 0 1 °2 3 °4 5 °6 ----1---j----1___|----1----1 5 6 10.2
§ 2. СУБОПТИМЛЛЬНЫЕ ОБРАТНЫЕ СВЯЗИ 495 Истинное движение в силу исходного уравнения должно быть близко к нему. Попытаемся воспользоваться этим отличием для то- ру чтобы обеспечить минимизацию показателя С0[ж(^)] с помощью выбора управления tf], где U — заданное ограничен- ное множество. Проведем несколько нестрогие рассуждения. Поскольку функция z(f) Л ИЛ [ж (О, и (t), *1 мала при любом выборе управления,, то ее влияние на изменение траектории также мало и может быть оценено с помощью уравне- ния в вариациях I бж = A(t)$x + z, A(t) = -~ . ' ' ' dx |x=K(i) Мало и вызванное ею изменение показателя: dG I бС0[ж(^)]^(Со(0)тбж(^, С0=^-°|ж=%р. Используя известную схему (см. § 3 гл. 9), можно явно выразить это изменение через z(t): V 6G0« — J №(t)z(t)dtfi *0 где X(£) удовлетворяет уравнению b = -A’(t)X. Х(^) = -Со. (2.15) Теперь вновь вернемся к исходным обозначениям */ 6Ge ==; — jx'J Хт (t) [ж (t), и (t), t] dt. ‘о Таким образом, мы получаем возможность найти оптимальное уп- равление для каждого момента времени, решая задачу max {V(£)Jj[a:(£), и(£),/]/п(£)<= Ш. (2.16) Рассмотрим в дополнение задачу с фиксированным на правом конце условием G1[x(f/)] = O (2.17) и свободным выбором момента t,. Предположим, что на порождаю- щей траектории это условие выполняется, т. е. 6Дж (£,)] = О, так что может быть найдено Поскольку время tf не фиксировано, то у,— поправка в скоростях приводит к у — поправке во времени, так что можно принять tf = tf + lit, + о(у).
496 ГЛ. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ В силу этого можно оценить изменение состояния в конечный мо- мент через tc. 8x(tt)^ 8x(tf) +f0(x(tf), ti)y.tl и оценить изменение функционала fdG | ~ ~ ~ ~ + (2.18) Кроме того, имеем /3G,\T| m ~ ~ ~ ~ 7 + = (2.19) поскольку ограничение (2.17) должно быть выполнено. Исключая из (2.19) t, и подставляя в (2.18), получаем формулу для прира- щения показателя 8G0^C^x(tf\ где гтГ ~ ~ ~ С0^С0 -^-Сц f0 А /0 [х (tf), tf] при Ci/o #= 0, сРо или, окончательно, ~ 6G0« —j №(t)z(t)dtt *0 где X(i) удовлетворяет условиям к = -Лт(О*. *(*/) = -€<>. (2.20) Тем самым выбор управления свелся к необходимости в каждый момент времени решать задачу шах {ХТ(*)/1ЬФ). к(0, t]/u(t)e= Ш, (2.21) которая отличается от (2.16) только изменением множителей. Конечно, все сказанное представляет собой лишь соображения «на пальцах». Строгая оценка близости получаемого решения к оп- тимальному достаточно сложна. Вместе с тем нетрудно заметить, что вся описанная процедура почти «копирует» 1-ю итерацию в мето- де последовательной линеаризации. Пример 2.2. Задача о полете на максимальную дальность [10.7]. Рассматривается движение центра масс летательного аппарата в- плоскости х, у: х = Х, y=Y — g, где x(t)—горизонтальная, а у(t) — вертикальная координата цент- ра, X, Y — компоненты ускорения, создаваемого аэродинамическими силами, g — ускорение силы тяжести.
§ 2. СУБОПТИМАЛЬНЫЕ ОБРАТНЫЕ СВЯЗИ 497 Предположим, что движение совершается в сильно разреженной атмосфере при небольших скоростях, так что аэродинамические си- лы во время всего полета малы по сравнению с силой тяжести. От- брасывая их, легко найдем порождающее движение — движение точ- ки в поле силы тяжести: x(t) = x(0)x x(t) == x(O)t + x(0)t . y(t) = y(0) — gtt p(0 = j/(O) + p(O)t — Требуется теперь выяснить закон изменения аэродинамических сил, обеспечивающий наибольшее приращение дальности полета до точки с заданной высотой, т. е. максимизировать x(tf) при ограни- чении у (£/)= у'и свободном выборе f,. Чтобы подробнее проиллюстрировать общую методику и выде- лить характерный малый параметр, запишем уравнения движения в стандартной форме, и притом в безразмерных величинах. Имеем ^ = _ррР2[сх(п)Жз + Су(и)ж4], (2.22), = — 1 + НРУ2 К (“) *з — Сх (и) ж4], где введены обозначения « = «1 = 4^ х2=4^’ хз=т-^ р0 *о ро о ж4 = 7" У, К2 = 4 + ж2, 42 о По — начальная скорость, р — плотность атмосферы (заданная функ- ция высоты, т. е. х2), отнесенная к начальной р0, сх(и), су(и)—ко- эффициенты сопротивления и подъемной силы, Которые являются заданными ограниченными функциями управления — угла атаки и. Безразмерная величина н-М1 2mg предполагается существенно меньшей единицы (S — характерная площадь аппарата, по отношению к которой заданы аэродинамиче- ские коэффициенты сх, с„). Поскольку диапазон изменения всех переменных х,(т), 4 = 1, ... ..., 4, в основном определен порождающим движением, то при ма- лом ц нетрудно убедиться в малости возмущений как функций вре- мени при всех т. 32 а. А, Первозванский
498 ГЛ. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ Примем для простоты ДЯ xt(0) = ж2(0) = 0, ж3(0) = cos Go, z4 (0) = sin 0», Я где 0о — начальный угол наклона траектории (угол между вектором 41 скорости й горизонтальной осью). На конце траектории потребуем, Ц чтобы яг2(т/)=О, а Ж1(т/) было максимальным или, что то же са- И мое, Go[^(t/)] = — было минимальным. Порождающее движе- I ние в безразмерных координатах описывается следующим образом: Я xt = т cos 0О, х2 = т sin 0о — т2/2, I Хз = cos 0о, Xi. = sin 0о — т; • а отсюда Т/ = 2 sin 0О. Подчеркнем, что удовлетворение граничного условия заведомо -и возможно только при 0о > 0, а поскольку метод возмущений пред- полагает малость изменения времени процесса, имеющего порядок й ц, по сравнению с невозмущенным значением, то, вообще говоря, 1 2 sin 0О > ц. _ .О Для оценки влияния возмущения вычислим множители Х((£), Д i — 1, .4, в силу уравнений (2.20), которые принимают вид р < ’ ~ л д ~ х ~ S Х^ “ 0,: Xg — 0t —Х^,- X4 = — Xg с граничными условиями ^1 (T/) “ 1»; ^2 (T/) = sin Q t ^3 ('t/) = 0» ^4 ('r/) — 0. <я| При вычислении граничных условий учтено, что ? с.а(Й!)|.=.<?)-(-1.0.0.0). ; /о = (^з» Qe ~ 1) 1х=х(ту) = (cos 0Q, cos 0Q, 0j — 1)2 СдИ1 =—d =(oioo) ) |х=х(Т/) дх |х=*(17) ' ’ ’ ’ h После интегрирования имеем Х!(т)=1, X2(T) = ctg0o, Хз(т)= -(Т - Т/), Х4(т)= - Ctg 0О(Т - Т/). Теперь в соответствии с (2.21), (2.22) следует исйать прибли- женно оптимальное управление, максимизируя выражение —Х5[сх(и);Га + си(н)х4] + X4[cv(u)x3 — cx(u)a:4] = = (т — T/){[cI(u)X3 + Су (и) Xi] — ctg 0o[c„(u)r3 — cx(u)xj}
§ 2. СУБОПТИМАЛЬНЫЕ ОБРАТНЫЕ СВЯЗИ 49» или, поскольку т < it, минимизируя Сх (и) кз + ctg 60^4] — Су (и) [ctg Qo^a — «*]. (2.23)> Последнее эквивалентно минимизации функции с (и) А ех (и) — ctg (0 + 0О) cv (u)t (2.24) где введено обозначение tg0=|\ (2.25> з так что 0 — угол наклона траектории в текущий момент времени.. Физический смысл (2.24) ясен: для увеличения дальности по- лета требуется иметь и меньший коэффициент сопротивления, и большую подъемную силу, а компромисс между этими противоречи- выми требованиями достигается при минимизации с (и). Если задаться какой-либо аналитической аппроксимацией аэро- динамических характеристик, то оптимальное значение угла атаки и* можно выразить явной формулой. Пусть, например [10.7], с*(и)= 1 — cos 2и0cos2», Су(и)= A: sin 2u0 sin 2», (2.26^ где и0, к — константы. Тогда нетрудно убедиться, что 4 к to 2и. = (2-27> если u0<-y, 0fl<-^-. Подчеркнем, что оптимальное управление найдено как функ- ция угла наклона траектории, который может быть измерен к каждый момент времени с помощью соответствующего датчика, причем для вычисления п*(т) следует знать как текущее значение 0(т), так и начальное 0О. Приведенные в [10.7] результаты расчетов показывают, что закон управления, найденный с помощью теории возмущений, поч- ти точно совпадает с оптимальным до ц = 0,1 и отличается не более чем на 10% при ц.^0,5. □ 2.4. Гипотеза слабой нелинейности. Одна из самых популярных гипотез, упрощающих построение управления, состоит в предполо- жении о том, что описание объекта близко к линейному х = Ах + Ви+. (х, и, t), x(t0) = x°, t е [t0, tf}. (2.28J Если оптимизация ведется по линейному или квадратичному пока- зателю, то при малых р, могут быть получены простые результаты. 32*
500 ГЛ. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ Остановимся подробнее на случае*), когда J = J [x^Qx + urRu] dt + x^tj) (2.29) (0 При |i = 0 имеем дело со стандартной линейно-квадратичной задачей с известным решением n(i)=-/?-‘^(Z)x(Z)=-^(f)x(/), где x(t) удовлетворяет порождающему уравнению х = Ах + Ви, х9 = хй, а P(tf— решение уравнения Риккати —р = РА + АТР — РВВ~*ВТР + Q, P(tf)~Q- Естественно искать следующее приближение, минимизируя функ- ционал на траекториях линейной системы х = Ах + Bu + z(t), д (2.30) где z(f)= p.fl£(t), u(t), fl — известная функция времени. Решение такой задачи также известно (см. § 8 гл. 6). Напомним «его структуру. Согласно формулам (8.28)-г-(8.30) из гл. 6 имеем u*(xw, t) — — К* (t)x{i) (t) — uw {t), (2.31) где x(1)(t) —решение системы (2.30), K*(t) определяется только свойствами невозмущенной системы, т. е. K*(t)=R(t), а и(1) (/) да- стся формулой u™(t)~R~lBW'(t), (2.32) причем для вычисления n<1’(i) требуется решить дифференциаль- ное уравнение п4-(4-В£)тя + Р2(г) = 0, n(i/) = 0. (2.33) Поправка к нулевому приближению имеет порядок ц и, как можно при определенных дополнительных условиях строго доказать [6.6], обеспечивает приближение к оптимальной траектории и оптималь- ному значению функционала’ с точностью до О(ц2) на конечном отрезке [t0, tf]. Однако при введении поправки закон управления (2.31) уже не имеет формы закона управления с обратной связью. Сама поправка u(1) (t) в текущий момент t определяется (в силу (2.32), (2.33)) значениями возмущения, вычисленного на порожда- ющей траектории для будущих моментов из [£, tj\. *) Вариант оптимизации по линейному функционалу хорошо иллюстриру- ется П.2.2, где объект был не только слабо управляем, но и слабо нелинеен.
8 2. СУБОПТИМАЛЬНЫЕ ОБРАТНЫЕ СВЯЗИ 501 Иначе говоря, вычислить поправку можно только при наличии полной информации о начальных условиях и возможных изменени- ях параметров. Применим теперь еще один полуэвристический прием. Предположим, что матрицы параметров А, В постоянны или ма- ло меняются, a tt —t0 достаточно велико (в смысле § 8 гл., 6); тог- да применима схема «замороженных» параметров, в силу которой P(t) и л*(0 находятся из алгебраических уравнений РА + АТР - PBR~'BTP + Q = Q, (A — BR) тл + Pt = 0. (2.34) Дополнительная гипотеза приводит к формуле и = — R~lBT[Pxw -[(Л -ВКу}-'Р^^°\ —Rxw, 0]. (2.35) Остается сделать еще один шаг в направлении упрощения и учесть, что отклонения истинной траектории от xw имеют порядок ц, а от- клонения от xw — порядок р,2. Поэтому с точностью до р.2 можно перейти от (2.35) к закону управления * и = — Rx + \iKw f (х, —Rx, t), (2.36) где RW А В-^В^{(А~- Вку}-гр. (2.37) Закон (2.36) уже имеет форму нелинейного закона управления с обратной связью по текущим измерениям переменных состояния. Строгий асимптотический анализ его эффективности при больших tf — ta не проведен, однако ясно по крайней мере, что при постоян- ных А, В устойчивость в «малом» положения равновесия автоном- ной системы, управляемой по закону (2.36), гарантирована. Пример 2.3. Пусть материальная точка движется в среде со сла- бым нелинейным сопротивлением. Ее скорость v меняется в соот- ветствии с уравнением v = — р,кг sign v + и, р(0) = р°, где и — управляемая часть ускорения. Требуется выбрать закон управления, обеспечивающий процесс торможения на отрезке t <= [0, Т), оптимальный по критерию т [ (q2v2 + u2) dt -> min. о Составим приближенное решение согласно (2.36). В данном слу- чае Р — скаляр, удовлетворяющий уравнению Риккати при А — 0, В = I, R = l, так что Р = q, R — P = q, — — 1, и окончательно имеем и — — qv + jw2 sign v. При использовании такого управления изменение скорости подчи- няется линейному уравнению v + qv = 0.
502 ГЛ. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ Таким образом, субоптимальное управление эквивалентно вве- дению линейного сопротивления и компенсации нелинейного. В таблице показана зависимость относительной потери по функ- ционалу gj. — ^11р ~ ^opt Aipt * связанной с применением такого управления по сравнению с опти- мальным*): ' V 0,1 0,3 0,5 1.0 а = 1, Г= 10. в/ 4-10-в 4 -10-* 3,3-10-6 5,6-10’2 Ясно, что точность приближенного закона вполне приемлема вплоть до отнюдь не малого ц = 1. □ 2.5. Гипотеза о малости отклонений от программы. Эта гипотеза близка по смыслу к гипотезе слабой нелинейности, но ей может быть придана более универсальная форма. . Пусть объект описывается уравнением a = f(x, и, t) (2.38) с «гладкой» нелинейностью. Пусть известно, что начальные условия могут выбираться толь- ко из малой окрестности некоторой точки х°. Тогда возможна следующая схема: а) рассчитать оптимальную программную траекторию, исходя- щую из точки х°; б) постулировать, что малость начальных отклонений гаранти- рует малость отклонений при всех te=[t0, в) линеаризовать в окрестности программной траектории урав- нения объекта и преобразовать функционал с сохранением слагае- мых 2-го порядка малости относительно 6я(£), 8u(t). Если исходный функционал был квадратичным, а на управле- ние не налагалось явных ограничений, то соответствующая задача окажется стандартной линейно-квадратичной задачей относительно неизвестных 6x(t), 8u(t), для которой можно найти решение в виде 8u(t) = -K(t)8x(f). (2.39) Эту формулу можно рассматривать как выражение обратной связи *) Расчет здесь и в П.2.4 проводился А. А. Сухановым, причем для поиска оптимального управления использовался метод решения краевой задачи прин- ципа максимума, описанный им в [9.20],
§ 2. СУБОПТИМАЛЬНЫЕ ОБРАТНЫЕ СВЯЗИ 503 по отклонениям от программы. Поскольку сама программа зависит от начального условия ха, то и K(t) также зависит от ж0. Несмотря на самое широкое распространение, описанная схема не имеет строгого обоснования даже в асимптотическом смысле. Можно лишь подозревать, что если управление (2.39) имеет стаби- лизирующий характер, т. е. обеспечивает сближение возмущенной и порождающей траекторий, то метод применим. Напомним, что в этом и состоит эвристическое существо применения линейно-квад- ратичного подхода к решению реально нелинейных задач. Глад- кость нелинейностей и отсутствие явных ограничений на управле- ние или фазовые координаты являются здесь обязательным усло- вием. Вместе с тем представляет большой практический интерес сле- дующий частный случай. Пусть система линейна, функционал квадратичен, но на управление (для простоты, скалярное) наложе- но ограничение. Требуется решить задачу (Т - J [xTQx + и2] dt/ х — Ах + Ви, ж(0)=ж°, | u(f)| ^u0 .0 min Как было указано в § 3 гл. 9, явного выражения оптимального уп- равления получить не удается. Пусть, однако, допустимы лишь ма- лые начальные отклонения от желаемого состояния ж(0)=0. Обо- значим их рж° и введем новые переменные, полагая x(t)=[ix(t), u(t) = iiu(t), считая тем самым, что малы и отклонения, от нуля по всей траектории. В новых переменных задача принимает почти та- кой же вид: г . р2 f [xTQx + и2] dt/ х = Ах + Ви, х (0) = х°, | и (t) | — •. J Р о Очевидно вместе с тем, что при малых р ограниченностью управ- ления можно пренебречь и решать стандартную ЛК-задачу, полу- чая при р = 0 й(£)= — KOJ,tx (i). Иначе говоря, показано, что линей- ное приближение является решением порождающей задачи. Следу- ограничение ^opt^(i)>H’’1“o» | Koptx (t) | р-1м0, Z<0pt*(*)<9~lwo- Возвращаясь к исходным переменным, получаем закон управления в виде усеченного линейного закона min ющее приближение позволит учесть 1р-1и0 — #оргж(0, —- р и0, KQVix (t) > u0 u(t) = Zlopt^ (t), — U0l | Kopix (£) | !'o ^Lopt^- (0 ^01
504 гл. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ который можно рассматривать как разумное приближение к опти- мальному закону управления. Хотя опять-таки асимптотические оценки отсутствуют, эффективность приближения несомненна, о чем, в частности, свидетельствует следующий пример; Пример 2.4. Рассмотрим задачу Для этой задачи было найдено оптимальное значение функционала численным методом с высокой точностью и значение, соответствую- щее приближенному закину управления. Относительная погреш- ность б/ указана в таблице (расчет велся при Т = 15,55) 1 10 15 20 30 50 100 1000 0 7.10-3 4-Ю’2 9.10"2 0,17 9-10-2 2-Ю-4 0 Результаты демонстрируют поразительную эффективность, и притом не только при малых отклонениях — почти во всем диапазо- не начальных условий погрешность практически несущественна. □ 2.6. Гипотеза о разных скоростях изменения переменных состоя- ния. Эта гипотеза формализуется в виде следующего описания объ- екта (см. § 3 гл. 8): x = A(z)x + B(z)u + ц/х(я, z, и), ir(O) = a:',, z = iifv(z, х, и), z(O)=z°. (2-4°) где р — малый параметр. При р, = 0 имеем порождающее решение z(t) = z°= const, х = A (z°) х + В (z°) и, z(0) = z°, Решив задачу оптимизации, например, по квадратичному криг терию для линейной порождающей системы, получаем для нее уп- равление в виде обратной связи S(/) = -X(t, z°)x(t). После этого в качестве управления для исходной системы кажется приемлемым взять закон a(t) = -K[t, z(t)W). (2.41) где вместо постояного параметра z° введен наблюдаемый медленно меняющийся процесс z(f), а вместо решения порождающей систе- мы x(t)—наблюдаемое состояние. Конечно, этот результат относится к числу наиболее рискован- ных эвристик. Для того чтобы продемонстрировать возникающие
8 2. СУБОПТИМАЛЬНЫЕ ОБРАТНЫЕ СВЯЗИ ‘ 505 здесь опасности, приведем результаты строгого асимптотического анализа для более частного класса задач. 2.7. Гипотеза квазистатичности для непрерывных систем. Рас- смотрим задачу управления системой x — f(x, и), x(t6) — x°, (2.42) хде управление выбирается с целью минимизации показателя V J{u} = , Jy- [goto u)dt. (2.43) о f J 'о Если интерпретировать go (а и) как интенсивность текущих затрат, то показатель (2.43) определяет среднее значение затрат за время работы системы. Сначала проведем «правдоподобные» рассуждения. Предположим, что при любом постоянном управлении u(t)== — й = const с допустимыми значениями в объекте устанавливается стационарный режим х = const, удовлетворяющий статической связи f(x, м) = 0. (2.44) Будем также считать, что время практического установления t мно- го меньше времени, на котором оценивается работа системы, т. е. Перейдем в (2.42), (2.43) к безразмерному времени Тогда получим 1 \^="iKx,u), J {и} = \ u(x)]dx. (2.45) О В качестве разумного приближения можно принять р, == 0, т. е. решать задачу минимизации 1 J {u) = J g0 (х, и) dt о при статической связи (2.44), что эквивалентно решению задачи min {go (*> «)//о = 0). - (2.46) U&J Если й(х) есть значение и, доставляющее в (2.46) минимум при х, рассматриваемом как параметр, то, опять-таки предполагая бли- зость истинной траектории x(t) к х в течение почти всего времени
506 ГЛ. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ работы системы, можно принять н = й(ж) в качестве закона управ- ления, претендующего на близость к оптимальному. Эти типичные для предшествующего изложения «правдоподоб- ные» рассуждения можно в некоторых ситуациях строго обосно- вать*). Теорема 2.1 [10.3]. Пусть g0(x, к) выпукла по х и и удовлетво- ряет условию Липшица на любых ограниченных множествах. Пусть система описывается линейным уравнением x = Ax + Bu + fa, (2.47) где А, В, fa постоянны, причем А гурвицева. Пусть й, х — решение статической задачи min {g0(x, и)/Ах + Ви + fa = 0, и е U}. (2.48) Тогда на любом кусочно-непрерывном управлении и(1} со значе- ниями из выпуклого ограниченного множества V, удовлетворяющем условию Ч —1—f u (t)dt = и, ' (2.49) 7 — % i 10 и, в частности, на постоянном управлении u(t) = u значение функ- ционала (2.43) отличается от оптимального не более чем на О(ц). Теорема показывает, что для линейно-выпуклых задач переход к статике дает управление, обеспечивающее почти оптимальное зна- чение показателя «средних затрат» на большом отрезке времени. Казалось бы, имеется прочное обоснование для описанной об- щей эвристики. Однако, вообще говоря, недопустимо переносить по аналогии частные результаты на общую ситуацию. Убедимся в этом на простом контрпримере. Контрпример. Пусть объект описывается скалярным управле- нием х — — х + и, х(0) = ж°, и требуется минимизировать т J~-±rjx*dt о при Т > 1. Допустимыми являются управления, принимающие только одно из двух значений ±1. Если исходить из статического приближения, то управление должно обеспечивать minta2/—х + и = 0, и = ± 1). *) Дальнейшие теоремы 2,1—2.3 установлены В, Г, Гайцгори,
§ 2. СУБОПТИМАЛЬНЫЕ ОБРАТНЫ® СВЯЗИ 507 Очевидно, что оба допустимых значения равносильны и дают при больших Т одно и то же значение функционала JeT == 1. Однако заметим, что одно из условий Т.2.1 не выполнено: мно- жество U допустимых значений управления не является выпуклым. Попробуем использовать другое управление u(t) = (—!)*, ЙД t С (к + 1) Д, к = 0, 1, ..., т. е. кусочно-постоянное управление, периодически переключаемое с одного допустимого значения на Другое. При применении такого управления в системе быстро устанав- ливается периодический режим. Ясно, что с уменьшением Д раз- мах колебаний x(t) уменьшается (инерционный объект слабо реа- гирует на высокочастотное воздействие). Нетрудно подсчитать, что Ни} ~ Д и J{u} -> 0 при Д 0. Таким образом, оптимальным является вовсе не постоянное уп- равление, а управление в скользящем режиме при сколь угодно час- тых переключениях с одного допустимого значения на другое. □ Ситуацию, описанную в контрпримере, обобщает следующее ут- верждение. Теорема 2.2. Пусть выполнены условия Т.2.1, за исключением того, что множество U состоит из конечного числа допустимых то- чек и,, и2, ..., ик. Пусть conv [и,, ..., Uw] — выпуклая оболочка U, т. е. множество, состоящее из любых точек, представимых в виде N U = 2 КЦц (2.50) i=l где X,- — произвольные неотрицательные числа такие, что N 2 К = 1. (2.51) г=1 Пусть й — решение задачи min{g0(x, и)/Ах + Ви + fo — 0, и е= conv [iib ..., ии]}, (2.52) Тогда асимптотически (при — оптимальным в задаче (2.43), (2.47) является скользящий режим управления, при кот- ром для любого конечного Д > 0 обеспечивается условие д i f ~ -д-J u(t)dt — u. и о Невыпуклость задачи часто приводит к тому, что оптимальным установившимся режимом является не режим х = const, u = const, а периодический или даже более сложные режимы. Теорема 2.3. Пусть разыскивается управление и (Г) со значения- ми в ограниченном U, минимизирующее показатель (2.43) на
508 гл. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ траекториях системы х = Ах + f(u), х(0) = аЛ Пусть g0(x,u) удовлетворяет условиям Липшица на ограничен- ных множествах. Тогда асимптотически оптимальным (с точностью ® j по значению показателя) является периодическое управление u(t)=u(t + T0), u(t) = u(t), ie[0, То], (2.53) если и только если Та и u(t) являются решением задачи периоди- ческой оптимизации ( т 1 I 1 С * I min (— I g0 (хх u)dt[x = Ах + f(u), u(t) е U, х(0) =х(Т) к д ' О ' (2.54) Отметим, что в задаче периодической оптимизации начальное значение x(t) не фиксировано, а выбирается из условия периодич- ности. Конечно, частными случаями решения задачи (2.54) являются и постоянный и скользящий режимы, но возможно и отнюдь не редко, что оптимальным является непостоянное периодическое u(t) с конечным периодом. Пример 2.5. Пусть минимизируемый показатель качества имеет вид J {и} = —qzy2 + u2]dt, (2.55) о a y(t) задается уравнением у + 2п0у + = и, п0<<о0, т. е. y(i) является выходом осциллятора с малым демпфированием. При статическом управлении минимум функционала достигается, если принять й — 0, у — 0 (предполагаем, чтоу<«>о). При этом Ли) — а. Вместе с тем ясно из вида подынтегрального выражения в /{и), что функционал будет улучшаться, если будет увеличиваться средняя мощность управляемого процесса. Если использовать управление вида u(t) = a cos т. е. заставить объект работать в резонансном режиме, то можно добиться больших колебаний на выходе с амплитудой -s—— и сред- ^ошо а2 2л ней мощностью Q 2 8 . Значение функционала (при t/> —) легко 8й0<00 °
§ 3. УПРАВЛЕНИЕ ПРИ НЕДЕТЕРМИНИРОВАННЫХ ВОЗМУЩЕНИЯХ 50& вычисляется: При малом демпфировании получаем улучшение по сравнению со статическим управлением, причем улучшение ограничено только допустимым диапазоном управления. О Несмотря на упрощенный характер исходной постановки в при- мере 2.5, она отражает важную особенность управления многими технологическими процессами, где текущие затраты невыпуклым образом зависят от выходной переменной, а частотная характери- стика преобразования «управление — выход» немонотонна, имеет резонансный характер. В таких случаях выгодно не стабилизировать объект, а заста- вить его работать в резонансном режиме. Этого можно добиться и периодическим программным управлением и с помощью обратной связи, переводящей объект в режим автоколебаний (в П.2.5 можно, например, взять u = kyzy, к>0). В заключение подчеркнем, что к правильному результату в при- мере мы вновь пришли из «правдоподобных» эвристических сообра- жений, однако эта эвристика основывалась на более четком пони- мании особенностей задачи (с формальным рассмотрением проблемы оптимальных периодических управлений можно познакомиться, на- пример, по работе [10.10], хотя результаты можно получить и са- мостоятельно, используя общую методику принципа максимума). § 3. Управление при недетерминированных внешних возмущениях 3.1. Оптимизация по ожидаемому и гарантированному результа- ту. Сохранив в основном постановку задачи управления дискретной системой, принятую в § 1, внесем в нее один новый элемент. Будем считать, что описание объекта дано в виде*) z[A: +1] = Fh(x[k], гг[/с], »[&]), к = 0, 1, ..., (3.1) где — априори неизвестная последовательность, которую можно трактовать как внешнее возмущение. Иначе говоря, в опи- сание вносится элемент неопределенности. Даже если фиксированы начальные условия, мы не можем точно предсказать, какой окажет- ся реакция объекта на управляющее воздействие Пусть по- казатель качества принят в виде fey—1 J = 2 gkfxtk + 1], ы[/с]). (3.2) h=o *) В отличие от § 1, явная зависимость от времени к функций многих ар- гументов здесь для удобства отображается индексом,
510 ГЛ. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ Очевидно, что нельзя предсказать точно и каким окажется показа- тель качества, если принято то или иное управление: его значение -зависит и от неуправляемого воздействия. Символически запишем J = J{u, w}, (3.3) где под и, w подразумеваются совокупности всех значений u[fc], w[/«] соответственно. Постановка задачи оптимального выбора управ- ления из условия минимума (или максимума) показателя J, вообще говоря бессмысленна: управление, наилучшее при одном возмуще- нии, может быть плохим при другом. Фактически мы сталкиваемся •с наличием множества показателей качества управления, различных при различных w. Для четкой постановки задачи оптимизации сле- дует на базе этого множества построить один, сводный показатель. Наиболее часто используются два варианта построения. В первом варианте предполагается заданным множество W, которому могут принадлежать возмущения ю. Пусть, для определенности, жела- тельно при любых w выбрать и так, чтобы Ли, w} принимал наи- меньшее значение. Тогда при фиксированном и значение показате- ля не может быть хуже, чем Jg {и} Д sup [ J {и, w}/w е W]. (3.4) W Иначе говоря, Jgtu} показывает, каково гарантированное значение исходного показателя при заданном и и любых возможных w. По- этому, если в качестве сводного показателя при постановке задачи оптимального выбора управления принимается целевая функция Jg{u}, то говорят об оптимизации гарантированного результата. Во втором варианте дополнительно предполагается, что на w задана вероятностная мера, или, что то же самое, предполагается, что w является совокупностью Случайных величин w\k\ с реализа- циями из W, и известно их совместное распределение -вероятно- стей Л. Тогда в качестве сводного показателя можно использовать функцию Je{u) = М<Д7{п, w}], (3.5) где Ми означает операцию вычисления математического ожидания. Управление и, доставляющее наилучшее (минимальное) значение Je{u}, называют оптимальным по ожидаемому результату, или оп- тимальным в среднем. Подчеркнем, что нельзя указать никаких формальных правил отбора того или иного сводного показателя *) в конкретной зада- че — это дело интуиции постановщика задачи. Вместе с тем очевид- но, что невозможно использовать показатель (3.5), если отсутствует априорная информация о вероятностных характеристиках возму- щений. *) Существует и ряд других способов формирования сводного показателя (см, например, (4,7, гл, 3]),
§ 3. УПРАВЛЕНИЕ ПРИ НЕДЕТЕРМИНИРОВАННЫХ ВОЗМУЩЕНИЯХ 511 Дальнейшее рассмотрение проведем в рамках дополнительной гипотезы о непрогнозируемости значений w[k} в различные момен- ты к. Если w[k] — случайные величины, то свойство непрогнозируе- мости совпадает со свойством независимости этих случайных вели- чин в совокупности*). Обозначим 5s* функцию распределения w[k}-, тогда • = П 2Рк. (3.6) Если для w[k] задана функция распределения 53*, то будем исполь- зовать краткое обозначение w[k] <= £Рк. Если w[k] не случайны, то непрогнозируемость означает, что знание конкретных значений, ко- торые приняли возмущения к < т, не дает никакой дополнительной информации о возможных значениях w\k} при к > т. Пусть Wk — множество возможных значений w[&]. Тогда множество W возмож- ных значений всей совокупности {щ[/с]} есть произведение Wk. , Пример, как и в § 2, предположение, что в любой момент х от датчиков информации поступает значение вектора х[т]. Строго говоря, этот вектор может быть назван вектором состояния объекта, только если выполнена гипотеза о непрогнозируемости возмущений. В противном случае знание предшествующих значений х\к\, к<х, могло бы улучшить прогноз будущих значений возмущений, а сле- довательно, и поведения объекта. Часто говорят, что из непрогно- зируемости следует марковость описания объекта (см. § 1). Таким образом, класс возможных законов управления с обрат- ной связью может быть ограничен функциями ufe(^[/f]) со значе- ниями из заданных множеств Uk. Оптимальным законом управления назовем такую функцию ик (х [Л:]), для которой соответствующий сводный показатель достигает наилучшего (минимального) значения при любых начальных состояниях ж[0]. Подчеркнем, что это значе- ние, вообще говоря, лучше, чем достижимое при любой возможной программе управления, т. е. заранее (без использования текущей информации) построенной последовательности {up]}, даже если известно я[0]. Это достоинство обратной связи при управлении в условиях неполной определенности подчеркивалось в течение всего курса. 3.2. Уравнения динамического программирования. Для построе- ния оптимальных законов управления с обратной связью в принци- пе возможно использовать метод динамического программирования, детерминистский вариант которого был описан в § 1. По аналогии введем в рассмотрение функции двух типов: A. ^t(x) Amin [<jpg(х, и[к}, к^х)/и[к] е Uh, (3.7) U Б. 33х (х) A min {qpj (лг, и [Л], к^х)/и [к] е Uk, к^ т}8 (3.8) и ! *) Часто используется также термин «дискретный белый шум»,
512 ГЛ. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ где q>g«sup|2 gk{x{k+ l]t u[&])/№[&] e=fKftl! W fe=T (3.9) <pj = Мю kf-i 2 gh(x[k + 1], u\k})lw\k]<=&k(w)* ь=т k~^x (3.10) В обоих вариантах предполагаем, что величины arffc] вычислены в силу (3.1), начиная с я[т] = х, где х — произвольный параметр. В точности повторяя рассуждения из § 1, можно прийти к ре- куррентным соотношениям: А. ^т(ж) = ппп sup {gT[Ft(х, u,w),u] + $х+1 [Fx(х, и, ш)]},, u=UtwSWT (3-11) Б. (х) = min Mwe5,T {gx [Fx (x, и, w), u\ + ^x+1 [Fx (x, u, w)]}. USU, (3.12) Оба уравнения одинаковы по структуре и отличаются лишь заме- ной операции вычисления верхней грани по множеству возможных значений возмущения (в текущий момент т) на операцию усред- нения по этому множеству с учетом заданной функции распреде- ления. В обоих вариантах можно принять одинаковое граничное усло- вие ^fe/(tf)s=0, (3.13) отталкиваясь от которого, производится рекуррентный пересчет. Находимое на каждом шаге рекурренции оптимизирующее уп- ♦ равлепие их зависит от произвольно заданного на уровне х состоя- ния в момент т, а следовательно, решение может рассматриваться как оптимальный закон управления с обратной связью по состоя- нию, которое, как предполагалось, точно измеряется: и*==их(х)==их(х[х]). (3.14) Задачи, в которых рекуррентная процедура осуществима в анали- тической форме, можно пересчитать по пальцам. Приведем класси- ческий содержательный Пример 3.1. Управление запасом при неопределенном спросе*). Пусть скалярная величина x[fc] обозначает запас продукта на скла- де в начале такта к, w[А] — объем спроса, up] — объем поставок на такте к. Тогда х\к +1]“х\к] + и[к\ — w[Zc], 7с = 0, 1, ... (3.15) *) С углубленным анализом этой проблемы можно познакомиться, напри- мер, по книге [4.6, гл. 4].
§ 3. УПРАВЛЕНИЕ ПРИ НЕДЕТЕРМИНИРОВАННЫХ ВОЗМУЩЕНИЯХ 513 Предполагаем, что спрос является неотрицательной случайной ве- личиной с известным распределением вероятностей, а объем поста- вок — управляющее воздействие, причем по смыслу и[к] 3» 0. При случайном спросе, вообще говоря, нельзя гарантировать, что х[к} > 0. Условимся, что при х\к] > 0 величина х[к} имеет смысл количества продукта на складе, а при х[к\ < 0 величина -х[*] имеет смысл долга, который со временем следует погасить. Затра- ты, связанные с работой склада, определяются оплатой поставок, затратами на хранение и штрафами за задержку в удовлетворении спроса. Примем, что затраты за один такт равны ( hx[k + 1],, х [к + 1] 0„ + + + II4+1|<0< <з-1в> где X, h, v — заданные положительные коэффициенты, имеющие очевидный смысл. Требуется минимизировать суммарные (за время [0, &,])’ ожи- даемые затраты путем выбора закона управления с обратной связью по измерениям запаса. Принятые предположения позволяют записать для данной зада- чи соотношение (3.12) в виде $х (х) = min {Xu + Jx (у) + Мю[т]^т+1 (у — w [?])}, где у Д х + и,. Jx(y) Д MW[Tj {Ji max (х[х + 1], 0) + vmax (— х[х + 1], 0)} =» = {h max (у — w [т], 0) + v max (— у + w [r],, 0)} — у OO e h J (y — w) d$>w[xi (u>) 1 (y) + v J (w — y) (u>). ° u Нетрудно проверить, что Д[у] являются выпуклыми функциями. Для последнего такта имеем М = min jXu+ . (у)1 = min [Ху + А. (у) I —lx. (3.17) 1 u^o 1 > 1 1 1 1 Минимизируемое выражение является выпуклой функцией и достигает мини- мума либо на границе (у = х), либо внутри допустимой области в точке Dhf-i, удовлетворяющей условию 4z-i (^-i) = - *- > *• где штрихом обозначена операция дифференцирования*). *) Если функция распределения является дифференцируемой, то Jx(y) также дифференцируемы. S3 а. д_ Псрвозианский
514 гл. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ Таким образом, оптимальное управление на последнем такте дается фор- мулой. 0, x{kf— 1]>УЙ/_Х. “ [*/ - Ч - _ х у + х р, - !]< (3,18> причем ( Лу-1 Х^Ук4-1’ 1 (ж)= | . , . * । г / * \ * (3.19)’ Функция (х) непрерывна и выпукла на всей оси х. По индукции можно показать, что все функции .55, (х), т kf — 1, обла- дают теми же свойствами. Действительно, обозначим ОО Gx М = л (у) + мюМ<5т+1 (у - W [т]) = zT (у) + J з?т+1 (у-w) as>wM (w). ‘ о (3.20> Функция С,(у) является выпуклой, как сумма (интегральная) выпуклых функций. Поскольку .55 т (ж) = — X® + min {Лу + (у)}, у>х то, повторяя проведенные при т — kf —1 рассуждения, приходим к установ- лению выпуклости Ях{х) по х, что доказывает справедливость индуктивного предположения. При этом выявляется и структура оптимального управления на любом такте: ( О, а:[т]>у*8 и*№ * , (3.21> где у*— корень уравнения 6ч (у)= X» Полученный результат содержательно интерпретируется следую- щим образом: для каждого момента т существует фиксированный уровень Ут, зависящий только от априорных данных X, h, v, такой, что если запас на складе выше ут, то продукт поставляться не должен; в противном случае поставка должна быть такой, чтобы дополнить имеющийся запас до уровня Ут- О Вместе с тем закон управления (3.21) является законом типа отрицательной обратной связи по состоянию, представимым кусоч- но-линейной функцией (рис. 10.3) и*[т] = -/(«[%]) (обратная связь линейна в пределах допустимой области и[т] > >0). О
§ 3. УПРАВЛЕНИЕ ПРИ НЕДЕТЕРМИНИРОВАННЫХ ВОЗМУЩЕНИЯХ 515 3.3. Линейно-квадратичная задача. Рассмотрим далее проблему оптимального управления линейной дискретной системой общего айда _ х[к + 1] = 4ж[А:] + Вн[/с] + w[k], ж[0] = х\ (3.22) где rr[&] — вектор состояния, и\к\ — вектор управлений, w\k} — век- тор возмущений, А, В —заданные матрицы (возможно, зависящие от к). Пусть показа- / тель качества задан в виде (3.2), где / ^(х[А: + 1J, «[£:])= хт[А: + 1 + 1] + У*/ + uT[fc]Bu[A:], (3.23)' " / причем Q > О, В > 0 — заданные матрицы, рис ,0 „ также, возможно, зависящие от к. Предполагаем, что на выбор и[к~\ явных ограничений не наложе- но, a w\k] является последовательностью взаимно . независимых центрированных случайных векторов с известными дисперсионными матрицами Dwm. Уравнение (3.12) может быть записано в виде (х) = min [(Ах + BuyQ (Ах + Ви) + u^Ru + + Мю(т) {»т [т] Qw [т]} + М№(т] {^т+1 (Ах + Ви + w (т])}]. (3.24) Используем матричное представление M»[t] {wT [т] Qw [т]} = tr {BroW<?} A . и учтем, что это слагаемое не зависит от х, и. Для последнего такта имеем Жу-1 (х) = min [(Ах + Buy Q (Ах + Ви) + итДм] 4- щ ' и * Минимум достигается при где #*[&/ - 1] = (IPQB + В) ~'B'QA, так что (х) = х^Р[kt — 1] х + где P\kt - 1] = (А*[к! - i\YQA*[kt - 1] + (K*[kt - l]yRK*[kt - 1], 4* [kt — 1] Д A — BK* [kt — 1]. По аналогии можно предположить, что для любого к ^К(х) = хгР[к]х + п[к\, . (3.25) S3*
516 ГЛ. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ где матрицы Р[к{ и скаляры должны быть соответствующим образом подобраны. Это предположение легко проверить с по- мощью (3.24). Если оно верно для к = т + 1, то &х {х) = min {{Ах + Buy {Q + Р [т + 1]) {Ах + Ви) + и^Ви} + + Рч + ^{DwMP [т + 1]} + л [т + 1], (3.26} так что минимум достигается при и = и*[т] — —К*[т]ж, (3.27} где = [Вт {Q + Р[х + 1])В + Я]-*ВТ {Q + Р[х + 1]) А, (3.28) \ и, как и предполагалось, верно (3.25) при к = х, причем Р[т] = (Л*[т])т(<2 + Ят+ 1]) 4*[т] + (Я*[т]ГЯ£*[т|, 4*[т] А А— ВК*[х], (3.29) л[т] — л[т + 1] + tr {Dw[x} {Q + Р[т + 1])). (3.30) Таким образом, установлено, что а) оптимальным является линейный закон управления (3.27) с обратной связью по измерениям текущего состояния x = xfx]-r б) коэффициенты усиления 7£*[т] могут быть вычислены ш> априорным данным с помощью рекуррентных соотношений (3.28) г (3.29), в которых можно принять Z5[/c/J = 0, л[/с/] = 0; в) значения Р[т], -К*[т] не зависят от характеристик возмуще- ния; г) наличие случайных, непрогнозируемых возмущений прояв- ляется лишь в ухудшении оптимального значения функционала на величину л [0], определяемую только дисперсионными матрицами,, независимо от формы закона распределения. Это практически важные выводы. Стоит отметить, что они могут быть получены и более простым путем, как это делалось в гл. 7 для стационарной дискретной задачи или в гл. 6, § 8, для непре- рывного аналога нестационарной. Вместе с тем следует подчеркнуть их эвристическую ценность, Поскольку закон управления (3.27) оказался тем же самым, что и в соответствующей детерминированной ЛК-задаче, то можно по- пытаться строить субоптимальные управления и для вероятностных задач другого типа (не являющихся линейно-квадратичными!), при- нимая за основу закон управления с обратной связью, найденный опять-таки в детерминированной задаче. Для ряда проблем (см., например,* [6.6]) этот прием оказывается исключительно удачным, по крайней мере, если случайные возмущения ограничены и имеют малую дисперсию.
§ 4. УПРАВЛЕНИЕ ПО НЕТОЧНЫМ ИЗМЕРЕНИЯМ 517 § 4. Управление с обратной связью по неточным измерениям 4.1. Оценка состояния. Откажемся от гипотезы о том, что в каждый момент может быть получена точная информация о со- стоянии объекта, и будем далее считать, что результаты измерения искажены случайными помехами. Пусть описание объекта дано рекуррентными соотношениями х [/с + 1] = u[7c]) + х [0] = ж0, (4.1) где {«•’[/«]) — последовательность взаимно независимых случайных (векторных) величии, дискретный белый шум, Fk(-) — известные функции*). Пусть результаты измерения связаны с состоянием объекта уравнениями ^]=ад*])+ад, (4.2) где Ф,,( •) ~ известные функции, a {7V [Zc]> — последовательность слу- чайных величин, независимых в совокупности и не зависящих от возмущений ш[&]. Дополнительно предполагается, что заданы функции распределе- ния возмущений помех и начального состояния (начальное состояние считается случайным и независимым от {пфф, {У[Аф)- Выбор управления и[т] в любой момент т может строиться толь-, ко на основе априорной информации и результатов измерений, по- лученных к этому моменту: . = ИИ, . .„ЯтР, так что любой закон управления с обратной связью должен пред- ставлять собой уравнение вида и[т] = и1(р(г,)( т = 0, 1, ..... (4.3) где Uz (•) — некоторые функции. Оставив пока в стороне вопрос о том, как выбрать эти функции наилучшим образом, займемся вспомогательной проблемой наилуч- шей оценки состояния системы (4.1), замкнутой обратной Связью типа (4.3), по результатам измерений (4.2). С этой целью попытаемся найти выражения для условных рас- пределений вектора состояния х[т] после получения набора ре- зультатов измерений ую, tPxwtx/y™) или соответствующих ус- ловных плотностей Для сокращения записи примем *) Описание объекта несколько упрощено по сравнению с § 3. В болев полном и общем виде материал, излагаемый в этом параграфе, можно найти в книге [10.1]. 34 д, а, Первозванский
518 ГЛ. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ обозначения *) РхЫ(х/Ум)Лр(х[х]/у<Ъ) Д рх, рхю(х) Д р(л?[0])« (4.4) Теорема 4.1. Условные плотности вероятности состояния системы (4.1) — (4.3) подчиняются рекуррентному соотношению f pxh (х [т], х [т + 1]) dx [т] 'Рг+1=7Т—2--------------------:------------->: Т = 0, (4.5) j j pxh (х [г], х [т + 1)) dx It] dx [x -|- 1] где Л (44 4T + Л) = (4^ + 1] — ulT]))X X/’«[T+D (4* + 1]-Фг + 1(4Т+ 1])) . (4.6). a „ _ p^IODpam^IOI-^UIQI)) . j P 101) PN[O] (y (0] - Фо (ж [0])) dx [01 Доказательство. Напомним некоторые формулы теории вероятностей, необходимые для оперирования с условными плотностями (см., например, [4.8]). Пусть в, &, с — три взаимосвязанных случайных величины. Обозначим плотность их совместного распределения р(я, 6, с), распределения а и Ъ при фиксированном с через р(а, b/с), распределения а при фиксированных Ь и с через р (а/b, с) и т. д. Тогда нам понадобятся три формулы: р(а, b/c) = p(b/c)p(a/b, с) (4.8) (формула следует из определения условной вероятности), р (а/с) ~ J р (b/с) р (а/b, с) db (4.9) (формула получается путем интегрирования (4.8) по всем возможным зна- чениям Ь), р (а/Ъ) = (4.10) j Р («) Р (b/a)da Формула (4.10) называется формулой Байеса и вытекает из тождества р(а/Ъ)р(Ь) = р(Ь/а)р(в) = р(а, Ь). (4.11) Очевидным обобщением (4.10) является следующая формула: р (alb, с) = , . (4.12) j р (а/с) р (b/а, с) da С помощью приведенных формул построим рекуррентное соотношение для плотностей р(х[т]/г/к)). Пусть задана р(х[т]1у{х)}- Из уравнения объекта (4.1) следует, что р(ж[т +1]/ж[т], и[т]) = Pw[zj(^[r+1] — Рт(х[т1, и[т])), (4.13) ♦) При использовании сокращенных обозначений не следует забывать, что ж[т] как аргумент плотности распределения уже не является случайной вели- чиной,
§ 4. УПРАВЛЕНИЕ ПО НЕТОЧНЫМ ИЗМЕРЕНИЯМ 519 поскольку при фиксированных х[т], и[х] величина х(х +1] отличается от w [т] только фиксированным смещением, что приводит к сдвигу аргумента плотности распределения на величину этого смещения. В силу аналогичного соображения получаем из уравнения (4.2), что р(у[т + 1] /х [т + 1]) = Piv(T+i](y[t +1] — + 1])). (4.14) Положим в формуле (4.8) -а = х[х+1], & = у[т+1], с = у<г>. Т°ГДа р(х[т + 1], у[т+1]/у<”) =р(у[т + 1]/у<’>)р(Ж[т + 1]/У<’+»). (4.15) Аналогично имеем д(ж[т], 4т+ 1], у[т + 1]/у(т)) = Р(x[xWz>) X Хр(«[т +у(П)р(у[т+1]/а:[т], г[т +1], у(”). (4.16) Учтем далее, что и[х] предполагается функцией от измерений у(г), и из фик- сации у{т> следует фиксация и[т]. Поэтому с использованием (4.13) найдем р(х[т+ 1]/ж[т], y(t>) = />„,|г|(.г[т + 1] — Л(.т[т], п[т])). Равным образом замечаем, что в силу (4.14) д(у[т + 1]/х[т], х[т + 1], у(т>) =р(у[т+1]/х[т + 1]) = = Рщг+1](!/[т + 1] — Фг+1(ж[т-Ь 1])). Тем самым правая часть (4.16) задана. Интегрируя по переменной ж[т], на- ходим Р (х [т + 1], у[х + Ц/у(т)) = J р (х [г], X [т + 1], у [х + 1 ]/у(т)) dx [т], (4.17) а с другой стороны, в силу (4.15) ^т+1 А р (® 1Т + 11/^(T+1>) = = P^tT+1b у 1Т + = p(«h+ 1|, у(т + 1]/у(т)) р(у 1г + 1]/У^) J р (х [т-|- 1J, у [т-|- 1|/у(т)) dx [т-ф 1) Подставляя в (4.18) выражения (4.17), (4.16), приходим к основной рекуррент- ной формуле. Начальная плотность до = р (х [0]/у [0)) также находится с по- мощью формулы Байеса с учетом заданной априорной плотности р (х[()]). В качестве наилучшей оценки состояния х[т] по результатам измерений ум естественно принять наиболее вероятное значение д[т], т. е. величину, доставляющую максимум по х условной плот- ности pt при фиксированном ум. К сожалению, вычисление такой оценки в общем случае сталкивается с практически непреодолимы- ми трудностями, ибо в ходе рекуррентного пересчета pz требуется проводить интегрирование по 2п-мерной области, причем сохраняя свободными /t/Ш параметров (п — размерность х, т — размер- ность у). 4.2. Фильтр Бьюси — Калмана. В предположении, что система является линейной, а все случайные факторы имеют нормальное (гауссово) распределение, процедуру построения наилучших оценок состояния удается существенно упростить. 34
520 гл. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ связки Рассмотрим систему а;[й + 1] = Л[ВДА:] + В[ф[/с]+47с], 40] = х\ (4.19) у[к] = С[к]х[к] + ЛВД, к = 0, 1, ..., (4.20) где Л[&], #[&], С[к] — заданные матрицы, векторы х°, «4М, ММ, к = 0, 1, ..., случайны и взаимно независимы, а их плотности рас- пределения в силу гипотезы нормальности имеют вид Рх» (х) = с0 ехр -у (х — т0) W1 (х — /п0)|, Риад 04 = с»ехР -у Рдад (А?} = ехр ---у jVTDA>17vj. Матрицы Do, Dw, DK являются матрицами ковариаций соответ- ствующих векторов, причем 4М, N[k] для' простоты предполагают- ся центрированными, а х" имеет математическое ожидание т0. Константы Со, cw, cN известным образом выражаются через Do, Dw, Dn в силу условий нормировки. Теорема 4.2. Распределение вектора состояния 4Т] линейной системы (4.19) при условии, что фиксированы результаты наблю- дений ум = (г/[0], ..., у{т]), является нормальным, если нормально априорное распределение начальных условий х°, а последователь- ности {^[к]}, {2V[A:]} являются нормальными взаимно независимыми белыми шумами. Наилучшая оценка ж[т] вектора состояния, совпадающая с его условным математическим ожиданием, может быть вычислена ре- куррентно, по мере получения наблюдений, согласно формуле фильтра Бъюси — Налмана ф+l] = Л[^;]4т] + B[тMтi + +L[т]{y[т+ 1]-Пт+Л](А[т]4т] + Б[т]4т])}, т = О, 1, ..., (4.21) где х [0] = D-1 [0] (D^m. + Ст [0] D^y [0]), L[t] = D(t+ 1]Ст[т+ 11ВД1, т = 0,1, ..., < -22> a B[t], т = 0, 1, ..ковариационная матрица ошибок оценивания е(т],е[т] Д х[х] — я[т], может быть вычислена по априорным данным с помощью рекуррентных соотношений D~y [т + 1] = (А[т]О[т]Ат[т] + nJ"1 + Ст[т + 1]/)4С’[т + 1], т = 0, 1, ..., (4.23) D-1 [0] — Dq1 + Ст[0] Щ1С[0].
§ 4. УПРАВЛЕНИЕ ПО НЕТОЧНЫМ ИЗМЕРЕНИЯМ 521 Доказательство. Введем сокращенные обозначения для условных ' плотностей pt А Р (х [т]/у(т)), Рт+1/т А Р (х [т + 1]/у<х)) и докажем, что они являются нормальными. Доказательство проведем по индукции. Пусть р-, нормально. Тогда спра- ведливо представление . .. рт = с [т! ехр А (х |т] — т [т])т/9~1 [т] (х (т] — т [т])}, (4.24) где т[т], имеют смысл условных математического ожидания и ковари- ационной матрицы вектора ж[т], а с[т]—нормировочная константа, завися- щая только от О[т]. Тогда ж[т + 1] в силу (4.19) является линейной комбинацией нормально распределенных векторов и также нормален, а следовательно, справедливо представление /’т+1/т = с[т+1/т] схр Iх + С “ т Iх + 1/т])тП~1 [т+1/т] х X (х[т+Ц-т[т+1/т))}, (4.25) где т[т4 1/т], £>[т4- 1/т] имеют смысл условных математического ожидания и ковариационной матрицы вектора ®[т4- 1] при фиксации Поскольку, как и ранее, предполагается, что управление и[т] фиксиро- вало при заданной последовательности наблюдений у^', то »[т 4- 1/т] = А [т] тГт] + В[т]и[т], (4.26) а для ковариационных матриц имеет место связь Р [т+ 1/т] = А [т]25[т]Дг[т] +DW, (4.27) устанавливаемая точно так же, как это делалось в гл. 7, § 2, для ковариацйй безусловных распределений. Вычислим далее pt+i с помощью формулы Байеса (4.12): Рт+1 Д Р Iх + Wv Iх + У^> = ________Р (ж [т + 1 ]/р(Т)) Р 6/ ]Т 4- 11/т + 1], у(т))_____ J р{х [т 4~ 1]/у(1)) р (у |т+ 1]/х |т 4* 1], y(r>)dx |т4-1] ( 8) Согласно (4.20), имеем у[т 4-1] = С[т 4- 1]лг[т 4-1] 4- N[x 4-1], так что при фиксированном х[т 4-1] вектор у [т 4-1] распределен нормально с математическим ожиданием С[т + 1]х[т + 1] и ковариацией, совпадающей с ковариацией помехи, т. е. - Р (У [*4-1]/® к 4- 1]) = = cN ехр А. (у [т 4-1] - С [т 4-1] х [т4- Ц)’^1 (у (т4-1] -С|т4-lk(T4-l])j. Учитывая (4.25), (4.28), можем записать T't+i = сехр|—-1-((х[т4-1] т-m ]т 4-1/т])тД~1 [т4-1/т] X Х(г[т+1]-т1т4-1/т])4-(у[т4-П — - С ]т 4-1] т[т4--1])тР^ (у Гт4- И - С 114-И «Ь + И)]}, (4.29)
522 гл. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ где в с отнесены все сомножители, заведомо не зависящие от х[т+ 1] (в том числе, знаменатель представления (4.28)). Выражение в квадратных скобках равно [т + 1] (Z)-1 [т + 1/т] + Ст [т + 1] D^C [т + 11) х (т + Ц - - 2хт [т + 1] (Z)-1 [т + 1/т] т (т + 1/т] + Ст (т + 1] D^y |т + 1]) (4.30) с точностью до слагаемых, не зависящих от х[т+ 1], а следовательно, с точ- ностью до слагаемых того же типа представимо в виде (х[т + 1] — т[т + 1])тй-1[т + 1] (х[т + 1] - т[х + 1]), (4.31) если выбрать т[т + 1], £>[т 4-1] из условий тождественного совпадения сла- гаемых 1-го и 2-го порядка по х[т + 1] в (4.30) и (4.31), т. е. принять О"1 {т + 1] т (т + 1] = D~1 [т + 1/т] т [т + 1/т] + Ст [т + 1] D^y [т + 1], (4.32) D~l (т 4- 1] = D-1 [т + 1/т] + Ст ]т + 1] D^C [х + 1]. (4.33) Тем самым доказано, что из нормальности дт следует нормальность pt+1, при- чем найдены выражения для т[т+1], О]т + 1], имеющих смысл условных математического ожидания и ковариации вектора ж[т + 1] при фиксирован- ных наблюдениях у<х+1>. Для завершения индукции остается доказать нор- мальность р0 Д р (х [0]/у [0]). Поскольку Р(*Ю1) р(у 101/^101) Р(У]О]) "=c[O]expf— 1 (x[0]-mo)TZ>71(xl0]-mo) + + (У ]0] - С [0] х ]0])т^ (у [0] - С [0] х (01)}, то можно повторить те же преобразования, что и в (4.29), установив и факт нормальности, и формулы: Z^1 [0] т ]0] = + Ст [0] D^y [0], (4.34) D-1]0] = Z)-1 + CT[0]Z)^1C(0], (4.35) задающие условные математическое ожидание и ковариацию начального сос- тояния после получения исходного наблюдения у [О]. Отметим, что (4.34), (4.35) можно рассматривать как частный случай (4.32), (4.33) при т — —1, ес- ли формально положить m[0/—1] = т0, Р[0/—1] = О0. Таким образом, индуктивное предположение доказано, причем получены рекуррентные соотношения для пересчета условных математических ожида- ний и ковариаций. Поскольку плотность нормального распределения рх достигает максимума в точке т[т], вектор т[т] является наиболее вероятным значением вектора состояния хМ после получения наблюдений т. е. т[т] является наилуч- шей оценкой х [т] вектора х[т] в смысле данного выше определения,
§ 4. УПРАВЛЕНИЕ ПО НЕТОЧНЫМ ИЗМЕНЕНИЯМ 523 Остается вывести соотношения (4.21)—(4.23). Ошибка оценивания'Дт] = ж)т] — mjt] является центрированным случай- ным вектором с матрицей ковариаций О[т]. Из (4.27), (4.33) находим, что D-1 [т + 1] = (Л |т] D ]т] Лт |т] + Oj-1 + Ст [т + 1] D^C |т + 1], а это соотношение совпадает с (4.23). С другой стороны, из (4.32), (4.33) следует от[т + 1] = = D ]т + Ц [(D-1 ]т + Ц - Ст [т + 1] D^C (т + Ц) т (т + 1/т] + + С’г [т -Н] 1Т + О] = m 1т+ 1/т] + D [т+ 1] Ст ]1+ 1] D~l (у (т+ 1] — — т [T -|- 1/т]), что приводит к (4.21), (4.22) с учетом (4.26) и определения х[т] = и[т]. Замечание 1. Условное математическое ожидание т[т] явля- ется и наилучшей оценкой вектора х[т] в смысле метода наимень- ших квадратов (МНК). Точнее, если (/ — произвольная положи- тельно определенная матрица, то вектор g = £*, доставляющий ми- нимум функции Л Ю А М {(X [т] - IYQ (х1 т] - совпадает с иг[т]. Действительно, функция Д(£) имеет единствен- ный минимум при § = £*, удовлетворяющем условию экстремума Vт Ш h=&* = 0 => QMДх Гт) — £*)/yw} = 0 => . =>£*=М {xhl/z/W} Д т[т]. Замечание 2. Если оценка вектора х[т] должна строиться по совокупности предшествующих наблюдений то наилучшей (в обоих указанных выше смыслах) является оценка х[т], совпа- дающая с условным математическим ожиданием т [т/т — 1]. Из (4.26), (4.27), (4.32), (4.33) следует рекуррентное соотношение типа фильтра Бьюси — Калмана, но имеющее несколько другой вид: х[т + 1] = Л[т]х[т] +5[т]и[т] + Г[т] (у[т] — С[т]х[т]), (4.36)’ где L[t] = H[t]D[t]Ct[t]ZV,: х[О] = шо. Если матрицы Л, С постоянны и существует единственное поло- жительно определенное решение уравнения D' = (ЛРЛТ 4- D^-1 + С’/Д’С, (4.37) равное Z),», то [3.3] D[т]Dx, L [т]->Б», = LooCW, L [т]->Lx = AD^D^. Отсюда можно вывести формулы для стационарного фильтра Бью- си — Калмана, приведенные в гл. 7, § 2. Отметим лишь, что мат- рица ковариаций оценки х[т] есть D[x + 1/т] и ее установившееся
524 ГЛ. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ значение связано с Dm соотношениями 5оо Д Km D [т + 1/т] = AD^ + £>«, = [ D~l + (4.38) Т-*оо Если О» удовлетворяет (4.37), то D„ удовлетворяет уравнению D^Atb-' + eD^Cy^ + D», (4.39) которое преобразуется к виду (2.36), указанному в гл. 7, если вос- пользоваться несложно проверяемым матричным тождеством (/Г1 + CWC)'1 = Ь ~ DC1 (Dn + (fbcy-'CD. (4.40) 4.3. Оптимальные обратные связи. Вернемся к основной пробле- ме — построению оптимального управления с обратной связью, т. е. к выбору наилучших функций wt(p(I)). Пусть исходный показатель качества задан в виде J = S gk(x[k + 11, и\к\) = й=0 Й/-1 = 2 gdEft(x[7c], u[fcl) + и[к]]. (4.41) fe=0 Ожидаемый результат при применении любого управления и[к] = — uh(ym) можно оценить величиной Й/-1 /е(рМ)д 2 М {gk[Fh(x[k]t п[М) + ш(&1, и[к\]/у^} = Л=9 h/-l = 2 f \gh[Fh{x\k\,u{k}) + w[k\,u[k\\p4h}(xlyW)y. fe=0 X Pw[k]{w)dxdw. (4.42) Подчеркнем, что оценка ведется с учетом полученных к каждому моменту наблюдений и используются плотности и математические ожидания. , ' В соответствии с общей логикой динамическою программирова- ния введем функции &х(ум), определяемые как минимальные зна- чения ожидаемого результата, полученного на интервале [т, /«/] с учетом того, что к началу этого интервала уже известен набор ре- зультатов измерений. Действуя по той же схеме, что и в §§ 2, 3, нетрудно построить рекуррентное соотношение ^t(P(x)) = min M{gx[ET(;r[T], н[т]) + w [т], н(тП + Ф] . +^r+i(y<x+1Wx))h . * = 0,4.., kt-it (4.43) С вычислительной точки зрения это соотношение практически бес- полезно, ибо требует вычисления и хранения функций аргумент
§ 4. УПРАВЛЕНИЕ ПО НЕТОЧНЫМ ИЗМЕРЕНИЯМ " 525 которых достигает размерности mkt. Однако для линейно-гауссовых (ЛГ) проблем с его помощью легко получить важный качественный вывод. ' , . - Теорема 4.3. В предположениях Т.4.2 функции $х, а следова- тельно, и оптимальные управления и*[т] зависят от yw лишь кос- венно, через оценки х[т]*), т. е. ^х(ую) = ^(4TD> и*[т] = U*(x[t]). (4.44) Доказательство очевидно, поскольку у,т> входят в (4.43) только че- рез условные распределения у(,)), но таковые, по Т.4.2, являются нор- мальными и полностью задаются своими средними m [т] =2[т] и дисперсион- ными матрицами £>[т]. Последние же не зависят от результатов измерений и определяются по априорным данным. Общая структура оптимальной системы управления представле- на на рис. 10.4. Она состоит из линейной части, включающей объ- ект, измеритель и фильтр Бьюси — Калмана, а также безынерцион- ного нелинейного преобразователя, вырабатывающего сигнал управ- ления на основе оценок т[т]. Рис. 10.4 4.4. Теорема разделения. В общем случае (при произвольном показателе качества) характеристика безынерционного преобразова- теля зависит от характеристик случайных факторов. Однако стоит выделить важную ситуацию, когда эта зависимость отсутствует. Теорема 4.4 (теорема разделения). Пусть показатель качества (4.31) является квадратичным Sh (%[k + 1], u[fc]) = x*[k + l](?4ft + 1] + (4.45) где Q, R — заданные симметричные матрицы Q > 0, R > 0, а явные ограничения на u[k] отсутствуют. Пусть описание объекта и измерителя удовлетворяет условиям Т.4.2**). Тогда оптимальное преобразование оценок т[т] в сигнал управления и[т] не зависит от характеристик измерителя и совпа- *) Величины с такими свойствами принято называть достаточными ста- тистиками. **) Задачу оптимального управления, удовлетворяющую условиям Т.4.4, принято называть липейно-квадратично-гауссовой задачей или, сокращенно, ЛКГ-задачей.
526 ГЛ. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ дает с оптимальным преобразованием вектора состояния х[х] в получаемым при наличии непосредственных точных данных о со- стоянии. Доказательство. При выполнении условий Т.4.2 соотношение (4.43) можно записать в виде #,(*[*1) = min Rt(“- ® 1Т1) + ^r+i (4.46) где -gx = Mx(T]{Mwtt]gt(4x[T] + Ви 4- а>(т), п(т])/х(т]}, (4.47) ^x+i = Мя[Т]Мх[т1{МЮ[г]^,+1(л:[т + 1])/х[т]}, (4.48) причем в силу (4.19) 4-(4.21) *) я[т + 1] = Лх[т) + Ви 4- + /Дт] с[А (х(т) — х[т]) + w [т] ] 4- £[т4Д4т 4-1]. (4.49) Выпишем подробнее выражение gx с учетом (4.35): gx = МХ(1]{(4а:[т] 4- Bu)'tQ(Ax[t] 4- 5«)/х[т]} 4- М„.Гт](шт[т]Qw[т]} 4* u^Ru = = Цафг] 4- Bu)?Q(Ax[-c] 4- Ви) 4- u^Ru 4- tr{£> [г) Л Т(?Л 4- DWQ}. (4.50) Сопоставим это выражение с входящим в (3.24) выражением ожидаемых «за- трат» за такт т при точных измерениях х[т): gx(u, Ж[Т-]) = = МШ[т]{(41л:[т] 4- Ви 4- юрт) )T<2(4xft] 4- Ви 4- ш[т]) 4- u^Ru) = = (Ах[т] + Bu)XQ(Ax(x] 4- Ви) 4- 4-(4.51) Они совпадают с точностью до замены х[т] па его оценку х[т) и появления дополнительного слагаемого, определяемого дисперсионной матрицей О(т]. Поэтому по аналогии с (3.25) будем разыскивать функцию ^s(x[/cl) в виде ЯьЩк]) = x?[k]Plk]x(k] -f-nffc], (4.52) причем _ ^k/(x[kf]) = 0, itRf] = 0. Если (4.52) верно при к = т 4- 1. то &м) = min 1а 4- м RT [т 4- И Р [Т 4-1] X [т 4- и/x [т]}1 4- Я [т 4-1]. и . (4.53) -С учетом (4.49) имеем М{хт[т 4-1]Р[т 4-ll^fx 4-1]/х[т]} = = (4х[т] 4- Ви)тР[х 4-1] (4х[т] 4- Ви) 4- tr{De[T]P(x 4-1]}, (4.54) где De [т] —дисперсионная матрица вектора ошибки прогноза е [т] Д х [т 4-1] — (Ах [т! 4- Ви) = = L [т] СА (х [т] — х [т]) 4- L [т] CW (т] 4- L [т] N [т 4- 1], *) Здесь и далее зависимость матриц А, В, С от т для краткости опущена.
§ 4. УПРАВЛЕНИЕ ПО НЕТОЧНЫМ ИЗМЕРЕНИЯМ 627 состоящего из трех центрированных взаимно независимых слагаемых, так что М{е[т]}=0, Рс[т] = М{е[т]ет[т]} = = £[т]С[Л1)[т]ЛТ + Рв]СТ£Т[т] + LP[x\DNL[%\f (4.55) Подстановка в (4.53) представлений (4.50), (4.54) дает (х [т]) = min [(Л? [т] + Вм)т (<2 + Р [т-|- 1]) (Ах[т] ф- Ви) 4- итЯи] ф, л [т], (4.56) где _ _ я[т] = я[т + 1] + tr{DwQ) + tr{0«[T]P[T + 1]}. (4.57) Поскольку (4.56) совпадает с (3.26) с точностью до замены г[т] на г[т], то устанавливаем справедливость индуктивного предположения, а вместе с ним и справедливость формулы и*[т] = —К*[т]а:[т], где К*[т] дается (3.27), (3.28). » Основное утверждение теоремы доказано. Кроме того, (4.57) показывает, что наличие ошибок измерения приводит к дополнительному ухудшению функционала на величину У, tr{£>e[T]P(T+l]}. т Таким образом, мы, наконец, строго установили справедливость . основного утверждения линейной теории, которое без доказательства приводилось в гл. 6 и 7. Правда, доказательство дано лишь для дискретных систем во избежание формальных сложностей, связанных с понятием белого шума *). 4.5. Эвристика. При решении нелинейных задач приходится при- бегать к эвристическим приемам построения обратных связей, в луч- шем случае претендующих лишь на субоптимальность. Основная ;идея проста и содержит два этапа: (а) нахождение субоптимальных оценок состояния,, (б) использование субоптимальных алгоритмов управления, описанных в § 2, 3, где вместо точных значений пере- менных состояния вводятся полученные на этапе (а) оценки. Иначе говоря, основная идея состоит в перенесении факта, до- казанного в теореме разделения для ЛКГ-задач, на общую ситуа- цию. Важно, однако, понимать, что теорема разделения в общем случае неверна. Даже если оба этапа выполнены оптимально, то полученная в результате их композиции обратная связь, как прави- ло, неоптимальна. Поэтому, вообще говоря, нет и смысла в борьбе за оптимальность оценивания, если эта оценка используется в кон- туре обратной связи. Опишем одну из практически полезных эвристических процедур, ориентируясь на непрерывное описание объекта х — ](х, и, (4.58) и измерителя ^ = Ф(ж)+ #(/)’. (4.59) *) Строгое доказательство для систем, описываемых стохастическими диф- ференциальными уравнениями, можно найти в [6.4].
528 гл. 10. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ Возмущение w(t) будем считать состоящим из двух компонент: w(t) = wM(i)+ w6(t), (4.60) причем wK(t) — медленно меняющаяся компонента, которая стано- вится известной в, каждый момент времени с помощью дополнитель- ного датчика, a w5(t) — непосредственно не наблюдаемая быстро меняющаяся компонента. Пусть исходный показатель качества за- дан в виде' т f [£i U) + (“)Ж , (4.61) о Управление строится как обратная связь по измерениям у и w„. Выделим в управлении также медленную, «„(£), и быструю, компоненты: u(#) = iiM(i) + w6(0. . (4.62) причем наложим на выбор медленной ограничение /(^м, им, znM)0, (4.63) где хк — медленная компонента в таком же представлении со- стояния: o:(f) = х6(1), |ij < lx«l. (4.64) В силу уравнений объекта имеет место связь хм + xt = f (хя + х6, и„ + и6, wK + w6) При выборе управления заменим ее на линеаризованную. С учетом (4.63), (4.64), получим xs = Аях6 + Baiit + GMwr„ (4.65) (здесь и далее все производные вычислены при х Хм, 14 44м, w == грм и использованы упрощенные обозначения для матриц про- изводных). Произведем также упрощение показателя (4.61), раз- лагая функции gj(x), gi{x) в ряд Тейлора в окрестности х = хя, и —Нм с удержанием слагаемых 2-го порядка: т г J ~ J [gt (жм) + g2 (uM)l dt + J о , о 1 J, , -я~Хб + s-u6ldt + dx v du J T 7 J [z<5<2m£6 + Иб#м«б] dt, (4.66) 0
S 4. УПРАВЛЕНИЕ ПО НЕТОЧНЫМ ИЗМЕРЕНИЯМ 52!) где й8 *м = — 1 R — д ‘ ’ М йи2 ‘ Подчиним выбор хк, ия требованию минимума первого слагаемого с учетом ограничения (4.63). Это эквивалентно выбору uM(f) из решения в каждый момент t задачи min {у, (.хи) + gt(u„)/f[xa, и„, н?м(г)] = О}. (4.67) Тем самым xa(t), uM(f) могут быть найдены в каждый момент t, а вместе с ними вычислены матрицы 4М, Вж, G„, Q,.„ RM и матрицы Ф(хм), Са в линеаризованном описании измерителя у Ф (жм) + СмХб + /V (t), См = д—. (4.68) Предположим далее, что tPe(f), N(t)— центрированные случайные процессы с заданными спектральными свойствами. Тогда возникает возможность построить ли- нейную обратную связь, обеспечивающую минимум математического ожидания 3-го слагаемого в (4.66), при- чем математическое ожида- ние 2-го слагаемого обратит- ся в нуль в силу центриро- ванности х6, щ. Во избежа- ние необходимости использо- вать значения указанных матриц в будущем придется ограничиться приближением, даваемым методом заморо- Рис. 10.5 женных параметров (гл. 6, § 8). Если считать N(t) белыми шумами, то линейная обратная связь примет вид — KMXQr •Гб — -^м*Гб 4“ + LK (ув CM^g)s Уб *= у — Ф (хм), (4.69) где матрицы Кя, L„ строятся с помощью решения матричных квад- ратных уравнений типа Лурье — Риккати по известным в каждый момент матрицам 4И, Вя, ... Если же ws(t) имеет дробно-рацио- нальную спектральную плотность, то та же схема требует исполь- зования формирующего фильтра. Описанная эвристическая проце- дура в разных модификациях широко используется на практике. Ее структурная схема в обобщенной форме представлена на рис. 10.5.
530 ГЛ, 10, СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ Схема включает два уровня управления: «быстрый уровень», обеспечивающий стабилизацию объекта и борьбу с быстрыми воз- мущениями и помехами, и «медленный уровень», обеспечивающий оптимизацию режима, относительно которого ведется стабили- зация*). Сделаем три дополнительных замечания, касающиеся практиче- ской реализации схемы. (а) В силу предполагаемой медленности изменения w„(t) ре- шение задачи (4.57) может производиться только в те моменты, когда обнаружилось существенное изменение wM(i) по сравнению с его значением, принятым в предшествующем решении. При этом зачастую можно упростить пересчет «уставок» хк, ия, используя приемы теории возмущений, для статических задач оптимизации [6.6, гл. 1, 2]**). В соответствии с этим лишь в отдельные моменты времени должен вестись пересчет параметров 6Ы Д {Лм, В№, Км, в законе управления с обратной связью по «быстрым переменным». (б) При технической реализации расчет уставок и параметров по достаточно сложным алгоритмам обычно ведется с помощью управляющей ЭВМ, а выработанные ею сигналы передаются на микро-ЭВМ или аналоговые вычислители, вырабатывающие сигналы управления непрерывно. При использовании аналоговых вычислителей приходится пре- дусмотреть наличие усилителей, с управляемыми от ЭВМ верхнего уровня коэффициентами. Такие вычислители обычно называют ре- гуляторами с автоматической настройкой (самонастройкой) пара- метров***). Зачастую оказываются работоспособными и более простые си- стемы, где параметры регулятора выбираются фиксированными по априорным данным и не меняются в ходе работы системы, хотя изменение самих «уставок» ведется. Следует учесть, что если по- мехи в измерениях еще более высокочастотны, чем «быстрая» ком- понента возмущений, приведенная к выходу объекта (отрабаты- ваемый сигнал), то целесообразно применение простых схем рас- чета, описанных в гл. 3. Иначе говоря, для подавления помех ис- пользуются произвольные фильтры с малыми постоянными време- ни, лишь бы они затрагивали только диапазон частот, характерный для помех. (в) В описанной,процедуре не учитывались явные ограничения на допустимый уровень управляющих воздействий типа u(t)^U, где U — заданное множество. При наличии таких ограничений при- ходится принимать решение о разделении допустимой области па «зоны действия» быстрой и медленной компонент управления. *) Медленные компоненты им, в технической литературе часто назы- вают уставками для «быстрого» регулятора. **) См. также ниже, гл. 11, § 2. ***) См., также гл. И, § 3.
§ 4. УПРАВЛЕНИЕ ПО НЕТОЧНЫМ ИЗМЕРЕНИЯМ 531 Вместо условия ставится условие и [j cz U, (4.70) где V «вписывается» в U так, чтобы даже при выходе uM(f) па границу О при решении задач (4.67) с добавленным ограничением (4.70) суммарное управление не выходило из U. Поскольку значе- ние ue(t) случайно, то можно требовать лишь малой вероятности выхода. Однако заранее неизвестны даже вероятностные характери- стики «б(0- Поэтому задаются лишь априорными оценками диспер- сий компонент щ>(£) и сужают исходную допустимую область, поль- зуясь правилом «Зо»*). Подчеркнем, что описанная выше процедура построения закона управления является чисто эвристической. Какие-либо оценки эф- фективности такого закона по сравнению с оптимальным отсутству- ют, так что было бы неправильным именовать его даже приближен- но оптимальным. Вместе с тем эта и подобные эвристические про- цедуры широко используются. Зачастую, например, можно считать известными начальное состояние и некоторую компоненту возму- щения. Тогда первоначально строится программа управления и со- ответствующая программная траектория из условия минимума (4.61) при ограничении (4.58), где в w(t) учитывается только из- вестная компонента. После этого производится линеаризация задачи в окрестности программной траектории (в функционале учитыва- ются слагаемые 2-го порядка) и решается задача синтеза дополни- тельной обратной связи по оценкам отклонений от программы. При наличии явных ограничений на управление вновь возникают опи- санные выше проблемы сужения допустимой области при построе- нии программы. *) Несколько более полные рекомендации можно дать лишь для конкрет- ных задач (см., например, в [4.7] описание сходной процедуры для задач уп- равления запасами).
ГЛАВА И МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ § 1. Идентификация объектов управления 1.1. Существо проблемы. Исходным пунктом при построении законов управления всегда является математическая модель объек- та, позволяющая с той или иной полнотой предсказывать изменение состояния объекта при приложении к нему управляющих воздей- ствий. Выше предполагалось, что такая модель заранее построена на основе теоретического исследования объекта с использованием известных физических закономерностей. Однако зачастую, присту- пая к расчету системы, инженер-исследователь вынужден считаться с тем обстоятельством, что указанные закономерности отсутствуют или по крайней мере в них входят заранее неизвестные параметры (массы, жесткости, коэффициенты теплообмена и т. п.). Вместе с тем сам объект, подлежащий управлению, уже создан и функцио- нирует, причем возможны получение информации о протекающих в нем процессах и иногда даже организация специальных воздей- ствий на объект с целью изменения этих процессов. Таким образом, имеются наблюдения (экспериментальные дан- ные). Требуется на их основе построить или уточнить математиче- скую модель объекта — такова общая постановка проблемы иден- тификации. - В столь общем виде задача, как правило, не имеет эффективно- го решения, и ее целесообразно рассматривать в более простой форме: на основе априорных сведений о природе объекта задана его математическая модель, однако в модель входит набор парамет- ров, значения которых заранее неизвестны и подлежат оценке. В такой суженной формулировке проблема идентификации сводится к проблеме оценивания параметров по экспериментальным данным, систематически изучавшейся в естествознании и математике со вре- мен К. Ф. Гаусса, задолго до появления теории автоматического управления. При этом наиболее важные результаты были получены в рамках математической статистики (см., например, [4.3, 11.10]'), где учитывалось, что результаты наблюдения искажаются случай- ными погрешностями. Развитие теории управления дало новый стимул исследованиям, расширив круг моделей, представляющих
• § 1. ИДЕНТИФИКАЦИЯ ОБЪЕКТОВ УПРАВЛЕНИЯ- 533 практический интерес. В настоящее время имеется огромная ли- тература, специально посвященная проблеме идентификации (об- зоры см., например в [11.12, 11.19, 11*20]). В рамках данного кур- са мы ограничимся лишь кратким описанием основных подходов и некоторыми примерами. - 1.2. Идентификация статических объектов. Начнем с простой гипотезы: пусть заранее известно, что состояние объекта х [А] опре- деляется линейным уравнением х[к + 1]= Ви[к] + Gw[k], к = 0, 1, ..., (1.1) где {ифс]} — внешнее возмущение, а {»[&:]} — управляющее воздей- ствие. Предположим, что матрица G задана, но матрица В известна не полностью, а задана с точностью до линейно входящих парамет- ров 0, т. е. заданы лишь 50, Bv такие, что B = Bo + Bt0. (1.2) Равным образом будем считать, что ш[/с] = const, но известны лишь величины w0, wt такие, что w\k\ = + ш,0. (1.3) Требуется найти значение 0 параметров, используя данные о наблюдениях выхода у[к} = Сх[к\ к = 1, 2, ... (1.4) Матрицу С также считаем заданной. В силу исходных сведений наблюдения должны быть связаны соотношениями урс] = фо[М+ф[М0, ; (15) где у0[к]== СВои[к — 1] +CGw6, (p[k] = CBiu[k-l] + CGwl. (1’6) Предположим сначала, что мы не используем управляющих воз- действий, и[к] = 0 (такой эксперимент назовем пассивным). Тогда Фо[/с] = ф0, ф[/с] = ф и все наблюдения окажутся одинаковыми, у[к] ~ У- Для определения параметров 0 имеется только одно урав- нение ' Ф0 = у - фо. (17) Это линейное алгебраическое уравнение имеет единственное реше- ние 0 = 0, только если гапкф = п9, (1.8) где пе — размерность вектора неизвестных параметров 0. В против- ном случае произвольно взятое решение уравнения (1.7) может оказаться не. совпадающим е истинным значением параметров, опре- 35 А. А. Первозваиекий
534 гл. 11. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ деляющих поведение объекта. В частности, если у — скаляр, а 0 — двумерный вектор, то из одного скалярного уравнения (1.7) невоз- можно однозначно определить два неизвестных параметра. Введение управляющих воздействий (организация активного эксперимента) создает новые возможности. Получаемые наблюде- ния окажутся различными, и для оценки можно использовать ре- шение системы ф[/с]0 = у[/с] - Форс], й = 1, 2, ... (1.9) Бели при каком-либо числе наблюдений t окажется, что ( Ф ИИ rank<D[f] = «e, $[*]=••« (1.10) I Ф [t] 1 то решение найдется однозначно и эксперимент окажется коррект- но поставленным. Из сказанного ясна особенность активного экспе- римента: в нем возможно «раскачать» объект так, чтобы в измере- ниях независимо проявлялось влияние всех параметров. Впрочем, из формул (1.6) видно, что тот же результат может быть достигнут и в пассивном эксперименте, если возмущение пе- ременно и его компонента trjfc] такова, что условие (1.10) выпол- нено. В этом случае говорят, что возмущение достаточно разно- образно длй достижения цели идентификационного эксперимента. Пример 1.1. Пусть y[li + 1] = x[k + 1] = Bu[&] + Gw, (1.11)’ где w, G постоянны и известны. Размерность векторов и, у совпа- дает, так что В — (п X п) -квадратная матрица. Предположим, что все ее элементы не заданы. Очевидно, что пассивный эксперимент бесполезен. Однако активный эксперимент легко организовать по следующему плану. Зададим u[0] = и[1] = г2, ..., и[п — 1] — г„, где ij, j = 1, ..., п,— единичные векторы. Иначе говоря, на каждом так- те будем использовать только одну из компонент управляющего воздействия. Тогда p[lJ-Gu> = Bi1 = Bt, ..., y[n] — Gw = Bn, (1.12) где Bi — столбцы матрицы В. Тем самым по наблюдениям за п так- тов находятся все элементы матрицы В. Если G, w неизвестны, то одного пассивного эксперимента достаточно для того, чтобы пред- варительно найти вектор Gw, после чего перейти к определению матрицы В. Однако очевидно, что найти по отдельности элементы G и w невозможно. □ Заметим теперь, что простота описанных выше результатов свя- зана не с гипотезой о линейности самого объекта (линейности свя- зи между воздействиями и состоянием, а также выходом), а с ги- потезой о линейной зависимости выхода от оцениваемых парамет- ров, явно выражаемой уравнением (1.5).
§ 1. ИДЕНТИФИКАЦИЯ ОБЪЕКТОВ УПРАВЛЕНИЯ 535 Предположим, например, что объект нелинеен: а;[/с+1]==Е(и[й], iz/[A:], 6), (1.13) но параметры 0 входят в правую часть линейно: F (и[к], и>[к}, Q} = Fe(u[k], w[k}) + Ft(u[k}, щ[/с])0. (1.14) Если измеритель линеен и подчиняется (1.4) с известным С, то для оценки параметров вновь располагаем линейными соотношениями (1.5), с той. лишь разницей, что <p0[Zc] = CF0 (и[к — 1], w[k — 1]), . ф[*] = СЛ («[*-!],. ш[Л=—1]), /с = 1, ..., (1.15) и все предшествующие результаты сохраняют силу. Более сложна ситуация, когда связь выхода с неизвестными па- раметрами нелинейна: р[*] = фА(0), к = 0, 1, ..., (1.16) где фь — известные функции от искомого аргумента. Такое, в частно- сти, будет иметь место и для линейного объекта (1.1), если элемен- ты матрицы В нелинейно зависят от 0. Теперь мы вынуждены для получения оценки 0 решать систему уравнений (1.16), а это, как правило, возможно только численными методами, причем не суще- ствует простых способов установления единственности решения и, более того, гарантии нахождения всех решений в случае неедин- ственности. Поэтому в дальнейшем будем в основном рассматривать только модели с линейной зависимостью выхода от параметров и ограничимся лишь иллюстративным примером решения нелиней- ной задачи. Пример 1.2. Пусть объект задан скалярным уравнением у[к + 1J = tjuf/c]'-)- Ь2иг[к], где коэффициенты bt, b2 зависят от одного неизвестного парамет- ра 0: . Ъ, = 1 - О2, Ь2 = 0. Использовав воздействие u[0] = 1 и получив наблюдение у[1] = 1, приходим к условию 1 = 1_02 + 0, откуда возникают два варианта оценок: е<о = 0, 6<2’ = 1. Примем гипотезу, что 0 = 0. Тогда модель полностью детерминиру- ется и при любых к должно быть у[к + 1] = и[к}. 35*
536 гл. И. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ Для проверки гипотезы проведем еще один, контрольный экспери- мент, приняв п[1] = 2. В результате измерения получим у[2] = 4, что не согласуется с гипотезой 0 = 0, но согласуется с альтерна- тивным вариантом 0 = 1, который и дает правильную оценку. О Из примера можно сделать два простых вывода-, а) при нали- чии конечного множества решений уравнений (1.16) можно про- вести испытания различных гипотез об оценках на контрольных экспериментах; б) увеличение числа наблюдений, т. е. числа урав- нений (1.16), принимаемых во внимание при расчете оценок, мо- жет исключить неоднозначность, хотя это и не является правилом. 1.3. Роль факторов неопределенности. Выше мы исходили из гипотезы, что модель, связывающая наблюдения с неизвестными параметрами, детерминирована (см. (1.5) или (1.16)), т. е. из пред- положения, что как только найдены значения параметров, резуль- таты всех дальнейших наблюдений точно предсказуемы. Однако для построения законов управления могут быть эффективно исполь- зованы и недетерминированные модели. Следовательно, целесооб- разно расширить класс математических моделей до соотношений типа = 4W» (1-17) где {v[/c]} — недетерминированная последовательность. Соотноше- ния (1.17) отражают два типа факторов: во-первых, на объект мо- гут действовать непрогнозируемые внешние возмущения а во-вторых, результаты наблюдений могут быть искажены непро- гнозируемыми помехами. Действительно, рассмотрим модель статического объекта, зада- ваемую соотношениями (1.1), (1.3), (1.4), однако предположим, что не постоянно, а является непрогнозируемой последовательностью {гд0[А:]'}. Тогда (1.5) перепишется в виде у|7с] = <р[7с]0 + фо[&] + у[Ц где v[&] = CGw0[k]. Напротив, если мы сохраним гипотезу (1.3) о поведении воз- мущений, но вместо (1.4) примем y[fc] = Сх[к] + N[k], где Ал[7с] интерпретируется как непрогнозируемые помехи в изме- рениях, то у[А:] = ф[А-]0 + ф0[&] 4- v[/c], у[Аг] = 2V[fc], (1.18) В обеих описанных ситуациях приходим к однотипным линрйным недетерминированным зависимостям выхода от параметров 0, под- лежащих оценке. Поэтому в дальнейшем будем именовать после- довательности {v[Zr]} помехами независимо от их происхождения. В отличие от (1.5), наличие связей (1.18), вообще гЬворя, не дает возможности точно определить истинные величинЬг 0. Если
§ 1. ИДЕНТИФИКАЦИЯ ОБЪЕКТОВ УПРАВЛЕНИЯ 537 нет никакой априорной информации о помехах, то наблюдения не дадут никакой информации о значении параметров. Наиболее часто используется гипотеза о том, что помехи случайны, точнее, явля- ются дискретным белым шумом с ограниченной постоянной матри- цей ковариаций Dv. Теорема 1.1 (о методе наименьших квадратов]. Пусть оценка 6[i] разыскивается по наблюдениям {;/[&], k = 1, ..., t} как значение 6, удовлетворяющее условию метода наименьших квадратов (МНК\, т. е. доставляющее минимум функции /(0)= £ |<p[A:]0 + <Po№-i/[W, (1-19) Й=1 где ф[&], Ф»[Н у[к] заданы. Пусть выполнено условие (1.10). Тогда W\ = ^bt, (1.20) где обозначено = 2 фтМФ1П=(Фт)тФш, ьг=(Ф[ti)Ty[tj, . fe=i (l.Zl) y[t]=(ИЛ]~Фо[Н k = i, 2,..., t). Если {v[fc]J является центрированной случайной последователь- ностью, то оценка 0[t] несмещенна, т. е. МСер] - 0) = 0. (1.22) Если {vffcll— дискретный белый шум с ограниченной матрицей ко- вариаций Dv и существует положительно определенный предел lim y j//= lim-i 2 фт [А:] <р [Л] А > 0,: (1.23) /-♦оо 1 t~+<x * k=l то оценка 0[£] состоятельна, т. е. Z> It] Д D {0 (И — 0}-* 0 при t-^ oo. (1-24) Доказательство. Матрица sE симметрична. Составим квадратичную форму 2Т^(? = ^(Ф[(])’Ф[ф = = ISI2>o, где z — произвольный вектор, а £ = Фр]з. Квадратичная форма обращается в нуль только при = 0, но в силу (1.10) это влечет за собой z = 0. Следова- тельно, матрица является положительно определенной, &Е > 0. Функция J представима в виде 7 = |ФИ0-РИ12 = '§Т^0-2(УИ)ТФШ9+|ГИР и достигает минимума при выполнении условия ^<0= (Ф[г])ту[«], откуда непосредственно следует (1.20).
538 гл. И. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ Перепишем (1.18) в векторном виде- у[«] = ФМе+?И, где v[«] = (v[A], к = 1, .... /). При 0 = 0 это соотношение удовлетворяется тождественно, так что |ФШ0-УШ+уШР = О, откуда _ 0 = ^-1(Ф1Фт(УШ~'ф]) 2 е0 [t] Д 0 [t] - 0 = (Ф [Z])T V [t]. Несмещенность оценки очевидна. Вычислим ковариационную матрицу ошибок оценивания D Ш Д м {ев [t] eg [t]} = а-1 (Ф [< Dv [t] Ф (t) Л-1. Далее, для простоты ограничимся случаем скалярных vfi], и D{vf&]} = dv = = const. Тогда pv[«] = где 7[t] — единичная матрица, размерность которой равна числу наблюдений, а следовательно, D[t] (ф P])T ф И (1-25) Переходя к пределу в уравнении 1 1 - atD [i] = — dvI [t], убеждаемся, что при выполнении условия (1.23) имеет место lim D [t] = 0. i-ьоо Если априорная информация о помехах более полная и вклю- чает сведения о функции распределения помех, то целесообразно воспользоваться оценками метода максимального правдоподобия (ММП). Если помехи независимы и распределены по нормальному закону с заданной матрицей Dv, то оценки ММП близки по струк- туре к оценкам МНК (см., например, [11.10]) О[/] = 5Г1?,# (1.26) где fe=l й=1 т. е. различие проявляется в множителе Dv1» Можно доказать, что оценки 6[i] несмещенны и состоятельны. Если матрица D„ заранее неизвестна, то метод максимального правдоподобия позволяет получить как ее оценку так и оценку
§ 1. ИДЕНТИФИКАЦИЯ ОБЪЕКТОВ УПРАВЛЕНИЯ 539 самих параметров из системы уравнений t - у 2 1*1 “ Фо 1*1 “ Ф t*l ® 1*1) (У 1*1 ~ Фо 1*1 — Ф 1*19 [*])’« 1 Й=1 (1.27) г t t е [ t j = 2 фт 1 *1 (ЯГ ф 1*1 2 фт № (ЯГ (у [Щ - ф0 [&]). ife=i k—i Поясним смысл оценивания по ММП в рамках общей нелинейной задачи. Обозначим для краткости у<‘> полный вектор всех полученных наблюдений, V О — вектор помех в этих наблюдениях и предположим, что । j,<O = ф<О(©) + vC*>, (1.28) где Ф<!> — заданная вектор-функция оцениваемых параметров. Естественно в качестве оценки взять наиболее вероятное^ значение параметров, найденное при выполнении (1.28), т. е. как значение 0, доставляющее максимум условной плотности вероятности р(0/у(‘>). но . (1.29) Если ре(§) не задано (нет ацриорной информации о возможных значениях па- раметров), то приходится ограничиться максимизацией. функции правдопо- добия л =рЛ»“>-Ф(‘>(0)1, где /),[•]—заданная плотность вероятности вектора v((>. В предположении нормальности vu) это эквивалентно выбору оценок из условия максимума ехр | [у«>- Ф<‘> (0)IT D~}t} - ф«> ( 0)]} или, что то же самое, минимума функции j да = [£,<*>_ф«>(§)г-Ф(‘>(о)] = t = 2 ^7ЧрИ-фй(0)]- (1-30) Л=1 где учтена независимость помех в последовательных наблюдениях. Если мо- дель линейна, Фй(0) = Ф[Л]0, то минимизирующее значение находится в явном виде и дается формулой (1.26). Система (1.27) соответствует необходимым условиям максимума функ- ции правдоподобия, если D, также рассматривается как ее аргумент. Для не- линейной модели получение оценок ММП возможно лишь численными метода- ми. При этом следует учесть, что, как правило, некоторая априорная инфор- мация о возможных значениях параметров имеется. В частности, можно ука- зать множество 0о, в котором заведомо должны находиться значения пара- метров. Тогда поиск минимума J следует производить в пределах 0О. Оценки ММП совпадут при этом с наиболее вероятными значениями параметров, ес- ли их априорное распределение равномерно на 0О.
540 гл. 11. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ Дополним сказанное замечанием, что зачастую гипотеза о нор- мальности помех *) или даже гипотеза о их случайном характере неприемлема, и все, что мы можем предположить, сводится к ука- занию ограниченной области N, в которой могут находиться зна- чения помех. Тогда в качестве оценки одинаково пригодны любые значения 0, удовлетворяющие условиям у[к] ~ ФА(0) + v[*], _v[*]e1V, * = 1, t; 0е=0о. (1.31) Если модель линейна, а множества N, 0О заданы линейными не- равенствами, то для нахождения допустимого значения 6 можно воспользоваться эффективными методами линейного программиро- вания. Приведем численный пример, иллюстрирующий описанные спо- собы идентификации. Пример 1.3. Модель системы, результаты наблюдения одного выхода которой г/[*] зависят от неизвестных значений двух пара- метров 0t, 02, дана в виде * ’/[*] = фи[*]01 + ф12[*]02 + v[*], * — 1,2,..., где v[*] — непрогнозируемая последовательность, трактуемая как помехи в измерителе. Результаты измерений и данные о коэффициентах фи, ф12 даны в таблице ____ ______ k Фи У 1 1,0 0,3 1,70 2 20 0,5 2,95 3 1,5 0,8 3,11 4 0,5 1,3 3,12 5 1,2 0.4 1,92 . В паспортных данных измерительного устройства указана его погрешность ± 0,15. Обычно ошибки предполагаются случайными, нормально распределенными, и погрешность рассматривается в смысле правила «За», т. е. размах погрешности предполагается равным Зо„ так что здесь ov = 0,05. Применим МНК для оценивания (в скалярном случае оценки МНК и ММП совпадают). Построим матрицы •_ Ф„1*1Ф121*П (8,94 3,631 Ь=1\<?и Ф1221*] J 13,63 2,83? * |ФП 1*1 Н*1| (16,1291 bt 1*1/= I 9,297? •) С построением оценок при иных гипотезах о функции распределения можно познакомиться, например, в [11.17, 11.19].
§ 1. ИДЕНТИФИКАЦИЯ ОБЪЕКТОВ УПРАВЛЕНИЯ 541 откуда согласно (1.20) получаем 6, = 0,982, 02 = 2,026. Подсчитаем дисперсии ошибок оценивания, используя (1.25): D [0t - 0*} = ст®.0,233, . D {02 -0*} = ст®-0,738. Применяя вновь правило «За», приходим к оценкам диапазонов, в которых могут находиться истинные значения параметров*): 0,91 0, < 1,05, 1,90 <02< 2,15. Откажемся далее от гипотезы о случайном характере ошибок измерений, считая просто, что они могут принимать любые значе- ния в диапазоне ±0,15. Тогда в соответствии^; (1.31) в качестве оценок можно принять любые значения 0Ь 02, удовлетворяющие системе неравенств —0,15 у[/с] — фц[М01 — Ф12[^]0г 0,15, к = 1, 2, 5. Каждое из таких неравенств выделяет полосу на плоскости (0», 02)’. Пересечение всех полос и является допустимой обла- стью. На рис. 11.1 эта про- цедура наглядно представ- лена (границы полос пере- нумерованы, а область вы- делена жирной линией). Диапазоны возможного из- менения параметров оцени- ваются неравенствами 0,86^0^1,08, 1,87 <02< 2,18, причем для их получения достаточно было бы распо- лагать только измерениями к = 2, к = 4. Конечно, такая наглядность достижима толь- ко в случае двух оценивае- мых параметров, причем при графический дисплей. □ Подчеркнем важность условия (1.10). Оно определяло возмож- ность идентификации как при детерминированной, так и при сто- хастической постановке. Более того, на точность оценивания влияет *) Более тонкие методы построения доверительных интервалов для пара- метров даются в учебниках математической статистики (см., например, [11.10, гл. 7]).
542 ГЛ. 11. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ обусловленность матрицы Известно [11.10], что |det^,p-2C t где — определители всех миноров Ф(|> размера ne X п6. Поэтому, даже если условие (1.10) выполнено, т. е. найдется 6а>0, во величины 81 малы, ошибки оценивания окажутся большими. От- сюда вытекает, что целью планирования активного эксперимента должно быть прежде всего обеспечение возможно большей ортого- нальности векторов-строк матрицы Ф(|) *). При выделении области допустимости также очевидна важность ортогональности полос, выделяемых при каждом измерении. С другой стороны, ясно, что дем больше абсолютная величина элементов Фи), тем выше уровень сигнала относительно уровня помех, а следовательно, меньше погрешность оценивания. Поэтому основным ограничителем точности практически является допусти- мый уровень активных воздействий на объект, возможный по усло- виям его эксплуатации. 1.4. Идентификация динамических объектов. Рассмотрим снача- ла общую динамическую нелинейную модель х\к + 1] = Fk(#[&], //[&], 1/4X1, 6)» к —0, 1, ..., ж[0] = ж0. (1.32) Если предположить возможность полного и точного наблюдения как состояния х[к], так и возмущений ш[А:], то проблема идентификации динамического объекта окажется ничем не отличающейся от ранее рассмотренной. Действительно, положив #[&] = //[&], ф>. (0) = = Fk-i (х[к — 1], u[A:—1], w[k— 1], 6), А = 1, 2, ..., приходим к со- отношениям вида (1.16). Если же возмущения {w;[fc]} содержат непрогнозируемую ком- поненту {v[fc]l, то получаем модель вида (1.17). Новые проблемы возникают только в связи с отсутствием пол- ных и точных измерений. Остановимся подробнее на задаче идентификации линейной си- стемы. Пусть справедлива гипотеза, что объект описывается урав- нениями х[к + 1] = Лх[/с] + Z?u[&] + G «>[&], к = 0, 1, ..., х[0] = х°, (1.33) у[к} = Сх[к] + 2VJA:], где матрицы А, В, С, G постоянны, но могут зависеть от неизвест- ных параметров 0. Неопределенность может содержаться и в хв. Воздействие {//[&]) будем предполагать управляемым или по край- ней мере известным. Возмущение {г/ф/ф и ошибки измерений {#[&]} считаем независимыми «белыми шумами». Требуется дать оценку параметров на основе наблюдений. *) См., например, [11.15, 11.25],
§ t. ИДЕНТИФИКАЦИЯ ОБЪЕКТОВ УПРАВЛЕНИЯ 543 Прежде всего отметим некоторые почти очевидные факты, вы- текающие из структурной теоремы (гл. 6): а) невозможна оценка тех параметров, которые не входят в опи- сание наблюдаемой части системы; б) если = 0, то невозможна оценка параметров, которые вхо- дят в «висячие» части системы. Для простоты будем считать, что и[к\, у[к} скалярны, а еэ 0. Из гл. 7 известно, что в предположении полной управляемости и наблюдаемости можно свести описание связи «вход-выход» к one-, раторному уравнению - рМ=яа)ивд+вд, (1.34): где Я(£)== С\&1~ А]~‘В— скалярный оператор преобразования, яв- ляющийся дробно-рациональной функцией от оператора 5 сдвига на такт, Я(£) = ШМ£)- Любая наблюдаемая последовательность {у[7ср несет в себе инфор- мацию только о коэффициентах (ос,, i = 0, 1, ..., к—1) много- членов а(£), р(£), и значения неизвестных параметров можно пы- таться извлечь только из этих коэффициентов. Поэтому обычно про- цедуру идентификации разделяют на два этапа: во-первых, полу- чают оценки а«, коэффициентов а,-, а затем находят 0 как решение уравнений a.,(0) = ai, = хотя такая процедура и не всегда рациональна, если число не- известных параметров мало. л Для построения оценок а<, (Ь удобно переписать уравнение (1.34) в виде явной зависимости каждого очередного измерения от предшествующих измерений и воздействий. Имеем «(0 = Г + ап-1Г-1+ ... +«о= . = Г[1 + «„_1Г1+ ... + aerUr[l+S(r1)L (t) = JW1-1 + • • • + + •. • + = П(П, откуда + + (1.35) или, в явной форме, ;/[&] = — a,n-ty{k — 1] —... — <хоу[к ~ п] + (in-1— 1] +... ... + — п] + N[k} 4- а„-1Я[А: — 1] +... + asN[k — и]. (1.36) Формально соотношения (1.36) можно переписать в виде, анало- •гичном (1.18), рИ — фШ0 + v[H (1.37),
544 ГЛ. 11. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ если ввести вектор 6 неизвестных параметров 0=(an-i, ..., а»; .... М (1.38) и обозначить <рИ = {—у[к — 1], — у[к — п\, и[к — 1], и[к — п}}, (1.39) а также •\>[к] = N[k] + an-iN[k — 1] +... + а0А?[& — я]. (1.40) Матрица-строка ф[/с] состоит из известных (измеряемых) величин, a v[/c] представляет собой эквивалентную помеху. После этого можно применять МНК для получения оценок па- раметров 6. Однако имеется существенное отличие от ранее "рас- сматривавшейся задачи: во-первых, последовательные значения взаимно коррелированы, во-вторых, их взаимная корреляция зави- сит от неизвестных параметров an-i, ..., a0, в-третьих, q>[fe] корре- лирована с v[/c]. Формальное применение МНК может привести к плохим оценкам. Поясним смысл возникающих неприятностей. Предположим, что воздействие {м[/с]} является стационарной случайной последователь- ностью, а объект устойчив. Пусть наблюдения производятся в уста- новившемся режиме, когда также можно считать стационар- ной последовательностью. Получаемые в результате применения МНК оценки 0(1] удовлетворяют условию минимума по 0 величины t • > S 1Ий]-ф[й]0|2. (1-41) . fe=i Можно предполагать эргодичность, т. е. что среднее (по времени) значение квадрата ошибки, найденное по одной реализации, совпа- дает с его математическим ожиданием *): t lim у У —ф[^]0|2 = М{|у[А:] —ф[А;]9|2}. (1.42) 4-»оо 1 fe=i . Пусть 0* — оценки МНК, получаемые по неограниченно возрастаю- щей стационарной последовательности наблюдений. Тогда они долж- ны удовлетворять условию м {| у [к] - Ф1*]5|2} = 0,: или л М{(р[/с] — ф[&]0*)ф‘г[&]> =0. (1.43) Поскольку получаемые наблюдения у[к\ порождены функциониро- *) Правая часть (1.42) не зависит от к в силу предполагавшейся стацио- нарности последовательностей {у [Л]}, {u[fc]}, а следовательно, {<р[Л]},
§ 1. ИДЕНТИФИКАЦИЯ ОБЪЕКТОВ УПРАВЛЕНИЯ 545 ванием объекта при некотором неизвестном, но фиксированном 0, то p[Zc] = ф[/с]0 + у[ к]. Подставляя это соотношение в (1.43), полупаем М{ф[А:] (0 — 0*)фт[/с]) + М{у[&]фт[А]} = 0 (1.44} и убеждаемся, что оно не удовлетворяется при 0* = 0, если имеется корреляция между v[/c] и ф[/с], отмеченная выше. Таким образом,, «лобовое» применение МНК не может привести к совпадению оцен- ки с истинным значением параметров, даже если число учитывае- мых наблюдений неограниченно возрастает. Кроме того, условие (1.43) дает единственное решение, соответствующее минимуму, только если выполнено условие идентифицируемости М{ф[А’]фт[/с]) > О, которое трудно проверить заранее, поскдльку ф[&] зависит от неиз- вестных параметров. , Для преодоления неприятностей используются различные при- емы. Один из них состоит в применении ММП с оценкой матрицы ковариаций всей последовательности к = i, ..., /}, т. е. по существу с оценкой корреляционной функции эквивалентной поме- хи. Функционал ММП при этом окажется неквадратичлой функ- цией параметров, и вычислительная процедура его минимизации резко усложняется*). Остановимся подробнее лишь на более простом приеме, обычно именуемом корреляционным анализом и в различных вариантах используемом на практике. Примем вновь гипотезу о случайности и стационарности последовательности у\к§ п вычислим на. основе измерений {и[&], у[к]} величины t R'w I) = —2 У № “ и I* ~ 7 (1.45) Run (т, I) = ттгтфп 2 и № ~~ и Iк ~~ для различных значений т = 1, 2, ..., 2п и 1 = 0, 1, ;.п. Если умножить (1.36) на — т] и произвести усреднение результатов, то получим соотношения Ryu (Уг 0) в dn—lRyU (п 1) • • • ^ftRyU (Т, и) ~~~ Pn—iR-uufti 1)+ ... • • • + (Т, «) + Rnu (т, 0) + ... + a6R^u (т, п),; (1.46} *) Детальное исследование дано в [11.21].
546 ГЛ. 11. МЕТОДЫ ИДЕНТИФИКАЦИЙ И АДАПТИВНОЕ УПРАВЛЕНИЕ где дополнительно обозначено i = —тт ^N[k — l]u[k — т]. Ь --- к “Т~ 1 При больших t воспользуемся гипотезой эргодичности. Тогда Як(т, 1)^RnAt-1], (1А1) тде справа стоит соответствующая корреляционная функция. Но {и[*]} и {2V[*]} некоррелированы, и RNv. = 0, так что Як(т,0«0. Следовательно, мы приходим к системе 2га линейных уравнений Rtyu(т, 0) = Фа(т)а + Фр(т)р, т 2га, (1.48) где Фа(т) = {— Rlu{x, 1), ..., — Ryu(x, га)}, а = {an-i. •••., «о) Ф₽(т)={Ми(т, 1), ...,2?L(t, га)}, ₽ = {рп_х, ...,рв} Система (1.48) может служить для вычисления оценок непосред- ственно или же к ней может быть применен МНК, если увеличить число значений т и формально считать, что величины Rnu (т, 0) + ... + (Т, П) не равны точно нулю, но слабо зависимы при различных т*). 1.5. Оценка весовых функций и частотных характеристик. Если входное воздействие {«[*]) на линейный динамический объект мо- жет быть выбираемо, т. е. осуществим активный эксперимент, то зачастую используют воздействия типа одиночного импульса, или скачка на постоянную величину, или гармонических функций с раз- личными частотами. Иначе говоря, ставят эксперименты по опре- делению весовой (импульсной) функции преобразования «вход-вы- ход»,' или его переходной функции, или его частотной характери- стики. Знание любой из этих характеристик полностью определяет оператор Я (С), т. е. детерминированную часть модели (1.34). Предположим сначала, что помехи отсутствуют, р[&] = Я(?)п[Н (1.49) а начальные условия — нулевые. Положим u[0]=l, u[fc] = 0, k > 1 (воздействие типа единичного импульса). Тогда - р[*] = *[*], * = 1,2,..., (1.50) *) Здесь также возможны вычислительные трудности, связанные с плохой обусловленностью обращаемых матриц. О. Ю. Кульчицким показано, что ме- тод работает только при условии Re //(«’“) > 0, со > 0, Н (Q Д ‘аТсГ'
§ 1. ИДЕНТИФИКАЦИЯ ОБЪЕКТОВ УПРАВЛЕНИЯ 547 где {fc[Zc]} — весовая функция (для дискретной системы — последо- вательность). Формально по величинам /г[7с] (и притом используя не более 2п таких величин) можно восстановить значения коэффици- ентов многочленов а (£), Р(£) в операторе Я(£). Однако поведение весовой функции в основном определяется модами, соответствую- щими наибольшим по модулю собственным числам. Если система устойчива (в противном случае трудно исключить эффект малых отклонений начальных условий от нуля), то {(&[&]) определяется наиболее медленно затухающими модами, а быстро затухающие оказываются почти незаметными на фоне неизбежных помех. По- этому практически идентификация путем определения весовой функции используется только, для простых объектов 1-го или 2-го порядка при заведомо низком уровйе помех. То же относится и к определению переходной функций, которая совпадает с выходом, если и[/с]=1, к — О, 1, ... В наибольшей степени на практике распространен способ актив- ной идентификации линейных динамических объектов, основанный на оценке частотных характеристик.' При этом активное воздействие выбирается в виде гармонической (или полигармонической) функ- ции времени. Если объект устойчив*), то значения его выхода при- ближаются с течением времени к гармонической (или полигармони- ческой) функции, вообще говоря, искаженной помехами. Определе- ние амплитуд и фаз гармоник в выходном процессе эквивалентно определению значений комплексной частотной характеристики (ЧХ) объекта на частотах этих гармоник. Очевидно, что по п значениям ЧХ в принципе восстановимы значения параметров а<, £<, а следова- тельно, п. ф. в целом. Если же объект является и минимально фазовым, то достаточно знать только значения амплитуд гармоник, поскольку в этом случае АЧХ полностью определяет п. ф. (но, как минимум, потребуется 2п амплитуд). Описанная идея осуществима в множестве конкретных вариан- тов. Приведем краткое описание процедуры параллельного экспе- римента с предварительной обработкой по методу синхронного де- тектирования. Активное воздействие (тест-сигнал) берется в виде , i, » 1^] = У1, (о, cos 40,-f-Ь, sin 40,), 4 = 0,1,..., (1.51) 1=1 где L п, a ai, bi, 0; — заданные величины. Измерения дадут значения (см. § 4 гл. 7) У 1*1 = 2 Re {11 (Лг) («; - ibt) е™1} + e[k] + N (Л], 1=1 1 ' *) Если объект неустойчив, но его можно стабилизировать с помощью об- ратной связи с известными параметрами, то принципиально подход не меня- ется, за тем исключением, что по частотной характеристике замкнутой системы приходится строить частотную характеристику объекта.
548 ГЛ. И. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ где е[/с] —отличие реакции объекта от установившейся, так что е[/«] ~>0 при к -> оо. Обозначим /?( = Re я(ег9г), Zz = Im Н (et0<). Тогда. у\к\ = У, [сг cos &0z + s; sin -he [/с] + Я[*|, (1.52) 1=1 — I Pi- (1.53) Теперь требуется пайти амплитуды гармоник ci, si, имея их смесь, искажен- ную наличием побочных процессов ё[к] и ZVffc], т. е. затухающего переход- ного процесса и помех в измерениях. Это классическая проблема вычисли- тельной математики*). Простейший способ ее решения таков: при достаточно большом числе t измерений оценки,, cz [t], si [«] указанных амплитуд даются формулами t t ?г[4] = А 2 У [A] cos 40z, [f] = А 2 sin А0Г (1.54, k=i 1 h=i Такое построение' принято именовать обобщенным Фурье-преобразованием, а в технике — методом синхронного детектирования. По оценкам ci, si далее строятся оценки ftz=(4 + &9-1(?zaz + ?z6z), Zz = (af + значений вещественной и мнимой ЧХ на «частотах» 0f, Согласно определению Я(£) имеем ₽Gi9i) = ff(«i9i)a(ei90, Z= ИЛИ pGi0i) = (^z + «?z + vz)aGi0O, Z = (1.55) где Vi — ошибки в оценке значений ЧХ на соответствующих частотах. Если бы ошибки отсутствовали, то, взяв L = п, мы бы получили систему 2п вещест- венных линейных уравнений относительно коэффициентов (az, {4} многочле- нов а($), Р(£). В простейшем случае можно применить МНК, находя оценки параметров из условия минимума 2|₽(е{0г)-(йг+1л)а^г)Г. !=1 _ Делать какие-либо строгие суждения об эффективности описанной процедуры затруднительно, поскольку даже при N[/с] типа «белого шума» ошибки- v< за- висимы, а кроме того, входят в уравнения (1.55) неаддитивио. Ясно, однако, что как влияние помех, так и сложность вычислений сильно зависят от вы- бора «частот» 0! воздействий. Поскольку H(eie) 2л-периодична по 0, то 0 < 0Z sg 2л. Если отсутствует априорная информация о свойствах ЧХ, то рекомендуется выбирать логариф- мически равномерную шкалу пробных частот **) I lg 0Z =-g-1g 2я, *) Обзор основных приемов содержится в [4.10]. Отметим также, что оце- нивание по формулам (1.54) тесно связано с применением МНК к систем ме (1.52). - ** ) В частности, такой выбор позволяет построить экономный рекуррент- ный алгоритм вычисления оценок (1.54), называемый «быстрым преобразова- нием Фурье (БПФ)ь [5.2, гл. 4]. ’
§ 2. АДАПТИВНОЕ УПРАВЛЕНИЕ СТАТИЧЕСКИМ ОБЪЕКТОМ ' 54Ф Если же заранее подозревается наличие резких изменений ЧХ в некоторых; частотных диапазонах, то естественно «уплотнить» в них сетку частот. Метод частотных характеристик очевидным образом переносим и на иден- тификацию непрерывных объектов, описываемых линейными дифференциаль- ными уравнениями. Можно также показать [11.25], что использование гармо- нических тест-сигналов в определенном смысле наиболее выгодно, если ограни- чена энергия воздействия. § 2. Адаптивное управление статическим объектом 2.1. Рекуррентные процедуры оптимизации и экстремальное ре- гулирование. Перейдем к рассмотрению адаптивных алгоритмов управления, отличающихся тем, что априорная неопределенность описания объекта преодолевается в ходе работы системы. Напомним первоначально уже знакомую (гл. 9, § 7) задачу численного ана- лиза: задана функция J(u) вектора и, требуется вычислить значе- ние и*, доставляющее ее минимум. Простейшая вычислительная схема (градиентный метод) заключается в построении последова- тельности £ = 0, 1, ..., такой, что и(0) берется произвольно, а ц«-о = ц«) _ 7tv(o( t = о, 1, ... (2.1) В качестве векторов V(t) выбирается либо градиент функции 7(и) в точке u(t), VJ(u(‘)), либо какой-либо близкий вектор, рассматри- ваемый как оценка градиента. Скалярная последовательность вы- бирается так, чтобы обеспечить сходимость и(1> к и* при t-»-<»*).. Далее рассмотрим проблему управления статическим объектом: пусть состояние объекта х [й +1] в момент к + 1 определяется за- данием управления и [/с]: xte + 1] = /(вИ), А = 0, 1, ... (2.2) Требуется выбрать {и [А:]} так, чтобы обеспечить минимум либо по- казателя Joo = limg(x[A: + 1],u[A]) (2.3) fe-»OO [(оптимальность в установившемся режиме}, либо показателя Т-1 J = lim ±-%g(x[k + 1], u[/c]) (2.4) (оптимальность в среднем по времени). Построим функцию 4 (/(«)»«X (2-5> далее считая ее дифференцируемой. Очевидно, что если и* достав- ляет минимум J(и), то, приняв управление постоянным и равным: и[к] = и*, к = 0, 1, (2.6) *) Точные рекомендации даны ниже,
550 ГЛ. 11. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ мы обеспечим минимизацию как (2.3), так и (2.4). Более того, если последовательность управлений любая, но и[к]-+и* при к оо, то она все равно является оптимальной в смысле (2.3) и (2.4). Отсюда естественно возникает основная идея так называемого экст- ремального регулирования*): представить градиентную процедуру минимизации (2,1) как процесс, разворачивающийся в реальном времени, т. е. вычислить в каждый новый момент к + 1 управля- ющее воздействие по формуле и[к+\] = и[к]-ц^т, к^О, 1, ... (2.7)’ Этот подход практически бесполезен, если вид функции J(u) изве- стен заранее, а следовательно, заранее может быть вычислено зна- чение и* и использована простейшая оптимальная программа (2.6). Однако он обладает замечательным достоинством: закон управления (2.7) можно использовать и тогда, когда вид функции J(u) в целом заранее неизвестен. Действительно, для его применения достаточно только иметь в каждый момент времени оценку градиента при те- кущем значении управляющего воздействия, а ее можно получить по измерениям (наблюдениям) за объектом в ходе его работы. 2.2. Оценки градиента и основные алгоритмы управления. Выде- лим некоторые возможные ситуации, начиная с простейшей. а) Значения вектора градиента ' наблюдаются непосредственно ® каждый момент к, к = 0, 1,.:. Реализуема точная градиентная процедура и[й+1] = нИ-Ъу[Н уИ = ^(цВД). (2.8) б) Непосредственно наблюдается текущее значение показателя, $[fc] = 7(it[fe]). Реализуема процедура с оценкой компонент гра- диента. Если размерность u=(u.j) равна т, то для оценки т част- ных производных в точке и — м(1) можно взять простейшие разност- ные аппроксимации**): dJ ди- J (u(0 + Si;) — J i = 1, ..., m, (2.9) где ii—i-й единичный вектор, a 6 — малая скалярная величина (ве- личина пробного шага). Однако для вычисления (2.9) необходимо, кроме значения 7(«(1)), иметь т наблюдений значения показателя ® соседних точках w(f) + бц. Поэтому процесс экстремального регу- лирования строится как циклический, в котором рабочие шаги че- *) Идея экстремального регулирования была предложена почти одновре- менно В. В. Казакевичем в СССР и Ч. С. Дрейпером в США для одномерных -задач и обобщена А. А. Фельдбаумом на многомерные. Обзор различных прак- тических вариантов ее реализации дан, например, в [5.9, 11.13]. ?*) Общая схема построения оценок градиента дана в [11.5].
§ 2. АДАПТИВНОЕ УПРАВЛЕНИЕ СТАТИСТИЧЕСКИМ ОБЪЕКТОМ 551 редуются с пробными, тестовыми. Его можно описать формулами u[k] = u(t\ k = (m+l)t, 1 = 0, 1, и[к] = u(t) + di,, k = (m+l)t + j, j = u(t+" 1 = 0,1,..., (2.10) 7 = 1, = 6-1(l/M- ИЛ), У Ik] = J(u[k]), k = (m + i)t+j. Подчеркнем, что такой процесс представляет собой сочетание управ- ления с обратной связью по измерениям и плана эксперимента, где результаты измерений используются только для идентификации зна- чений градиентов. Поскольку оценка градиента равносильна по- строению линейной аппроксимации функции /(и) в малой окрест- ности текущей рабочей точки «(1), то и план (программа) иденти- фикационного эксперимента строится так же, как при идентифика- , цип линейного объекта (ср. П.1.1). Чем меньше 6, тем теоретически ближе оценка типа (2.9) к точному значению, однако тем более начинают сказываться погреш- ности вычисления разности близких величин. в) Значения вектора градиента наблюдаются с погрешностями: р[А-] = VJ(u[7c])+JV[H (2.11) Если погрешности N [к} случайны, то кажется целесообразным ис- пользовать осреднение по нескольким измерениям и вновь построить процесс управления циклически, оставляя на каждом цикле (дли- тельностью I шагов) управление постоянным: u[k]=uw, к —It, 1 = 0,1,..., ц«+1) = UC) _ V(Vw (212> 1-1 1-1 v(f)=4 2 +*1 = v^(“(/))+4 2 + к\ Если {W [А:]} — белый шум, то с увеличением I в силу закона боль- ших чисел влияние погрешностей уменьшается. Однако замедляется и процесс управления, причем неясно, на сколько тактов следует «застревать» на месте для улучшения идентификации. Очевидно лишь, что вдали от экстремума, где величина градиента велика,, роль погрешностей не слишком существенна (уровень сигнала зна- чительно выше уровня помехи). Поэтому в начале процесса можно брать I малым; а затем увеличивать. Но есть и более интересная идея: производить усреднение в ходе самого рабочего движения,, постепенно замедляя его за счет уменьшения коэффициента yt. Ока- зывается, что последовательность и[к], построенная в силу простей- шего алгоритма: Ы[А+1]=ывд-ьНн (2.131
552 ГЛ. И. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ несмотря на возможно .. большие ошибки в оценке градиента на каж- дом шаге, может сходиться к значению и*, если у* сделать посте- пенно убывающим и стремящимся к нулю при к ->«>*). При этом процедуру (2.13) обычно называют алгоритмом Роббинса — Монро (11.28]. г) Наблюдаются текущие значения показателя с погрешностями: y[k] — j(u[k]) = J(u[k]) + N[k]. (2.14)' Задача оценки градиента равносильна построению линейной аппрок- симации J(и) в малой окрестности текущей рабочей точки по за- шумленным наблюдениям. Здесь вновь можно построить план иден- тификационного эксперимента, используя малые пробные шаги и производя оценку m необходимых величин частных производных по результатам наблюдений, например, с помощью МНК, если число наблюдений (и пробных шагов) существенно больше числа оцени- ваемых величин. Можно и попытаться использовать минимальное количество наблюдений, беря грубые оценки по приращениям и строя алгоритм по схеме (2.10), но с постепенным уменьшением величины шага у(, как и в алгоритме Роббинса — Монро. Это, одпа- ко, не вполне эффективно из-за наличия очевидной зависимости случайных ошибок в оценках компонент градиента. Поэтому идут на удвоение длительности цикла пробных шагов и построение оце- нок типа <7«) + 6tb)(ц<<)-бл) 7 5“;|u=u<0 = = (25а~ЧИ* + »г]--Ш1),: (2.15) так что алгоритм управления принимает вид и [Л] = »(<> + 8tij, k — (2m + l)t + ], j = u[k]==u{t) — 8tij, k =(2m + l)f + m + /, j — i, .... m, (2.16) u«+» = u<‘)_^(v(o# В этой процедуре, называемой алгоритмом Кифера — Волъфовица 111.26], величины б( также иногда берутся постепенно убывающими, хотя и медленнее у». д) Рассмотрим, наконец, ситуацию, когда измеряется состояние объекта y\k] = x{k], z[k+l] = f(u[k]'), а вид функции g(x, uj, определяющей значение показателя в за- висимости от состояния и управления, известен. Естественно, что *) Поскольку сама последовательность и[к] является случайной, то и схо- димость должна пониматься в вероятностном смысле (точная формулировка ниже, в Т.2.1).
§ 2. АДАПТИВНОЕ УПРАВЛЕНИЕ СТАТИСТИЧЕСКИМ ОБЪЕКТОМ 553 можно использовать уже описанную схему, поскольку У(иИ) = £(ж[/с + 1], и[к]) = g(y[k +i\, и[к]), и по измерениям непосредственно вычисляется текущее значение показателя качества, по которому далее можно строить оценку гра- диента. Однако иногда эффективнее использовать имеющуюся ин- формацию. Действительно, VJ(M) = V^ + Vlg.vu/. (2.17) Поэтому для оценки достаточно оценить матрицу Vuf(и [&]), называемую матрицей коэффициентов чувствительности выхода к изменениям управления. Если выход скалярен, то эта матрица ока- зывается столбцом и ее оценка осуществима по m пробным изме- нениям входа так же, как это делалось выше при непосредственных измерениях функционала. Очевидно, что преимущества этого подхо- да будут особенно явными, если объект линеен, а следовательно, коэффициенты чувствительности не зависят от управлений, и оцен- ка градиента показателя сводится к оценке конечного числа неиз- вестных параметров (см. ниже, п. 2.6). 2.3. Условия применимости экстремального регулирования. При- ведем сначала сводку теоретических результатов, касающихся влия- ния погрешностей в оценке градиента на процесс поиска экстре- мума. Обозначим и опишем, как ведет себя последовательность {uw}, строящаяся в силу (2.1), при различных свойствах функции J(u) и погрешно- сти г(,). Теорема 2.1. Пусть функция J (и) непрерывно дифференцируема и, кроме того, для любых и, v выполнены условия: 1) J(u + v)<J(u) +V*J(u)y + y№ г>° (2-18) (условие сильной выпуклости с константой I); 2) |VJ(a + у)-VJ(u) 1^ LIH, L>0 (2.19) (условие Липшица с константой L для VJ). Пусть минимум J(и) достигается при и~и*. Тогда а) если |r(1>i=Se, yi — ц, то найдется у>0 такое, что \и(1> — 14*1=^ р(е)+ q‘\um— и*\ (2.20) при 0 < у < у, причем ' О < q < 1, p(e) = O(s); Ъ) если rw — случайные взаимно независимые величины, Mrm=Q, М|г(,’|2<Р, 36 а. А. Первоаванский
554 ГЛ. 11. МЕТОДЫ ИДЕНТИФИКАЦИИ II АДАПТИВНОЕ УПРАВЛЕНИЕ то найдется 7>0 такое, что. М {J(uw) - J(u*)} С р (7) + {J (и(0)) - 7(и*)} (2.21) при 0< 7, = 7 < 7, причем 0<7<1, р(1) = 0(у); с) если выполнены условия (Ь), но 7( переменны и t Yt->0, при (->оо,, (2.22) h=o ТО М|и(,)-и*12->0 при г-* ос; (2.23) если при этом = V>4z’ <2-24> то Mj(um')-J(u*)^c0± + o[yj,. (2.25) я л LDv2 где с0Л 2(2/у-1) ’ d) если помехи произвольны, но |г<(>|2 a|VJ(u«>)\\ (2.26) то при сс< 1 существует 7>0 такое, что |и(<) — и*| < <z‘lu(0) — н*1, g < 1 при 0 < 7 < 7; е) если rw случайны и независимы, но М|г(<,|2 <а|?7(и(<))12, (2.27) то при любом а существует 7 > 0 такое, что Mlu(t> — и*\г С cq‘, q<i, c = const при 0 < 7 < 7. □ Доказательство. Т.2.1 приводится в [9.18, с. 97—99]. По- ясним лишь смысл результатов: а) при произвольных ограниченных погрешностях (в частности, постоянных) процедура приводит в ограниченную зону вблизи ми- нимума «размером» порядка величины погрешности; Ь) при наличии случайных погрешностей выбор постоянного 7 также не позволяет точно прийти к минимуму; с) при убывающих и случайных погрешностях имеется схо- димость в среднем, причем ожидаемое значение минимизируемой функции убывает не медленнее, чем O(i/t) *); *) Элементарное объяснение смысла требований к 71 дано в [9.17]. Боль- шое количество примеров приведено в [5.9]. Там же были получены результа- ты типа Т.2.1 для квадратичных J(u),
g 2. АДАПТИВНОЕ УПРАВЛЕНИЕ СТАТИЧЕСКИМ ОБЪЕКТОМ 555 d) при ограниченных искажениях направления градиента сохра- няется сходимость к минимуму при = const; е) относительные случайные погрешности в оценке градиента не ухудшают условий сходимости. . > . Вернемся вновь к описанным выше законам экстремального ре- гулирования, предполагая выполненными условия (2.18), (2.19). В алгоритме (2.10) градиент вычисляется с систематической по- грешностью порядка 6, случайные погрешности отсутствуют. Поэто- му, принимая у, = 7 = const, например, у = L-1, обеспечим сходи- мость последовательности и(<) в окрестность порядка б. Более того, н любые и [к], возникающие при пробных шагах, будут при доста- точно больших к отличаться от и* на величины порядка б. Если модифицировать (2.10), считая 6 зависящим от t и убывающим, то при отсутствии ошибок вычислений и наблюдений закон управле- ния окажется оптимальным, т. е. и [&] и*. Процедура Роббинса — Монро (2.13) действует при наличии слу- чайных ошибок в оценке градиента. Если коэффициенты убывают, подчиняясь условиям (2.22), то обеспечена сходимость в средне- квадратичном, но асимптотическая скорость приближения очень медленная. Стоит, однако, подчеркнуть, что она определяется осо- бенностями закона больших чисел, обеспечивающего здесь «полное осреднение» влияния погрешностей. Алгоритмы типа (2.12) с цик- лическим осреднением не могут иметь лучшего асимптотического поведения [5.9], хотя, как правило, более эффективны на начальных шагах. Отметим также, что на практике предпочтительно повысить скорость сходимости, не снижая ниже определенного порога, хотя при этом гарантируется лишь сходимость в окрестность. Наконец, остановимся на процедуре Кифера — Вольфовица. Здесь возникают и систематические погрешности, и случайные. Убы- вание у, согласно (2.22) обеспечивает осреднение случайных по- грешностей, а убывание б( — систематических. Поскольку в силу (2.15) случайная компонента погрешности равна 26?1 ( W 4-иг) — Аф]), то ее дисперсия иЛет порядок б~2 и неограниченно возрастает при б( -* 0. Поэтому Т.2.1 здесь непосредственно неприменима. Дополнительный анализ показывает [9.18], что, беря, например, 6Z = О (у yt) ->0 при Г-* оо, можно обеспечить сходимость в среднеквадратичном. Практически принимают б, малым, но отлич- ным от нуля, смиряясь с потерями из-за пробных шагов. . Подведем итоги анализа. Вывод. Законы экстремального регулирования базируются на общих принципах построения систем с обратной связью'по на- блюдениям. Они приводят к оптимальным или субоптимальным решениям, даже если априорная информация о свойствах объекта и процесса наблюдения очень ограничена (необходима лишь ин- 36*
556 ГЛ. 11. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ формация о выполнении условий типа указанных в Тл2.1). При- нято говорить, что применение этих законов обеспечивает боль- шую адаптивность системы, т. е. сохранение хорошего качества при плохой априорной информированности. Вместе с тем выводы об оптимальности или субоптималъности экстремального регули- рования верны лишь для показателей, характеризующих устано- вившиеся режимы или поведение в среднем за длительный отре- зок времени, требующийся для установления процесса. Обеспече- ние эффективной работы при наличии помех в измерениях воз- можно лишь за счет еще большего замедления переходных про- цессов. Поскольку сама модель (2.2) дискретного статического' объекта практически приемлема для описания устойчивых объ- ектов, действующих в реальном времени (гл. 10, § 2), а длитель- ность такта (интервала между моментами изменения управления) должна быть достаточной для установления реакции, то ясна ос- новная область практического приложения экстремального регу- лирования — это устойчивые объекты, функционирующие в тече- ние длительного времени в одних и тех же условиях. О других возможностях — ниже, в § 3. 2.4. Управление с использованием оценок параметров. Разовьем идею, намеченную в конце п. 2.2. Предположим, что неопределен- ность в описании объекта сводится к заданию конечного числа па- раметров, вектора 0, т. е. .х[к +1] = f(u[k], 0), (2.28) причем вид функции / известен, равно как известен и вид функ- ции g(x, и), определяющей показатели качества (2.3) или (2.4). Естественным представляется идентификационный подход', на основе наблюдений найти оценки параметров, а с помощью оценок вычислять управление, оптимизирующее показатель качества. Этот подход в принципе допускает три варианта реализации. 1. Затратить начальные Та тактов для вычисления оценок, вы- бирая при этом управляющее воздействие только как тест-сигнал, обеспечивающий условия идентифицируемости еДолученную оценку 9 использовать для вычисления минимума оценочного показателя ](u) = g(f(u, 6), и). Если оценка 0 совпадет с истйнным значением 0*, то минимизиру- ющее значение и совпадает с оптимальным и* и при к> Т° может быть использована простейшая постоянная программа (2.6). 2. Исходя из произвольного начального управления н[0] и ап- риорной оценки 0 [0], .осуществлять на каждом такте уточнение этой оценки с помощью поступающих наблюдений, причем, если оценка на такте к равна 0 [к], то n[/c] = argminA(u), A(u) = gr(/(w, 0И), и). (2.29)
§ 2. АДАПТИВНОЕ УПРАВЛЕНИЕ СТАТИЧЕСКИМ ОБЪЕКТОМ 557 Если оценка окажется точной хотя бы асимптотически, 0 [7с] 0 при к -* °°, то такая управляющая последовательность будет опти- мальной в смысле (2.3), (2.4). 3. Учесть, что VJn(u) является оценкой градиента 7(н), и ис- пользовать один из алгоритмов экстремального регулирования и[к + 1] = и\к\ JK(и[к]) (2.30) с тем или иным выбором При этом по правилу дифференци- рования сложной функции имеем Vu4(upc]) = Vug + VxgVujf(в> §[&]) |u=ut4, (2.31) Алгоритм (2.30) может сходиться к и*, даже если оценки 0 [Тс] не сходятся к 0. Существенно лишь, чтобы функция J(u) и по- грешности r(S> =VuJ(BM)-V„7ft(B[Tc]) . (2.32) удовлетворяли условиям Т.2.1. Реализация подхода 1 наиболее очевидна и сводится к раздель- ному применению процедур идентификации, описанных в § 1, и решению обычной задачи на минимум функции конечного числа переменных. Однако ясно и то, что область применения подхода 1 ограничена ситуацией, когда наблюдения не зашумлены или помехи очень слабы. При реализации подхода 2 возникают две практиче- ские трудности: требуется каждый раз пересчитывать оценку после поступления новых данных (например, повторять процедуру МНК с увеличивающимся числом наблюдений), а кроме того, каждый раз заново решать оптимизационную задачу. Подход 3 сталкивается с тем же первым препятствием, но избегает второго, хотя сходимость экстремального регулирования может быть медленной. Достоинством алгоритмов типа (2.30) является отсутствие явных требований к выполнению условий идентифицируемости. Алгоритмы же типа (2.29), как правило, не реализуются в чистом виде: к «рабочему» воздействию, вычисляемому согласно (2.29), приходится добавлять тест-сигнал для обеспечения идентифицируемости. Вместе с тем предпочтение той или иной схемы практически определяется как возможностями вычислительной техники, так и допустимым откло- нением от оптимальности. 2.5. Рекуррентное оценивание параметров. В двух наиболее важных из описанных схем возникает проблема пересчета оценок параметров при появлении новых наблюдений. Упрощению про- цедуры переоценки посвящено множество исследований (см., на- пример, [11.9, 11.25]). Осветим лишь некоторые основные факты, ограничиваясь ситуацией, когда каждое наблюдение — скаляр у [А:], линейно связанный с оцениваемыми параметрами: [Лг] = ф [&] 0 + <р0 [&] + v [А:], /с-1,2,..., (2.33) причем {v [А]} — дискретный белый шум.
558 ГЛ. 11. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ Назовем рекуррентной процедуру оценивания, если она пред- ставима в виде О [& + 1] = 0[А] + Lh(y\k + 1]-у [k + 1]), (2.34)' где у [А] — наблюдение на такте к, а .у [А:] — прогноз его значения на основе ранее полученной оценки, так что у [/с + 1] = <р [А: + 1] 0 [А] + фо [А + 1]. (2.35) Соотношение (2.34) выражает принцип обратной связи по ошибке прогноза. Вектор Lh — вектор коэффициентов, усиления. С другой стороны, процедуры типа (2.34) отражают идею экст- ремального регулирования. Действительно, введем вспомогательный, идентификационный показатель Jid(0) = 1^4- i^~\y[k\ -ф[/€]0- ф0 m- v[A]|a, (2.36) имеющий в силу (2.33) минимум, равный нулю, при 0 = 0*). • Разворачивая во времени процедуру минимизации, получим 0[А + 1] = ед - Ъ v Zd (ОВД). (2.37) Возьмем в качестве оценки градиента вектор v(ft) = т ।v l/i:+11 _ <₽[к +1]8 ~~4,0 +1] 12к='е[ч= = -Фт[й +1ЦИА+ l\-y[k+ 1J). (2.38) Очевидно, что (2.37) совпадает с (2.34), если ; £Й = -Ъфед. (2:39) Вопрос о точности оценки (2.38), а следовательно, о выборе уь, обеспечи- вающем сходимость процедуры, проще всего обсудить в рамках Т.2.1, предпо- лагая, что каждая из последовательнрстей {<р[&]}, {фор]}, РР]} является эр- годической последовательностью независимых центрированных случайных ве- личин, распределенных по одинаковому, хотя и неизвестному закону с ограни- ченными ковариациями**), причем {v[A]} независима от {ф[А]}, {фор]}. Тогда Jid (е) = М I у [к + 1] - ф [Л- + 1] $-ф0 [к + И - v + 1 ]|2) (2.40) *) При случайных vp] значение (2.36), вообще говоря, случайно, но для любой реализации минимум достигается при одном и том же значении 0, сов- падающем с истинным значением параметров. **) При такой постановке задачу принято называть задачей стохастиче- ской аппроксимации. На самом деле нет необходимости считать входные (на- блюдаемые) воздействия случайными. Здесь это сделано лишь для удобства использования общих результатов Т.2.1. Отказавшись от гипотезы случайности, можно провести доказательство непосредственно и несколько ослабить требо- вания к последовательности {фр]},
§ 2. АДАПТИВНОЕ УПРАВЛЕНИЕ СТАТИЧЕСКИМ ОБЪЕКТОМ 559 Ve' = М [фт1* + и (у [* + и — ф[* + и 0 —ф0 [*4-1] — v[*+l])J = = -м{фт р+ 11 Ф [* + 1]} (0- 0). * В то же время V») = —<pT[A: + 1]ф[к + 1] (tpj — 0) + фт[& + 1]v[k + 1]. Поэтому погрешность в оценке градиента равна r« = V/1(i(^[A])-VW = {VT[i + l]<p[A + l]- -Мфт[* + 1]фИ + 1]}(0И -0) -Фт[А + 1]у[* + 1]. (2.41) Если помехи в измерениях отсутствуют, v[/c] == 0, то имеется лишь относи- тельная случайная погрешность и в силу Т.2.1 может быть обеспечена схо- димость к истинному значению 0 при "(* = у > 0. Если же помехи есть, то для обеспечения сходимости рекуррентной про- цедуры приходится замедлять процесс, требуя, чтобы уь убывали, удовлетво- ряя условиям (2.22). Подчеркнем, что утверждения Т.2.1 справедливы только при выполнении (2.18), что в данной задаче эквивалентно требованию .t ' ~ • Alim XV фт[&-HI ф [* + !]= М{фтр+1] ф [*+!]}>0, (2.42) /—> оо t к=0 - . совпадающему с условием (1.23) сходимости МНК. Кратко остановимся на более конкретных рекомендациях по вы- бору уь в (2.37). Если помехи отсутствуют, то выбирается либо (2.43) где константы I, L удовлетворяют условиям s£ — И 0, — LI 0, либо Ъ =[|л + [ф[/с + у, > 0. (2.44)’ Последнее приводит к классическому методу Качмажа, перво- начально разработанному для решения конечных систем линейных уравнений, но столь же естественно приспособленному и для реше- ния бесконечной системы г/И = ф[А:]0 + фо[Н k — i, 2, ..., (2.45) если она, как и в данной задаче, имеет единственное решение 0 = 0. Если помехи ограничены величиной е, то вновь можно принять. (2.43) со сходимостью со скоростью геометрической прогрессии в область порядка eL1/2Z-1, если |v[&]ICs [9.18]. Эффективны также различные модификации метода Качмажа с введением зоны нечув- ствительности [4.11], например, = ( [> + |ф[* + 1] |21, если \ у]к + 1] — у[& + 1] |>ё>, (2 [ 0 в противном случае, ' '
560 гл. 11. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ что может интерпретироваться как процедура поиска точки 0, удовлетворяющей бесконечной системе неравенств 1уИ —ф[А]0 —фо[*]1^8. (2.47) Найомним, что истинное значение 0 заведомо является такой точ- кой, причем размер зоны неопределенности, т. е. расстояние от 0 до произвольной точки, удовлетворяющей (2.47), вновь определяется показателем обусловленности Ll~l. Одинаковый характер имеют и оценки скорости сходимости в зону. Наконец, рассмотрим ситуацию, когда помехи случайны и имеют ограниченную дисперсию dv. В погрешности гт при этом имеется как несущественная случайная относительная компонента, так и существенная, абсолютная &rw = фт [к + 1] v [А: + 1], причем MlArw!2^Wv. (2.48) Здесь вновь можно использовать рекомендации (2.43), (2.44) для обеспечения сходимости в зону, размер которой случаен, но имеет среднеквадратичное значение уже указанного порядка. С другой стороны, для обеспечения сходимости к 0 (в среднеквадратичном) приходится осуществлять замедление поиска, требуя для вы- полнения условий (2.22). Это можно вновь делать различными способами: а) по программе 7л = [ц +fc]-*7, Ц>0, 7>0; (2.49) б) с нормировкой типа Качмажа ,7л = [н + 1ф[* + 1]1Т% Н>0, (2.50) причем удовлетворяет (2.22) ; в) с нормировкой типа Гудвина [11.25] / ''•*1 \ _ Та = И + 2 |ф[Л |2 Y, Ц>0, 7>0; (2.51) \ i=i / г) с локально оптимальным выбором 7л, где выполняется (2.50), но 7л = 1 + dv(q>[k + 1]2)[&]ффс + I])-1, dv > 0, (2.52) матрица T)[k] вычисляется рекуррентно: D{k] = (7-?й-хФт [А] Ф [/«]) D [к - 1] (7 - Тй_хфт [/с] ф [/г]) + + Vk-td^lk] ф[.М, (2.53) начиная с некоторого Do > 0.
§ 2. АДАПТИВНОЕ УПРАВЛЕНИЕ СТАТИЧЕСКИМ ОБЪЕКТОМ 561 Во всех вариантах у, вводится только во избежание деления на нуль. Остановимся несколько подробнее на способе (г). Его на- звание связано с тем, что такой выбор доставляет минимум М{|0й(у)-0|2}, (2.54) где 0*(Т) А + y(f[k}(y[k + 1] — ЙК+ Л), (2.55) иначе говоря, осуществляется выбор из условия наискорейшего спуска (в среднеквадратичном) к 0 по выбранному направлению. Если известна дисперсия помехи dv, то принимается dv = d„. Если задана ковариационная матрица Do априорной оценки 0[0] и принято £>[0] = Do, то D[k] является матрицей ковариаций текущих оценок. Вместе с тем при dv — 0 алгоритм (г) автоматически пере- ходит в классический алгоритм Качмажа, в котором выбирается из условия |0А(7)—0Рmin. . (2.56) Его преимущества особо проявляются при сравнительно низком уровне помех. Алгоритм достаточно быстро приводит в малую окрестность 0, после чего происходит медленное уточнение оцен- ки*). Асимптотическое же поведение при любом из приведенных способов имеет в силу Т.2.1 один и тот же порядок £“‘. Впрочем, ту же скорость сходимости (см. Т.1.1) имеют и оценки, получае- мые нерекуррентно, с помощью МНК или ММП. Рассмотрим еще одну возможность. Примем в (2.37), (2.38) вме- сто скалярного коэффициента матричный Г4, т. е. используем процедуру 0 [к + 1] = 0 И + Гщ/ [к + 1](у [к + 1] - у [к + 1]). (2.57) Выберем Гд из условия минимума МШ(Г)-0|2), - (2.58) где 0(t(-) определено, как и в (2.55). Можно убедиться в том, что rft = (<p[7c + 1]ПЙ<рЧ/« + 1] + dv)~lD[k] (2.59) a D{k] имеет смысл матрицы ковариаций текущих оценок и мо- жет быть вычислена рекуррентно: D[k] = D[k—i] — Pk-SD[к - 1]ФтИ<рИD[k- 1]. , (2.60) Замечание. Придадим исходной задаче несколько иную фор- му. Введем дискретную динамическую систему тривиального вида Q[k + 1] = 0[fc], 0[О] = 0, (2.61) *) Детальный анализ был проведен М. Г. Захаровым,
562 гл. И. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ состояние которой 0 [7с] наблюдается с получением текущих изме- рений У И — ф [Аг] 0 [&] + v [А]. (2.02) Очевидно, что исходная задача оценки параметров 0 эквивалентна задаче оценивания текущего состояния системы (2.61) по наблю- дениям (2.62), если принять у[к] = у[к\ — ф0[Лг]. Вместе с тем в гл. 10, § 4, было получено оптимальное решение этой задачи в виде фильтра Бьюси— Калмана. Сравнивая результаты, нетрудно убе- диться в полном (с точностью до обозначений) совпадении только что построенной процедуры с рекуррентным уравнением этого фильт- ра. С другой стороны, выход фильтра совпадает с оценкой ММП (при нормальности помех), т. е. фильтр дает рекуррентную про- цедуру построения таких оценок*). Асимптотическое поведение оценок во всех алгоритмах, как уже указывалось, имеет один и тот же порядок f‘, определяемый осо- бенностями закона больших чисел. Вместе с тем при том же поряд- ке величин асимптотическую точность можно улучшить, если име- ется априорная информация о законе-распределения помех [11.19]. В частности, если помехи представляют собой смесь нормаль- ных процессов с резко разными дисперсиями, причем доля помехи с большой дисперсией мала, то целесообразно использовать так на- зываемые робастные алгоритмы, отличающиеся тем, что 7л = 0, если \у [к + 1] — у \к + 1]| > v. Введение порога v позволяет отсеивать редкие, но сильные выбро- щ>1, отклонения наблюдений от прогноза, почти заведомо порождае- мые большими-помехами**). Если принять v~ |<р[к + 1]|, то отсе- ятся наблюдения с низким уровнем сигнала, что, как показывает практика вычислений, почти всегда необходимо. Важно также отчетливо представлять, что все методы градиент- ного типа (со скалярным yft) малоэффективны при плохой обуслов- ленности матрицы (малом IL~'). Преимущество в этом отноше- нии имеет .алгоритм (2.57), по крайней мере при малых дисперсиях случайных погрешностей и грубых априорных оценках. В равной мере использование рекуррентных форм симплекс-метода предпоч- тительнее (2.46) при малых е. Практически на выбор метода влия- ют, конечно, и сведения о возможностях вычислительных устройств. С другой стороны, обусловленность улучшаема за счет планиро- вания идентификационного эксперимента, но, как мы убедимся ниже, это может вступить- в противоречие с основной целью управления. — - - '/ *) Если априорные сведения о дисперсии помех и ковариации начальной оценки отсутствуют, то используют МНК в обычной форме для обработки не- которой начальной серии наблюдений, а затем применяют рекурренцию (2.57) — (2.60) для обработки остальных наблюдений. **) По поводу теории робастных оценок наиболее полные сведения даются в [11.17] (см. также обзор [11Л9д]),
§ 2. АДАПТИВНОЕ УПРАВЛЕНИЕ СТАТИЧЕСКИМ ОБЪЕКТОМ 563 2.6. Объект, линейный по управлению и по параметрам. Опи- шем несколько, подробнее особенности различных вариантов экстре- мального регулирования, применительно к задаче управления ли- нейным статическим объектом, описываемым соотношением x[k+l} = Bu[k] + Gw[k\, к = 0, 1, ..., где ж — n-вектор состояния, и — «„-вектор управления, w — гею-век- тор возмущения. Цель управления состоит в приближении выхода у[к] — Сх\к] (2.63) к желаемому z/d [Аг], т. е. в уменьшении ошибки управления еИ = г/'!И — У 1к]. (2.64) Сопоставим с этой целью показатели вида =Tto 4 Iе I*] I2 (2-65) fe->00 Z ИЛИ t 7=11^42 4-1 ew« <2-66) Если последовательность {zz [Ar]} выбрана так, что значение по- казателя (2.65) равно нулю, то гарантируется равенство нулю ошибки в установившемся режиме. Равенство же нулю показателя (2.66), вообще говоря, может иметь место и при наличии редких отклонений от нуля *). Пусть w [к] = w = const и yd [А] = yd = const. Заменяя исходную цель задачей минимизации (2.65) или (2.64), приходим к постановке, описанной в п. 2.1 при J(u)=4^d-Ca;l2i=4-|^-CSM-CGM;la* (2.67) Оптимизационная постановка конкретизирует задачу выбора управления и для ситуаций, когда объект не является полностью управляемым, т. е. не существует такого и [А] = и*, чтобы е [Аг] — О при любом yd, иначе говоря, не имеет решения система ₽u = s, s^yd — CGw, $&СВ, (2.68) а следовательно, показатели (2.65), (2.66) не могут достигать ну- левого значения. Рассмотрим последовательно ряд возможных ситуаций, считая выполненным условие rank р = m, т A dim и. (2.69) *) Равенство (2.66) нулю в анализе именуется сходимостью последователь- ности {е[/<]} к нулю в смысле Чезаро и, вообще говоря, не влечет за собой стремления к нулю элементов последовательности.
564 ГЛ. it. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ а) Известны р, s. Тогда, полагая и[*] = 1г*=(ртр)-1рч £ = 0,1,..., (2.70) сразу достигаем минимума J(u), при котором e[A] = 8* = [Z-p(P’P)-‘p]s. (2.71) В случае полной управляемости е* = 0, и при dim у = m u[fc] = u* = p-ls. (2.72) б) Известно р, но неизвестно а. Тогда, полагая и[0] произволь- ным и измеряя ошибку е [1], находим, что закон управления с обратной связью по ошибке и [к + 1] — и [к] + К [к] е [к + 1], е [к + 1] = s — рп [Л] (2.73)' приводит к минимуму за один такт, если выбрать ^W = (pTP)-1pT = const. (2.74) в) Неизвестны ни з, ни р. Пусть имеет место полная управляе- мость. Тогда при использовании закона (2.73) -получим процесс, сходящийся к и*, если матрица коэффициентов усиления удовлет- воряет условию < а Д(|/-2Г₽||<1. (2.75) Действительно, и [к + 1] — и* = и [к] — и* + К (s — ри )£]) — = (1— К$) (иИ — и*) — К(з — Рн*), (2.76) так что при условиях (2.72), (2.75) |п[£ + 1]— и*|<а1мИ — и*\ и имеется экспоненциальная сходимость: |п[£] —• u*!< а,!|и[0] — и*[. (2.77) Для того чтобы удовлетворить (2.75), необходимо иметь некоторую информацию о р. Более того, при отсутствии полной управляемости последнее слагаемое в (2.76) не равно нулю, и даже выполнение (2.75) не обеспечивает сходимость и[к] к и*. Обратимся к алгоритмам экстремального регулирования. Отме- тим прежде всего, что VJ(u) = pT(s-pu). (2.78) Вектор 6 неизвестных параметров, входящих в выражение градиен- та, состоит из столбцов Pj матрицы р и вектора $. Попытаемся применить алгоритм (2.16) с оценкой компонент градиента по фор- муле (2.15). Однако, в отличие от (2.14), предположим, что изме- ряется, и притом точно, ошибка управления. Тогда, поскольку
§ 2. АДАПТИВНОЕ УПРАВЛЕНИЕ СТАТИЧЕСКИМ ОБЪЕКТОМ 565 J(u[/c])=e2[fc], имеем' = (2б/)-1 [ | е [£ (2m + 1) + /] |2 - | 8 V (2т + 1) + т + /] |2], (2.79) или = (26()-1[(s— $u[t(2m + i) + j])2 — (s — Pu[t(2m + 1) + m + j])2] = = (260"1 [(« - - рбгiJ2 - (s - pM(t) + Р6г/>)2] = = _ _ ри<‘>)т. (2.80) Убеждаемся, что точно совпадает с j-й компонентой градиен- та, даваемой формулой (2.78) при u = u('), при любом б(>0. Поэтому алгоритм (2.16) при Y( = у = const, 0 < 7 < 2L-1, где L — наибольшее с. ч. матрицы ртр, обеспечит сходимость к минимуму последовательности {uw}. Если же принять б( -> 0, то и[к] -* и* для любых к (исчезают потери на пробных шагах). Однако можно поступить и проще, обеспечивая сходимость точно за т + 2 тдкта, Действительно, в силу алгоритма имеют место равенства е [1] = s — ри [0], е [/с] = s — р (и [0] + бог3) = е [1] — 60pij-, / = А-1 = 1, 2, ... Отсюда Р; д РО = б^1 (е [1] — 8 [Л:]), j = к — 1 = 1, ..., т, s = е[1] + Ри [0]. (2.81) Таким образом, по (т+1)-му наблюдению вычислим все т столб- цов р} матрицы р и вектор s. После этого можно на всех дальней- ших тактах использовать управление и [Zc] = и*, вычисленное со- гласно (2.70). Фактически оказался использованным простейший идентифика- ционный подход с получением точной оценки всех параметров за конечное число начальных тактов. Несколько иная идея применена в [11.4д]: пробные шаги совме- щаются с рабочими, а параметры определяются в результате обра- ботки по МНК текущих наблюдений. Пусть и [А:], к — 0, ..., т,— какие-либо произвольные векторы рабочих шагов. Тогда наблюдение дает линейные связи 8[Н2]-е[Н1] = ?(и[Н1]-1{И), & = 0, 1, ... (2.82) Находя на каждом такте к оценки р [/<] из условия минимума 2 |8[Z + 2]-8[Z + l]-p(u[Z + l]-un])|% fc = 0,l, (2.83) 7=0 , ' приходим за т +1 такт к истинным значениям, если выполнены очевидные условия невырожденности. Можно доказать, что они вы- полняются при почти любом п[0], если далее и [к] строятся соглас- но (2.73) при ЭДМШеШ (2.84)
566 гл. 11. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ Поскольку р[т + 1] = р*, то и[т + 1] = и* и е[ш + 2] = е*. Пере- счет МНК оценок разумно вести в рекуррентной форме + И = + |&uftr2(Aeft - ЙМ buh)bul, &uh А и [к + 1] — и [Ar], Дей А е [к + 2] — е [А + 1]. 2.7. Управление при случайных помехах*). Пусть наблюдаются величины 8И = еИ + ДВД, (2.86) где {N[&]} — «белый шум». Очевидно, применим алгоритм Кифе- ра — Вольфовица (2.15), (2.16) при 7(н) = е2. Сходимость управле- ний обеспечивается за счет убывания у(, 6(. Практически более ин- тересен идентификационный подход. Простейший вариант состоит в циклической процедуре, где в каждом цикле т + 1 такт затрачи- вается на пробные шаги, а (тп + 2)-й — на рабочий шаг. В цикле t из уравнений типа (2.81), где е [fc] заменено на е [&], находятся векторы s(<), р(<), отличающиеся от s*, 8* в силу случайных ошибок. Если в качестве текущей оценки брать результат усреднения этих векторов по всем предшествующим циклам, то оценки сойдутся (в среднеквадратичном) к s*, р*. При вычислении рабочих шагов согласно (2.70) с заменой s, р на s(t\ р<о последовательность uu> также сойдется к и*. Очевидно, что усреднение можно проводить рекуррентно: ?"+" - гп ₽“> + даП ?'+и - гл’"’ + гл7'1’ <2'87> Для упрощения вычислений обратим внимание на то, что с ростом t оценки и соответствующие им управления сближаются. Поэтому при достаточно больших t в формуле и(>+1) — [(р(<+,>)тр<(+‘)]-‘ (р('+1>)тр<+О можно учесть малость изменения матриц и попытаться выразить и<‘+1> через предшествующее значение и(‘\ Если в 'ходе выкладок формально отбрасывать слагаемые порядка меньшего, чем то получим рекуррентную процедуру . ••• + +тs<°’ = + е<‘) + ₽<f> е<% (2.88) ^(t+i) = pw _ J_ pW [(p(O)T^(o + ( pwypfi)] pa^ где *) Имеется ряд интересных исследований [4.11, 11.3, 11.11] по алгорит- мам, учитывающим ограниченные помехи, но результаты применимы только» при полной управляемости.
§ 2. АДАПТИВНОЕ УПРАВЛЕНИЕ СТАТИЧЕСКИМ ОБЪЕКТОМ 567 Процедура (2.88) может интерпретироваться как реализация двух контуров обратной связи: основной контур реализует обрат- ную связь по наблюдаемой ошибке управления е(() с поправкой по прогнозу этой ошибки а в дополнительном контуре осуществ- ляется идентификация параметров и пересчет матриц коэффициен- тов усиления необходимых для работы основ- ного контура. Вместе с тем алгоритм имеет все особенности алго- ритма экстремального регулирования с введением убывающего ко- эффициента 7г ~ 7~* для усреднения случайных помех. Очевидно, "что аналогичному преобразованию может быть под- вергнут и алгоритм (2.73), (2.84), (2.85), где идентификация произ- водится без пробных шагов. При его циклической реализации в кон- це каждого цикла находятся текущие величины р(|), которые далее подлежат усреднению. Возможно, что более эффективной в вычислительном отношении является нециклическая реализация, т. е. алгоритм с основной об- ратной связью вида и |7с + 1] = и [&] + К [&] е [к + 1] и К [&], рассчи- тываемым согласно (2.84), где 0 [А] — текущие МНК оценки. Однако условия сходимости здесь не изучены. 2.8. Переменные внешние воздействия. Кратко рассмотрим си- туацию, когда внешние воздействия изменяются по времени, т. е. — CGu> [к — 1] =й=я = const. При этом наиболее важны три варианта. а) Воздействие известно заранее с точностью до константы ё. Тогда применимы описанные алгоритмы с очевидной модификацией: из обрабатываемых наблюдений вычитается известная часть, а оцен- ке подлежит лишь константа и матрица (J. б) Воздействие заранее неизвестно, но его изменение ограничено. Тогда применимы те же алгоритмы, но вносится дополнительная ошибка в силу отличия получаемой постоянной оценки от действи- тельного меняющего воздействия. в) Воздействие заранее неизвестно, но непосредственно наблю- дается и, более того, является полиномиальным степени г. Тогда оно представимо как решение однородного уравнения Г^И = 0, где £ — оператор сдвига на такт при неизвестных начальных усло- виях, а следовательно, за г тактов может быть восстановлено по наблюдениям, если таковые точны, или восстановлено асимптотиче- ски точно, если наблюдения зашумлены. Описанные алгоритмы сохраняют силу, если оценка воздействия ведется независимо (по его наблюдениям), а при оценивании мат- рицы по формулам типа (2.81) учитывается изменение воздействия по его оценкам*). *) Детальнее —в [11.6].
568 гл. 11. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ Сделаем также важное замечание, относящееся к постановке за- дачи. Неопределенность в описании объекта лишь в редких ситуа- циях можно задать с помощью набора постоянных параметров. Обычно при постановке задачи управления неявно подразумевается, что параметры, формально принятые постоянными, на самом деле медленно изменяются, дрейфуют. Приведенные алгоритмы иденти- фикационного типа работоспособны лишь, если они • обеспечивают сходимость за время, когда дрейфом параметров можно пренебречь. Алгоритмы с р->0 в их теоретической форме неприложимы, по- скольку приводят к асимптотическому обнулению коэффициентов усиления. Обычно прибегают к их циклическому применению, через определенный период восстанавливая yt до исходного значения. В заключение приведем пример, иллюстрирующий скорее поста- новку задачи, чем методы ее решения. Пример 2.1. Адаптивное управление формой поверхности астро- номического зеркала. Поверхность фокусирующего астрономиче- ского зеркала должна представлять собой сферический сегмент. Традиционная оптическая технология добивается этого путем тщательной обработки поверхности и большой жесткости его конст- рукции. Однако повышение требований к точности (в особенности в больших телескопах) приводит к тому, что недопустимыми оказы- ваются и малые деформации, вызванные различными некомпепсируе- мыми внешними механическими и тепловыми воздействиями. Эти воздействия приводят к искажению идеальной формы, даже если таковая получена при первоначальной обработке. За последние годы выдвинут (см., например, [11.1]) новый принцип: искажения по- верхности должны компенсироваться в ходе работы оптического' инструмента путем приложения управляемых усилий к зеркалу. ' Пусть и\к] — вектор, компоненты которого равны управляющим силам, приложенным в момент к к разным точкам конструкции, а г/[А] — вектор наблюдаемых смещений поверхности зеркала отно- сительно идеальной в различных контрольных точках, число которых может быть существенно большим числа усилий. Тогда у[к + 1] — — ри[&] + yw\k + 1], где р — матрица коэффициентов влияния (по- датливостей), a yw\k + 1] — смещение, вызванное внешними факто- рами. При этом учитывается, что ввиду естественной диссипации за такт между очередными изменениями воздействий реакция уста- навливается и определяется лишь упругими свойствами конструк- ции. Требуется выбрать и[к] так, чтобы смещения отсутствовали, т. е. yd[k + 1] = 0t s[fc] = — Уи[/г]. Ввиду отсутствия полной управ- ляемЬсти (число входов меньше числа выходов) удовлетворимся показателем типа |б[&]|2 или |у[&]|2, т. е. суммой квадратов откло- нения по всем контрольным точкам. За такт у1С[/с] меняется несу- щественно, и его можно считать” постоянным, хотя и неизвестным. Если матрица податливостей ф предварительно рассчитана, то при- меним простейший закон с обратной связью (2.73), (2.74), приво- дящий за один такт к оптимальному заданию управляющих сил.
§ 3. АДАПТИВНОЕ УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ 569 * Однако точный расчет 3 ввиду сложности конструкции невозмо- жен, поэтому мы располагаем лишь априорной оценкой Можно- попытаться сохранить закон (2.73), введя в него К = 1 (Р°)т. Тогда, если выполнено (2.75), т. е. точность оценки р® велика, то- процедура сойдется, причем чем лучше точность, тем быстрее. Быстродействие существенно, поскольку процесс должен сойтись быстрее, чем существенно изменится у» И. Дополнительные труд- ности связаны с плохой обусловленностью матрицы (^°)ТЭ°, что по- вышает уровень установившихся ошибок, как видно из (2.76). Основной практический прием состоит в том, чтобы улучшить обус- ловленность за счет выбора точек приложения управляющих сил, хотя трудности и сохраняются. При высокой точности измерений предпочтительнее подход экстремального регулирования с оценкой р, s по пробным воздействиям. При низкой точности, даже если погрешности измерений случайны, действие системы неэффективно- из-за слишком малого быстродействия (хотя асимптотически имеет место сходимость, но за длительное время изменятся оцениваемые возмущения). □ § 3. Адаптивное управление динамическими объектами. Самонастройка 3.1. Основные принципы. Динамичность объекта существенно- усложняет проблему управления в условиях малой априорной ин- формации. Идея непосредственного поиска текущего управляющего- воздействия по оценке вызываемого им изменения показателя ка- чества здесь сталкивается с большими трудностями, поскольку эф- фект от управления, прилагаемого в данный момент, сильно иска- жается влиянием ранее приложенных к объекту воздействий и на- чальных условий. Поэтому наибольший интерес представляет не- сколько иной подход, называемый принципом автоматической на- стройки (самонастройки) параметров закона управления. Предпо- ложим, что задан закон управления с обратной связью по сово- купности наблюдений у{к) в виде u(k\=4l(ym, u{k~l\ 0„), (3.1) где функция б7/(-, •, •) известна, но заранее не определен конечно- мерный вектор параметров 0„. Таким образом, задача выбора теку- щего управляющего воздействия заменяется задачей выбора (на- стройки) параметров 0„. Определение. Закон управления называется самонастраи- вающимся по отношению к (3.1), если он имеет вид uM=W‘>, и'*-1’, 0иЩ), (3.2) где 0„ [к] изменяется (настраивается) в зависимости от получен- ных наблюдений и, возможно, ранее принятых управлений. 37 д, а, Перпозвансиий
570 гл. И. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ (3.3) Соотношения типа 0u[A] = ^"(pw, называются алгоритмами самонастройки. Конечно, если подставить (3.3) в (3.2), то вновь получим неко- торую зависимость u[t] только от у(!>, т. е. некоторый общий закон управления с обратной связью. Однако выделение двух кон- туров (рис. 11.2), основного кон- тура обратной связи, задаваемого (3.2), и контура самонастройки, задаваемого (3.3), стимулирует эвристические соображения, спо- собствующие изобретению новых способов борьбы с неопределен- ностью (ср. § 4 гл. 10). Выделим два основных пути построения самонастраивающихся законов, которые условно назо- вем прямым и косвенным (иден- тификационным). Пусть задан какой-либо пока- затель качества работы системы, замкнутой обратной связью (3.1). Если свойства объекта полностью известны, то показатель можно вычислить при каждом значении параметров 0„, и он окажется некоторой функцией /(0„) этих па- раметров.. Более того, в принципе можно найти значение 0ut опти- мизирующее этот показатель (минимизирующее J(0U)). Предположим далее, что ни 7(0„), ни тем более 0и неизвестны, однако по наблюдениям и априорной информации в любой мо- мент к можно построить оценку градиента функции J(0„) в точке 0„ [А]. Тогда, начиная с некоторого 0М [0], последовательность ;0и [А] вычисляется по формуле градиентного типа 0и[А + 1] = 0а[А]—- Y*v<w, (3.4) задающей тот или иной алгоритм самонастройки. При подходящем выборе у» последовательность 0и [к] сходится к 0И. Однако даже н этом1 случае нельзя, вообще говоря, утверждать, что соотношения (3.2), (3.4) доставляют показателю качества значение J (©и), по- скольку в ходе процесса настройки система функционировала при неоптимальных значениях параметров. Как и в задачах управления статическим объектом, можно рассчитывать на достижение опти- мального или субоптимального результата, только, если показатель качества имеет вид (2.3) или (2.4), т. е. характеризует установив- шийся реяшм или поведение системы в среднем за длительное время. Очевидно и сходство алгоритма (3.4) с процедурой (2,7) экстре- мального регулирования статического объекта. Действительно, ал-
§ 3. АДАПТИВНОЕ УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ 571 горитм (3.4) также задает управляющие воздействия 0„И, но это управления верхнего уровня, влияющие на объект косвенно, через основную обратную связь. Теперь должен быть ясен и второй, идентификационный путь. Если неопределенность в описании объекта может быть сведена к незнанию конечного числа параметров, вектора 0,' то возникают все алгоритмические возможности, описанные в п. 2.4, но применен- ные к поиску управления верхнего уровня {0и [/с]) при фиксирован- ной структуре (3.2) основной обратной связи. Конечно, исследова- ние их эффективности значительно сложнее, поскольку, кроме ди- намики процесса настройки, приходится учитывать динамику ос- новного контура * *). . Контур самонастройки, как Правило, выполняется медленно дей- ствующим: скорость изменения параметров делается малой по сравнению со скоростью процессов в основном контуре. Поэтому обычно применим простой прием «замораживания параметров» (см. гл. 6, § 8), в силу которого динамика основного контура мо- жет исследоваться так, как будто закон управления сохраняет те- кущие значения настраиваемых параметров до полного установле- ния переходных процессов. Однако в некоторых простых ситуаци- ях возможно построение самонастройки, .скорость которой немала или уменьшается постепенно. Примеры этого даются ниже. 3.2. Стабилизация линейного объекта. Рассмотрим объект, опи- сываемый уравнением “ аК]г/М= МЙМН (3.5) где у, и — скалярные выход и управление, а(£), р(£)—многочле- ны от оператора сдвига на такт, а(?)=5’‘ + ап_1Г-, + ... + а0, ^(g)=Mn-, + :.. + p0. Будем предполагать, что хотя параметры а<, неизвестны, но- многочлен Р(£) устойчив (имеет корни внутри единичного- круга) и многочлены a(z), ^(z) не имеют общих корней. Построе- ние стабилизирующей обратной связи при известных параметрах — элементарная задача, по существу рассмотренная еще в гл. 3. Достаточно взять закон управления в виде г(£)а[*]~-*(£)ИН (3.6) причем подобрать многочлены Z(z), k(z) так, чтобы было выполне- но тождество a(z)Z(z) + P(z)/c(z) = Ad(z), где A<f(z) — желаемый устойчивый многочлен, который и окажется характеристическим многочленом замкнутой системы. В частно- 'сти, если Ad(z) = z^(z), (3.7) *) Общий подход, базирующийся на развитии метода функций. Ляпунова, изложен в [11.7]. ; 37*
572 гл. 11. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ то можно удовлетворить тождеству, приняв Z(z) = p(z), fc(z)=.zn — cc(z)= — [«„^z"-1 + ... + а0]. (3.8)' При принятых предположениях замкнутая система окажется устойчивой, а закон управления реализуемым. В явной форме его можно записать так: ц [/.] = о-(otn-iP [к] + .»• + аоу [к — п + 1] — Рп-1 -Pn_2w[fc-1]----------pou[fc —га —1]). (3.9) Если же ввести матрицы ф„[/с] (строка) и 0и (столбец) по фор- мулам Ф« И = ^У И, . •у[к — п + 1], и [к — 1], ..., и[к — п + 1]}, 0« — Р„+1 («п—It • • ч Рп—2» • • •! — Pfl)t (3.10) то запись принимает вид и И = Фи И 0и. (3.9')' Если истинные значения параметров объекта неизвестны, то попы- таемся согласно общей схеме заменить (3.9') на закон управления о самонастройкой: и И = ф„ И 0и И, (3.11)’ тде {0u [fe]) — последовательность настраиваемых коэффициентов. Заметим предварительно, что уравнение объекта (3.5) можно также переписать в рекуррентной форме у [к + 1] = ₽„_!«[&] — (ап_гу [&] + ... + айу[к — п + 1] — — Рп— 2й [к — 1] — • • • — Рои [к — п + 1]) = Рп-1^ [к} — фи [&] 0и, тде указаны истинные значения параметров. Таким образом, при любом управлении имеет место соотношение у [к + 1] = Pn_iu[A] — Фи [Zc] 0ut (3.12) я на управлении вида (3.11) получаем У[к + 1] = Рп-1Фи[&](9и№-0),, * (3.13) причем это верно только при к > п, поскольку само управление (3.11) может быть использовано лишь после получения измерений на начальных п тактах. Остается главное — предложить эффективный алгоритм само- настройки. На первый взгляд алгоритмы типа (3.4) неприменимы, поскольку в них фигурирует оценка градиента минимизируемого показателя качества, а задача стабилизации не носит оптимизаци- онного характера. Однако можно искусственно построить показа’»
§ 3. АДАПТИВНОЕ УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ 573 I тель, например, вида J = lim 4-г/2[/е]. (3.14) Й-»оо Z Пусть удается найти управление, в силу которого У принимает ми- нимальное значение, равное нулю, тогда гарантируется асимптоти- ческая устойчивость, если на любом такте у[к], ограничены. В качестве текущей оценки V<*’ градиента J можно взять вектор д ! 1 \ д Дд&Г (y у2& + 1]/ = У № + и у + 1] = = у[/с+1]₽:_1фи^]. (3.15) В эту оценку входит лишь один неизвестный параметр Pn-i» но поскольку важно лишь направление вектора, то достаточно знать знак Рп-i- Считая Pn-i > 0,: запишем стандартную процедуру (3.4) в виде + 1] = 0„И -Jky[k + l]q>]. (3.16) Теорема 3.1 *). Пусть £(z)—устойчивый многочлен; тогда при выборе yft = T[p + |<p[/f+l]|2F\ М>0, 0<рп_1у<2, (3.17) имеет место ограниченность {уЩ}, {n[fe]} и у[к] -> 0 при к -> Отметим, что для построения эффективного алгоритма необхо- дима некоторая априорная информация о коэффициенте ₽n-i. Это- го недостатка лишены идентификационные алгоритмы. Введем в рассмотрение вектор параметров 0: 0 =(«„_!, ..., а0, ..., р0) (3.18) и перепишем тот же закон управления (3.9) в виде ФИ0 = О, (3.19) где ф[/с] = {—у [к], ..., — у [к — п+1], и И, ..., и\к — п + 1]}. (3.20) Тогда в соответствии с общей схемой при неизвестном 0 можно применить закон управления ф[&]0[/с] = О, (3.21) где оценки параметров в [А:] строятся согласно некоторому иденти- фикационному алгоритму. •) Доказательство Т.3.1, а также Т.3.2 можно найти в [11.22]. Выбор у» со- ответствует алгоритму Качмажа (см. также [11.3]),
574 гл. 11. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИИ Закон управления (3.21) задан в неявной форме. Явно он пе- реписывается в виде Wvlk} + ... - Ро lk]u[k-n + 1]) (3.22) Рп-1 1*1 и почти аналогичен построенному ранее (3.11). Поскольку необхо- димо делить на p„_4[A:], то в идентификационные алгоритмы еле дует ввести небольшое изменение, противодействующее появлению в ходе его работы нулевых оценок этой, (п+1)-й компоненты вектора 6 [к]. Теорема 3.2. Пусть P(z) устойчив, используется закон управ- ления (3.21) и алгоритм идентификации вида еда+1]=е да]+г*Фт да+1](У да + и - Ф да+и е да]). (з.гз) Тогда {у [А:]}, {и [&]} ограничены и у [А] -*• 0 при к оо, если используется одно из следующих правил выбора 1\: 1 + ah<f [Л] D [к — 1] ф1 [4] где ад = да - (1 + a^ik]D\k - 1]Фтда]) -1 х хдда-1]Фтда]Фда]]ода-1], (з.25> D[0]>0; б) ъ-i = аДц + ФИФтда]]~1. И>о, (3.26) причем щ=1, если 0„+1[A+l] — 0. В противном случае 0<щ<1. № Оба правила совпадают с описанными в § 2 с точностью до коэффициента ак, роль которого ясна из сказанного выше. Под- черкнем, что сходимость оценок 0[А] к 0 не гарантируется, поскольку нельзя гарантировать выполнение условия идентифицируемости для последовательности Ф [А]. Приведенные результаты почти без изме- нений распространяются на случай, когда система имеет несколько выходов, но число управлений равно числу выходов [11.22]. 3.3. Управление при наличии случайных возмущений. Рассмот- рим объект, задаваемый операторным уравнением у[к] = HUy(t,)u[k] +Hwy(t,)w[k], (3.27) где ГТ lf\ _ Р (С) ТГ /f-\ _ Pw № пг1у — а , nwy — а , а, р, Р» — многочлены от оператора £.
§ 3. АДАПТИВНОЕ УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ 575 Будем считать, что {» Щ)— белый шум (если w[k\— последо- вательность с дробно-рациональной спектральной плотностью, то также можно использовать запись (3.27) после предварительного построения формирующего фильтра). В качестве показателя используем й 7 = 1Ы4-Ум{р2[/]}. (3.28) При известных параметрах объекта задача построения оптимальной обратной связи может быть решена многими способами (гл. 7). Ограничимся особо простым случаем, когда dega(z) = degP(z)+1 = degpM(z) = n, ап = рш,» = 1, (3.29) а многочлены £, устойчивы. Тогда, как показано в гл. 4, форму- ла (4.55), оптимальный линейный закон управления имеет вид (3.6) при Z(z)=p(z), &(z)= fJw(z)—a(z), а следовательно, может быть записан в векторной форме ф[Л]0.= О, . (3.30) где ф [Аг] — строка, определяемая согласно (3.20), а 0„ — столбец ко- эффициентов, которые вычисляются непосредственно, если известны истинные значения параметров объектов. В противном случае можно прибегнуть к самонастройке. Вновь используем тот факт, что при условиях (3.29) справедливо рекуррентное представление р [А: + 1] = —а„-1У И — ... —[А: — n + 1]+ 4- [А:] + ... +М [к - п + 1] + v [/с], к>п, (3.31) где v[fc]A £~(n~l,'3„,(£) ю[А:] и является случайным непосредственно ненаблюдаемым процессом. При обозначениях (3.18), (3.20) имеем р[А + 1] = фИ0 + уИ. (З.ЗГ) Располагая-в момент к оценкой параметров 0 [А:], выберем управ- ление из условия обращения в нуль прогноза ф[/с + 1] = фИ0И==0, (3.32) а переоценку параметров произведем пропорционально ошибке про- гноза 0 [к + 1] = 0 [А:] + ГлФт И (у [A: + 1] - у [А: + 1]), (3.33) тде Рй выберем согласно одной из известных схем § 2. Опять-таки важно понимать, что любой выбор может гарантиро- вать сходимость оценок только при выполнении условия идентифици- руемости, а таковая не обеспечена, поскольку последовательность
576 ГЛ. 11. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ Ф [А] выбирается в ходе алгоритма. Тем не менее при определен- ных дополнительных условиях описанная процедура теоретически эффективна. Теорема 3.3*). Пусть многочлены P(z), pM(z) устойчивы, а (fe . \-i _ |А 4- 2 ф[/]фт UJ к р. > О, Т>0. (3.34) 1=0 / Тогда при любых начальных условиях применение алгоритма (3.33) г (3.34) обеспечивает то же значение - функционала (3.28), что и оптимальное управление, построенное на основе известных значе- ний параметров, если выполнено дополнительное условие Re{z-X(z)|2=ei“l>4- (3.35) & ! Коэффициент ah выбирается так же, как в Т.3.2. Хотя формально в условиях Т-3.3 отсутствует требование устойчивости объекта, но вычислительный эксперимент демонстри- рует практическую непригодность метода при большом удалении корней cc(z) от единичного круга (или при высоком уровне помех): система в процессе настройки успевает столь раскачаться, что за- ведомо выходит из области, где справедлива линейная модель. 3.4. Задача слежения. Эталонные модели. В рассматривавшихся выше задачах предполагалось, что желательным состоянием систе- мы является состояние у [fc] = 0. Очевидно, что все рассуждения останутся неизменными, если требуется обеспечить близость выхо- да к любому заранее заданному состоянию yd = const или ограни- ченному процессу yd [/с]. Несколько сложнее ситуация, когда !/“[&] — заранее неизвестный, но наблюдаемый процесс. Будем считать, что ненаблюдаемые возмущения и помехи от- сутствуют. Даже если параметры известны, то идеальный закон управления, вытекающий из тождества р‘'И = рИ = -а(г1)г/И + Р(Г‘)»[Н (3.36) нереализуем, ибо он эквивалентен соотношению и [к - 1] = р-li {/[ к] + ап_1у.[к-1 J + ...L (3.37) где управление выражается через будущее (предполагаем, что вы- полнено условие (3.29)). Поэтому при отсутствии дополнительной информации об УВД лучшее, чего можно добиться, это обеспечить у[к]^уЧк-^ = Уа[к]-(уЛ[к]-уЧк-1]), (3.38) заранее соглашаясь на погрешность, равную приращению желаемо- го процесса за один такт. При этом закон управления принимает *) Доказательство дано в [11.23], а в [11.24] приведен анализ той же про- цедуры, но при выборе Г* по несколько модифицированной схеме МНК.
§ 3. АДАПТИВНОЕ УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ 577 ВИД u{k-\=^—{y4k-i}+^n_ly[k-i}+...}. (3.39) Рп-1 Обобщая эту идею, потребуем, чтобы HM = W)*/d[M, = (3.40) а \э/ где ccd, — многочлены, причем ал устойчив. Разделив на старшее слагамое в ad, запишем Тогда желаемая связь примет вид &И = -^(Г‘)!/га+Р(?-1)г/йМ, (3.41)’ а обеспечивающий ее закон управления дается уравнением ₽(V) и И = (а (?-*)- а* (Г1)) У И + №‘) У* И- (3.42) Он реализуем, если Hd(t,) — правильная дробь. Попытаемся обеспечить тот же результат в условиях неопреде- ленности, хотя бы в установившемся режиме. Пусть - Чк]^у [к] — Hd (£) yd [к], (3.43) так что (1 + ad (Г1)] е [к] = [1 + ad (Г1)] У [*] (Г1) УЧк] Д 6Й. (3.44) Ввиду устойчивости ad из <% -> 0 следует, что е [к] -> 0. Таким об- разом, для того чтобы (3.41) выполнялось в установившемся ре- жиме, достаточно добиться lim 8% = 0. (3.45) fe-*oo Эта задача аналогична рассмотренной в п. 3.2 и может быть ре- шена с помощью почти тех же алгоритмов, если у [A], yd [А:] наблю- даются без помех. В частности, справедливо утверждение. Теорема 3.4. Пусть многочлены ^(z), ad(z) устойчивы и ис- пользуется закон управления и И —Ф И (Н (3.46) где ф И = = 0" (?“’)/[А], у\к}, ..., у [к — п], и[к — 1], ..., и[к — n + 1]},
578 гл. И. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ а коэффициенты закона управления .пересчитываются по формул^ 0и [А +• 1] = би И — 'Укф [&] б [fc + 1] (3.47) с = 7 [е + | $ [А] I2]-1,. е > 0, 0<рп_!у<2. Тогда из ограниченности {yd[/c]} следует ограниченность {п[А:]}, {у [А:]} и бИ “* 0, е[/с] 0 при fc -► оо *). Отметим, что описанному алгоритму можно дать структурную интерпретацию (рис. 11.3), где явно выделено устройство с пере- даточной функцией №*(£), называемое эталонной моделью. Основ- ной контур управления организуется по наблюдениям выхода (с использованием ранее принятых управлений) и наблюдениям от- слеживаемого воздействия. Внешний (нижний) контур обеспечи- вает самонастройку закона управления**). Естественно, что при реализации алгоритма с помощью управляющей ЭВМ в таком структурном выделении нет необходимости. Рис. 11.3 Идея эталонной модели широко используется на практике, хотя обычно в более простом варианте, с использованием тестовых (пробных) воздействий в контуре самонастройки (рис. 11.4). Стро- ится основная обратная связь, задаваемая с точностью до настраи- ваемых параметров 0». Приращение значений 0„ ведется пропор- ционально оценке градиента квадрата ошибки слежения за выходом эталонной модели. Для вычисления оценок используются, например, приращения 82, вызванные пробными сдвигами по компонентам 0„. Другой вариант, идентификационный, связан с подачей тесто- вых воздействий в основной контур (рис. 11.5). Идентификация *) Доказательство — в [4.11, 11.3]. Ряд новых математических приемов ис- следования систем с эталонной моделью дай в [11.27]. *♦) На рис. 11.3, 11.4 использованы обобщенные обозначения (3.2), (3.3) цравил управления. -
g 3. АДАПТИВНОЕ УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ 579 параметров 6 ведется по измерениям входа и выхода объекта. По текущим оценкам перестраивается закон управления в основ- ной обратной связи. Структура зависимости Ht (0, £) определяется заранее так, чтобы при 0 = 0 достигалась цель управления. В ка- честве алгоритмов идентификации наиболее часто используются простейшие типы корреляционного анализа или оценки по частот- ной характеристике, если те- стовые воздействия являют- ся гармоническими и поли- гармоническими £11.8]. Процесс перестройки, как правило, осуществляется до- статочно медленно для того, чтобы не искажать иденти- фикационную процедуру. Чем выше уровень тест-сиг- нал ов, тем эффективнее идентификация, но «ни же ухудшают качество, обеспе- Рис. 11.4 чиваемое основным конту- - ром управления. В этом проявляется общее свойство систем с иден- тификацией, названное А. А. Фельдбаумом [11.16] свойством дуальности: управление вынуждено подчиняться двум, не обяза- тельно согласованным целям:- основной цели управления и вспо- могательной (изучению свойств объекта). 3.5. Об определении понятия «адаптивность» и «адаптивное управление». В ходе изложения использовалось несколько нечеткое понятие «адаптивный закон управления». Попытаемся его уточнить. . В житейском смысле адаптивность означа- ет приспособляемость, спо- собность системы достигать основной цели независимо от того, в каких условиях она работает. Если эффек- тивность достижения целей характеризовать показате- лем качества, то идеально адаптивной окажется систе- Рис. 11.5 ма, у которой значение показателя не зависит от усло- вий, инвариантно к ним, хотя бы при изменении условий ра- боты в пределах некоторой заданной области. Если это не- достижимо, то можно указать допустимый диапазон изменений показателя и считать систему адаптивной, если показатель не выхо- дит из этого диапазона (выполнены целевые неравенства [4.11]£ при всех возможных условиях работы из заданной области.
680 ГЛ. 11. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИИ Закон управления естественно считать адаптивным, если адап- тивна система, где он используется. G другой стороны, определению такого рода соответствуют лю- бые из описанных в предшествующих главах оптимальных или субоптимальных законов управления. Что же является специфиче- ской особенностью методов, изучавшихся именно в этой главе и представляющих собственно теорию адаптивного упрвления? Спе- цифика заключается в том, что они позволяют строить законы, обеспечивающие адаптивность (и иногда даже идеальную), исполь- зуя существенно меньший объем априорной информации, чем это требуется при применении других методов. При этом успех дости- гается за счет введения в алгоритм управления тех или иных про- цедур обучения, уточнения первоначальной модели объекта. Поэто- му многие специалисты считают возможным называть адаптивными только такие законы управления, которые наряду с обеспечением адаптивности приводят и к сужению области неопределенности. Однако важна не терминология, а существо дела. Следует пони- мать, что применять обучение отнюдь не всегда целесообразно. Предположим, что неопределенность конкретизируется заданием не слишком широкого множества 0О, которому могут принадлежать параметры объекта 0 в зависимости от заранее неизвестных усло- вий работы. При этом чаще всего используется более простой под- ход: алгоритмы управления выбираются, исходя из гипотезы о том, что, например, заданы какие-либо априорные оценки 0 параметров объекта, в действительности не совпадающие с истинными 0. Одна- ко алгоритм,, построенный с заменой 0 на 0, оказывается адаптив- ным (в смысле исходного определения) без какого-либо дополни- тельного обучения. Эта ситуация особенно часто возникает, если показатель качества имеет асимптотический характер, и по суще- ству требуется лишь обеспечить устойчивость замкнутой системы. Отметим, что инвариантность таких показателей по отношению к весьма широкой области 0О может достигаться и с помощью алго- ритмов управления с обратной связью, не использующих обучение (см., например, [11.4], [11.14], где строятся специальные нелинейные алгоритмы на основе идеи большого коэффициента усиления). На практике априорная неопределенность обычно заключается в том, что поведение определено с точностью не до постоянных параметров, а до медленно меняющихся в ходе работы, и притом в широком диапазоне. Даже если начальные значения заданы, то рассчитанные по ним алгоритмы приходится перестраивать на осно- ве текущей информации. Таковая мржет включать даже текущие значения параметров, тем не менее настройка алгоритмов оказы- вается целесообразной (см. гл. 6, § 8, и гл. 10, § 4). Остановимся еще на одном формальном аспекте. Всегда можно расширить пространство состояний, включив в него неопределен- ные параметры (см. § 1). Вспомогательная задача обучения, иден- тификация параметров сводится при этом к оценке состояния по
§ 4. ЗАКЛЮЧЕНИЕ 581 наблюдениям, а задача оптимального управления в условиях не- определенности сводится к задаче синтеза закона управления в расширенной системе. Если эта задача решена, а оптимальное зна- чение функционала не зависит от начального состояния, то полу- чим идеально адаптивную систему. К сожалению, как подчеркива- лось в гл. 10, общие эффективные алгоритмы отсутствуют, особен- но для нелинейных систем. Вместе с тем, даже если объект описан линейными соотношениями в исходном пространстве состояний, то в расширенном он окажется нелинейным, если неопределенные па- раметры (как это было в рассмотренных в данном параграфе зада- чах) входят как сомножители. Поэтому имеется тесная связь менаду эвристическими приемами решения нелинейных задач оптимального управления при неполных измерениях (гл. 10, § 4) и методами адаптивного управления, изложенными в данном параграфе. В частности, идентификационные алгоритмы могут интерпрети- роваться как алгоритмы оценки состояния типа фильтров Бьюси — Калмана со специальным способом выбора коэффициентов уси- ления. § 4. Заключение , В этом, последнем параграфе последней главы целесообразно привести некоторые суждения, относящиеся не только к ней, но и к курсу в цепом. Действительно, проблема борьбы с априорной не- определенностью и использование с этой целью управления, осно- ванного на текущей информации,— общая тема курса. Мы убедились, что построение оптимального синтеза сталкива- ется с принципиальными трудностями. Все известные, строго уста- новленные результаты касаются лишь узкого класса объектов (в ос- новном статические или линейные динамические) при специально выбранных показателях качества. В то же время инженерная прак- тика «поставляет» проблемы, не соответствующие ни одной из стро- гих формулировок. В отличие от математика, инженер не имеет права отказаться от решения задачи управления на том основании, что для нее от- сутствуют теоретические «заготовки» или она не поддается строго обоснованному решению; он обязан «выдать» конкретную рекомен- дацию. При этом инженер должен четко сознавать, что любое ма- тематическое описание объекта в определенной мере условно. Его прогнозирующая сила зависит от той ситуации, в которой будет работать объект, а она заведомо не в полной мере известна. Все «теоремные» утверждения начинаются словами—«пусть выполне- ны условия», однако инженер-разработчик системы не может быть уверен, что в стоящей перед ним конкретной задаче эти условия выполнены. Как правило, приходится полагаться лишь на интуи- цию, вбирающую в себя опыт работы со сходными по своей приро- де объектами.
5Ь2 ГЛ. 11. МЕТОДЫ ИДЕНТИФИКАЦИИ И АДАПТИВНОЕ УПРАВЛЕНИЕ Напомним также выводы частотного метода: необходимая пол- нота математического описания объекта зависит от используемого закона управления. Чем быстрее изменяется управление, тем более подробным должно быть Динамическое описание, тем выше должен быть порядок уравнений, описывающих объект. Точно так же и нелинейный анализ показывает: чем более ши- рок диапазон уровней управляющих воздействий, тем детальнее должно быть математическое описание. Элементы системы, для ко- торых приемлема линейная модель при малых уровнях воздействий, должны описываться нелинейными соотношениями при высоких уровнях. Неоднократно указывалось и то, что критерии оптимальности, как правило, носят условный характер: инженер должен приду- мать тот или иной сводный показатель качества работы системы, ориентируясь как на интуитивное представление о том, «что такое хорошо, и что такое плохо», так и на известный ему набор образ- цов типичных формулировок. При этом весьма распространенной является ситуация, когда превалирующим оказывается второй ас- пект: выбирается не тот показатель, который наиболее соответству- ет смыслу дела, а тот, который входит в условия строго доказанных математических утверждений, например, стандартный интеграль- ный квадратичный показатель. Зачастую забывают и об указанной выше «обратной связи»: найденное в результате «строгой оптимизации» управление может оказаться таким, что для него теряет смысл исходное математиче- ское описание объекта, включенное в условие оптимизационной за- дачи. Сказанное ни в коей мере не означает, что оптимизационный подход не имеет практической ценности: каждое полученное и фор- мально обоснованное решение дает определенные образцы, рекомен- дации, которые можно испытать при создании систем управления конкретными объектами. Однако при этом, во-первых, не следует считать, что закон управления, построенный на базе того или ино- го «строго доказанного» результата, действительно будет хорошо ра- ботать на практике, а с другой стороны, не. следует считать, что закон управления, для которого нет «строгого’ обоснования», не дол- жен практически применяться. Сама теория управления, как техническая наука, не должна исключать из рассмотрения те рекомендации «изобретательского» характера, которые не обоснованы как «оптимальные» по какому- либо четко сформулированному единому критерию. Окончательные •оценки инженерной работы, по созданию систем управления можно поставить только на основании достаточно длительной эксплуата- ции системы в реальных условиях. Такая оценка редко Дается по какому-либо одному сводному критерию: она включает множество показателей, каждый из которых по-своему характеризует систему.
ПРИЛОЖЕНИЕ! СВЕДЕНИЯ О ПРЕОБРАЗОВАНИЯХ ЛАПЛАСА*) 1. Определение и свойства ^-преобразования. Любой кусочно непрерывной функции f(t), возрастающей при не быстрее, чем ес‘, с — const, может быть поставлено в соответствие ее преоб- разование Лапласа (S’-образ): S’ {/ (t)} Л j e-^f (t) dt = F (p). о S’-образ является функцией комплексной переменной р, определен- ной при любых р таких, что Rep>c. Если /(i) = 0 при t < 0, то она однозначно определяема (с точностью до значений в точках разрыва) по своему S’-образу: - /(t) = S’-‘{F(p)}. Явные способы вычисления оригинала по S’-образу указаны в п. 3. Основные свойства, легко проверяемые по определению: а) S’-образ линейной комбинации функций /(i) = с,/,(£) + c2/2(f), сг — константы, равен линейной комбинации S’-образов: S{/(t)} = c1S’{fi(t)} + c2^{/2(t)}; б) S’-образ 1-й-производной D/(f) равен S’{D/(f))=p2’{/(0>-/(0). S’-образ г-й производной r> 1, равен S’{D7(t)} = pTS?{f(t)} - р’-‘/(0) - pr~2D/(0) - ... - Dr~‘f(O); в) S’-образ интеграла равен {t А J/(T)dT Up-iS’VW); О j *) Доказательства и полные таблицы см., например, в [П.3, П.5].
584 ПРИЛОЖЕНИЕ 1 г) S’-образ свертки двух функций равен произведению S’-обра- зов этих функций: Z Н/1(т)/2(«-т)Л = S{A(0}S{/2(i)}. .0 J 2. Таблица типовых функций и их S-образов (все функции пред- полагаются равными нулю при t < 0) /(О F(P) 1 2 3 4 5 6 (t) 1 t” еМ eUtn, п 1 sin cos <ot еи sin cat cos <ot 1 1/p n!/p(n+1) 1 p — к nj (p-^)n+1 <B p2 + <O2 p p2 + co2 _______w______ (P — %)2 Г W2 p — к ~(p - X)2 + w2 6 7 8 9 3. Нахождение оригиналов по S -образам (обратное преобразова- ние). Общая формула обращения имеет вид c+joo j F(P)ePtdPt . c—foo тде путь интегрирования в комплексной плоскости р выбирается правее всех особых точек (в частности, полюсов) S-образа Е(р). Если Е(р) является дробно-рациональной функцией, то она пред- ставима в виде Т by F (р) = 2 свРц + 2 2 сру (р — Ц=0 V Ц=1 где X» — полюс F (р) кратности 7rv, г — разность степеней числителя
СВЕДЕНИЯ О ПРЕОБРАЗОВАНИЯХ ЛАПЛАСА 585 м знаменателя, с№, — константы. Тогда u=0 V ц=1 ' где б1* (0—обобщенная производная ц-го порядка б-функции. 4. Применение ^-преобразования для решения линейных диффе- ренциальных уравнений с постоянными коэффициентами. Решение уравнения a(В) У (t) — ®”У (0 + a„_,D’*_1y (0 + ... + аоу (0 = /(0 при начальных условиях У (0) = ут, Dy (0) = у<», ..D-‘y (0) = у<""‘> дается в виде У (t) = 2 Ф? (0 У(п + J Фп-1 (t — -0 / (т) йт,; ?=о 0 где • _f -у j—"2 _J_ f_ -у {ф; (0} Д Ф, (р) = Р--+ .......’’Л 7=0, ..., п — 1, так что фД0 определяются путем обращения дробно-рациональных функций с одинаковым знаменателем. Функции ф3(0 удовлетворяют условиям а(П)фД0=О, D\pj(O)= 6j(1, к — 0, 1, ..., п — 1, где 6jft — символ Кронекера, ( 1, у = к, 6jfe = I 0, 7=#fe. 5. Определение и свойства ^-преобразования. Любой последова- тельности {/[к], к = 0, 1, ...}, возрастающей при к -* оо не быстрее, чем сА, с = const, сопоставимо ее ^-преобразование: 2 г-ад д m . Л=о .SK-образ является функцией комплексной переменной z, определен- ной при любых z таких, что !z| > с *). Если ввести замену z = ерт% •) В теории вероятностей используется производящая, функция последова- тельности (также введенная Лапласом), отличающаяся от ^-преобразования лишЬ заменой z на z-1, 38 А, А. Первозванский
ПРИЛОЖЕНИЕ 1 где to > 0, то ^-образ становится функцией переменной р: ^ {/[&]} = 2 e'hpxof[k]^F*(p). h=Q ' Функцию F*(p) именуют также дискретным преобразованием Лапласа. Если последовательности {/[&]} сопоставить функцию f(t) = f[k]6[t — kr0], kr0 <-t < (k + 1)т0, то 2 {/ (0) A f e~vtf (0 dt = S e~hv^i [A] = F* (p). о ° Основные свойства ^-преобразования: а) Если f[k] = Cift[k] + c2f2[k\, c,, c2 = const, to 2L{f[k}} = + c2£{f2[k]}. 6) £{J[k + 1]} = z[2Afik]} - /[0]], ^{j[k + m\} = zmZ{j{k}}-zmf[Q]-...-zj[m-i\, m> 1. в) &{{[k +1]} = z~lZU[k]}. r h ] г) 2 АIЛ /2 - zi = 1*1} {/2[*]}- 4=0 I 6. Таблица ^-образов типовых последовательностей zmy /[fe] 1 , z~ z, z - 1 , fc 1- z — a z (2 -1)2 (все элементы последовательностей при fc<0 равны нулю). 7. Нахождение оригиналов ио ^-образам. Общая формула обра- щения имеет вид = £зЫ- J *> где интегрирование ведется по контуру в плоскости z, охватываю- щему все особенности F(z). Если F(z) —дробно-рациональная функция такая, что Т1 z-1F(z) = 7, Cv---т-,: cv = const,, 2 Av
СВЕДЕНИЯ ИЗ ТЕОРИИ МАТРИЦ 587 то п f [Л] = 2 CvXv. V=1 8. Применение ^-преобразования для вычисления рекуррентно заданных последовательностей. Если задано, что а(2Ш&] ДИ* + «1 + ап-1У1^ + га —1] + ... + аоу[к\ = 0, причем известны z/[0], ..у[п — 1], то У {к} = 2 фД&ШЯ, i=o где {фг [&!} = Z zn j 1 + ап_^п 3 2 + ... + aj+1 a (z) А гфз (z)>. j = 0, ..га — 1, так что фД/с] могут быть найдены по формуле обращения дробно-ра- циональных функций. Применение ^-преобразования для неодно- родных соотношений при нулевых начальных условиях описано в § 4 гл. 7. ПРИЛОЖЕНИЕ 2 СВЕДЕНИЯ ИЗ ТЕОРИИ МАТРИЦ*) 1. Определение и обозначения. Матрицей называется прямоуголь- ная таблица, элементами которой являются числа или функции, на- пример, 72 3—1.1 р еН 14 0 1J’- (о г2р Размер матрицы характеризуется числом строк и числом столб- цов таблицы. Краткая запись «А—(тп X га)-матрица» означает, что А. имеет т строк и га столбцов. Если гаг = га, то матрица называется квадратной. Если гаг = га = 1, т. е. матрица имеет только один эле- мент, то она называется скаляром. Если матрица состоит только из одной строки (или столбца), то она называется матрицей-строкой (или матрицей-столбцом). Матрицу-столбец будем также называть вектором. Каждый элемент матрицы характеризуется своим местом в таб- лице,!. е. номером строки г, г = 1, ..., гаг, и номером столбца /, j = = 1, ..., га, и обозначается двойным индексом (г, /). *) Доказательства всех фактов, приводимых в пп. 1—6, можно найти в любом учебнике по теории матриц, например, [П.1, П.2]. 38*
688 ПРИЛОЖЕНИЕ 2 Как правило, матривд обозначаются большими буквами, а эле- менты — соответствующими малыми. Обозначение А = {a,j, i = 1, ...., т, j = 1, ..., п} читается: матрица А состоит из элементов и имеет т строк и /г- столбцов. Если размер несуществен, то пишут сокращенно А = {ай}. , Матрица-строка может быть обозначена так: с = {с,, с2, ..., с„} {cjt ] = i, п}, а для матрицы-столбца может быть использована и запись в строку,, но в круглых скобках: i = 1, ..., ш). Если дана матрица А общего вида, то она может рассматриваться как совокупность своих строк а{, i = 1, ..., т, или столбцов Ajt j =* = 1, ..., п, и записываться в виде А = (а{, i — 1, ..., т) — {Ajt j — 1, ..., п}. Квадратная матрица Л, у которой все элементы равны нулю, кроме элементов, стоящих на диагонали, называется диагональной, и для нее используются обозначения Л — diag Kii, ..., %„} «= diag {Л>, i — 1, ..., п}, например, Л== р 2 .0 0 1 О °) 0| = diag{l, 2, 3}. 3J Диагональная матрица, на диагонали которой стоят только еди- ницы, называется единичной и имеет специальное обозначение 1 = diag {1, 1, 1). Если хотят указать, что размерность единичной матрицы равна пг то ее обозначают 1„. Единичную матрицу можно рассматривать как совокупность единичных векторов (столбцов) /» = h, ..in) = {ij, 7 = 1, ..nt, где Ь “ (Qt • • -i 1, «• •». Op \ i 1 Матрицу, состоящую только из нулей, обозначают просто 0. 2. Сложение, умножение, возведение в степень, транспонирова- ние, след. Матрицы можно преобразовывать по определенным правилам.
СВЕДЕНИЯ ИЗ ТЕОРИИ МАТРИЦ 589 а) Если А и В — матрицы одинакового размера, то их сумма есть матрица, элементы которой являются суммами элементов сла- гаемых, стоящих на тех же местах: С = А + В = {atj + &у}, например, (2 41 (1 51 (3 91 |3 1J + 16 2J 19 3J* б) Если % —скаляр (число, функция), то ХД === ), например, (2 41 (6 121 6J = (з 18J* , в) Если С — строка, а В — столбец с тем же числом элементов п, то произведение СВ является скаляром (скалярным произведе- нием} : СВ — Cibi + с2Ъ2 +... + спЬп. г) Если С— (/га,XП|)-матрица, а В— (т2Хп2)-матрица и Hi = т2 (число столбцов С совпадает с числом строк В}, то может быть найдено произведение этих матриц: D = CB = {dlh, 1 = 1, ..., mh k = l, п2), причем ^ih — CiBh = 2 3=1 где Ci — l-я строка С, a Bk — А-й столбец В, например, (2 41Г21 Г2-24-4-61 |281 (3 1Д6 J “(3-2 + 1-6J (12J или (2 3 51 (! (Ю 4) 11 4 6)^ 0| 111 2) Если пг^ т2, то. умножение невозможно. Вообще говоря, ВС ФСБ. Если же имеет место равенство, то матрицы В и С называются пе- рестановочными. Перестановочными могут быть только квадратные матрицы. Приведем также важные частные случаи общего правила умножения. г 1) Если Л — диагональная матрица, а В — квадратная того же размера, то AjB = (Xi&i),
590 ПРИЛОЖЕНИЕ 2 где bi — строки матрицы В, например, |2 О'! (5 61 (2-5 2-61 10 3J17 8J “ (з-7 3-8J* Аналогично, ВЛ — {KjBjl, где В, — столбцы В, например, Г5 6W2 0| Г2-5 3-6| (7 8J (о 3J [2-7 3-8J* г 2) Умножение матрицы на единичную сохраняет ее неизмен- ной: 1В = В1 = В. г 3) Умножение строки на матрицу дает в результате строку: СВ - {СВ,, СВ2, ..СВп}„ если С — строка, a В, — столбцы В; умножение матрицы на столбец дает столбец: АЬ=(а,Ь, апЪ), если b — столбец, а а< —строки А. В частности, если 1}— j-й еди- ничный вектор, то Aij *sk{a,ij, a^ij, • {a,j, ,., n#, • •., Aj, т. e. выделяется J-й столбец матрицы. д) Операции сложения и умножения матриц, как и скалярных величин, обладают сочетательным и распределительным свойством, т. е. * {АВ)С = А{ВС}, {А + В)С — АС + ВС, А{В + С} = АВ +АС. В силу этого для квадратных матриц определена операция возведе- ния в целую положительную степень Ап = А.А-;...А праз и любому скалярному многочлену / (х) = хк + ак-,хк~1 + ... + а0, к > 0, может быть сопоставлен многочлен от матрицы /(4) = Ак + ak_14'tT1 +... + aj. Два многочлена от одной и той же матрицы перестановочны: _ h(A)g{A) = g{A)h(A). е) Для любой матрицы определена операция транспонирования, ваключающаяся в перестановке элементов таким образом, что эле-
СВЕДЕНИЯ ИЗ ТЕОРИИ МАТРИЦ 591 менты г-го столбца исходной матрицы становятся элементами i-й строки транспонированной, т. е. если А — {ау}, то транспонирован- ная, обозначаемая Ат, такова: ЛТ = {«Д Если А = Ат, то А называется симметричной (относительно диаго- нали), в частности, диагональная матрица симметрична. Справедливо правило транспонирования произведения (АВу = ВтА\ распространяемое на любое число сомножителей: при транспониро- вании произведения сомножители переставляются в обратном по- рядке, после чего каждый из них транспонируется, например, (Л5С)Т = СТ5ТЛТ. ж) Следом квадратной (n X п) -матрицы А называется сумма ее диагональных элементов. Используется обозначение ггЛ = 2 «и- i=l Если С — (тХ п)'-матрица, В — (п X т)-матрица, то tr {СВ} = tr {ВС}. 3. Обращение. Блочные матрицы. Ранг. Собственные числа и век- торы. а) Для каждой квадратной матрицы А может быть вычис- лено по известным правилам число, называемое определителем, ко- торое будет обозначаться det Л. Если det Л ¥= 0, то матрица назы- вается неособой и существует матрица Л-1, называемая обратной к Л и удовлетворяющая тождеству Л~*Л = ЛЛ~* = I. Обратная матрица может быть вычислена по формуле где Ли, А22 — квадратные, называется блочно-треугольной. Для нее которой laffe] являются алгебраические дополнения элементов aht в определителе Л, например, Л = ГП Я^! °22 — “12| Г21 а22) “ «21 М °21 “11Г д-1___________1_____| °22 ~~ в1г| аП°22 “ а12°21 l~ai2 “ill’ Справедливо тождество (ABC)"1 =*C~lB-lA~l, распространяемое на любое число сомножителей, если каждый из них является неособой матрицей. *) Используется также обозначение adj Л.
592 ПРИЛОЖЕНИЕ 2 б) Любая матрица может быть произвольным образом разбита на прямоугольные блоки, каждый из которых является матрицей, называемой также подматрицей относительно исходной. Например, (3 4: 11 (А А , л= 6.21.8 = 11 Ч 12 " 1 : 5J 1^21 A22l ’’ где . (3 41 (11 ч Au — [6 7J’) ^12 = (в г A2i — {^ О» -^22 = {51- Матрица, в которой выделены квадратные блоки At, расположен- ные по диагонали, а все остальные элементы равны нулю, назы- вается блочно-диагональной и обозначается diag{Ab Аг, Ah). Например, А = 4 О' 3 6 7 O| = diag{A1, А2), где Ах = О " ' О 5. '3 41 6 7}.; A = {5}. обратная к блочно-диагональной, сама блочно-диаго- Матрица, нальна, причем det diag {Alf .,., Ak) = det At •... • det Ahf [diag{An ..., A}]-1 = diag (Af1,; ..A,t Блочная матрица вида . — \А11 ^121 А —' |А л Ь 1и л221 где Atl, А22 — квадратные, называется блочно-треугольной. Для нее верно, что detA = detA и detA22. Справедливо также правило (лемма Шура)’. det I д1 У*) “ det det = 1Л21 Л221 = det А22 det (Ац А12А22 А21)* Матрицы могут перемножаться поблочно, причем, если С = {С«}, B = то I 3 ) т. е. применяется то же правило, что и при поэлементном перемно- жении (с соблюдением ограничений по размерам перемножаемых блоков!).
СВЕДЕНИЯ ИЗ ТЕОРИИ МАТРИЦ 593 в) Рангом'матрицы, А называется число, равное наибольшему из порядков отличных от нуля миноров, или, что то же самое, на- ибольшему числу строк (столбцов) неособой квадратной подматри- цы, которую можно выделить в А. Принято обозначение rank Л. г) Характеристическим многочленом квадратной (n X п)-матри- цы А называется многочлен степени п, равный ДА(Х) = йеНМ-Л}. Его корни Xv, V —1, ..., п, называются характеристическими или собственными числами (с. ч.) матрицы. д) Теорема Гамильтона — Кэли-, если Д (X) — характеристический многочлен матрицы А, то Д(Л)^0. е) Решение однородного уравнения Ах — Х,х -*=► (W — А}х ?= О, где х — столбец с неизвестными элементами, называется собствен- ным вектором А, соответствующим с. ч. и обозначается Sv. Соб- ственный вектор определен с точностью до постоянного множителя. Если все с. ч. различны, то матрица S, составленная из столб- цов 5,,, v = 1, ,,., п, является неособой. Она удовлетворяет тожде- ству AS = SAo S-lAS = Д А = SAS~\ где Л = diag{Xj. Пример. Пусть Тогда п+5 —21 ДСМ-аеЦ^ x + 2J = v + 7^ + 6. Собственные числа равны X, = — 1, Х2 = — 6. Собственные векторы равны 5! = (1, 2), 52 = (—2, 1), так что Выполнено тождество (—5 21(1 —г"! р — 21Г-1 01 (-1 121 (2 —2Д2 1J = (2 1До — 6j=t— 2 —6J- D 4. Линейные алгебраические уравнения, а) Если А — неособая матрица, а Ь, х — векторы, то уравнение п Ах — Ь <=> У, aijXj = bit i = 1г .. ns i=i
594 ПРИЛОЖЕНИЕ 2 имеет решение х — А~1Ъ. Решение матричного уравнения АХ = В, где В — заданная матрица, а X — неизвестная матрица того же раз- мера, представима в виде Х — А~'В. б) Если А — прямоугольная (т X и)-матрица, то однородное уравнение п Ах = 0 <=> 2 Да = о j=l относительно вектора х = (х{, х„) имеет решение «¥=0, если п > т. Если л=Ст, то решение х 0 существует, если и только если равны нулю определители всех квадратных (гаХи)-блоков А. Если столбцы Aj матрицы А рассматриваются как т-векторы, то те же утверждения трактуются так: при п>т столбцы заведо- мо линейно зависимы; при п^т столбцы As линейно зависимы, ес- ли rank А < п. Неоднородное уравнение Ах= b имеет решение относительно n-вектора х при произвольном т-век- торе b Ф 0, если и только если rank А = т. в) Уравнение относительно матрицы X вида АХ + ХВ — С, где А, В — квадратные матрицы, .имеет решение при любой квад- ратной матрице С, если и только если где Xj — с. ч. A, a ц, — с. ч. В. Если В = /Г, то с. ч. В совпадают с с. ч. А и указанное условие заведомо выполняется, когда все они лежат в одной полуплоскости. 5. Дифференцирование, интегрирование, линейные дифференци- альные уравнения, матричная экспонента, а) Если элементы мат- рицы зависят от скалярного аргумента £, то А Д (L f A dt Д .(1 dijdtк dt •= (. dt J* J = U w J Матричное дифференциальное уравнение -Ф==4Ф, dt 1
СВЕДЕНИЯ ИЗ ТЕОРИИ МАТРИЦ 595 где А = {а«) — заданная квадратная матрица, а Ф — {<pik} — искомая, эквивалентно системе уравнений относительно столбцов ФЛ матри- цы Ф: Фй = АФк ч=> = 2 яиФ^- i б) Если А = const, то решение уравнения с начальным услови-. ем Ф(0) = / определяет неособую матрицу еА‘, называемую матрич- ной экспонентой. Укажем ряд способов вычисления матричной экс- поненты. 61) Вычисление по определению. Элементы k-го столбца мат- рицы еА‘, обозначаемые epife(i), удовлетворяют системе уравнений с начальными условиями cpftft(O)=l, <₽,&(()) = О, i¥=/c. Эта система'ре- шается произвольным образом, например, сведением к одному урав- нению. Пример. Пусть 4 = t-G»2 OJ* Тогда ' ~dP = Ф-211. Ф11(0) = 1,. = Ф22, Ф12(0)=0« = — ®2фи,. ф21 (0)t ^ = - ®2Ф12« Ф22 (°) = 1„ откуда .. (Ф11 Ф12 f COS СО 4 ®-1 sin <0/1 еА‘ — > г = > <• п |ф21 (0 Ф22 WJ I— ° Sin COS <04 J 62) Вычисление с помощью 3?-преобразования. Имеем eAi^S~l{{pI-A)-1}. Пример. Пусть А та же, что в 61. Тогда (р/.Л)-*-/' -‘Г_ *-;( ", I<в2 pi р2 + (О21— (О2 Р) Используя таблицу S’-образов элементов (приложение 1), имеем 11 —5} = COS fflt, Ь2 + ®2) ,-1 { ® | 1 2 I 2 I = SIH (0tt, [р + (О J * откуда вновь следует результат примера из 61. □ 63) Вычисление с помощью диагонализирующего преобразова- ния. Если с. ч. X» различны и найдены соответствующие им собст- венные векторы S4, то eAt вычислима по формуле eAt = 5 diag
696 ПРИЛОЖЕНИЕ 2 Пример. Рассмотрим матрицу А из примера в п. 3. Имеем Г~ 5 21 (1 — 21 , 1 Г 1 21 ^ = (. 2 2)’ ^1=—1» ^2 = 6, S =|2 l },, S =5Д_2 J* Тогда 1 fl ~ 21(е~г 0 ) ( 1 21 1 fe-/4-4e~e( 2е“‘ — 2e~st 5 12 1 Д 0 е~в‘Ц~ 2 V |2«—4 — 2е—et 4е~{ - e~2t f 64) Вычисление с помощью степенного ряда. Матричная экс- понента представима в виде ряда eAl = I + At + ... + ^Ahth + При вычислении ее значения для конкретного t с помощью ЭВМ можно рекомендовать алгоритм, вытекающий из следующего тож- дества: е-'4* = \е2 j. где — произвольное целое число. Оно всегда может быть взято настолько большим, что приближение At Г Г I At 1 I 1 Л*- ( 1 -[/ + 2^+ +ЙЛ ] (при фиксированном к > 1) окажется удовлетворительным. Вычисления сводятся к простому алгоритму. При к — 1 имеем: 1. Вычислить Ф(0)= 1 + At/2N. 2. Для / = 1, ..., N вычислить последовательно Ф(/) = Ф2(? —1). 3. Положить еА‘ = Ф (IV). Пример. Пусть Тогда А = ( °, *}, t = ~, N - 10. 1— 1 0J’ 4/ Ф(0) = ! 1 - I— 7,669-10~4 Значение, получаемое из 7,669-10“ 4 1 0,7073 0,7073' .0,7073 0,7073. примера в 0,7071 0,7071 61 при <в = 1, t = л/4, таково: 0,70711 0,7071) и совпадает с Ф(10) с точностью до 4-го знака. □ Имеются формулы, позволяющие указать величины к, N, обес- печивающие вычисление с наперед заданной точностью и притом с наименьшим числом операций. Общие рекомендации: при использовании выкладок «вручную» удобен способ 62; при получении с помощью ЭВМ зависимостей в
СВЕДЕНИЯ ИЗ ТЕОРИИ МАТРИЦ 597 «формульном» виде удобен способ 63; при организации вычислений на ЭВМ для конкретной сетки значений t удобнее способ 64. Замечание. Способ 64 может быть положен в основу числен- ного интегрирования нелинейных уравнений л- = /(ж), x(ft) = xa. Выбирается шаг т по времени и последовательно определяются л:(Ат) А £[&]: х [к + 1] = х [к] + (еА'‘т -I) где Ah а(Щж[Ч, /ь А /-(х)|я=4М. Матричная экспонента eAfeT при этом вычисляется по спосо- бу 64 *). 6. Квадратичные и эрмитовы формы. Положительно определен- ные матрицы. Устойчивые (гурвицевы) матрицы, а) Если Q — сим- метричная матрица -с вещественными элементами, то G(x) = x*Qx называется квадратичной формой относительно вектора х. Если С (ж)>0 при ж¥=0, то форма (и матрица Q) называется положительно определенной. Если G (х) > 0, то форма (и матри- ца Q) называется неотрицательно определенной. Соответственно ис- пользуют краткие обозначения Q > 0 и Q > 0. По критерию Силь- вестра (re X га)-матрица Q > 0, если и только если положительны все определители диагональных блоков At = det {qih i — l,...,k,j = i,..., k), k — i, 2, ..., га. 6) Матрица А называется устойчивой (гур вице вой), если все ®. ч. лежат в левой полуплоскости. Если известны коэффициенты характеристического многочлена а (X) = V + ап_ Л”-1 + ... + ссо, то по критерию Гурвица устойчивость А эквивалентна положитель- ности главных миноров (га X га)-матрицы Н: ®п—1 <*п 0 0 °] CZn—3 • • • • &П—2 «п-1 • • • * On • 9 • • 0 * Р' 2k — 1 G'n—Zk • » « 2fe+i • • • • ап—2k+a • » » » ° где ai А 0,: 1 < _ 0,- Al. в) Если Q — матрица с комплексными элементами и Q = <?(*\ где (*) означает одновременное выполнение операций транспонирова- ния и замены элементов на комплексно сопряженные, то она назы- *) Подробности можно найти в [П.6].
598 ПРИЛОЖЕНИЕ 2 вается эрмитовой. Соответственно, для любого комплексного векто- ра z вводится эрмитова форма G(z) = zwQz, если Q эрмитова! Если Q вещественна и z = х + iy, где х, у вещественны, то G(z) = G(x) + G{y). Если (?>0, то G(z)>0 при lz| =#0. Если z — вектор, состоящий из подвекторов zb z2, и V = )л(*) п I эрмитова, то V'12 "22J G(z) A zf’Qirh + 2^ez(*)Q12z2 + z^Q^z^ 7. Лемма Якубовича — Калмана. Пусть пара А, В невырождена, Ф{р)к[р1— Л]-1. Пусть G(x, v)—эрмитова форма от вектора (х, v). Если С[Ф(ий)Во, к] СО Щ для всех v и со, то существуют*) Р = Р(*’, h, 7 такие, что справед- ливо тождество 2Reх{*}Р(Ах + Bv)+ G(x, v) =—\hx — (2J причем, если А, В и коэффициенты формы G вещественны, то Р, h и у можно выбрать вещественными и Р = Р\ , Если выполнено строгое частотное условие G[O(s©)Bv, р]<0 (1'} для всех © е [—°°, 00] и v Ф 0, то существует Р = Р<*) такое, что 2Rex'*>P(Ax +Bv)+G(x, р)<0 (2Z> для всех х, и, лишь бы |я1 + Id Ф 0. Если G(0, р(*,д22У < 0 при всех скалярных v^=0, то det {pl — {А — ВК)}= (- fe)~V2 g (р), К А (- q22)-1,z h, где g(p) может быть сделан устойчивым многочленом за счет вы- бора h. Доказательство дается для случая гурвицевой А и скалярного v, т. е. В — 6 —столбец. По определению G(0, и) = 922!И2, Q22 k Q22 — скалярная кон- станта. Из (1) следует, что 922 С 0. Положив 7 =₽ (—??2)1/2, удовлетворим (2) при х = 0 и любых и. Выберем h как решение уравнения „G{O4iu>)b.u, а] -=—г|/гф(1(й)6 т—^|2,|а|2. (3) Далее будет показано, что такое h существует. Если это так, (2) удовлетво- ряется при х = Ф(1ш)Ьа и любых v. При известном h определим Р из урав- нения РА +4<*>Р= -— Wh, ' (4) которое имеет решение в силу гурвицевости А (п.4в). При таком выборе Р ♦) Если veRm, где m > 1, то дополнительно к (1) достаточно потребо- вать, чтобы G(0, и) < 0, и ^= 0.
СВЕДЕНИЯ ИЗ ТЕОРИИ МАТРИЦ ‘.)Э -тождество (2) выполняется при v = 0 и любых ж, поскольку (4) эквива- 2Re х^РАх — —— x^h^hx. Остается доказать, что сделанный выбор 7, Л, Р позволяет удовлетворить (2) при любых других х, и. Установим два вспомогательных положения. Лемма А. Пусть а (р) А рп + «„-jp”-1 + ... + я0, где at — комп- лексные числа. Пусть — числа, им сопряженные, и обозначено ay,{p):=(—p)n + an-l(—p)n-l + ... + as. Тогда 1. Корни а4 (р) расположены симметрично относительно мнимой оси с корнями а(р). 2. av(ia>)~a(i(o). 3. Если a(i<n)~ a(ia), то а?(р) = а(р). 4. Если X (р) = где Ь, а — многочлены, и ' а (ру ' 14 Re у (ко) = О, то 5. Если а(р) = аУ (р) и Rea(i<o)>0, то справедливо представле- ние {обобщенная факторизация) a(p)=a(p)av(p), где а(р)— многочлен. - Доказательство леммы А, за исключением последнего результата, элементарно и требует лишь учета того, что если многочлены совпадают па мнимой оси, то они совпадают и на всей комплексной плоскости. Докажем последний результат. В силу а(р) = av(p) все корпи а(р)’ с точностью до кратности расположены симметрично относительно мнимой оси. Поэтому все корни, ие лежащие на мнимой оси, можно разбить йа две сим- метричные группы. Если же у а есть чисто мнимый корень гшо, то он должен быть четной кратности, так как в противном случае «(iw) = av(ia>) = а (гы) = = Rea(i<u) менял бы знак при переходе через ib>0. Таким образом, чисто мни- мые корпи тоже разбиваются на две симметричные группы. Если a(toj) = = Re a(iw) > 0 Va> е (—оо, 4- оо), то чисто мнимых корней пет и многочле- ны а{р), av(p) также ие имеет чисто мнимых корней. Лемма Б. Пусть F(x, v) — эрмитова форма такая, что. F(x, О)53 0, v] = 0 при всех со. Тогда F{x, i:) = 0. Доказательство леммы В. Учтем, что Ф(гш) ->0 при <в -> оо. Тог- да F (0, а) = 0, т. е. справедливо представление F(x, v) = Re где / — некоторый вектор. Положим % (Р) А г^/МФ (р) bv0, где го — произвольное фиксированное число. Имеем, по условию, Re % (ico) = Re (гео) Ы>0 = F (Ф (г<а) br0,t>0) Из леммы А следует, что полюсы у(д) должны быть расположены симмет- рично относительно мнимой оси. Однако, по определению, х(р)~ дроби о-рацио- яальпая функция, полюсами которой могут быть только с, ч. устойчивой мат-
600 ПРИЛОЖЕНИЕ 2 рицы А. Следовательно, х(р) вообще не имеет полюсов, т. е. является много- членом. Но %(р)->0 при р->оо, что возможно только, если х(?)^0, т. е. /<*)ф(р)Ь == 0 <=> f^[pl — A]~lb == 0 => f*eAtb ==0, t > 0, что в предположении невырожденности А, Ъ эквивалентно / == 0, а тогда и F(x, и) = 0. Из леммы Б следует, что тождество (2) удовлетворяется при любых х, v, поскольку оно эквивалентно F (х, v) Д G (г, v) + 2 Re х^Р (Ах + v) + | hx — yv |2 == 0. Остается доказать, что возможен выбор h согласно (3). Пусть а(р) — характеристический многочлен А. Умножим (3) на — |a(to)|2. Тогда — |a(to) |2G[(to 1 — Aj-'bv, р] = + |a(to) |2|&(to I — Л)~1Ъ — у|2|ц|2. (5> Сократив на |р|2, получим слева многочлен от to с заданными коэффици- ентами, который можно обозначить P(to). Его можно однозначно распростра- нить на комплексную плоскость р. Очевидно, что Р(р) = P^jp), поскольку P(to) веществен при всех <о и P(to) = ReP(to) = P(to), а следовательно, применим результат 3 леммы А. Далее, из результата 5 леммы А следует воз- можность факторизации: Р(р) = g(p)gv(p) с устойчивым g(p). Теперь очевид- но, что (5) удовлетворится, если выбрать h так, чтобы g(p) =3— [fe(pZ — А)~Ч — у]а(р). (6) Это тождество можно переписать в виде h(pl — A)nb a fe(Cn_1p"-14-... + C0) = —g(p) + 7а(р). (6'> Многочлен справа имеет степень не выше п — 1. Действительно, Р(р) = —a(p)av(p)?22 + (многочлен степени 2п — 2) => =>g(P) == YPn + g(p) + уа(р) = вп-iP"-1+ ... +со- Коэффициенты а0, ап_| известны, и тождество (6') удовлетворится, если найти h из решения системы hCt = at, l=S 0, 1, .... n — 1. Векторы Ci линейно независимы, если пара 4, & невырождена, так что си- стема разрешима и тем самым доказательство того, что (1) => (2), завершено. Докажем, что det(pZ — А — (—дгг)~''/гЬЬ) = (—?22)~’/2g(p), т, е. что det(pZ — А — у-'Ыг) = Y-1g(p). Действительно, используя (6) и лемму Шура (п. 36), получим , det(pZ — А — y~lBh) — detfpZ — 4) (1 — y~'h(pl — 4)-16) = = у-‘а(р)(7 — fe(pZ —4)-гВ) =-f-’gfp). Таким образом, доказано, что (1)=* (2). Очевидно, справедливо и обратное (2)=>(1). Для доказательства того, что (Г) =>(2'), перепишем (Г) в виде С[Ф(гш)&р, п] = — р<*)П(/й>)п, где П((щ) непрерывна и П((и)> 0, так что П(но) > По > 0, По = const. Введем также vl—^Lxi v).+e(kl2 +Ini2), е > 0.
СВЕДЕНИЯ ИЗ ТЕОРИИ МАТРИЦ 60Г Тогда <?1[Ф(гй)6р, — и<*,Пог’ + е(с + 1) |р|2 «S О, где с— константа такая, что при всех со |Ф(ко)Ь)2 «С с. В силу доказанного выше существует Р — Р(*’, удовлетворяющая при всех ж, v неравенству 2Re xl*'P(Ах + bv) + Gt(х, v)is?О, которое согласно (7) влечет за собой (2'). Следствие*). Уравнения A'P + PA-K'RK + Q^Q, RK = B^P (8)' имеют единственное положительно определенное решение Р и со- ответствующее ему К такое, что А — ВК — устойчивая матрица, ес- ли R>0, пара А, В невырождена и выполнено одно из двух усло- вий: Q > 0, либо Q — С*С, причем пара Аг, С* невырождена. Доказательство. Существование симметричной Р и К, удовлетворя- ющих (8), эквивалентно существованию Р — Рт и К, для которых выполнено- тождество 2Кех‘*’(-Р)(Лх-|-Рр) - (*<*><?*+ = ~(v + Kx}^R(v + Кх) для любых комплексных х, и. По лемме 'Якубовича — Калмапа для этого до- статочно, чтобы • G [Ф (i<o) Bv, v] < О, G (х, v) А — (x^Qx + v^Rv). Поскольку R > 0, то это условие заведомо выполнено. Более того, выпол- нено и строгое условие (Г), причем G(0, у) =_—v*Rv < 0, так что из леммы также следует, что имеется единственное решение Р = Рг, К, для которого- А — А — ВК устойчива. Поскольку система (8) эквивалентна 4ТР + РА = — K^RK — Q A-Q, K^R^B^P, ' (9) то при <2 > 0 имеем Q > 0, и положительная определенность решения Р сле- дует из леммы Ляпунова (гл. 8, § 2). Несколько модифицируя доказательство этой леммы, можно убедиться, что Р > 0 и при условии невырожденности па- ры Лт, Ст. 8. Алгоритм факторизации для решения матричного квадратно- го уравнения (8). Пусть В = Ь — столбец, В = р > 0 —• скаляр и (8} записывается в виде ATP + PA-pKTK+Q = 0, К = р-‘ВТР. (10J Пусть существует решение Рв, Кв. Обозначим Яр(р)АК0Ф(р)&, Ф(р) Д [pZ —AJ-1. *) Следствие эквивалентно Т.5.2 из гл. 6 и пропущенному при доказатель- стве Т.5.1 утверждению. 39 А. А. Первозванский
602 ПРИЛОЖЕНИЕ 2 Тогда для произвольного р верно тождество рй (л - pi) + {а + Piy р0 - Рад, + Q = о Р.ф-1 (р) - [ф-1 (- р)Г Ро - рКт0К0 + Q = о => ^-Б^(-Р)РОВ-В^РОФ(Р)В- -рВтФЦ-р)К1К0Ф(р)В + ВтФЦ-р)<2Ф(р) 5 = - [1 + Нр (-Р) ][1 + Яр (Р) ] = L (р), где В(р)Л1 + р-ЧРФЦ-р)(1Ф(р)В. . Производя факторизацию L(p), запишем L (р) = 1 \р\1 (~-С (И) 'г' а.(р)а(—р)' ' ' где Z (р) — устойчивый многочлен. Если представление (11) возмож- но, то а вектор Ко находится из тождества K0[pZ-4]-*&a(p)=Z(p)-a(p), (12) после чего матрица Р>0 определится из решения линейного урав- нения. Алгоритм обоснован в условиях следствия (п. 7). Обобщение на случай произвольного В дано в [4.11]. Пример. Пусть [° 11 (О'! (1 01 л==(о op 5==[ip Of Тогда Л(7?)==1 + _^{0 1}[-Р out ovp 1W01 1 + J_ = pA+l. ' рр4 I 1 —Я io oJlo p)\i) рр^ рр* Имеем а(р) = Р2, Z(p)=p-‘/2%2(pp,/4), где %2(s) —многочлен Баттер- лорта, Хг(з) = s2 + У2s + 1. Тождество (12) принимает вид {*i (о = P.llip + Р 1/2* откуда к^р-1^, /с2 = У2р-*/4, Щто совпадает с решением, полученным «в лоб» в П.5.2 гл. 6. О 9. Итеративный алгоритм для решения матричного квадратного уравнения (8). Уравнение (8) эквивалентно системе (9).
СВЕДЕНИЯ ИЗ ТЕОРИИ МАТРИЦ СОЗ Зададимся каким-либо Кт таким, что Л(о) АЛ — ВК^ гур- впцева. Тогда последовательные приближения строятся по правилу: [Л<‘)]гр<о + = _ [KW]TRKW - Q, = R-WP^, Л<!+1) = А - &К<‘+1>, t = 0, 1, 2, .. причем на каждой итерации решается линейное матричное уравне- ние. Сходимость алгоритма обеспечена в условиях следствия из п. 7, причем р<о _/>('-*) > о и все матрицы A(t} устойчивы. Доказательство см., например, в [П. 7, П. 8]. Начальное приближение (стабилизирующие коэффициенты уси- ления) может быть найдено либо по алгоритмам, указанным в гл. 6, либо с помощью следующего приема. Пусть 0 > 0 таково, что р >_— ReX, где X, — с. ч. Л; тогда — (Л + pZ)* устойчива и матрица Р, удовлетворяющая уравнению - (Л + pZ)P - Р(А + pZ)T + 2SZ?~’BT == О, является^ положительно определенной. Найдя Р, примем Кт =• — В~1ВТР~‘. Устойчивость А° — А — ВКа следует из леммы Ляпуно- ва, поскольку при таком выборе К° справедливо тождество Л^Р + Р(Л<°>;т + 2рр = 0. 39*
СПИСОК ЛИТЕРАТУРЫ*) К ГЛАВЕ 1 .4.1. Автоматизация производства и промышленная электропика/Под род. А. И. Берга, В. А. Трапезникова. Т. I.— М.: Советская энциклопедия, 1962,— 424 с. 1.2. Белянин В. Н. Промышленные роботы.—М.: Машиностроение, 1957,— 1.3. Бесекерский В. А., Орлов В. П., Полонская Л. В., Федо- ров С. М. Проектирование следящих систем малой мощности.—Л.: Суд- промгиз, 1958.—508 с. 1.4. Брускин Д. Э., Зороховйч А. Е., Хвостов В. С. Электрические машины и микромашины.—М.: Высшая школа, 1971.— 432 с. 1.5, Б у р д а к о в С. Ф., П е р в О з в а н с к и й А. А. Динамический расчет элект- ромеханических следящих приводов промышленных роботов.—Л.: ЛПИ, 1.6. Основы проектирования следящих систем/Под ред. Н. А. Лакоты.—М.: Машиностроение, 1978,—391 с. -1.7. Строганов Р. П. Управляющие машины и их применение.—М.: Выс- шая школа, 1978.— 264 с. К ГЛАВЕ 2 2.1. Воронов А. А. Устойчивость, управляемость, наблюдаемость.—М.: На- ука, 1979.— 336 с. 2.2. Коган Б. Я. Электронные моделирующие устройства и их применение для исследования систем автоматического управления.— М.: Физматгиз, 1963.— 510 с. 2.8. МаркушевичА. И. Краткий курс теория аналитических функций,— Изд. 4-е.— М.: Наука, 1978.— 415 с. 2.4. Палю де Ла Барьер Р. Курс теории автоматического управления,— М.: Машиностроение, 1973,—397 с. 2.5. Понтрягин Л. С. Обыкновенные дифференциальные уравнения,—Изд. 5-е,— М.: Наука, 1982.— 331 с. 2.6. Постников М, М. Устойчивые многочлены,—М.: Наука, 1981.—175 с. 2.7. Смирнов В. И. Курс высшей математики. Т. I,— Изд. 15-е,— М.: Гостех- издат, 1954.— 472 с. К ГЛАВЕ 3 :8.1. Бесекерский В. А., Попов Е. П. Теория систем автоматического регулирования,— М.: Наука, 1966,— 992. 3.2. Заде Л., Дезоер Ч. Теория линейных систем.—М.: Наука, 1970.— 703 с. •) Приведенный список является списком использованных источников, .а не рекомендуемой литературы, и тем более не претендует на полное отраже- ние даже основных работ по затронутым темам;
СПИСОК ЛИТЕРАТУРЫ 605 3.3. Квакернаак X., Сиван Р. Линейные оптимальные системы управ- ления.— М.: Мир, 1977.— 650 с. 3.4. Лойцянский Л. Г., Лурье А. И. Курс теоретической механики. Т. II.— Изд. 5-е.— М.: Гостехиздат, 1955.— 595 с. 3.5. Окунев Л. Я. Высшая алгебра.—М.: Учпедгиз, 1958,—335 с. 3.6. РозенвассерЕ. Н., Юсупов Р. М. Чувствительность систем управ- ления.—М.: Наука, 1981.—464 с. К ГЛАВЕ 4 4.1, Воронов А. А. Основы теории автоматического управления. Т. 2.—М.; Л.: Энергия, 1966,—371 с. 4.2. Катковпик В. Я., Полуэктов Р. А. Многомерные дискретные сис- темы управления.—М.: Наука, 1966.— 416 с. 4.3. Колмогоров А. Н., Фомин С. В. Элементы теории функций и функ- ционального анализа.— М.: Наука, 1968.— 496 с. 4.4. Крамер Г. Математические методы статистики.— М.: ИЛ, 1948.—631 с. 4.5. О с т р е м К. Введение в стохастическую теорию управления.— М.: Мир, 1973.- 321 с. 4.6. Первозванский А. А. О качестве регулирования частоты в энерго- системах,— Известия АН CGCP, ОТН, 1957, Я» 1. 4.7. Первозванский А. А. Математические модели в управлении про- изводством,— М.: Наука, 1975.— 617 с. 4.8. Пугачев В. С. Теория случайных функций и ее применение к задачам автоматического управления.— М.: Физматгиз, 1962,— 559 с. 4.9. Свешников А. А. Прикладные методы теории случайных функций.— Изд. 2-е.— М.: Наука, 1968. 4.10. Серебренников М. Г., Первозванский А. А. Выявление скры- тых периодичностей.— М.: Физматгиз, 1965. 4.11. Фомин В. Н., Фрадков А. Л., Якубович В. А. Адаптивное уп- равление динамическими объектами,— М.: Наука, 1981.— 448 с. 4.12. Чанг Ш. С. Л. Синтез оптимальных систем автоматического управле- ния.— М.: Машиностроение, 1964. К ГЛАВЕ 5 5.1. Айзерман М. А., Смирнов И. М. О применении методов малого па- раметра для исследования периодических режимов в системах, не содер- жащих малого параметра.—В кн.: Памяти А. А. Андронова.—М.: Изд-во АН СССР, 1955, с. 77—92. 5.2. Бахвалов Н. С. Численные методы,— М.: Наука, 1975.— 632 с. 5.3. Браве р м ан Э. М., Пятницкий Е. С. Прохождение случайного сигнала через абсолютно устойчивые системы.— Автоматика и телемеха- ника, 1971, т. 32, № 2. 5.4. Г е л и г А. X. Об устойчивости движения систем с неединственным поло- жением равновесия.— ДАН СССР, 1962, т. 147, № 3, с. 526—528. 5.5. Гольдфарб Л. С. О некоторых нелинейностях в системах регулиро- вания.— Автоматика и телемеханика, 1947, т. 8, № 5, с. 347—383. 5.6. Казаков И. Е., Доступов Б. Г. Статистическая динамика нелинейных автоматических систем.— М.: Физматгиз, 1962.— 332 с. 5.7. Красовский Н. Н.— Некоторые задачи теории устойчивости движе- ния.— М.: Физматгиз, 1959.— 212 с. 5.8. Крылов Н. М., Боголюбов Н. И. Введение в нелинейную механи- ку.— Киев: АН УССР, 1937,— 363 с. 5.9. Первозванский А. А. Случайные процессы в нелинейных автома- тических системах.— М.: Физматгиз, 1962.— 352 с. 5.10. Попов В. М. Об абсолютной устойчивости нелинейных систем автома- тического регулирования.— Автоматика и телемеханика, 1961, т. 22, № 8, с. 961-979.
603 СПИСОК ЛИТЕРАТУРЫ 5.11. Попов Е. П., П альтов И. П. Приближенные методы исследования нелинейных автоматически? систем.— М.: Физматгиз, I960.— 792 с. 5.12. Якубович В. А. Периодические и почти периодические предельные- режимы регулируемых систем.—В кн.: Труды III Международного кон- гресса ИФАК.— М.: Наука, 1971. 5.13. Boo ton R. С. Jr. Nonlinear control systems with random inputs.—IRE Trans., 1954, CT-1, p. 9-17. 5.14. Cho Y.-S., Narendra K. S. An off-axis circle criterion for the stabili- ty of feedback systems with a monotonic non-linearity.— IEEE Tr. on AC» 1968, Aug., p. 413-416- K ГЛАВЕ 6 6.1. Айзерман M. А. Классическая механика.—M.: Наука, 1974.— 367 с. 6.2. К а л м а и Р., Ф а л б П., А р б и б М. Очерки по математической теории систем.— М.: Мир, 1971.— 400 с. 6.3. Ли Э., М а р к у с Л. Основы теории оптимального управления,— М.: На- ука, 1972.— 576 с. 6.4. Липцер Р. Ш., Ширяев А. Н. Статистика случайных процессов,—М.: Наука, 1974.—696 с. 6.5. Л а р ц н В. М., Н а у м е н к о К. И., С у н ц е в В. Н. Спектральные методы синтеза линейных систем с обратной связью.— Киев: Наукова думка, 1971,— 137 с. 6.6. Первозванский А. А., Гайцгори В. Г. Декомпозиция, агрегирова- ние и приближенная оптимизация,— М.: Наука, 1979.— 342 с. 6.7. Первозванский А. А. О методе замороженных коэффициентов при синтезе линейных регуляторов.— ДАН СССР, 1983, т. 268, № 5, с. 1075— 1078. 6.8. Романовский 10. М., Степанова Н. В., Чернявский Д. С. Ма- тематическое моделирование в биофизике.—М.: Наука, 1975.— 344 с. 6.9. К a Hath Т. Linear systems.—New York: Prentice Hall, 1980.—682 p. См. также [3.2, 3.3, 4.2, 4.5, 4.11]. К ГЛАВЕ 7 7.1. Верешкии А. Е., Катковник В. Я. Линейные цифровые фильтры и* их реализация.— М.: Сов. радио, 1973.— 152 с. 7.2. М е д и ч Д. Статистически оптимальные линейные оценки и управление,— 1 М.: Энергия, 1973.— 440 с. 7.3. Ц'ыпкин Я. 3. Теория импульсных систем,—М.: Физматгиз, 1958.—724 с. 7.4. Цыпкин Я. 3. Основы теории автоматических систем,— М.: Наука, 1977» 7.5. Фомин В. Н. Методы управления линейными дискретными объектами.— Л.: Изд. ЛГУ, 1985.— 336 с. См. также [3.3, 4.2, 4.5, 4.11, 4.12]. К ГЛАВЕ 8 8.1. Андронов А. А., Витт А. А., Хайкпп С. Э. Теория колебаний,— М.: Физматгиз, 1959.— 915 с. 8.2. Барбашин Е. А. Функции Ляпунова.— М.: Наука, 1970,—240 с. 8.3. Беллман Р. Теория устойчивости решений дифференциальных уравне- ний.- М.: ИЛ, 1954,- 216 с. 8.4. Б арки н А. И. Оценки качества нелинейных систем регулирования.— М.: Наука, 1982,—256 с. 8.5. Васильева А. Б., Бутузов В. Ф. Асимптотические разложения ре- шений сингулярно возмущенных уравнений.— М.: Наука, 1973.— 272 с. 8.6. Г е л и г А. X., Лео но в Г. А., Якубович В. А. Устойчивость нелиней- ных систем с неединственным состоянием равновесия.—М.: Наука, 1978.
СПИСОК ЛИТЕРАТУРЫ 607 8 7 Демидович Б. П. Лекции по математической теории устойчивости,— М.: Наука, 1967,—472 с. 8.8. Красносельский А. М. Частотные признаки в задаче о вынужден- ных периодических колебаниях в методе гармонического баланса,— В кн.: VIII Всес. совещание по проблемам управления: Тезисы докладов. Кп. I.— М.: ИПУ, 1980, с. 21-23. 8.9. Красносельский М. А., ВайпиккоГ. М., Забрей к о П. П. При- . блйженное решение операторных уравнений,— М.: Наука, 1969. 8.10. Лурье А. И. Некоторые нелинейные задачи теории автоматического ре- гулирования,— М.;-Л.: Гостехиздат, 1951,— 216 с. 8.11. Розенвассер Е. Н. Колебания нелинейных систем: метод интеграль- ных уравнений.— М.: Наука, 1969,— 576 с. 8.12. Якубович В. А. Частотные условия автоколебаний в нелинейных сис- темах с одной стационарной нелинейностью.—Сиб. мат. журнал, 1973, т. XIV, № 5, с. 1100-1129. 8.13. Saksena V. К., О’На Не у J., Ко koto vic Р. Singular perturbations and time-scale methods in control theory: survey 1976—1983. Automatica, v. 20, № 3, 1984, p. 273-293. . „ 8.14. S i 1 j a k D. Nonlinear systems.— New York: J. Willey, 1969.— 618 p. См. также литературу к гл. 5. К ГЛАВЕ 9 9.1. Алексеев В. М., Тихомиров В. М.,- Фомин С. В. Оптимальное уп- равление.— М.: Наука, 1979.— 430 с. 9.2. Аркин В. И., Евстигнеев И .В. Вероятностные модели управления . и экономической динамики.— М.: Наука, 1979,— 176 с. 9.3. Болтянский В. Г., Гамкрелидзе Р. В., Понтрягин Л. С. К те- ории оптимальных процессов.—ДАН СССР, 1956, т. ПО, № 1, с. 7—10. 9.4. Болтянский В. Г. Математические методы оптимального управле- ния.— М.: Наука, 1966.— 308 с. 9.5. Болтянский В. Г. Оптимальное управление дискретными система- ми.— М.: Наука, 1973. 9.6. Г а б а с о в Р. Ф., Кириллова Ф. М. Оптимизация линейных систем.— Минск: БГУ, 1973.— 248 с. 9.7. Г р о д з о в с к и й Г. Л., Иванов IO. Н., Токарев В. В. Механика кос- мического полета с малой тягой.— М.: Наука, 1956.— 680 с. 9.8. Данциг Дж. Линейное программирование, его обобщения и примене- ния.— М.: Прогресс, 1966.— 600 с. 9.9. Демьянов В. Ф., М а л о з е м о в В. Н. Введение в минимакс.— М.: Наука, 1972,—368 с. 9.10. Ко л о веки й М. 3. Автоматическое управление виброзащитными сис- темами.— М.: Наука, 1976,— 320 с. 9.11. Красовский Н.' Н. Теория управления движением — М.: Наука, 1968. '9.12. Куржанский А. Б. Управление и наблюдение в условиях неопреде- ленности.— М.: Наука, 1977,— 392 с. 9.13. Лейт май Д. Введение в теорию оптимального управления,—М.: Нау- ка, 1968.- 192 с. 9.14. Лэсдон Л. Оптимизация больших систем.—М.: Наука, 1975,—432 с. 9.15. Моисеев Н .Н. Численные методы в теории оптимальных систем,—М.: Наука, 1971.— 424 с. 9.16. Первозванский А. А. О минимуме максимального отклонения управ- ляемой линейной системы.— Известия АН СССР, Механика, 1965, №2. 9.17. Первозванский А. А. Поиск.— М.: Наука, 1970,— 264 с. 9.18. Поляк Б. Т. Введение в оптимизацию.— М.: Наука, 1983,— 384 с. 9.19. Розоноэр Л. И. Принцип максимума Л .С. Понтрягина в теории опти- мальных систем,—Автоматика и телемеханика, 1959, т. 20, № 10—12. 9.20. С у х а н о в А. А. Метод решения нелинейных двухточечных краевых за- дач.— ЖВМ и МФ, 1983, № 1, с. 228-231.
608 СПИСОК ЛИТЕРАТУРЫ 9.21. Федоренко Р. П. Приближенное решение задан оптимального уп- равления.—М.: Наука, 1978.—488 с. См. также [3.3, 6.3]. К ГЛАВЕ 10 10.1. Аоки М. Оптимизация стохастических систем.—М.: Наука, 1971. 10.2. Веллман Р., Дрейфус С. Прикладные задачи динамического про- \ граммирования.— М.: Наука, 1964,—457 с. 10.3. Гайцгори В. Г., Первозванский А. А. Асимптотические свойст- ва управлений, оптимальных в среднем,— В кп.: Математические методы оптимального управления и обработки данных,—Рязань: РРТИ, 1983. 10.4. Колосов Г. Е. Синтез оптимальных автоматических систем при слу- чайных возмущениях,— М.: Наука, 1984.— 256 с. 10.5. Рей У. Методы управления технологическими процессами.—М.: Мир. 1983,— 368 с. 10.6. Флеминг У., Р и ш е л Р. Оптимальное управление детерминирован- ными и стохастическими системами.— М.: Мир, 1978.— 322 с. 10.7. Черноусько Ф. Л. Некоторые задачи оптимального управления с малым параметром,—Прикладная математика и механика, 1968, т. 32, вып. 1, с. 15—26. 10.8. Черноусько Ф. Л., Акуленко Л. Д., Соколов Б. Н. Управле- ние колебаниями.— М.: Наука, 1980.— 384 с. 10.9. Черноусько Ф. Л., Колмановский В. Б. Оптимальное управле- ние при случайных возмущенийх.— М.: Наука, 1978,— 352 с. 10.10. Gilbert Е. Optimal periodic control.—SIAM J. on Control and Opt., 1977, v. 15, №5. См. также [3.3, 6.6, 7.2, 9.2, 9.12, 9.18]. К ГЛАВЕ 11 11.1. Адаптивная оптика/Под ред. Э. А. Ветриченко.— М.: Мир, 1980.— 456 с. 11.2. Веллман Р. Процессы регулирования с адаптацией.— М.: Наука, 1964,— 360 с. 11.3. Деревицкий Д. П., Фрадков А. Л. Прикладная теория дискрет- ных адаптивных систем управления.— М.: Наука, 1981.— 216 с. 11.4. Емельянов С. В. Системы автоматического управления с перемен- ной структурой.— М.: Наука, 1967,— 336 с. 11.4д . 3 а х а р о в М. Г., Кульчицкий О. Ю., Первозванский А. А. Экономный алгоритм адаптивного управления многомерным статическим объектом,— Автоматика и телемеханика, № 9, 1982, с. 70—76. 11.5. Катковник В. Я. Линейные оценки и стохастические задачи опти- мизации.— М.: Наука, 1976.— 488 с. 11.6. ' Катковник В. Я., ХейсинВ. Е. Динамическая стохастическая ап- проксимация полиномиальных дрейфов,—Автоматика и телемеханика, 1979, № 5, с. 89—98. 11.7. Кульчицкий О. Ю. Алгоритмы типа стохастической аппроксимации в контуре адаптации диксретной стохастической линейной динамической модели.— Автоматика и телемеханика, 1983, № 9 (ч. I); 1984, X» 3 (ч. II). 11.8. Кухтенко В. И. Динамика самонастраивающихся систем со стабили- зацией частотных характеристик.— М.: Машиностроение, 1970.— 232 с. 11.9. Л и Р. Оптимальные оценки, определение характеристик и управление.— М.: Наука, 1966.—176 с. 11.10. Линник Ю. В. Метод наименьших квадратов и основы теории наблю- дений.— М.: Физматгиз, 1962.— 352 с. 11.11. Люблинский Б. С., Фрадков А. Л. Адаптивное управление нели- нейными статическими объектами с неявно заданной характеристикой.— Автоматика и телемеханика, 1983, № 4, с. 126—136. 11.12. Райбман Н. С., Ча де ев В. М. Построение моделей процессов про- изводства,—М.: Энергия, 1975,—376 с.
СПИСОК ЛИТЕРАТУРЫ 609 11.13. Растригин Л. А. Системы экстремального управления.—М.: Наука, 1974,- 632 с. 11.14. Уткин В. М. Скользящие режимы в задачах оптимизации и управ- ления.— М.: Наука, 1981.— 368 с. 11.15. Федоров В. В. Теория оптимального эксперимента,—М.: Наука, 1971.— 312 с. 11.16. Фельдбаум А. А. Теория дуального управления, I—IV,—Автомати- ка и телемеханика, 1960, т. 21, № 9, 11; 1961, т. 22, № 1, 3. 11.17. Хубер Д. П. Робастность в статистике.— М.: Мир, 1984.— 304 с. 11.18. Цыпкин Я. 3. Адаптация и обучение в автоматических системах.— М.: Наука, 1968.— 399 с. 11.19. Цыпкин Я. 3. Основы информационной теории идентификации.— М.: Наука, 1984,—323 с. 11.19д . Цыпкин Я. 3., Позняк А. С. Рекуррентные алгоритмы оптими- зации в условиях неопределенности.— В кн.: Итоги науки и техники, сер. «Техническая кибернетика».— М.: ВИНИТИ, 1983, т. 16, с. 3—70. 11.20. Эйкхофф П. Основы идентификации систем управления.—М.: Мир, 1975.— 682 с. 11.21. Astrom К. J., Soderstrom Т. Uniqueness of the Maximum Likeli- hood Estimates of the Parameters of an ARMA Model.— IEEE Trans., 1974, v. AC-19, No. 6, p. 763-773. 11.22. Goodwin G. C., Ramadge P. J., Caines P. E. Discrete-Time Mul- tivariable Adaptive Control.— IEEE Trans, 1980, v. AC-25, No. 3, p. 449— 456. 11.23. Goodwin G. C., Sin K. S., Saluja К. K. Stochastic Adaptive Cont- rol and Prediction.— The general delay-coloured noise case.— IEEE Trans, on AC, 1980, v. AC-25, No. 5, p. 946—950. 11.24. Goodwin G. C., Sin K. S. Stochastic Adaptive Control using modified least squares algorithm.— Automatica, 1982, v. 18, No. 3, p. 313—321. 11.25. Goodwin G. C., Payne R- L. Dynamic system identification experi- ment design and data analysis.— Newcastle: Univ, of Newcastle, 1977. 11.26. Kiefer J., Wolfowitz J. Stochastic estimation of the maximum of a regression function.— Ann. Math. Stat., 1952, v. 23, No- 3, p. 462—466. 11.27. Landau L. D. A survey of model reference adaptive techniques.— Theo- ry and Applications.— Automatica, 1974, v. 10, p. 353—379. 11.28. Robbins H-, Monro S. A stochastic approximation method.— Ann. Math. Stat., 1951, v. 22, No. 3, p. 400—407. 11.29. Liung L., Soderstrom T. Theory and practice of recursive identifi- cation.— Cambr., Mass-: MIT Press, 1983.— 529 p. 11 30. Adaptive control.— IEEE Proc, on A. C., 1976, v. 64, No. 8, p. 3—142. См. также [4.3, 4.5, 5.9, 7.2, 9.17, 9.18]. КПРИЛОЖЕНИЮ ПЛ. Веллман P. Введение в теорию матриц.—М.: Наука, 1969,—367 с. 11.2. Гантмахер Ф. Р. Теория матриц.—М.: Гостехиздат, 1953.—492 с. П.З. Диткин В. А., Прудников А. П. Справочник по операционному ис- числению.— М.: Высшая школа, 1966.— 405 с. П.4. Методы исследования нелинейных систем автоматического управления/ Под ред. Р. А. Нелепина,—М.:Наука, 1975.—448 с. П 5. Л у р ь е А. И. Операционное исчисление и его приложения к задачам ме- ханики,— М.; Л.: ГЙТТЛ, 1951.—432 с. П.6. РакитскийЮ. В., Устинов С. М., Черноруцкий И. Г. Числен- ные методы решения жестких систем.— М.: Наука, 1979.— 208 с. П.7. Kleinman D. L. On an iterative technique for Riccati equation compu- tation.— IEEE Trans on AC, 1968, v. 13, No. 1, p. 114—115. П.8, Man F. T., Smith H. W. Design of linear regulators optimal for time multiplied performance indices.— IEEE Trans on AC, 1969, v, 14, No. 5.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ ABM 13, 122, 192, 328, 531 Автоколебания 217 и д„ 387 — обобщенные 404 Адаптивность 556, 579 Айзермана гипотеза 209 — диаграмма 222, 223 Алгоритм 10, 95 — адаптивный 549 — Евклида 78 — Кифера — Вольфовица 552 — Вауса 44 — Роббинса — Монро 552 — самонастройки 570 — синтеза закона управления 95 — стабилизации 77 и д., 80 Амплитуда реакции 50 Анализ корреляционный 545 Ансамбль реализаций 140 А ппроксимация стохастическая Астатизм 97, 166 АЦП Ы 558 Базис внутреннего описания 260 Баланс гармонический 219 Баттерворта многочлен 102. 165. 290 Веллмана уравнение 489 Блок измерительный (датчиков инфор- мации, ДИ) 10 — преобразования и хранения информа- ции (ПИ) 10, 12, 14 Боде диаграмма 109 Быстродействие оптимальное 409 Быоси — Калмана фильтр 327, 519, 562 Вандермонда определитель 263 Вариация игольчатая (импульсная) 432 Вектор полной текущей информации 482 — собственный 593 Величина случайная 140 Винера теорема 152 Воздействие входное 19 —, изменяющееся с постоянной ско- ростью 51 — отрабатываемое 85 — полиномиальное 50 — постоянное 51 — случайное 140 и д. Возмущение достаточно разнообразное 534 — нелинейное 201 — - сингулярное 379 — случайное 292 и д. Восстанавливаемость 273 Вход полный векторный 263 ---скалярный 262 Вырождение 380 Выход внешний 33 Выход полный векторный 263 ---скалярный 262 Вычислитель аналоговый см. АВМ Гамильтона — Кэли теорема 264, 593 Гамильтониан 419 Гелига критерий 213 Гидротурбина 181 и д. Гипотеза Айзермана 209 — квазистатичности для непрерывных систем 505 — Лагранжа 414 — малости отклонений от программы 502 — слабой динамичности 491 --- нелинейности 499 --- управляемости 494 Годограф частотной характеристики 5ft -------модифицированной 210 Гольдфарба диаграмма 222, 223. 229 Граф 27 — геориентированный 54 — ориентированный 54 Грубость 123 Гурвица критерий 597 — неравенство 45, 62 Гурвицева матрица 371, 597 Датчик 10 — давления 12 — идеальный 12 — неидеальный 12 — относительного перемещения 11 — рассогласования 139 — температуры 12 . — угловой скорости 12 Двигатель гидравлический 14 — пневматический 14 Дельта-функция 25 Детектирование синхронное 547. 548 Децибел 109 Диагонализация 261 Диаграмма Айзермана 222 — Боде-109 — Гольдфарба 222, 229 Динамичность 569 — слабая 491 Дискретизация грубая 200 Дисперсия 141 — ошибки 168, 194 Добротность системы 98 Достижение заданной скорости, оптими- зация 449 Дуальность 579 Евклида алгоритм 78
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Gil Задача выпуклого программирования 417 — линейного программирования 465 — линейно-квадратическая 515' — линейно-квадратично-гауссова 525 — математического программирования 464 — о наименьшем уклонении 476 — о полете на максимальную дальность 496 — об оптимальном быстродействии -409 — общая математической теории опти- мального управления 408 — оптимального слежения 302 — оптимальной стабилизации 287 — оптимизации со свободным правым концом траектории 410, 424 и д. — регулирования 70 — слежения 70 — стохастической аппроксимации 558 — Цермало навигационная 453 Зазор см. Люфт Закон распределения нормальный (гаус- сов) 150 — управления 10 ------ адаптивней 579 ------ оптимальный 155 ----пропорционально-дифференциаль- ный 78 ------ пропорционально-йнтегрально-диф- ференциальный (ПИД-закон) 78 ----, реализация 121 и д. ----самонастраивающийся 569 ----, синтез в ЭСС 137 Запас устойчивости по амплитуде (мо- дулю) 124 ---- по фазе (аргументу) 124 Звено апериодическое 24, 25, 43 — безынерционное 368 — «висячее» 262, 267, 363 — колебательное 43 — неустойчивое по входу 40 — типовое 24, 25 — устойчивое по входу 40 — — по начальным условиям 46 Золотник 192, 203 •Зона нечувствительности 198, 226 Идентификация объектов управления, 532 571 ---динамических 542 -------линейных 542 ------- статических 542 Изменение базиса внутреннего описа- ния 260 Измерение неполное и неточное 299, 517 и д. Импульс 25 — одиночный 546 Инвариантность 87—90 Инерционность датчика 12 Интегратор 24, 39, 43 Интегрирование в смысле Римана 142 — численное 359 Интенсивность белого шума 171 Калмана теорема структурная 264 Качество 97 —• процесса стабилизации 284 Качмажа метод 559 Кифера — Вольфовица алгоритм 552 Ковариация 293 Компенсация динамическая 91 и д. Компенсация линейная последовательная 245 — нелинейная 247 Контур внутренний обратной Связи 87 Коши формула 305 Коэффициент гармонической линеариза- ции 249 — усиления большой 108 ---- статический 108 — чувствительности показателя качест- ва 161 — — функционала по параметру 474 Критерий оптимальности квадратичный 338 ----минимаксный 475 — устойчивости гармонического баланса 229 ----Гелига 213 ---- Гурвица 597 ----Ляпунова матричный 367 ----Найквиста обобщенный 63, 65. 124, 229 •---по входу 43 ----по начальным условиям 46 ----Попова В. М. 207, 376 -------, достаточность 298 ----Стодолы 43 » ----Чо-Нарендры 211 Крутизна средняя характеристики нели- нейного элемента 236 Куна — Танкера условия 416 Лагранжа гипотеза 414 — множители 413 Лагранжиан 413 Лапласа преобразование 22, 583 •---дискретное 344, 586 — — обратное 584 Лемма Ляпунова 367 — о факторизации 101 ------- спектральной плотности 146 — о преобразовании к форме Фробениу- са — Калмана 274 — Розоноэра о приращении функциона- ла 429 > , — Шура 592 — Якубовича — Калмана 376, 598 Линеаризация 183, 200. 368. 471 — гармоническая 219, 230 — статистическая 239, 245 Линейность кусочная 197 Лурье уравнение 287, 299, 308. 370 ЛФХ 109 —асимптотическая 115 i Люфт 198, 225 Ляпунова лемма 367 — функция 364 ид. _ Ляпунова — Пуанкаре теорема оо устой- чивости по первому приближению 3G8 Марковость описания объекта 482, 511 Математическое ожидание 149 Матрица блочная 592 — блочно-диагональная 592 — блочно-треугольная 592 — в форме Фробениуса 251 — весовая (переходная) 306 — гурвицева (устойчивая) 371, 597 — диагональная 588 — инциденций звеньев 254 — - квадратная 587 — ковариаций векторного случайного процесса 293 ----ошибок оценивания 300
612 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Матрица неособая 591, 593 — неотрицательно-определенная 597 — обратная 591 — положительно-определенная 597 — присоединенная (союзная) 591 — симметричная 591 — транспонированная 591 — фундаментальная 305 — эрмитова 598 Матрица-столбец 587 Матрица-строка 587 Машина вычислительная аналоговая см. АВМ ' ---цифровая см. ЭВМ Маятник, приведение в равновесие 338 Мембрана измерительная 12 Метод асимптотический малого парамет- ра 377 — Галеркина 395 — гармонического баланса 397 — градиентный 464 — динамического программирования 484 — динамической компенсации 91 — «замороженных» параметров 309. 571 — интегральных уравнений 397 — Качмажа 559 — кЛгпенсации 350 — Ляпунова второй (метод функций Ля- пунова) 363 — максимума правдоподобия (ММП) 538, 545, 562 — медленно меняющихся амплитуд 235 — множителей Лагранжа 157, 413 — наименьших квадратов (МНК) 523. 537, 544, 562 — ньютоновский 464 — операторно-структурный 250 — операторный в теории дискретных и Импульсных систем 342 и д. — пространства состояний в линейной теории 250 — Пуанкаре 387 — статистической линеаризации 238 — штрафных коэффициентов 465 Многочлен Баттерворта 102, 165. 290 — характеристический 33, 258, 593 ---устойчивый 47 Множество выпуклое 417 — состояний равновесия, поточечно асимптотически устойчивое в целом 363 Множители Лагранжа 413 Мода 261 Модель дискретная линейная 316 ---приближенная 332 ---точная непрерывного объекта 231 — математическая 18, 532 и д, — недетерминированная 536 — электронная 39 — эталонная 578 Модулятор 329 Набег фазы 395 Наблюдаемость 273 Найквиста критерий 125, 229 ---Обобщенный 63, 65, 124, 229 Наклон ЛАХ 109 Настройка автоматическая 569 Нелинейности 196 ид. Нелинейность безынерционная 201, 368 — разрывная кусочно линейная 3„1 — слабая 499 Неравенство Гурвица 45, 62 Нестационарность оптимальной обратной связи 308 Нормировка типа Гудвина 560 ----Качмажа 560 Область притяжения решения 361 Обучение 580 Объект дискретный 457 ----слабодинамичный 491 — линейный по управлению и по пара- метрам 563 —неустойчивый и неминимально-фазо- вый 176 и д. Ограниченность управления 72 Оператор дифференцирования 20 — звена 22 Описание в нормальной форме 250. 251. 254 . / ’ Определитель Вандермонда 263 Оптимальность в среднем 510, 549 Оптимизация 4Л7 и д., 482 — локальная 463 ---- градиентного типа 464 ----ньютоновского типа 464 — по быстродействию 445 — по гарантированному результату 510 — по квадратичному критерию 338 — приближенная численная 461 — стабилизирующей обратной связи 284 — численная непрерывных систем 471 и д. Оценивание 532 Оценка наилучшая состояния системы 517 Ошибка слежения 70 Параметры «замороженные» 310, 571 — модели в методе пространства состоя- ний- 250 ПД-закон 79 Переменные «быстрые» 379 — «медленные» 382 — состояния 250 —. фазовые 256 Перерегулирование 105 Период квантования по времени (чере- дования импульсов) 329 ПИД-закон 78, 194 Плотность спектральная 141 ---- дискретная 347 ---- дробно-рациональная 148 Погрешности датчиков 139 Подматрица 592 Показатель качества 160 ----грубый 161 ----интегральный (энергетический) 286 >---нечувствительный, инвариантный «в малом» 161 ----сводный 510 Помехи 89, 90, 139, 140 и д., 536 — в измерительных устройствах 301 Понтрягина принцип максимума 420 Попова В. М, критерий 207, 208 Порядок управления звена 19 Последовательность дискретная 317 Постоянная времени ИЗ, 185 Потенциометр измерительный 11 Потеря устойчивости медленная 237 Правило За 151 Представление спектральное матричной экспоненты 261 Преобразование «вход-выход» 19 — Лапласа 22, 71, 583, 586 ---- дискретное 344 ---- обратное 584 , — случайных процессов линейное 141
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 613 Преобразование Фурье 141 ---быстрое 548 --- синхронное 548 Преобразователь «аналог — код» 200 — «аналог — цифра» (АЦП) 13 — дифференцирующий 66 — «цифра — аналог» 13 Принцип автоматической настройки 569 — максимума дискретный 460 ----, достаточность в выпуклых зада- чах 422 ---, необходимость 418 — — Понтрягина 420 — суперпозиции 33 Проблема линейно-квадратичная опти- мального управления 287 — оценивания 532 — размещения собственных чисел 274 Проводимость операторная 66 --- в цепи обратной связи 66 Программа управления 10—11, 71 Программирование выпуклое 417 — динамическое 484, 511 — линейное 465 — математическое 464 Пространство состояний 251 Процедура см. Алгоритм — оценивания рекуррентная 558 Процесс случайный 140 ---нормальный 150, 240 ---стационарный 141, 239 --- типа «кенгуру» 144 Пуанкаре теорема 377 Равновесие 205 Размещение собственных чисел 274 Ранг матрицы 593 Распределение вероятностей 149 — гауссово 150 Рауса алгоритм 44 Реакция звена 29, 48, 52 — системы 231, 259, 341 ---установившаяся 259, 346 Реализация случайной величины 140 Реализуемость строгая передаточной функции 43, 348 Регулирование 70 — угловой скорости вала турбины 181 ид. — экстремальное 550, 555 Режим скользящий 212, 507 Реле 199, 212 Риккати уравнение алгебраическое 287, 309 ---матричное 308, 384. 438 Решение неустойчивое по начальным ус- ловиям 361 — обобщенное автоколебательное 404 — периодическое 386 и л. — устойчивое асимптотически 361 ------- в целом 361 -------по начальным условиям 361 ‘Роббинса — Монро алгоритм 552 Робот промышленный 16 Розопоэра лемма о приращении функци- онала 429 Ряд Фурье 398 Самонастройка 531, 569 Свертывание системы в одно звено 35 Свойства структурные дискретной ли- нейной системы 319 Связь обратная 11 Связь обратная в дискретной системе 320> ---внутренняя 86, 93 -------в электромашинкой следяще& системе 134 ---, заданная алгоритмически 491 ---импульсная 333 --- нелинейная 248 --- оптимальная 481 --- отрицательная 57 — — по выходу 82 ----------и его производным 75 ---по ошибке управления 152 , «Сглаживание» зоны нечувствительно- сти вибрационное 247 Сдвиг по фазе реакции относительно воз- действия 50 Сервомеханизм 193, 203 Сигнал информационный 10 — приведенный 85 — управления 10 Симплекс-метод 473 Сингулярность 162, 379 Синтез закона управления 95, 137 и д, — оптимальный обратной связи 482 Система автоматического управления^ (САУ) 15 — адаптивная 579 — асимптотической оценки 280 — астатическая 97, 166 с большим коэффициентом усиле- ния 106 — вполне наблюдаемая 273, 319 --- управляемая 269 — вырожденная 380 — грубая 123 — дискретная 316 и д. ---, оптимизация 457 и д. ---, устойчивая к внешним возмуще- ниям 318 -------по начальным условиям 318 — замкнутая (с обратной связью) Ю- (см. также Связь обратная) — импульсная 328 --- линейная 230 — инвариантная 70 — линейная 19 и д., 387 — многосвязная 263 — нелинейная 196 и д., 359 и д. — непрерывная кусочно линейная 389 — разомкнутая 10 — релейная 200 — с медленно меняющимися параметра- ми 309, 382 — с переменными параметрами 304 — с типовой структурой 52 и д. — сингулярно возмущенная 379 — сходящаяся в окрестность равновесия- (диссипативная) 363 — устойчивая по отношению к внешним воздействиям 362 ---по начальным условиям 47, 362 — электромеханическая 28, 255 ---следящая (ЭСС) 15, 60. 85, 126 и д„ 137 Скаляр 587 Скважность импульса 329 Слежение 70 — оптимальное 402 Соединение звеньев параллельное 54 --- последовательное 53 Сопротивление цепи операторное 55, 66» Состояние равновесия 205, 360 Средства автоматики технические Ц Стабилизация 74 и д.. 278, 280 — импульсной обратной связью 333 — линейного объекта 571 — оптимальная 287 Статистика достаточная 525 Степень устойчивости 163, 291
€14 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Степень устойчивости бесконечная 338 Стодолы критерий устойчивости 43 Структура системы управления 19 ------- типовая 52 и д. Схема структурная 27, 30 Тахогенератор 12 Теорема Винера 152 — Гамильтона — Кэли 264, 593 — Калмана структурная 265 — Ляпунова — Пуанкаре об устойчивости по линейному приближению 368 — о методе наименьших квадратов 537 — о разрешающих уравнениях Лурье 370 — о свертке 23 — о системе асимптотической оценки 280 — Пуанкаре 377 — разделения 301, 327, 525 — Тихонова — Васильевой 380 — Фельдбаума 28 — Чебышева 151 — Четаева 365 Теория возмущений 376 и д. — матриц, справочные сведения 587 — нелинейная 196 ид. Термопара 12 Тест-сигнал 547 Торможение скорейшее в заданном поло- жении 455 Точка с переменной массой 449 Точность регулирования 194 Транспонирование матрицы 590 Трение сухое 198 Удар гидравлический 188 Управление адаптивное статическим объектом 549 ---динамическим объектом 569 ---формой поверхности астрономиче- ского зеркала 568 — в скользящем режиме 507" — движением механических объектов 9, 449 и д. — запасом при неопределенном спросе 512 — импульсное непрерывными объектами 328 и д„ 338, 342 — комбинированное 87 —оптимальное по гарантированному ре- зультату 510 — — по ожидаемому результату (опти- мальное в среднем) 510 — по возмущению 83 — по оценкам 314 — полетом реактивного космического аппарата 440 — при случайных возмущениях 140 и д„ 292, 509, 566, 574 — релейного типа 428 — с обратной связью внутренней 86. 93 ---------по ошибке 16. 84 — субоптимальное (приближенно опти- мальное) 490 — теплотехническими объектами 9 — химической и биологической техноло- гией 10 — электротехническими или электрон- ными объектами 9 Управляемость 269 — полная для дискретной системы 319 — слабая 494 Уравнение Веллмана (Веллмана — Га- мильтона — Якоби) 489 Уравнение гармонического баланса 219 — динамического программирования 484. 511 . — Лурье 287, 299, 308 — Риккати алгебраическое 287. 309 ---матричное 308, 438 Уравнения в форме Лурье 368 Усилитель 20 — вибрационный 236 — идеальный 24, 43 — мощности (УМ) 14 — операционный 13. 39, 66, 125 — релейный 223 — электромеханический 28 Условие астатизма 97 — Липшица 506, 553 — принадлежности сектору ГО. 4) 207 - — причинности 330 — строгой реализуемости передаточной функции 43 — устойчивости абсолютной достаточное 208 ---— необходимое 209 ---характеристического многочлена 43 Условия дополняющей нежесткости 415 — Куна — Таккера 416 — Рауса — Гурвица 45 — трансверсальности 422 Устойчивость 40, 361 — абсолютная 209 — асимптотическая 361 --- в целом 361 — многочленов 43 — нулевого равновесного состояния в целом 207 — по входу 40, 258 — по начальным условиям 45, 206, 259. 361, 362 — по отношению к внешним воздейст- виям 362 Устройство вычислительное аналоговое см. АВМ ---цифровое см. ЭВМ — дифференцирующее 125 — исполнительное (ИУ) 10, 14 Факторизация 101 — спектральной плотности 146 Фельдбаума теорема 428 Фиксатор 230 Фильтр Баттерворта 49, 129, 131 ---низкочастотный 100 — Быоси — Калмана 327. 519, 562 — Винера — Калмана 302 — идеальный низкочастотный 99 — формирующий 171 Форма квадратная 597 — операторная Дифференциального урав- .нения 20 — положительно-определенная 597 Формула Коши 305 Функция весовая импульсная 546 --- матричная 258 '--преобразования «вход-выход» 23 — выпуклая 416 — единичного скачка (функция Хевисай- да) 24 — корреляционная 141 — — установившейся реакции 143 — Ляпунова 364 и д. --- квадратичная 367 — передаточная допустимая замкнутого контура 176 ---комплексная 23 ------- дискретная 345 — — линейной части системы 205
предметный указатель Функция передаточная минимально-фа- зовая 113 неминимально-фазовая 113 операторная 22 1 дискретная 343 матричная 257 передачи по замкнутому контуру 85 по разомкнутому контуру 85 разомкнутого контура 57 типовая 119 и д. — — устойчивая 46 — переключения 428 — переходная 24, 546 фильтра Баттерворта 105 — формирующая 329 Фурье-преобразование корреляционной Функции 141 — быстрое 548 — синхронное 548 Характеристика амплитудно-фазовая 50 — амплитудно-частотная (АЧХ) 50 логарифмическая (ЛАХ) 108, 114 — фазо-частотная 50 логарифмическая (ЛФХ) 109 — частотная 143, 546 вещественная (ВЧХ) 50 дискретная 346 комплексная 49 мнимая 50 разомкнутого контура 57 Хевисайда функция 24 Частота дискретная 348 — сопрягающая 114 — фильтра характерная 100 Чебышева теорема 151 Четаева теорема 365 Числа собственные матрицы 258 Чо-Нарендры критерий 211 Шаг дискретности 324 Шум 89 — белый 171 — — дискретный 324, 347 нормальный 327 Шура лемма 592 ЭВМ 13, 16, 116, 126, 192, 200, 243, 328 359, 365, 531, 541, 597 Эвристика 527 Эксперимент активный 534 — параллельный 547 Экспонента матричная 258, 595 Электродвигатель 14 Элемент нелинейный 201 — переключательный (пороговый) 199 Эффект краевой 381 , Якубовича — Калмана лемма 376, 598.
Анатолий Аркадьевич Первозванский КУРС ТЕОРИИ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ Редактор А. С. Позняк Художественный редактор Г. М. Коровина Технический редактор Е. В. Морозова Корректор Л. С. Сомова Сдано в набор 10.03.86. Подписано к печати 28.10.86. Т-19644. Формат 60X90/16. Бумага тип. W 3. Гарнитура обыкновенная. Печать высокая. Уел. печ. л. 38,5. Усл. кр.-отт. 38,5. Уч.-изд. л. 40,16. Тираж 12 200 акз. Заказ Л« 105. Цена 1 р. 70 к. Ордена Трудового Красного Знамени издательство «Наука» "Главная редакция физико-математической литературы 117071 Москва В-71, Ленинский проспект, 15 4-я типография издательства «Наука» 630077 г. Новосибирск, 77. Станиславского, 25